СРАВНЕНИЕ НЕЙРОСЕТЕВЫХ МОДЕЛЕЙ НА АРХИТЕКТУРЕ ТРАНСФОРМЕРОВ В КОНТЕКСТЕ ЗАДАЧИ ОЦЕНКИ КОМПАКТНОСТИ ВЕКТОРНЫХ ПРЕДСТАВЛЕНИЙ СЕМАНТИЧЕСКИ БЛИЗКИХ ТЕКСТОВ ТРЕБОВАНИЙ ЕВРОПЕЙСКОЙ КЛАССИФИКАЦИИ НАВЫКОВ ESCO

Иван Евгеньевич Николаев, Андрей Витальевич Мельников

Аннотация


В процессе анализа коротких текстов требований вакансий российского рынка труда было выявлено, что одни и те же навыки могут иметь различные формулировки на естественном языке. В связи с этим актуальной задачей становится поиск нейросетевой модели, способной эффективно выделять семантически близкие группы текстов требований для дальнейшего формирования профилей навыков и профессий российского рынка труда. Целью исследования является разработка метода оценки нейросетевых моделей, построенных на архитектуре трансформеров, посредством сравнения компактности векторных представлений семантически близких коротких текстов навыков профессий из европейской классификации (European Skills, Competences, and Occupations). Материалы и методы. В статье приводится анализ для оригинальной модели европейской таксономии навыков ESCO на английском языке и текстов навыков, переведенных на русский язык сервисами автоматического перевода Yandex Переводчик и Google Translate. В статье также приводится сравнение различных методов получения вложений предложений (cls, mean, pooling, SentenceTransformers) для различных нейросетевых моделей, построенных на архитектуре трансформеров. Результаты исследования показывают, что с помощью предложенного метода можно эффективно осуществлять выбор нейросетевых моделей для задачи поиска групп семантически близких текстов требований из текстов онлайн-вакансий. Заключение. Предложенный метод позволил эффективно выбирать нейросетевые модели для задачи выделения компактных групп семантически близких текстов профессиональных навыков, что, в свою очередь, даст возможность выделять группы навыков при формировании профилей профессиональных навыков, включая семантически близкие формулировки, и профилей целых профессий. Такие инструменты позволят оперативно определять: ключевые изменения потребностей рынка труда на уровне отдельных компетенций позволят сформировать представление о динамике и наборах актуальных компетенций, повысят эффективность управленческих решений по созданию программ цифровой грамотности, переподготовки и повышения квалификации, позволят осуществлять оценку компетенций, помогут всем участникам рынка труда точнее оценивать существующие тенденции, предложение и спрос на рынке труда.

Ключевые слова


нейронные сети, кластерный анализ, профессиональные навыки, трансформеры, sentence transformer, ESCO, рынок труда

Полный текст:

PDF


DOI: http://dx.doi.org/10.14529/ctcr220302

Ссылки

  • На текущий момент ссылки отсутствуют.