УНИФИКАЦИЯ ПЕРЕВОДНЫХ ЭКВИВАЛЕНТОВ МНОГОКОМПОНЕНТНОЙ ЛЕКСИКИ ПРИ КОЛЛЕКТИВНОЙ РАЗРАБОТКЕ ДВУЯЗЫЧНЫХ ЛЕКСИКОНОВ

Ольга Ивановна Бабина
Южно-Уральский государственный университет

Екатерина Сергеевна Тамгина
Южно-Уральский государственный университет


Аннотация


Рассматривается вопрос коллективной разработки двуязычного лексикона, представляющего
собой базу знаний для системы автоматической обработки текстов. Пилотное исследование под-
твердило тезис о неизбежной вариативности переводов одних и тех же лексических единиц,
предлагаемых различными переводчиками. Для соблюдения автоматической системой принципа
единства терминологии предлагается введение в процесс компиляции автоматического словаря
этапа унификации переводных эквивалентов многокомпонентной лексики. Авторами разработа-
на формализованная процедура для выполнения данного этапа. Экспериментальная проверка ра-
боты предложенной процедуры на ограниченной выборке целевых терминов позволила сделать
вывод о возможности свести к минимуму количество переводных эквивалентов термина в соста-
ве более длинных вхождений лексикона. Корректировка вхождений лексикона в результате вы-
полнения предложенной процедуры позволяет унифицировать лексические манифестации вхож-
дений и в перспективе обеспечить более высокое качество работы автоматической системы.

Ключевые слова


многокомпонентная лексика, коллективная разработка лексикона, перевод- ной лексикон, управление терминологией, автоматическая обработка текстов

Полный текст:

PDF

Литература


Бабина, О.И. Построение базы лингвис-

тических знаний для многоязычных систем авто-

матической обработки текстов / О.И. Бабина //

Лингвистика в контексте культуры: материалы

V международной научно-практической конфе-

ренции (Челябинск, 28–30 ноября 2012 г.) /

под общ. ред. Е.В. Харченко. – Челябинск: Изда-

тельский центр ЮУрГУ, 2012. – С. 19–23.

Бабина, О.И. Построение модели извлече-

ния информации из технических текстов: дис. ...

канд. филол. наук / О.И. Бабина. – Челябинск,

– 235 с.

Залевская, А.А. Слово в лексиконе челове-

ка: психолингвистическое исследование / А.А. За-

левская. – Воронеж: Изд-во Воронеж. гос. ун-та,

– 208 с.

Хроленко, А.Т. Современные информаци-

онные технологии для гуманитария: практическое

руководство / А.Т. Хроленко, А.В. Денисов. – М.:

Флинта : Наука, 2007. – 128 с.

Шереметеьва, С.О. К вопросу об элек-

тронных ресурсах профессиональной лексики /

С.О. Шереметьева, П.Г. Осминин, Е.С. Щербаков

// Вестник ЮУрГУ. Серия «Лингвистика». – 2014.

– Т. 11, № 1. – С. 57–63.

A Contrastive Approach to Multi-Word Term

Extraction from Domain Corpora / F. Bonin,

F. Dell’Orletta, G. Venturi, S. Montemagni // Proceedings

of the International Conference on Language

Resources and Evaluation, LREC 2010. – Valetta,

– P. 3222–3229.

Improving Word Translation Disambiguation

by Capturing Multiword Expressions with Dictionaries

/ L. Bungum, B. Gambäck, A. Lynum, E. Marsi //

Proceeding of the 9th Workshop on Multiword Expressions,

NAACL-HLT 2013. – Atlanta, 2013. –

P. 21–30.

Chen, J. A Multi-Word Term Extraction System

/ J. Chen, C.-H. Yeh, R. Chau // Proceedings of

the 9th Pacific Rim International Conference on Artificial

Intelligence. – Guilin, 2006. – P. 1160–1165. –

(Volume 4099 of the series Lecture Notes in Computer

Science).

Fung, P. A Statistical View on Bilingual Lexicon

Extraction: From Parallel Corpora to Non-

Parallel Corpora / P. Fung // Lecture Notes in Computer

Science. – 2002. – Vol. 1529. – P. 1–17.

Garera, N. Improving Translation Lexicon

Induction from Monolingual Corpora via Dependency

Contexts and Part-of-Speech Equivalences / N. Garera,

C. Callison-Burch, D. Yarowsky // Proceedings of

the Thirteenth Conference on Computational Natural

Language Learning. – Boulder, 2009. – P. 129–137.

Hadni, M. Multi-word Term Extraction

based on New Hybrid Approach for Arabic Language

/ M. Hadni, A. Lachkar, S. el Alaoui Ouatik // Proceedings

of the Second International Conference on

Computational Science and Engineering (CSE-2014).

– Dubai, 2014. – P. 109–120.

Harris, Z.S. Distributional Structure /

Z.S. Harris // Word. – 1954. – Vol. 10, No. 2–3. –

P. 146–162.

Finlayson, M.A. Detecting Multi-Word Expressions

Improves Word Sense Disambiguation /

M.A. Finlayson, N. Kulkarni // Proceedings of the

Workshop on Multiword Expressions: from Parsing

and Generation to the Real World (MWE 2011). –

Stroudsburg, 2011. – P. 20–24.

Rapp, R. Automatic Identification of Word

Translations from Unrelated English and German

Corpora / R. Rapp // Proceedings of the 37th Annual

Meeting of the Association for Computational Linguistics.

– Stroudsburg, 1999. – P. 519–526.

Multiword Expressions: A Pain in the Neck

for NLP / I.A. Sag, T. Baldwin, F. Bond, A.A. Copestake

// Proceedings of the Third International Conference

on Computational Linguistics and Intelligent

Text Processing (CICLing 2002). – Mexico City, 2002.

– P. 1–15.

Sheremetyeva, S. On Extracting Multiword

NP Terminology for MT / S. Sheremetyeva // Proceedings

of the 13th Annual Conference of the EAMT. –

Barcelona, 2009. – P. 205–212.

Shudo, K. A Comprehensive Dictionary of

Multiword Expressions / K. Shudo, A. Kurahone,T. Tanabe // Proceedings of the 49th Annual Meeting

of the Association for Computational Linguistics:

Human Language Technologies (ACL–HLT 2011). –

Vol. 1. – Portland, 2011. – P. 161–170.

Váradi, T. 2006. Multiword Units in an MT

Lexicon / T. Váradi // Proceedings of the Workshop on

Multi-Word Expressions in a Multilingual Context. –

Trento, 2006. – P. 73–78.


Ссылки

  • На текущий момент ссылки отсутствуют.