УНИФИКАЦИЯ ПЕРЕВОДНЫХ ЭКВИВАЛЕНТОВ МНОГОКОМПОНЕНТНОЙ ЛЕКСИКИ ПРИ КОЛЛЕКТИВНОЙ РАЗРАБОТКЕ ДВУЯЗЫЧНЫХ ЛЕКСИКОНОВ

Ольга Ивановна Бабина, Екатерина Сергеевна Тамгина

Аннотация


Рассматривается вопрос коллективной разработки двуязычного лексикона, представляющего
собой базу знаний для системы автоматической обработки текстов. Пилотное исследование под-
твердило тезис о неизбежной вариативности переводов одних и тех же лексических единиц,
предлагаемых различными переводчиками. Для соблюдения автоматической системой принципа
единства терминологии предлагается введение в процесс компиляции автоматического словаря
этапа унификации переводных эквивалентов многокомпонентной лексики. Авторами разработа-
на формализованная процедура для выполнения данного этапа. Экспериментальная проверка ра-
боты предложенной процедуры на ограниченной выборке целевых терминов позволила сделать
вывод о возможности свести к минимуму количество переводных эквивалентов термина в соста-
ве более длинных вхождений лексикона. Корректировка вхождений лексикона в результате вы-
полнения предложенной процедуры позволяет унифицировать лексические манифестации вхож-
дений и в перспективе обеспечить более высокое качество работы автоматической системы.

Ключевые слова


многокомпонентная лексика, коллективная разработка лексикона, перевод- ной лексикон, управление терминологией, автоматическая обработка текстов

Полный текст:

PDF

Литература


Бабина, О.И. Построение базы лингвис-

тических знаний для многоязычных систем авто-

матической обработки текстов / О.И. Бабина //

Лингвистика в контексте культуры: материалы

V международной научно-практической конфе-

ренции (Челябинск, 28–30 ноября 2012 г.) /

под общ. ред. Е.В. Харченко. – Челябинск: Изда-

тельский центр ЮУрГУ, 2012. – С. 19–23.

Бабина, О.И. Построение модели извлече-

ния информации из технических текстов: дис. ...

канд. филол. наук / О.И. Бабина. – Челябинск,

– 235 с.

Залевская, А.А. Слово в лексиконе челове-

ка: психолингвистическое исследование / А.А. За-

левская. – Воронеж: Изд-во Воронеж. гос. ун-та,

– 208 с.

Хроленко, А.Т. Современные информаци-

онные технологии для гуманитария: практическое

руководство / А.Т. Хроленко, А.В. Денисов. – М.:

Флинта : Наука, 2007. – 128 с.

Шереметеьва, С.О. К вопросу об элек-

тронных ресурсах профессиональной лексики /

С.О. Шереметьева, П.Г. Осминин, Е.С. Щербаков

// Вестник ЮУрГУ. Серия «Лингвистика». – 2014.

– Т. 11, № 1. – С. 57–63.

A Contrastive Approach to Multi-Word Term

Extraction from Domain Corpora / F. Bonin,

F. Dell’Orletta, G. Venturi, S. Montemagni // Proceedings

of the International Conference on Language

Resources and Evaluation, LREC 2010. – Valetta,

– P. 3222–3229.

Improving Word Translation Disambiguation

by Capturing Multiword Expressions with Dictionaries

/ L. Bungum, B. Gambäck, A. Lynum, E. Marsi //

Proceeding of the 9th Workshop on Multiword Expressions,

NAACL-HLT 2013. – Atlanta, 2013. –

P. 21–30.

Chen, J. A Multi-Word Term Extraction System

/ J. Chen, C.-H. Yeh, R. Chau // Proceedings of

the 9th Pacific Rim International Conference on Artificial

Intelligence. – Guilin, 2006. – P. 1160–1165. –

(Volume 4099 of the series Lecture Notes in Computer

Science).

Fung, P. A Statistical View on Bilingual Lexicon

Extraction: From Parallel Corpora to Non-

Parallel Corpora / P. Fung // Lecture Notes in Computer

Science. – 2002. – Vol. 1529. – P. 1–17.

Garera, N. Improving Translation Lexicon

Induction from Monolingual Corpora via Dependency

Contexts and Part-of-Speech Equivalences / N. Garera,

C. Callison-Burch, D. Yarowsky // Proceedings of

the Thirteenth Conference on Computational Natural

Language Learning. – Boulder, 2009. – P. 129–137.

Hadni, M. Multi-word Term Extraction

based on New Hybrid Approach for Arabic Language

/ M. Hadni, A. Lachkar, S. el Alaoui Ouatik // Proceedings

of the Second International Conference on

Computational Science and Engineering (CSE-2014).

– Dubai, 2014. – P. 109–120.

Harris, Z.S. Distributional Structure /

Z.S. Harris // Word. – 1954. – Vol. 10, No. 2–3. –

P. 146–162.

Finlayson, M.A. Detecting Multi-Word Expressions

Improves Word Sense Disambiguation /

M.A. Finlayson, N. Kulkarni // Proceedings of the

Workshop on Multiword Expressions: from Parsing

and Generation to the Real World (MWE 2011). –

Stroudsburg, 2011. – P. 20–24.

Rapp, R. Automatic Identification of Word

Translations from Unrelated English and German

Corpora / R. Rapp // Proceedings of the 37th Annual

Meeting of the Association for Computational Linguistics.

– Stroudsburg, 1999. – P. 519–526.

Multiword Expressions: A Pain in the Neck

for NLP / I.A. Sag, T. Baldwin, F. Bond, A.A. Copestake

// Proceedings of the Third International Conference

on Computational Linguistics and Intelligent

Text Processing (CICLing 2002). – Mexico City, 2002.

– P. 1–15.

Sheremetyeva, S. On Extracting Multiword

NP Terminology for MT / S. Sheremetyeva // Proceedings

of the 13th Annual Conference of the EAMT. –

Barcelona, 2009. – P. 205–212.

Shudo, K. A Comprehensive Dictionary of

Multiword Expressions / K. Shudo, A. Kurahone,T. Tanabe // Proceedings of the 49th Annual Meeting

of the Association for Computational Linguistics:

Human Language Technologies (ACL–HLT 2011). –

Vol. 1. – Portland, 2011. – P. 161–170.

Váradi, T. 2006. Multiword Units in an MT

Lexicon / T. Váradi // Proceedings of the Workshop on

Multi-Word Expressions in a Multilingual Context. –

Trento, 2006. – P. 73–78.


Ссылки

  • На текущий момент ссылки отсутствуют.