УНИФИКАЦИЯ ПЕРЕВОДНЫХ ЭКВИВАЛЕНТОВ МНОГОКОМПОНЕНТНОЙ ЛЕКСИКИ ПРИ КОЛЛЕКТИВНОЙ РАЗРАБОТКЕ ДВУЯЗЫЧНЫХ ЛЕКСИКОНОВ
Аннотация
собой базу знаний для системы автоматической обработки текстов. Пилотное исследование под-
твердило тезис о неизбежной вариативности переводов одних и тех же лексических единиц,
предлагаемых различными переводчиками. Для соблюдения автоматической системой принципа
единства терминологии предлагается введение в процесс компиляции автоматического словаря
этапа унификации переводных эквивалентов многокомпонентной лексики. Авторами разработа-
на формализованная процедура для выполнения данного этапа. Экспериментальная проверка ра-
боты предложенной процедуры на ограниченной выборке целевых терминов позволила сделать
вывод о возможности свести к минимуму количество переводных эквивалентов термина в соста-
ве более длинных вхождений лексикона. Корректировка вхождений лексикона в результате вы-
полнения предложенной процедуры позволяет унифицировать лексические манифестации вхож-
дений и в перспективе обеспечить более высокое качество работы автоматической системы.
Ключевые слова
Полный текст:
PDFЛитература
Бабина, О.И. Построение базы лингвис-
тических знаний для многоязычных систем авто-
матической обработки текстов / О.И. Бабина //
Лингвистика в контексте культуры: материалы
V международной научно-практической конфе-
ренции (Челябинск, 28–30 ноября 2012 г.) /
под общ. ред. Е.В. Харченко. – Челябинск: Изда-
тельский центр ЮУрГУ, 2012. – С. 19–23.
Бабина, О.И. Построение модели извлече-
ния информации из технических текстов: дис. ...
канд. филол. наук / О.И. Бабина. – Челябинск,
– 235 с.
Залевская, А.А. Слово в лексиконе челове-
ка: психолингвистическое исследование / А.А. За-
левская. – Воронеж: Изд-во Воронеж. гос. ун-та,
– 208 с.
Хроленко, А.Т. Современные информаци-
онные технологии для гуманитария: практическое
руководство / А.Т. Хроленко, А.В. Денисов. – М.:
Флинта : Наука, 2007. – 128 с.
Шереметеьва, С.О. К вопросу об элек-
тронных ресурсах профессиональной лексики /
С.О. Шереметьева, П.Г. Осминин, Е.С. Щербаков
// Вестник ЮУрГУ. Серия «Лингвистика». – 2014.
– Т. 11, № 1. – С. 57–63.
A Contrastive Approach to Multi-Word Term
Extraction from Domain Corpora / F. Bonin,
F. Dell’Orletta, G. Venturi, S. Montemagni // Proceedings
of the International Conference on Language
Resources and Evaluation, LREC 2010. – Valetta,
– P. 3222–3229.
Improving Word Translation Disambiguation
by Capturing Multiword Expressions with Dictionaries
/ L. Bungum, B. Gambäck, A. Lynum, E. Marsi //
Proceeding of the 9th Workshop on Multiword Expressions,
NAACL-HLT 2013. – Atlanta, 2013. –
P. 21–30.
Chen, J. A Multi-Word Term Extraction System
/ J. Chen, C.-H. Yeh, R. Chau // Proceedings of
the 9th Pacific Rim International Conference on Artificial
Intelligence. – Guilin, 2006. – P. 1160–1165. –
(Volume 4099 of the series Lecture Notes in Computer
Science).
Fung, P. A Statistical View on Bilingual Lexicon
Extraction: From Parallel Corpora to Non-
Parallel Corpora / P. Fung // Lecture Notes in Computer
Science. – 2002. – Vol. 1529. – P. 1–17.
Garera, N. Improving Translation Lexicon
Induction from Monolingual Corpora via Dependency
Contexts and Part-of-Speech Equivalences / N. Garera,
C. Callison-Burch, D. Yarowsky // Proceedings of
the Thirteenth Conference on Computational Natural
Language Learning. – Boulder, 2009. – P. 129–137.
Hadni, M. Multi-word Term Extraction
based on New Hybrid Approach for Arabic Language
/ M. Hadni, A. Lachkar, S. el Alaoui Ouatik // Proceedings
of the Second International Conference on
Computational Science and Engineering (CSE-2014).
– Dubai, 2014. – P. 109–120.
Harris, Z.S. Distributional Structure /
Z.S. Harris // Word. – 1954. – Vol. 10, No. 2–3. –
P. 146–162.
Finlayson, M.A. Detecting Multi-Word Expressions
Improves Word Sense Disambiguation /
M.A. Finlayson, N. Kulkarni // Proceedings of the
Workshop on Multiword Expressions: from Parsing
and Generation to the Real World (MWE 2011). –
Stroudsburg, 2011. – P. 20–24.
Rapp, R. Automatic Identification of Word
Translations from Unrelated English and German
Corpora / R. Rapp // Proceedings of the 37th Annual
Meeting of the Association for Computational Linguistics.
– Stroudsburg, 1999. – P. 519–526.
Multiword Expressions: A Pain in the Neck
for NLP / I.A. Sag, T. Baldwin, F. Bond, A.A. Copestake
// Proceedings of the Third International Conference
on Computational Linguistics and Intelligent
Text Processing (CICLing 2002). – Mexico City, 2002.
– P. 1–15.
Sheremetyeva, S. On Extracting Multiword
NP Terminology for MT / S. Sheremetyeva // Proceedings
of the 13th Annual Conference of the EAMT. –
Barcelona, 2009. – P. 205–212.
Shudo, K. A Comprehensive Dictionary of
Multiword Expressions / K. Shudo, A. Kurahone,T. Tanabe // Proceedings of the 49th Annual Meeting
of the Association for Computational Linguistics:
Human Language Technologies (ACL–HLT 2011). –
Vol. 1. – Portland, 2011. – P. 161–170.
Váradi, T. 2006. Multiword Units in an MT
Lexicon / T. Váradi // Proceedings of the Workshop on
Multi-Word Expressions in a Multilingual Context. –
Trento, 2006. – P. 73–78.
Ссылки
- На текущий момент ссылки отсутствуют.