ОБ ЭКОНОМИИ УСИЛИЙ ПРИ РАЗРАБОТКЕ МНОГОЯЗЫЧНЫХ ЛИНГВИСТИЧЕСКИХ Е-РЕСУРСОВ

Светлана Олеговна Шереметьева, Никита Юрьевич Дюмин

Аннотация


Описана новая методика автоматизированного построения многоязычных
лексических ресурсов, позволяющая экономить усилия и время разработчиков.
Экономия достигается за счет повторного использования отдельных компонентов,
ранее разработанных для других языков и приложений, с их последующей адапта-
цией к выполнению новых задач и включением в разрабатываемую нами систему
на определенных этапах обработки языкового материала. Методика иллюстриру-
ется на примере извлечения эквивалентных именных групп для английского и рус-
ского языков.


Ключевые слова


электронные ресурсы, многоязычный лексикон, автоматиче- ская обработка текста, экономия усилий.

Полный текст:

PDF

Литература


Braune F., Fraser A. Improved Unsupervised Sentence

Alignment for Symmetrical and Asymmetrical Parallel Corpora

// Coling, Beijing, 2010.

Li P., Sun M., Xue P. Fast-Champollion: A Fast and Robust

Sentence Alignment Algorithm // Coling, Bejing, 2010.

Unsupervised Word Alignment with Arbitrary Feature /

Ch. Dyer, J. Clark, A. Lavie, N.A. Smith // ACL Portland,

Germann U. Yawat: Yet Another Word Alignment Tool //

ACL Columbus, 2008.

Lefever E., Macken L., Hoste V. Language-independent

bilingual terminology extraction from a multilingual parallel corpus // EACL Athens, 2009.

Sheremetyeva S.O. On extracting multiword NP terminology for MT // EAMT-2009, Universitat Politècnica de Catalunya,Barcelona, Spain. P. 205–212.

Шереметьева С.О., Дюмин Н.Ю., Мыларщикова Т.Ю.

О возможности межъязыкового переноса систем автоматической обработки текста // V МНПК «Прикладная лингвистика в науке и образовании». СПб., 2010. С. 345–350.


Ссылки

  • На текущий момент ссылки отсутствуют.