| Общие принципы организации EuroWordNet |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 04.10.2011 09:21 | |||
Общие принципы организации EuroWordNetПервым проектом, который провозгласил цель построения ворднетов для нескольких европейских языков и в котором были сделаны попытки внести улучшения в структуру такого рода лингвистических ресурсов, был проект EuroWordNet, который включал в себя два этапа. На первом этапе (1996-1999 гг.) ворднеты создавались для голландского, испанского и итальянского языков. На втором этапе - для французского, чешского, немецкого и эстонского языков (Vossen, 1998; Vossen, 2003; Climent и др., 1996). Поскольку проект EuroWordNet был многоязычным, то перед разработчиками стоял серьезный выбор, нужно ли стремиться к разработке языково-независимой структуры, с которой необходимо сопоставить единицы каждого языка, или, может быть, нужно иметь единую систему син-сетов - новая единица в иерархической сети может быть включена, если хотя бы один язык из рассматриваемых имеет лексему или устойчивый оборот с таким значением. По принятому в проекте решению каждый ворднет должен сохранять специфику своего языка. При этом каждый ворднет должен содержать отсылки на значения Принстонского WordNet, что позволяет сравнивать ворднеты, обнаруживать непоследовательности в построении ворднетов и видеть различия в устройстве разных языковых систем. Одновременно в рамках проекта была создана небольшая классификация верхнего уровня, к которой должен был приписан каждый создаваемый ворднет. Основные предполагаемые применения ворднетов - это предсказание той или иной возможной замены лексических единиц в тексте для целей информационного поиска, генерации текстов, машинного перевода, разрешения лексической многозначности. Отношения между лексемами должны выявляться в процессе применения классических лингвистических тестов (Cruse, 1986). Учитывая сложности, которые возникали при применении тезауруса WordNet в компьютерных приложениях, разработчики европейских ворднетов предложили ряд существенных нововведений в структуре создаваемых ворднетов. Большой класс изменений касается описания отношений между синсета-ми, которые можно разделить на следующие группы: - приписывание дополнительных атрибутов отношениям, - введение отношений между частями речи, - введение дополнительных отношений.
|