Войти



Последние материалы

Золотые партнеры:

Дом-2: заказать суши на дом екатеринбург. Объявления о продаже квартир.

Серебряные партнеры:

Бронзовые партнеры:

Общие принципы организации EuroWordNet
Статьи
Автор: Лукашевич Н.В.   
04.10.2011 09:21

Общие принципы организации EuroWordNet

Первым проектом, который провозгласил цель построения ворднетов для нескольких европейских языков и в котором были сделаны попытки внести улучшения в структуру такого рода лингвистических ресурсов, был проект EuroWordNet, который включал в себя два этапа. На первом этапе (1996-1999 гг.) ворднеты создавались для голландского, испанского и итальянского языков. На втором этапе - для французского, чешского, немецкого и эстонского языков (Vossen, 1998; Vossen, 2003; Climent и др., 1996).

Поскольку проект EuroWordNet был многоязычным, то перед разработчиками стоял серьезный выбор, нужно ли стремиться к разработке языково-независимой структуры, с которой необходимо сопоставить единицы каждого языка, или, может быть, нужно иметь единую систему син-сетов - новая единица в иерархической сети может быть включена, если хотя бы один язык из рассматриваемых имеет лексему или устойчивый оборот с таким значением.

По принятому в проекте решению каждый ворднет должен сохранять специфику своего языка. При этом каждый ворднет должен содержать отсылки на значения Принстонского WordNet, что позволяет сравнивать ворднеты, обнаруживать непоследовательности в построении ворднетов и видеть различия в устройстве разных языковых систем.

Одновременно в рамках проекта была создана небольшая классификация верхнего уровня, к которой должен был приписан каждый создаваемый ворднет. Основные предполагаемые применения ворднетов - это предсказание той или иной возможной замены лексических единиц в тексте для целей информационного поиска, генерации текстов, машинного перевода, разрешения лексической многозначности.

Отношения между лексемами должны выявляться в процессе применения классических лингвистических тестов (Cruse, 1986).

Учитывая сложности, которые возникали при применении тезауруса WordNet в компьютерных приложениях, разработчики европейских ворднетов предложили ряд существенных нововведений в структуре создаваемых ворднетов.

Большой класс изменений касается описания отношений между синсета-ми, которые можно разделить на следующие группы:

- приписывание дополнительных атрибутов отношениям,

-       введение отношений между частями речи,

-        введение дополнительных отношений.