Войти



Последние материалы

Серебряные партнеры:

Купить шары черлидеры. Черлидеры помпоны.

Бронзовые партнеры:

Ворднет итальянского языка MultiWordNet
Статьи
Автор: Лукашевич Н.В.   
04.10.2011 10:08

Ворднет итальянского языка MultiWordNet

Основной моделью построения MultiWordNet (http://multiwordnet.itc.it, (Pianta и др., 2002)) является разработка его синсетов в максимально полном соответствии с синсетами Принстонского ворднета, т. е. итальянские синсеты вводятся на основе существующих английских синсетов, отношения между итальянскими синсетами импортируются из Принстонского ворднета. В тех случаях, когда для очередного англоязычного синсета в итальянском языке нет переводного эквивалента или имеется приблизительный (более специфический или более общий эквивалент), то вводятся специальные «пустые» синсеты.

В связи с принятой технологией разработки отношения MultiWordNet практически полностью повторяют отношения Принстонского WordNet, добавлено только отношение NEAREST, соединяющее в случае лексической лакуны итальянский синеет с ближайшим по смыслу англоязычным синсетом (или синсетами). Разработка ресурса выполнялась автоматизированным методом с помощью двуязычного словаря с последующей ручной проверкой.

MultiWordNet в 2005 г. включал 58 тысяч лексических значений итальянского языка, 41500 разных лемм (слов в словарной форме), 32700 синсетов, для которых установлены соответствия с англоязычными синсетами Принстонского ворднета. MultiWordNet также включает разметку пометами предметных областей.

Основное отличие своего ресурса от другого итальянского ворднета ItalWordNet (Roventini и др., 2000) разработчики MultiWordNet видят в более тесной связи своего ресурса с англоязычным ворднетом, когда для каждого итальянского синсета сразу устанавливается отношение с англоязычным синсетом. Впрочем, разработчики понимают, что такая модель разработки могла привести к заимствованию чуждых для итальянского языка лексических и семантических отношений, которые по необходимости будут устраняться.