Войти



Последние материалы

Золотые партнеры:

горящие путевки

Серебряные партнеры:

продажа автомобилей в Якутске - http://auto.sakha.slando.ru/yakutsk/24181_1.html. . отделка квартир под ключ

Бронзовые партнеры:

Слишком много значений в WordNet
Статьи
Автор: Лукашевич Н.В.   
04.10.2011 08:11

Проблемы представления лексической информации в WordNet:

Слишком много значений в WordNet

Серьезное обсуждение возникло по поводу описания значений многозначных слов в WordNet. Во многих работах признается, что различия значений в WordNet слишком тонки для таких компьютерных приложений, как машинный перевод, информационный поиск, классификация текстов, вопросно-ответные системы и др. В (Chugur и др., 2002) было показано, что среднее количество значений в WordNet больше, чем в традиционных лексикографических словарях.

Особенно большое количество значений имеют глаголы и прилагательные. Так, глагол give имеет 44 значения, а прилагательное good- 21 значение.

Некоторые из описанных значений плохо отделимы друг от друга. Например, значения глагола give: give5 и give 21. В обоих случаях в определении присутствует одно и то же слово bestow в том же значении:

Give5: give, pay - (convey, as of a compliment, regards, attention, etc.; bestow; "Don't pay him any mind"; "give the orders"; "Give him my best regards"; "pay attention",)

Give21: give, render- (bestow; "give homage"; "render thanks",)

Часть выделенных значений сочетается только с узким набором слов, например, значение give19:

Give 19: give - ("give (as medicine); "/ gave him the drug") - дать (как лекарство)

Как известно, число значений тех или иных лексических единиц может значительно различаться в различных лексических ресурсах, словарях. Но большое количество значений в WordNet препятствует его применению в приложениях автоматической обработки текстов. Кроме того, проблема лексической многозначности для компьютерных приложений усугубляется тем, что синсеты WordNet, соответствующие близким по смыслу значениям многозначных слов, в большинстве случаев не имеют между собой никаких отношений.

Эти проблемы привели к постановке вопроса о том, каким образом и какие типы значений многозначного слова могут быть объединены («кластеризованы») (Chugur и др., 2000; Peters и др., 2000; Agirre, Lacalle, 1996; McCarthy, 2006) для целей работы в приложениях автоматической обработки текстов, когда для значений многозначного слова из кластера можно не делать различий и это не приведет к снижению качества работы этого приложения.

Для рассмотрения предложенных подходов кратко остановимся на выделяемых типах отношений между значениями отдельного слова.