| Слишком много значений в WordNet |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 04.10.2011 08:11 | |||
Проблемы представления лексической информации в WordNet:Слишком много значений в WordNetСерьезное обсуждение возникло по поводу описания значений многозначных слов в WordNet. Во многих работах признается, что различия значений в WordNet слишком тонки для таких компьютерных приложений, как машинный перевод, информационный поиск, классификация текстов, вопросно-ответные системы и др. В (Chugur и др., 2002) было показано, что среднее количество значений в WordNet больше, чем в традиционных лексикографических словарях. Особенно большое количество значений имеют глаголы и прилагательные. Так, глагол give имеет 44 значения, а прилагательное good- 21 значение. Некоторые из описанных значений плохо отделимы друг от друга. Например, значения глагола give: give5 и give 21. В обоих случаях в определении присутствует одно и то же слово bestow в том же значении: Give5: give, pay - (convey, as of a compliment, regards, attention, etc.; bestow; "Don't pay him any mind"; "give the orders"; "Give him my best regards"; "pay attention",) Give21: give, render- (bestow; "give homage"; "render thanks",) Часть выделенных значений сочетается только с узким набором слов, например, значение give19: Give 19: give - ("give (as medicine); "/ gave him the drug") - дать (как лекарство) Как известно, число значений тех или иных лексических единиц может значительно различаться в различных лексических ресурсах, словарях. Но большое количество значений в WordNet препятствует его применению в приложениях автоматической обработки текстов. Кроме того, проблема лексической многозначности для компьютерных приложений усугубляется тем, что синсеты WordNet, соответствующие близким по смыслу значениям многозначных слов, в большинстве случаев не имеют между собой никаких отношений. Эти проблемы привели к постановке вопроса о том, каким образом и какие типы значений многозначного слова могут быть объединены («кластеризованы») (Chugur и др., 2000; Peters и др., 2000; Agirre, Lacalle, 1996; McCarthy, 2006) для целей работы в приложениях автоматической обработки текстов, когда для значений многозначного слова из кластера можно не делать различий и это не приведет к снижению качества работы этого приложения. Для рассмотрения предложенных подходов кратко остановимся на выделяемых типах отношений между значениями отдельного слова.
|