| Отсутствие отношений между частями речи |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 04.10.2011 08:04 | |||
Проблемы представления лексической информации в WordNet:Отсутствие отношений между частями речи.Появление WordNet и возможность его свободного использования вызвали большое число исследований по применению этого тезауруса в самых различных приложениях автоматической обработки текстов. Большое количество экспериментов привело к массовому выявлению и обсуждению проблем и недостатков WordNet, препятствующих его эффективному применению. В данной группе статей мы рассмотрим некоторые из таких проблем, возникшие дискуссии, а также изменения в структуре новых версий WordNet, которые были сделаны в результате этих обсуждений.
При разработке WordNet был выдвинут принцип раздельного описания разных частей речи. Между различными частями речи, имеющими одинаковое значение, не было установлено никаких отношений. Так, например, такие синсеты, как adornl (украшать) и adornment! (процесс украшения), никак не были связаны между собой: Adornl - (make more attractive by adding ornament, colour, etc.) Adornment2 - (the action of decorating yourself with something colorful and interesting) Это вызывало серьезные проблемы в приложениях, поскольку одна и та же мысль могла быть выражена разными частями речи (Climent и др., 1996). Кроме того, в различных языках для выражения одной и той же идеи могут использоваться лексемы разных частей речи. Поэтому иерархии синсетов, построенные на основе конкретных частей речи, становятся в большой мере зависимыми от естественного языка разработки, поскольку в некотором естественном языке может не оказаться возможности выразить некоторое понятие той или иной частью речи. Начиная с версии WordNet 2.0 в ресурс были введены отношения между однокоренными синсетами, относящимися к разным частям речи и связанными между собой по смыслу. Такие отношения обозначаются RELATED ТО (Miller, Fellbaum, 2003): Adorn#vl - RELA TED TO —> adornment#n2 Abandon#vl - RELATED TO —> abandonment#n3 Rule#v6 - RELA TED TO -> rulerttn I Catch#v4 - RELA TED TO -> catcher#n 1 Всего было размечено 21.5 тысячи пар синеет существительного - синеет глагола. В настоящее время выполнена автоматизированная семантическая разметка отношений между синсетами разных частей речи (Clark и др., 2008), которая указывает специфическое семантическое отношение между существительным и глаголом: abandonment#n3 EVENT of abandon#vl ruler#nl INSTRUMENT of rule#v6 catcherttnl AGENT of catch#v4.
|