Войти



Последние материалы

Золотые партнеры:

Новое про холодильник купить киев. Холодильник украина по адресу Киев, Московский, 8

Серебряные партнеры:

Бронзовые партнеры:

Модели представления знаний в информационно-поисковых тезаурусах и тезаурусах типа WordNet
Статьи
Автор: Лукашевич Н.В.   
04.10.2011 10:27

Модели представления знаний в информационно-поисковых тезаурусах и тезаурусах типа WordNet

Рассмотрев основные принципы устройства информационно-поисковых тезаурусов и тезаурусов типа WordNet, можно сделать некоторые выводы о сходстве и различии используемых моделей представления знаний в этих тезаурусах.

Наиболее бросающееся в глаза различие состоит в том, что информационно-поисковые тезаурусы описывают определенную предметную область, а WordNet содержит информацию о значениях общей лексики языка. Однако это различие не является принципиальным, поскольку, как указывалось в предыдущем разделе, можно строить тезаурусы типа WordNet и для конкретных предметных областей. Более значимые различия имеются в выборе единиц тезаурусов.

В информационно-поисковых тезаурусах имеется множество ограничений на включение в тезаурус языковых единиц: дескрипторы должны быть четко отделены по смыслу друг от друга, многозначность языковых единиц практически не представлена, ограничивается глубина иерархий и т.д. Это приводит к возникновению существенного расхождения между единицами тезауруса и языковыми единицами, упоминаемыми в текстах предметной области. В тезаурусах типа Wordnet такой разницы нет: если существует слово или выражение с определенными значениями, то оно включается в тезаурус в соответствующем количестве значений.

Существенно различным является подход к включению в эти два типа тезаурусов словосочетаний. В информационно-поисковых тезаурусах имеется достаточно подробный перечень правил, которыми должен руководствоваться разработчик тезауруса при вводе в тезаурус.