| Модели представления знаний в информационно-поисковых тезаурусах и тезаурусах типа WordNet |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 04.10.2011 10:27 | |||
Модели представления знаний в информационно-поисковых тезаурусах и тезаурусах типа WordNetРассмотрев основные принципы устройства информационно-поисковых тезаурусов и тезаурусов типа WordNet, можно сделать некоторые выводы о сходстве и различии используемых моделей представления знаний в этих тезаурусах. Наиболее бросающееся в глаза различие состоит в том, что информационно-поисковые тезаурусы описывают определенную предметную область, а WordNet содержит информацию о значениях общей лексики языка. Однако это различие не является принципиальным, поскольку, как указывалось в предыдущем разделе, можно строить тезаурусы типа WordNet и для конкретных предметных областей. Более значимые различия имеются в выборе единиц тезаурусов. В информационно-поисковых тезаурусах имеется множество ограничений на включение в тезаурус языковых единиц: дескрипторы должны быть четко отделены по смыслу друг от друга, многозначность языковых единиц практически не представлена, ограничивается глубина иерархий и т.д. Это приводит к возникновению существенного расхождения между единицами тезауруса и языковыми единицами, упоминаемыми в текстах предметной области. В тезаурусах типа Wordnet такой разницы нет: если существует слово или выражение с определенными значениями, то оно включается в тезаурус в соответствующем количестве значений. Существенно различным является подход к включению в эти два типа тезаурусов словосочетаний. В информационно-поисковых тезаурусах имеется достаточно подробный перечень правил, которыми должен руководствоваться разработчик тезауруса при вводе в тезаурус.
|