| Понятия и значения в информационно-поисковых тезаурусах |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 06.10.2011 16:18 | |||
Понятия и значения в информационно-поисковых тезаурусахМы уже указывали, что информационно-поисковые тезаурусы можно рассматривать как лингвистические онтологии, поскольку их единицы - дескрипторы - обычно вводятся на основе реально существующих в предметной области терминов. Поскольку многие решения в области построения информационно-поисковых тезаурусов связаны со спецификой их применения в ручном индексировании, с удобством человека-индексатора, это находит непосредственное отражение в представлении в тезаурусе квазисинонимов и многозначных слов. Так, многие близкие по смыслу термины могут быть представлены в тезаурусе одним термином-дескриптором, а остальные не включаются в тезаурус совсем, поскольку их включение как дескрипторов увеличивает субъективность индексирования, а включение как аскрипторов может затруднить восприятие индексатора. Включение различных значений слов и выражений минимизируется, представительство возможных значений не является необходимым, поскольку в процессе использования тезауруса имеется человек-посредник. Однако в результате возникает серьезная разница между языком документов предметной области и единицами тезауруса, что затрудняет автоматическое применение тезауруса при обработке текста.
|