Войти



Советуем прочесть

Последние материалы

Золотые партнеры:

Наборы и комплекты инструментов: narex инструмент. Выгодные инвестиции на Forex.

Серебряные партнеры:

квартира в ипотеку

Бронзовые партнеры:

Основные принципы разработки тезаурусов. Часть 3
Статьи
Автор: Лукашевич Н.В.   
01.10.2011 10:32

Основные принципы разработки тезаурусов. Часть 3

Таким образом, разработка хорошего информационно-поискового тезауруса представляет собой достаточно сложный, многоэтапный процесс,   в котором необходимо найти «золотую середину». С одной стороны, набор дескрипторов тезауруса должен быть достаточен для описания произвольного документа предметной области, с другой стороны, дескрипторов не должно быть слишком много, поскольку слишком большая величина тезауруса повышает субъективность индексирования и затрудняет развитие и использование тезауруса.

Не случайно значительная доля информационно-поисковых тезаурусов в самых широких областях включает не более 10 тысяч терминов и 6-7 тысяч дескрипторов. Широко известным исключением является Тезаурус по архитектуре и искусству (Тезаурус ААТ), содержащий более 30 тысяч дескрипторов, что, видимо, связано со спецификой соответствующей предметной области, когда нужно индексировать не столько документы, сколько конкретные музейные предметы.

Другим известным исключением, сверхбольшим тезаурусом, является тезаурус по медицине MeSH, что связано с гетерогенностью области медицины, состоящей из множества подобластей с собственной терминологией.