Войти



Последние материалы

Золотые партнеры:

Пластиковые окна для коттеджей. Интерактивная система расчета стоимости и заказа окон.

Серебряные партнеры:

Бронзовые партнеры:

Тезаурусы в информационном поиске
Статьи
Автор: Лукашевич Н.В.   
22.10.2011 18:37

Тезаурусы в информационном поиске

Современные модели информационного поиска не используют знаний, описанных в тезаурусах и онтологиях, а базируются на моделях текста как набора слов, предлагая изощренные методы учета частотностей встречаемости слов в предложении, тексте, наборе документов, совместной встречаемости слов и т. п.

Вместе с тем существуют типы запросов к поисковым системам, которые являются сложными для современных технологий информационного поиска, и, следовательно, качество поиска по этим запросам достаточно низкое. Исследованию таких запросов был посвящен специальный семинар под названием «Надежный доступ к информации» (Reliable Information Access), проведенный в 2003 г. В рамках этого семинара анализировались результаты поиска нескольких поисковых систем по трудным запросам, выявленным в рамках экспериментов конференции по информационному поиску TREC.

Обобщая результаты этих экспериментов, Д. Харман (Harman, 2005) указывала, что при проведении анализа исполнения трудных запросов шестью разными поисковыми системами было выявлено, что проблемы, возникающие в процессе обработки трудных запросов этими системами, были сходны в значительно большей степени, чем это ожидалось. Часто системы возвращали разные документы одного и того же класса, не сумев найти релевантные документы. Среди потенциальных методов, которые могли бы улучшить выдачу систем по таким запросам, указывались методы расширения запросов, в том числе и с использованием специальных ресурсов - тезаурусов.

В работе (Shah, Croft, 2004) в качестве одного из существенных факторов сложного запроса для современных информационных систем называлось расхождение между словесной формулировкой запроса и описанием релевантных ситуаций в документах коллекции, что, как показано в экспериментах, можно преодолеть с помощью тезаурусов.

Таким образом, одной из потенциальных возможностей преодоления проблем пословных моделей информационного поиска является встраивание в модели поиска знаний, описанных в онтологических ресурсах.

Целью этой главы является рассмотрение результатов работы методов, в которых для поиска документов в процессе автоматической обработки запроса используются тезаурусы и онтологии. Для такого изложения сначала необходимо кратко описать существующие модели информационного поиска.