Войти



Советуем прочесть

Последние материалы

Золотые партнеры:

цена Пежо 4007

Серебряные партнеры:

В СНГ раскрутка сайтов на наилучших условиях.

Бронзовые партнеры:

Отношения онтологической зависимости и автоматическое расширение запроса
Статьи
Автор: Лукашевич Н.В.   
13.11.2011 14:07

Отношения онтологической зависимости и автоматическое расширение запроса

Нетрудно видеть, что различия в типах онтологических отношений понятий должны некоторым образом проявляться и в текстах, которые упоминают эти понятия.

Так, при строгой зависимости зависимое понятие не может быть оторвано от конкретного экземпляра главного понятия, поэтому если возникает, существует, обсуждается конкретный пример такого строго зависимого понятия, то существует и обсуждается пример главного понятия. В случае родовой зависимости конкретный пример зависимого понятия может быть оторван от главного понятия, с ним может происходить что-то, не связанное с главным понятием, но обычно недолго и в относительно небольшой доле примеров зависимого понятия. При исторической зависимости пример зависимого понятия может достаточно долго существовать без главного понятия и участвовать в самых разных ситуациях, например, сельскохозяйственная продукция создается в процессе сельскохозяйственного производства, затем продукция значимое время живет «своей жизнью»: перевозится, продается, хранится.

Различия в «жесткости связей» между понятиями для разных подтипов отношений онтологической зависимости ведут к различным видам поведения этих отношений в информационно-поисковом контексте. Рассмотрим эти различия на основе анализа поисковых результатов так называемых элементарных запросов.

Запросы в информационной системе могут состоять из различного числа терминов и слов. С точки зрения онтологии простейшим запросом является запрос, ссылающийся на одно понятие онтологии. Все другие запросы, ссылающиеся на два или более понятий, должны обрабатываться как функция от элементарного запроса.

Мы предполагаем, что потенциальное качество расширения запроса на базе отношений онтологии может изучаться на простых запросах. Если поисковые характеристики расширения элементарных запросов являются низкими, то качество расширения сложных поисковых запросов не может быть лучше. Если онтологические отношения дают возможность эффективного расширения запроса для простых случаев, то это является важным шагом для изучения способов расширения сложных запросов. Смысл такого рода элементарных запросов таков: «найти все о С», и мы будем обозначать его как SQ(C).

Рассмотрим два понятия С1 и С2, между которыми установлено отношение R. Выполняя простой запрос SQ(C7), мы хотим узнать, может ли отношение R с понятием С2 быть использовано для расширения этого простого запроса. При этом в выдачу по запросу SQ(C1) с некоторыми весами добавятся документы, содержащие С2. Следовательно, для проверки полезности такого расширения для запроса SQ(C1) не нужно выполнять реальную обработку поискового запроса с расширением, а нужно рассмотреть документы, содержащие С2, и выяснить, какой процент документов релевантен SQ(C7).

Мы будем изучать потенциальную эффективность расширения простого запроса для главного понятия М в отношении концептуальной зависимости текстами, в которых упомянуто зависимое понятие D. Для этого мы проанализировали 50 первых текстов, полученных по простому запросу SQ(D).

В качестве запроса задавались выражающие понятие слово или выражение. Тексты в выдаче упорядочивались на основе стандартной векторной модели tf*idf (Са11ап и др., 1992). Поиск был выполнен на коллекции Университетской Информационной Системы РОССИЯ (http://uisrussia.msu.ru/), содержащей более 800 тысяч документов.

Существует корреляция между типом зависимости и поисковыми характеристиками для простых запросов:

-        в случае строгой зависимости для практически всех текстов выполняется, что если текст релевантен зависимому понятию, то он релевантен и простому запросу для главного понятия;

-        в случае зависимости по классу число текстов, содержащих зависимое понятие и релевантных простому запросу для главного понятия в отношении концептуальной зависимости, меньше;

-        в случае исторической зависимости число текстов, релевантных обоим понятиям, значительно убывает.

Поисковые характеристики для обратной ситуации в первых четырех случаях (т. е. когда выполняем поиск по главному понятию и смотрим, какие из текстов релевантны зависимому понятию) низки, т. к. имеется множество текстов, упоминающих главное понятие и не имеющих никакого отношения к зависимому понятию. Одновременно наблюдается отсутствие зависимости понятия Мот понятия D.

В пятой строчке таблицы мы видим, что значительная доля текстов об автомобильных заводах релевантны простому запросу об автомобилях. При этом нужно заметить, что здесь имеется отношение концептуальной зависимости: автомобильный завод строится, чтобы выпускать автомобили - имеется отношение концептуальной зависимости по классу понятия АВТОМОБИЛЬНЫЙ ЗАВОД от понятия АВТОМОБИЛЬ.

Таким образом, рассмотрев 10 вариантов расширения запроса на основе пяти пар понятий, мы видим корреляцию между эффективностью использования отношения при расширении простого запроса и типом этого отношения в рамках теории онтологической зависимости.