Войти



Последние материалы

Золотые партнеры:

европейский аукцион

Бронзовые партнеры:

Тезаурусы в вопросно-ответных системах
Статьи
Автор: Лукашевич Н.В.   
02.11.2011 16:52

Тезаурусы в вопросно-ответных системах

Одним из активно развивающихся направлений в сфере информационного поиска является разработка вопросно-ответных систем.

Исследования в области создания вопросно-ответных систем были начаты в 60-е годы. В то время предполагалось, что ответ на вопрос должен искаться в специально подготовленных базах знаний. Второе рождение вопросно-ответные системы стали переживать с 90-х годов 20 века. Теперь вопросно-ответные системы, в подавляющем большинстве случаев, должны искать ответы в больших текстовых коллекциях. От традиционных информационно-поисковых систем вопросно-ответные системы отличаются тем, что должны предоставить пользователю не набор документов, которые наиболее релевантны поставленному вопросу, но выдать фрагмент текста, содержащий точный ответ на заданный вопрос.

В 1999 г. стало проводиться тестирование вопросно-ответных систем («вопросно-ответная дорожка») в рамках конференции TREC (Voorhees, 2004), с 2003 г. соревнования вопросно-ответных систем в многоязычном контексте начаты на конференции CLEF (Magnini и др., 2005).

Приведем примеры вопросов из конференции TREC:

What is the brightest star visible from the Earth? Какая звезда, видимая с Земли, является самой яркой?

Which is the Mozart birth date? Какова дата рождения Моцарта?

When did Hitler attack Soviet Union? Когда Гитлер напал на Советский Союз?

С 2001 г. в рамках вопросно-ответной дорожки конференции TREC стало уделяться особое внимание не только ответам на вопросы о фактах (фактоидные вопросы), но и вопросам на определения и вопросам, предполагающим в качестве ответов списки. В 2003 г. отдельные вопросы сменились тематическими группами вопросов, что может моделировать диалог пользователя с вопросно-ответной системой (Voorhees, 2004). Например, предлагалась такая группа запросов о писателе Франце Кафке:

7.  Where was Franz Kafka born?

(Где родился Франц Кафка? - фактоидный вопрос)

2.      When was he born?

(Где он родился? - фактоидный вопрос)

3.      What is his ethnic background?

(Кто он no национальности? - фактоидный вопрос)

4.      What books did he wrote?

(Какие книги он написал? - вопрос на получение списка ответов)

С 2007 г. на конференции TREC было предложено новое направление исследований в построении вопросно-ответных систем, а именно, поиск ответов на вопросы по блогам, причем коллекция блогов включает как тексты, написанные на хорошем английском языке, так и тексты с плохим английским, а также спамерские тексты.