| Тезаурусы в вопросно-ответных системах |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 02.11.2011 16:52 | |||
Тезаурусы в вопросно-ответных системахОдним из активно развивающихся направлений в сфере информационного поиска является разработка вопросно-ответных систем. Исследования в области создания вопросно-ответных систем были начаты в 60-е годы. В то время предполагалось, что ответ на вопрос должен искаться в специально подготовленных базах знаний. Второе рождение вопросно-ответные системы стали переживать с 90-х годов 20 века. Теперь вопросно-ответные системы, в подавляющем большинстве случаев, должны искать ответы в больших текстовых коллекциях. От традиционных информационно-поисковых систем вопросно-ответные системы отличаются тем, что должны предоставить пользователю не набор документов, которые наиболее релевантны поставленному вопросу, но выдать фрагмент текста, содержащий точный ответ на заданный вопрос. В 1999 г. стало проводиться тестирование вопросно-ответных систем («вопросно-ответная дорожка») в рамках конференции TREC (Voorhees, 2004), с 2003 г. соревнования вопросно-ответных систем в многоязычном контексте начаты на конференции CLEF (Magnini и др., 2005). Приведем примеры вопросов из конференции TREC: What is the brightest star visible from the Earth? Какая звезда, видимая с Земли, является самой яркой? Which is the Mozart birth date? Какова дата рождения Моцарта? When did Hitler attack Soviet Union? Когда Гитлер напал на Советский Союз? С 2001 г. в рамках вопросно-ответной дорожки конференции TREC стало уделяться особое внимание не только ответам на вопросы о фактах (фактоидные вопросы), но и вопросам на определения и вопросам, предполагающим в качестве ответов списки. В 2003 г. отдельные вопросы сменились тематическими группами вопросов, что может моделировать диалог пользователя с вопросно-ответной системой (Voorhees, 2004). Например, предлагалась такая группа запросов о писателе Франце Кафке: 7. Where was Franz Kafka born? (Где родился Франц Кафка? - фактоидный вопрос) 2. When was he born? (Где он родился? - фактоидный вопрос) 3. What is his ethnic background? (Кто он no национальности? - фактоидный вопрос) 4. What books did he wrote? (Какие книги он написал? - вопрос на получение списка ответов) С 2007 г. на конференции TREC было предложено новое направление исследований в построении вопросно-ответных систем, а именно, поиск ответов на вопросы по блогам, причем коллекция блогов включает как тексты, написанные на хорошем английском языке, так и тексты с плохим английским, а также спамерские тексты.
|