| Применение феноменологической модели |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 08.02.2012 05:05 | |||
Применение феноменологической моделиЗнания, описанные в тезаурусе, не могут быть полными, и в очередной формулировке запроса могут потребоваться знания, не отраженные в тезаурусе. Поэтому феноменологическая модель не применяется отдельно, а входит в состав многошаговой модели. Феноменологическая модель работает после комбинированной векторной модели. Найденные в формулировке понятия тезауруса упорядочиваются по количеству документов, в которых они упоминаются в этих 100 документах для работы феноменологической модели. Таким образом, предполагается, что булевские запросы феноменологической модели будут строиться на понятиях тезауруса, которые наиболее часто упоминаются в связи друг с другом. В результате работы модели и исполнения построенных булевских запросов «копилка» документов для дальнейшего анализа пополняется дополнительными документами. Кроме того, в процессе своей работы феноменологическая модель расширяет запрос понятиями тезауруса, которые не были упомянуты в запросе, и эти дополнительные понятия будут также придавать дополнительный вес найденным документам. Суть дальнейшего анализа документов заключается в том, чтобы дополнительно проанализировать все найденные на предыдущих этапах документы (100 документов от смешанной векторной модели и 30-100 документов от феноменологической модели). Наилучшими считаются документы, в которых максимальное число найденных элементов запроса найдено в 2 парах соседних предложений документа. Формула предложения дополняется еще и весом понятий тезауруса, которые не были упомянуты в формулировке запроса, но были получены в процессе расширения по феноменологической модели. Таким образом, вес отдельного предложения вычисляется следующим образом:
В дополнительных предложениях также учитываются дополнительно полученные понятия тезауруса. Полученный на основе оценки предложений вес документа комбинируется с исходным весом документа, полученным по векторной модели первого этапа. Таким образом, выполнение феноменологической модели дает возможность привлечь дополнительное число документов для последующего анализа и, кроме того, учесть вес понятий, полученных как расширение булева запроса. Качество комбинированной модели, включая феноменологическую модель, тестировалось на 165 запросах типа «формулировка проблемы» в юридической области экспертами-юристами на коллекции документов, отвечающих на такие вопросы (40 тысяч документов). Оценка производилась по показателю точности по первым пяти документам - precision (5). В результате было получено, что показатель precision (5) для алгоритма, использующего тезаурусные знания и феноменологическую модель, более чем на 12% превышает работу лучшего алгоритма, работающего только на основе слов (векторная модель + упорядочение по предложениям + комбинирование полученных весов). Tags: Применение феноменологической модели Использование комбинированных моделей для поиска документов по запросам типа «формулировка проблемы» в правовой области Информационный поиск с учетом тезаурусных знаний
|