| Моделирование лексической связности на основе тезаурусов |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 03.11.2011 16:19 | |||
Моделирование лексической связности на основе тезаурусовПервой работой, в которой предлагалось использовать имеющиеся тезаурусы для автоматического выявления лексической связности текста в виде лексических цепочек и были предложены алгоритмы построения лексических цепочек на основе тезауруса Роже, была работа (Morris, Hirst, 1991). В работе указывалось, что лексическая связность возникает не только между парами слов, но связывает между собой группы слов текстового фрагмента, посвященного одной и той же теме. По определению авторов работы лексическая цепочка - это последовательность слов текста, в которой каждое следующее слова связано некоторым отношением с предшествующими словами цепочки. Лексические цепочки не останавливаются на границах предложений и могут проходить через целый текст. Авторы работы рассматривают лексические цепочки как важный шаг на пути к построению риторической и тематической структур текста. Эксперименты с использованием тезауруса Роже проводились вручную, поскольку на тот момент не существовало электронных версий тезауруса. С появлением тезауруса WordNet подавляющее большинство экспериментов по построению лексических цепочек было проведено с помощью этого тезауруса. Далее будут рассмотрены некоторые из подходов к построению лексических цепочек.
|