Войти



Последние материалы

Золотые партнеры:

Стадии развития целлюлита. Целлюлит - женская привилегия.

Серебряные партнеры:

Бронзовые партнеры:

Моделирование лексической связности на основе тезаурусов
Статьи
Автор: Лукашевич Н.В.   
03.11.2011 16:19

Моделирование лексической связности на основе тезаурусов

Первой работой, в которой предлагалось использовать имеющиеся тезаурусы для автоматического выявления лексической связности текста в виде лексических цепочек и были предложены алгоритмы построения лексических цепочек на основе тезауруса Роже, была работа (Morris, Hirst, 1991).

В работе указывалось, что лексическая связность возникает не только между парами слов, но связывает между собой группы слов текстового фрагмента, посвященного одной и той же теме. По определению авторов работы лексическая цепочка - это последовательность слов текста, в которой каждое следующее слова связано некоторым отношением с предшествующими словами цепочки. Лексические цепочки не останавливаются на границах предложений и могут проходить через целый текст. Авторы работы рассматривают лексические цепочки как важный шаг на пути к построению риторической и тематической структур текста.

Эксперименты с использованием тезауруса Роже проводились вручную, поскольку на тот момент не существовало электронных версий тезауруса. С появлением тезауруса WordNet подавляющее большинство экспериментов по построению лексических цепочек было проведено с помощью этого тезауруса.

Далее будут рассмотрены некоторые из подходов к построению лексических цепочек.