Войти



Последние материалы

Золотые партнеры:

Серебряные партнеры:

Бронзовые партнеры:

Краткий итог опубликованных статей о моделировании связности текста
Статьи
Автор: Лукашевич Н.В.   
06.11.2011 13:57

Краткий итог опубликованных статей о моделировании связности текста

Исследователи выделяют несколько взаимосвязанных между собой видов связности текста. Среди всех видов связности лексическая связность наилучшим образом поддается моделированию на основе информации, описанной в тезаурусах и онтологиях.

При моделировании лексической связности существенным является не установление пар лексически связанных слов, а цепочек близких по смыслу слов, так называемых лексических цепочек. Получение таких лексических цепочек важно не само по себе, а как шаг к выявлению тематической структуры текста, т. е. определению основной темы и побочных тем (подтем) документа.

Алгоритмы, основанные на лексических цепочках, использовались при решении различных задач автоматической обработки текстов. Особенно популярны методы, основанные на лексических цепочках, в задаче автоматического порождения аннотаций для одного и многих документов, поскольку именно в этой задаче особенно важно обеспечить связность порождаемой аннотации. Также лексические цепочки в автоматическом аннотировании помогают снизить излишние повторы в порождаемых аннотациях.