| Краткий итог опубликованных статей о моделировании связности текста |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 06.11.2011 13:57 | |||
Краткий итог опубликованных статей о моделировании связности текстаИсследователи выделяют несколько взаимосвязанных между собой видов связности текста. Среди всех видов связности лексическая связность наилучшим образом поддается моделированию на основе информации, описанной в тезаурусах и онтологиях. При моделировании лексической связности существенным является не установление пар лексически связанных слов, а цепочек близких по смыслу слов, так называемых лексических цепочек. Получение таких лексических цепочек важно не само по себе, а как шаг к выявлению тематической структуры текста, т. е. определению основной темы и побочных тем (подтем) документа. Алгоритмы, основанные на лексических цепочках, использовались при решении различных задач автоматической обработки текстов. Особенно популярны методы, основанные на лексических цепочках, в задаче автоматического порождения аннотаций для одного и многих документов, поскольку именно в этой задаче особенно важно обеспечить связность порождаемой аннотации. Также лексические цепочки в автоматическом аннотировании помогают снизить излишние повторы в порождаемых аннотациях. Tags: Краткий итог опубликованных статей о моделировании связности текста Моделирование связности текста
|