Войти



Последние материалы

Золотые партнеры:

Серебряные партнеры:

Бронзовые партнеры:

Краткий итог опубликованных статей о тезаурусе и построении тематического представления текста.
Статьи
Автор: Лукашевич Н.В.   
17.01.2012 19:52

Сейчас, в Москве лечение наркомании в стационаре осуществляется с гарантией.


Краткий итог опубликованных статей о тезаурусе и построении тематического представления текста.

На первый взгляд может показаться, что и человеку, и компьютеру выявить лексическую связность в связном тексте достаточно просто. Однако в экспериментах с людьми - аннотаторами была выявлена высокая субъективность выделения в тексте лексических цепочек близких по смыслу слов текста -такие цепочки являются основным инструментом моделирования лексической связности.

 

В этой группе статей мы показали, что для определения лексической связности в тексте недостаточно извлекать совокупности близких по смыслу слов и словосочетаний - для правильного формирования лексических цепочек необходимо учитывать взаимодействие упоминаемых сущностей в предложениях текста. Данное положение является следствием глобальной связности текста. Также из глобальной связности текста следует, что лексическая цепочка имеет внутреннюю структуру узла: все элементы цепочки должны иметь отношение к одному и тому же элементу цепочки - главному элементу цепочки, ее центру.

Оба эти фактора позволяют строить лексические цепочки в соответствии с тематической структурой конкретного текста. На наш взгляд, учет этих факторов в экспериментах с людьми - аннотаторами даст в результате более высокий показатель согласия между аннотаторами при разметке лексических цепочек.