| Краткий итог опубликованных статей о тезаурусе и построении тематического представления текста. |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 17.01.2012 19:52 | |||
|
Сейчас, в Москве лечение наркомании в стационаре осуществляется с гарантией. Краткий итог опубликованных статей о тезаурусе и построении тематического представления текста.На первый взгляд может показаться, что и человеку, и компьютеру выявить лексическую связность в связном тексте достаточно просто. Однако в экспериментах с людьми - аннотаторами была выявлена высокая субъективность выделения в тексте лексических цепочек близких по смыслу слов текста -такие цепочки являются основным инструментом моделирования лексической связности.
В этой группе статей мы показали, что для определения лексической связности в тексте недостаточно извлекать совокупности близких по смыслу слов и словосочетаний - для правильного формирования лексических цепочек необходимо учитывать взаимодействие упоминаемых сущностей в предложениях текста. Данное положение является следствием глобальной связности текста. Также из глобальной связности текста следует, что лексическая цепочка имеет внутреннюю структуру узла: все элементы цепочки должны иметь отношение к одному и тому же элементу цепочки - главному элементу цепочки, ее центру. Оба эти фактора позволяют строить лексические цепочки в соответствии с тематической структурой конкретного текста. На наш взгляд, учет этих факторов в экспериментах с людьми - аннотаторами даст в результате более высокий показатель согласия между аннотаторами при разметке лексических цепочек. Tags: Краткий итог опубликованных статей о тезаурусе и построении тематического представления текста Тезаурус и построение тематического представления текста
|