| Мулыпиграфы как база для порождения тематических узлов |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 17.01.2012 19:28 | |||
|
В Москве открылся великолепный центр лечения наркомании. Судя по фотографиям там прекрасные условия. Мулыпиграфы как база для порождения тематических узловКак мы уже указывали, построение лексических цепочек в большинстве подходов сводится, в конечном счете, к разбиению графа отношений между понятиями, упоминаемыми в тексте, на подграфы. По сути, та же процедура реализована и в процессе построения тематического представления - граф тезаурусной проекции разбивается на подграфы - совокупности тематических узлов. Для учета факторов построения тематического представления подходит представление распределения понятий текста в виде мультиграфа, т. е. графа с двумя типами дуг между вершинами. Один тип дуг, Rsent, отражает отношения между понятиями в тезаурусе. Другой тип дуг, Rtext, отражает совместную встречаемость понятий в предложениях текста. В вершинах мультиграфа указана частотность упоминания соответствующего понятия в тексте. На дугах Rtext отмечена частота встречаемости данной пары понятий в одних и тех же предложениях текста. Дуги Rsent указывают частотность упоминания данной пары понятия в пределах нескольких предложений (например се-ми предложений), но не в одном предложении текста (Loukachevitch, 2009b). Таким образом, мультиграф MG тематического представления может быть определен как MG = (V, fv, Rtext, frtext, Rsent, ftsent) (рис. 19.2).
Tags: Мулыпиграфы как база для порождения тематических узлов Тезаурус и построение тематического представления текста
|
