Войти



Последние материалы

Золотые партнеры:

Серебряные партнеры:

Бронзовые партнеры:

Мулыпиграфы как база для порождения тематических узлов
Статьи
Автор: Лукашевич Н.В.   
17.01.2012 19:28

В Москве открылся великолепный центр лечения наркомании. Судя по фотографиям там прекрасные условия.


Мулыпиграфы как база для порождения тематических узлов

Как мы уже указывали, построение лексических цепочек в большинстве подходов сводится, в конечном счете, к разбиению графа отношений между понятиями, упоминаемыми в тексте, на подграфы. По сути, та же процедура реализована и в процессе построения тематического представления - граф тезаурусной проекции разбивается на подграфы - совокупности тематических узлов.

Для учета факторов построения тематического представления подходит представление распределения понятий текста в виде мультиграфа, т. е. графа с двумя типами дуг между вершинами. Один тип дуг, Rsent, отражает отношения между понятиями в тезаурусе. Другой тип дуг, Rtext, отражает совместную встречаемость понятий в предложениях текста. В вершинах мультиграфа указана частотность упоминания соответствующего понятия в тексте. На дугах Rtext отмечена частота встречаемости данной пары понятий в одних и тех же предложениях текста. Дуги Rsent указывают частотность упоминания данной пары понятия в пределах нескольких предложений (например се-ми предложений), но не в одном предложении текста (Loukachevitch, 2009b).

Таким образом, мультиграф MG тематического представления может быть определен как MG = (V, fv, Rtext, frtext, Rsent, ftsent) (рис. 19.2).