Войти



Советуем прочесть

Последние материалы

Золотые партнеры:

Серебряные партнеры:

Бронзовые партнеры:

Автоматическое разрешение многозначности
Статьи
Автор: Administrator   
20.12.2011 17:31

Купить пищевые пластиковые емкости: упаковка для мороженного, пластиковые банки или пластиковые стаканчики


Автоматическое разрешение многозначности

При автоматической обработке текста на основе тезауруса РуТез первым этапом является сопоставление текста с единицами тезауруса и создание концептуального индекса, в котором указываются те понятия, которые встречались в тексте. Многозначность в этом индексе проявляется либо в сопоставлении одной и той же языковой единице разных понятий, либо в специальной пометке понятия, означающей, что текстовая единица, по которой было проведено сопоставление, является многозначной (см. «Ввод понятий для группы близких значений одного слова»).

 

Как указывалось ранее, на втором этапе строится так называемая проекция тезауруса для анализируемого текста. Проекция включает в себя понятия индекса и тезаурусные отношения между такими понятиями, которые входят в тезаурусную окрестность друг друга. В тезаурусную проекцию текста включаются и все варианты понятия, соответствующие многозначным текстовым входам тезауруса. Для них также выявляются все понятия, упомянутые в тексте и входящие в их тезаурусные окрестности.

Для разрешения многозначности текстовых входов тезауруса были предложены и экспериментально проверены два метода: метод глобального подтверждения и метод взвешивания подтверждения от локального и глобального контекстов, которые мы рассмотрим в следующих разделах.