| Автоматическое разрешение многозначности |
| Статьи | |||
| Автор: Administrator | |||
| 20.12.2011 17:31 | |||
Автоматическое разрешение многозначностиПри автоматической обработке текста на основе тезауруса РуТез первым этапом является сопоставление текста с единицами тезауруса и создание концептуального индекса, в котором указываются те понятия, которые встречались в тексте. Многозначность в этом индексе проявляется либо в сопоставлении одной и той же языковой единице разных понятий, либо в специальной пометке понятия, означающей, что текстовая единица, по которой было проведено сопоставление, является многозначной (см. «Ввод понятий для группы близких значений одного слова»).
Как указывалось ранее, на втором этапе строится так называемая проекция тезауруса для анализируемого текста. Проекция включает в себя понятия индекса и тезаурусные отношения между такими понятиями, которые входят в тезаурусную окрестность друг друга. В тезаурусную проекцию текста включаются и все варианты понятия, соответствующие многозначным текстовым входам тезауруса. Для них также выявляются все понятия, упомянутые в тексте и входящие в их тезаурусные окрестности. Для разрешения многозначности текстовых входов тезауруса были предложены и экспериментально проверены два метода: метод глобального подтверждения и метод взвешивания подтверждения от локального и глобального контекстов, которые мы рассмотрим в следующих разделах. Tags: Автоматическое разрешение многозначности Построение тезаурусного индекса разрешение лексической многозначности
|