| Числовая оценка семантической близости |
| Статьи | |||
| Автор: Administrator | |||
| 20.12.2011 18:04 | |||
|
Не растут позиции по продвигаемым запросам? Закажите технический аудит сайта. Пора выявить все проблемы! Числовая оценка семантической близостиСемантическая близость понятий, связанных путем той или иной конфигурации, зависит от особенностей пути между понятием-значением и подтверждающим понятием: - чем длиннее путь между понятиями, тем слабее семантическая близость; - наличие перегиба на пути ослабляет семантическую близость; - разные типы перегибов на пути могут по-разному влиять на семантическую близость; - перегиб пути на высоком уровне иерархии хуже, чем на более низком уровне. Кроме того, учитывался тот факт, что подтверждение от лексической единицы, которая в свою очередь многозначна, возможно, должно быть слабее. Так, в тексте примера во фрагменте «светила другая, куда более загадочная звезда» нахождение рядом слов светила и звезда приводит к трактовке обоих слов как небесных тел. Для учета такого рода рассуждений была применена следующая формула: Sim new (Cl, С2) = максимальный балл - длина пути -цена многозначности - цена перегиба - цена глобальности (18.1) Максимальный балл представляет собой максимально возможную оценку подтверждения, связанную с тем, что встретился однозначный синоним рассматриваемого многозначного термина. В настоящее время величина максимального балла равняется 10. Параметр цена глобальности составляет величину, большую нуля в случае оценки глобального контекста, и величину, равную нулю, при анализе локального контекста. Tags: Числовая оценка семантической близости Построение тезаурусного индекса разрешение лексической многозначности
|