| Учет локального и глобального контекстов |
| Статьи | |||
| Автор: Administrator | |||
| 20.12.2011 17:47 | |||
|
Контекстная реклама сайта - один из главных инструментов продаж с Вашего интернет-ресурса. Учет локального и глобального контекстовВ качестве локального контекста рассматривается фиксированная линейная окрестность многозначного вхождения слова, измеряемая в количестве найденных элементов тезауруса, - исследовался размер окна окрестности от 1 до 5 элементов в обе стороны. Также мы исследовали задание локального контекста как «динамического» окна N+N, т. е. сначала делается попытка выбора значения слова в окрестности длиной N - если это удается, то обработка данного вхождения заканчивается. Если не удается, то происходит расширение окрестности еще на N элементов и процедура выбора значения продолжается. Тестировались такие динамические окна, как 1 + 1, 2+2, 3+3. При использовании глобального контекста возникает вопрос о том, насколько в достаточно длинном тексте правомерно использование полного текста как базы для выбора значения, не нужно ли вводить некоторые ограничения, например, на расстояние (в абзацах, предложениях) между данным многозначным вхождением и упоминанием семантически близкого понятия в тексте. Так, в работе (Galley, McKeown, 2003) разные типы связи имеют разную сферу действия и разный вес в зависимости от такого рода расстояния, измеряемого в абзацах и предложениях. В процессе экспериментов нами была выбрана следующая специфика учета глобального контекста. В качестве элементов глобального контекста учитываются только однозначные вхождения тезаурусных единиц. Мы не накладываем никаких ограничений на расстояние между вхождением многозначного слова и семантически близкими словами. Предполагается, что возможное неправильное подтверждение от далекой части текста должно преодолеваться правильным подтверждением от локального контекста и более близкой части текста. Поскольку локальный контекст достаточно ограничен, а глобальный контекст может достигать весьма большой величины, то необходимо сбалансировать свидетельства в пользу того или иного значения, получаемые от локального и глобального контекстов. Прежде всего, вес подтверждения значения, получаемый от некоторой лексической единицы в локальном контексте, всегда выше, чем от той же единицы, расположенной вне локального контекста. Кроме того, мы тестировали возможность применения коэффициента, уменьшающего вес подтверждения от глобального контекста при увеличении длины текста (точнее, при увеличении максимальной частотности лексической единицы в тексте). Tags: Учет локального и глобального контекстов Построение тезаурусного индекса разрешение лексической многозначности
|