Войти



Последние материалы

Золотые партнеры:

Серебряные партнеры:

Бронзовые партнеры:

Проблемы автоматического построения лексических цепочек
Статьи
Автор: Лукашевич Н.В.   
06.01.2012 19:31

Проблемы автоматического построения лексических цепочек

Описания языковых выражений в тезаурусах могут использоваться для выявления лексической связности текста, что обычно делается посредством построения так называемых лексических цепочек - совокупностей языковых выражений текста, близких по смыслу.

Основными критериями для построения лексических цепочек в большинстве подходов являются следующие:

-        наличие и сила связей между лексемами, описанных в некотором ресурсе,

-        расстояние между вхождениями лексем в тексте, измеряемое обычно в предложениях. Если расстояние от текущего слова до предшествующих вхождений лексической цепочки больше некоторого порога, то лексическая цепочка прерывается и начинается новая.

Возникает вопрос, достаточно ли этих критериев для построения лексических цепочек.

Второй вопрос - являются ли лексические цепочки такими уж очевидными, поскольку, как мы увидим ниже, эксперименты по сравнению лексических цепочек, выделенных разными людьми, показали достаточно серьезное расхождение в представленных лексических цепочках. Второй вопрос связан с первым, т. к. важно понять, является ли такая субъективность неизбежной, или не учитывается какой-либо важный критерий построения лексических цепочек.

В следующих разделах мы рассмотрим вопросы критериев и субъективности выделения лексических цепочек подробнее.