| Проблемы автоматического построения лексических цепочек |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 06.01.2012 19:31 | |||
Проблемы автоматического построения лексических цепочекОписания языковых выражений в тезаурусах могут использоваться для выявления лексической связности текста, что обычно делается посредством построения так называемых лексических цепочек - совокупностей языковых выражений текста, близких по смыслу. Основными критериями для построения лексических цепочек в большинстве подходов являются следующие: - наличие и сила связей между лексемами, описанных в некотором ресурсе, - расстояние между вхождениями лексем в тексте, измеряемое обычно в предложениях. Если расстояние от текущего слова до предшествующих вхождений лексической цепочки больше некоторого порога, то лексическая цепочка прерывается и начинается новая. Возникает вопрос, достаточно ли этих критериев для построения лексических цепочек. Второй вопрос - являются ли лексические цепочки такими уж очевидными, поскольку, как мы увидим ниже, эксперименты по сравнению лексических цепочек, выделенных разными людьми, показали достаточно серьезное расхождение в представленных лексических цепочках. Второй вопрос связан с первым, т. к. важно понять, является ли такая субъективность неизбежной, или не учитывается какой-либо важный критерий построения лексических цепочек. В следующих разделах мы рассмотрим вопросы критериев и субъективности выделения лексических цепочек подробнее. Tags: Проблемы автоматического построения лексических цепочек Тезаурус и построение тематического представления текста
|