Войти



Советуем прочесть

Последние материалы

Золотые партнеры:

Slando: продажа авто в Йошкар-Оле

Серебряные партнеры:

Продажа грузовых автомобилей в Челябинске на доске бесплатных объявлений Slando . Экономьте на Сландо - бесплатные объявления Бийска

Бронзовые партнеры:

Языковые выражения как текстовые входы понятий
Статьи
Автор: Лукашевич Н.В.   
12.11.2011 19:48

Языковые выражения как текстовые входы понятий

Каждое вводимое понятие должно быть снабжено списком слов и словосочетаний, с помощью которых можно сослаться в тексте на вводимое понятие -текстовых входов. В качестве таких текстовых входов могут быть отдельные слова (существительные, прилагательные, глаголы), а также именные и глагольные группы. Текстовый вход может быть многозначным (иметь другие значения), тогда он должен быть помечен как многозначный. Для лучшего распознавания в тексте текстовые входы тезауруса РуТез снабжаются последовательностью нормализованных форм всех составляющих многословного выражения (мужской род, именительный падеж, единственное число).

Языковые выражения (слова, словосочетания, термины), которые были описаны как текстовые входы одного и того же понятия, становятся неразличимыми с точки зрения РуТез онтологии - онтологическими синонимами.

В тезаурусе РуТез большое значение придается работе со словосочетаниями не только как с источниками новых понятий, но и в качестве пополнения синонимических рядов. Поскольку в процессе нашей работы выяснилось, что многие слова имеют многословные синонимы, то такие синонимы специально ищутся и ими пополняются синонимические ряды текстовых выражений, связанных с понятием. Такие многословные синонимы особенно важно найти для многозначных слов, поскольку многословные синонимы уже становятся однозначными.

Как уже указывалось в статье «Понятия vs. синсеты как единицы тезауруса», онтологические синонимы не всегда являются синонимами - в том смысле, что не всегда возможны замены в предложении одного онтологического синонима на другой, сохраняющие грамматическую правильность и логическую истинность предложения. Однако онтологические синонимы понятия должны быть эквивалентны относительно отношений этого понятия с другими понятиями тезауруса. Как показала практика, нарушение этого принципа, неаккуратное объединение языковых выражений в рамках ряда онтологических синонимов, рано или поздно проявляет себя в ошибках при автоматической обработке текстов: находится приложение, для которого неучтенное различие языковых выражений оказывается существенным.