Войти



Советуем прочесть

Последние материалы

Золотые партнеры:

4 Магистральная - все здесь: Переходы магистральных нефтегазопроводов.

Серебряные партнеры:

Каркасные дома из GREEN BOARD: каркасный дом технология. WWF про пассивные дома.

Бронзовые партнеры:

Ввод понятий для группы близких по смыслу слов
Статьи
Автор: Лукашевич Н.В.   
08.11.2011 18:19

Ввод понятий для группы близких по смыслу слов

Как известно, в естественном языке есть значительно количество близких по смыслу групп слов – квазисинонимов. Выделяя понятия на основе значений таких квазисинонимов, мы пытаемся обеспечить, чтобы введенное понятие имело четкое, независимое от контекста, отличие от родового понятия и от так называемых понятий-сестер, то есть видовых понятий к тому же родовому понятию.

Поскольку в настоящее время понятия тезауруса РуТез не имеют внутренней структуры в виде фреймовых элементов или атрибутов, то отличительные свойства понятия могут проявляться в наборе отношений с другими понятиями или в особенностях, ассоциированных с понятием онтологических синонимов.

Таким образом, основными принципами работы с квазисинонимами являются следующие:

-        необходимо искать различия между квазисинонимами, которые не исчезают в зависимости от контекста употребления квазисинонимов и приводят к формированию разных рядов онтологических синонимов или к разным отношениям с другими понятиями,

-        найденные различия между квазисинонимами фиксируются вводом понятий с однозначными именами.

Работу с квазисинонимами рассмотрим на примере плохо различимых синсетов из WordNet, отражающих значение сходства.

На первом шаге необходимо выделить наиболее существенные для тезаурусного описания признаки квазисинонимов, то есть такие признаки, в зависимости от которых требуется установление разных отношений с другими понятиями тезауруса.

В совокупности английских слов со значением сходства (similarity) таким элементом значения является, например, сходство по внешним характеристикам:

likeness, alikeness, similitude - (similarity in appearance or character or nature between persons or things; "man created God in his own likeness" ) - сходство no внешности, характеру или природе между людьми или объектами.

resemblance - (similarity in appearance or external or superficial details).

Это означает, что в языке значимым является сходство по внешним характеристикам и нужно отразить этот факт соответствующим понятием.

На втором шаге необходимо подыскать подходящее название такому понятию. В качестве названия может выступать однозначное словосочетание, однозначное слово с таким значением или пара синонимов, пересечение значений которых однозначно идентифицирует данное понятие.

В случае квазисинонимов к слову similarity таким названием понятия может служить словосочетание Similarity in appearance. Данное словочетание активно используется носителями английского языка - так, поисковая система Google выдает 34700 страниц в ответ на поисковый запрос «Similarity in appearance». Понятие вводится в тезаурус с таким названием (рис. 16.1).

На третьем шаге необходимо найти разные способы выражения этого же понятия в виде словосочетаний и отдельных слов, например: resemblance in appearance, similarity of appearance, external resemblance и др. Все эти варианты добавляются в качестве текстовых входов к понятию.

На четвертом шаге слова с расплывчатым значением, которые могут употребляться и в более узком, и в более широком значении, вводятся как текстовые входы к нескольким понятиям. Например, слово resemblance, которое часто выражает внешнее сходство, но может использоваться и для выражения сходства вообще, указывается и как текстовый вход к понятию SIMILARITY IN APPEARANCE, и как текстовый вход к более общему понятию SIMILARITY (рис. 16.1).

Если независимых от контекста характеристик для различения значений квазисинонимов найти не удается, необходимо представить их в виде одного понятия. Для большей ясности имя такого понятия может быть представлено как пара соединенных в этом понятии синонимов.

В качестве основы для примера представления значений квазисинонимов на русском языке возьмем синонимические ряды, приведенные в синонимическом словаре НОСС (Апресян и др., 2003). Этот словарь интересен тем, что его словарная статья содержит подробный перечень сходных черт и различий синонимов. На основе такой словарной статьи разбора удобно показать, какие различия приводят к представлению синонимического ряда словаря в виде онтологических синонимов одного и того же понятия (т. е. такой же синонимический ряд сохраняется и в рамках тезауруса РуТез), а для значений каких слов, представленных в данном словаре как синонимы введены несколько понятий, и, таким образом, в рамках тезауруса РуТез они синонимами не являются.

В качестве первого примера рассмотрим пару синонимов памятник, монумент.

В словаре НОСС (Апресян и др., 2003, стр. 257) указываются следующие различия этой пары слов:

-        в память о конкретном человеке обычно ставится памятник, о группе людей - и памятник, и монумент, о событии - монумент; идеи воплощаются в монументах;

-        у монументов есть способность увековечивать подвиг живых людей;

-        по форме сооружения памятник часто представляет собой изображение увековечиваемого объекта;

-        монумент обычно больше по размерам;

-        пропагандистская роль больше свойственна монументам.

Анализ примеров употребления этих синонимов показывает, что вышеприведенные различия выполняются лишь по умолчанию, имеется достаточное число примеров употребления обоих синонимов в связи со всеми возможными типами увековечиваемых сущностей:

В память о конкретном человеке может быть установлен монумент:

Монумент выдающемуся исследователю севера Западной Сибири, лесоводу, этнографу Александру Дунину-Горкавичу торжественно откроется в Ханты-Мансийске.

В память события может быть установлен памятник:

На Пролетарской площади вновь оборудован сквер, в котором установлен памятник Победы.

Памятник может быть поставлен идее:

Он сказал, что это не первая акция вандалов в отношении памятника русско-армянской дружбы.

Памятник может быть поставлен при жизни:

 

Маргарет Тэтчер, которой в Британии при жизни поставили памятник, узнана, что американцы ее называли "провинциальной матроной".

Кроме того, авторы словаря указывают, что различия нейтрализуются при повторной, сокращенной номинации того же сооружения (там же, стр. 258):

На площади установлен первый памятник нашего города - основателю Петербурга. Монумент был открыт в 1782 г.

Таким образом, у слов монумент и памятник не нашлось ни одного четкого различающего свойства или отношения, которые бы привели к отнесению значений этих слов к разным понятиям, и эти два слова должны рассматриваться как онтологические синонимы.

В качестве второй пары синонимов, которую мы проанализируем с помощью словаря НОСС (Апресян и др., 2003), рассмотрим пару слов водитель, шофер. При рассмотрении этих слов авторы словаря указывают следующее различие: «шофер управляет только автомобилем или автобусом, водитель - и другими транспортными средствами (стр. 53)». Из этого замечания понятно, что шофер и водитель не могут быть онтологическими синонимами, поскольку водитель должен иметь отношения с понятиями, соответствующими словам вагоновожатый, судоводитель, а шофер - нет. Это означает, что для отражения значений этих слов необходимо введение, по крайней мере, двух понятий с названиями ВОДИТЕЛЬ ТРАНСПОРТНОГО СРЕДСТВА и ВОДИТЕЛЬ АВТОМОБИЛЯ. Видовыми понятиями для понятия ВОДИТЕЛЬ ТРАНСПОРТНОГО СРЕДСТВА будут такие понятия, как ВАГОНОВОЖАТЫЙ, СУДОВОДИТЕЛЬ (см. рис. 16.2).

В то же время носители языка ощущают эти слова как синонимы (см. также: Александрова, 1999). Чтобы отразить и это ощущение, и способность расширительного употребления, необходимо слово водитель представить как текстовый вход к двум понятиям ВОДИТЕЛЬ ТРАНСПОРТНОГО СРЕДСТВА и ВОДИТЕЛЬ АВТОМОБИЛЯ.

Сначала представляется, что слово шофер должно быть отнесено как текстовое выражение к понятию ВОДИТЕЛЬ АВТОМОБИЛЯ, но можно заметить, что водители автомобилей могут быть и любителями, и профессиональными работниками, а слово шофер все-таки относится к профессиональным водителям. Таким образом, онтологический анализ пары синонимов показал, что для адекватного отражения системы понятий, скрывающихся за близкими по смыслу словами водитель и шофер, нужно использовать три понятийные единицы: ВОДИТЕЛЬ ТРАНСПОРТНОГО СРЕДСТВА, ВОДИТЕЛЬ АВТОМОБИЛЯ, ШОФЕР (ПРОФЕССИОНАЛЬНЫЙ ВОДИТЕЛЬ) (см. рис. 16.2).

Необходимость принятия решений о представлении значений близких по смыслу языковых выражений посредством совокупности понятий возникает и в конкретных предметных областях.

Так, ситуации кредитования соответствуют такие слова и словосочетания, как: кредитование, кредит, кредитная услуга, кредитное обслуживание, кредитная операция, выделение кредита, выдача кредита, выделение кредитных средств, предоставление кредита и др. Имеется специфика употребления конкретных выражений из этого списка. Однако неправильным является введение дополнительных понятий онтологии для отражения именно специфики употребления. И в данном случае каждое вводимое понятие должно иметь четкий набор отличительных отношений. До тех пор, пока такие отличия не выделены, все такие выражения должны представляться как онтологические синонимы.