| Понятия vs. синсеты как единицы тезауруса |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 08.11.2011 18:07 | |||
Понятия vs. синсеты как единицы тезаурусаСоздавая тезаурус РуТез, мы не стремимся отделить лексические знания от знаний о мире, что провозглашалось такими исследователями, как И.А. Мельчук (Мельчук, 1974) или Дж. Миллер (Lenat et al., 1995). Единицей описания в тезаурусе является не множество синонимичных слов или терминов, как в тезаурусе WordNet, а понятие, отражающее значимые классы сущностей, различаемых людьми в мире, в современной общественной жизни, в психической жизни людей. Такие сущности бесконечно разнообразны, обладают индивидуальными особенностями. Учет всех таких особенностей ведет к чрезвычайно запутанной картине мира (Kuznetsov и др., 2007; Cimiano и др., 2004), непригодной для прикладного применения. Значения слов и выражений, существующие в современных естественных языках, позволяют выделить главное, существенное для современной жизни людей. Так, например, созвездия выделяются из других возможных совокупностей звезд, поскольку помогают людям ориентироваться в пространстве и указывать местоположение объектов на звездном небе (Gangemi et al., 2001). При этом понятия тезауруса РуТез должны быть отличимы друг от друга, иметь уникальные свойства в системе понятий (см. «Понятия как единицы мышления и понятия в онтологиях»). Использование в качестве единиц тезауруса таких отличимых понятий позволяет единым образом представлять лексические значения литературного языка и значения терминов предметной области, более последовательно описывать систему отношений между понятиями и тем самым облегчает формальный вывод на отношениях, позволяет отображать единым образом систему значений разных языков (Добров, Лукашевич, 2005; Loukachevitch, 2009а).
Понятию может соответствовать несколько синонимичных текстовых выражений - текстовых входов понятия. Слова и словосочетания, значения которых представлены как ссылки на одни и те же понятия тезауруса, будем называть онтологическими синонимами. От онтологических синонимов не требуется, чтобы они могли заменять друг друга в каких-либо предложениях. Значения этих синонимов должны иметь одинаковый набор отношений с другими понятиями тезауруса. Таким образом, онтологическими синонимами могут являться: - слова, являющиеся разными частями речи (стабилизация, стабилизироваться, стабилизационный), т. е. дериваты, так называемые синонимы в широком смысле (Апресян, 1995), - языковые выражения, относящиеся к разным языковым стилям (коммунальная квартира, коммуналка), - однословные выражения, устойчивые выражения, свободные словосочетания, выражающие одно и то же понятие (аэропорт - воздушные ворота, газ - газообразное вещество). В частности, нейтральные и уменьшительные названия сущностей (стол, столик) мы относим к одному и тому же понятию (в отличие от русского WordNet - RussNet (Азарова и др., 2003)), поскольку, на наш взгляд, использование таких названий не приводит к реальному изменению соотношений между понятиями - любой стол может быть назван столиком в некотором контексте. Причем невозможно четко указать причины, по которым было употреблено уменьшительное название: стол был рассмотрен как маленький, как любимая вещь или просто это такая манера разговора. Если нет четкого, независимого от контекста различия между значениями, то отдельное понятие не заводится, Подобно FrameNet (Fillmore и др., 2003), несовершенный и совершенный виды одного и того же глагола (выбрать, выбирать) также рассматриваются как онтологические синонимы. Глаголы-делимитативы (Зализняк, Шмелев, 2000), описывающие некоторую «порцию» действия, оцениваемую как небольшая и ограниченная по времени, рассматриваются как онтологические синонимы к глаголу, от которого они образованы, например, погулять - гулять, почитать - читать, побегать - бегать и т. п. Однократные и многократные действия (куснуть - кусать, моргнуть - моргать, плюнуть - плевать) также описываются как онтологические синонимы. Таким образом, в тезаурусе РуТез мы пытаемся соблюдать правило разработки онтологии, заключающееся в том, чтобы разные имена одних и тех же сущностей не вели к образованию разных понятий, а были объединены как онтологические синонимы одного и того же понятия.
|