Войти



Последние материалы

Серебряные партнеры:

окна пвх . Все для правильной осанки - реклинатор детский. Корректоры осанки.

Бронзовые партнеры:

Понятия как единицы мышления и понятия в онтологиях
Статьи
Автор: Лукашевич Н.В.   
06.10.2011 15:38

Понятия как единицы мышления и понятия в онтологиях

В литературе по компьютерным онтологиям трудно найти хорошее определение понятия как единицы онтологии. Б. Смит (Smith, 2004) указывает, что во многих случаях термин «понятие» используется вместо «слова», когда нужно абстрагироваться от конкретного естественного языка, специфических синтаксических особенностей. Иногда понятие - это идея, разделяемая людьми, использующими соответствующие слова или термины (Smith, 2004).

Тем не менее, можно отметить, что понятия современных онтологических ресурсов имеют прямые аналогии с философской классической теорией понятия (Margolis, Laurence, 2006), в которой понятие определяется как единица системы с уникальным набором свойств и отношений. В качестве примера такого «классического» определения понятия можно привести определение (Степанов, 1990):

Понятие - мысль, отражающая в обобщенной форме предметы и явления действительности посредством фиксации их свойств и отношений; последние (свойства и отношения) выступают в понятии как общие и специфические признаки, соотнесенные с классами предметов и явлений.

Таким образом, при определении понятия:

-        устанавливаются его существенные признаки (характеристики),

-        выявляются его связи с другими понятиями,

-        определяется его место в системе понятий данной области знания. Кроме того, значимым фактором рассмотрения понятий как единиц онтологии является их понимание как единиц, фиксирующих существующие знания о внешнем мире, предметной области (Smith, 2004; Gangemi и др., 2001b).

Такое понимание отражается в практических рекомендациях по введению понятий (классов) в компьютерных онтологиях. Так, во многих руководствах по разработке онтологии указывается, что важно различать класс (понятие онтологии) и его имя:

- классы представляют понятия предметной области, а не те слова, которые обозначают эти понятия;

- синонимы одного и того же понятия не представляют разные классы,   синонимы   -   всего   лишь   разные   имена   понятия   (Noy, McGuinness, 2001). Каждое понятие по определению должно быть элементом системы понятий и в то же время должно быть отделимо по своим свойствам от близких по смыслу понятий. В проектировании онтологии это положение раскрывается следующими рекомендациями по структуризации онтологии (Bouaud и др., 1995):

1)      Принцип сходства:

Принцип сходства контролирует сходство понятия по отношению к его родовому понятию. Нижестоящее понятие (понятие-потомок) должно разделять тип своего родового понятия (понятия-родителя). Таким образом, все понятия-потомки одного и того же понятия-родителя имеют между собой нечто общее. Отнесенность к типу понятия-родителя является необходимым условием описания понятия-потомка как видового по отношению к данному понятию-родителю. Потомок должен наследовать свойства родителя.

2)      Принцип специфичности:

Понятие-потомок должно отчетливо отличаться от понятия-родителя, что является необходимым и достаточным условием для понятия-потомка. Это отличие может выражаться в дополнительном свойстве, которое присуще потомку, или наличием дополнительных семантических ролей, например, при описании действий.

3)      Принцип оппозиции:

Понятие должно отчетливо отличаться от понятий одного уровня, и должно быть представлено различие между каждой парой понятий этого уровня.

Следствием из этих принципов является правило, что понятие-родитель должно иметь более одного понятия-потомка. Если понятие имеет только одно непосредственное понятие-потомок, то, возможно, при моделировании допущена ошибка или онтология неполная.

Рассмотрим, как на основе изложенных принципов анализируется конкретная онтология. В работе (Bodenreider и др., 2004) исследуется соответствие медицинского терминологического ресурса SNOWMED СТ следующим формальным онтологическим принципам:

-        каждое понятие должно иметь хотя бы одного родителя;

-        понятия, имеющие потомков, должны иметь по крайней мере двух потомков;

-        понятиям-потомкам следует иметь одного родителя;

-        описание каждого понятия-потомка должно отличаться от описания понятия-родителя;

-        все    роли    понятия-родителя    должны    наследоваться    понятием-потомком или уточняться;

- отличия понятия-потомка от понятия-родителя должны проявляться либо в уточнении заполнителя роли, либо во введении новой роли.

Исследование показало, что ресурс содержит 269864 понятия. 196237 понятий не имеют понятий-потомков - понятия-листья. Из 73267 понятий с понятиями-потомками, 23 174 понятия (31.5%) имеют только одно понятие-потомок. 8034 понятия имеют более 10 непосредственных потомков (11%), и 150 понятий имеют более 99 потомков, что, видимо, связано с недостаточной проработанностью классификации.

Каждое понятие, за исключением корня, имеет хотя бы одного родителя. Число родителей понятия может быть от 1 до 13. Из рассмотренных 377681 пар потомок-родитель 51% не проявили никакого различия между описаниями понятия-потомка и понятия-родителя.

В 7226 случаях некоторые роли, присутствующие у понятия-родителя, не наследовались и не уточнялись в понятии-потомке. В 21799 случаях, хотя у родителя и у потомка присутствует одна и та же роль, значения этой роли не являются идентичными, не состоят ни в таксономическом отношении, ни в отношении часть-целое. Обычно эта проблема возникает у понятий с множественными родителями: роль, которая не соответствует роли одного родителя, обычно находит свое соответствие с ролью другого родителя.

Качественный анализ понятий с одним понятием-потомком показал, что это явление может быть связано с тремя разными ситуациями:

-        неполнота описания;

-        единственное нижестоящее понятие представляет собой гибрид между двумя родительскими понятиями;

-        понятие-потомок и понятие-родитель не демонстрируют никаких отличий в описании, так что, скорее всего, нижестоящий класс является излишним.