Войти



Последние материалы

Золотые партнеры:

Автомобильные коврики EVA-DRIVE - коврики автомобильные. Автомобильные коврики NorPlast.

Серебряные партнеры:

Бронзовые партнеры:

Отношения часть-целое в информационно-поисковых тезаурусах и WordNet
Статьи
Автор: Лукашевич Н.В.   
10.10.2011 18:22

Отношения часть-целое в информационно-поисковых тезаурусах и WordNet

Как было указано в статьях «Иерархические отношения в информационно-поисковых тезаурусах» и «Отношение часть-целое в информационно-поисковых тезаурусах.», в рамках информационно-поисковых тезаурусов отношения часть-целое могут входить в состав иерархических отношений. Иерархические отношения обычно рассматриваются как несимметричные и транзитивные. При установлении иерархических отношений важна независимость от контекста.

В частности, в тех случаях, когда имеется множественная принадлежность части к целому, между такими терминами не должно устанавливаться иерархическое отношение. Между такими дескрипторами может быть установлено отношение ассоциации. Например, карбюраторы являются частями не только автомобилей. Поэтому дескрипторы КАРБЮРАТОР и АВТОМОБИЛЬ не должны быть связаны отношением часть-целое в информационно-поисковом тезаурусе (Will, 2004).

Таким образом, с точки зрения разработки информационно-поисковых тезаурусов не рекомендуется описывать как отношения часть-целое такие отношения, упомянутые в статье «Классификация отношений часть-целое». в качестве примеров этого отношения, как:

-        сталь - велосипед, поскольку сталь может быть в разных артефактах, не только в велосипеде;

-        рука - музыкант, поскольку руки есть не только у музыкантов;

-        кусок - пирог, поскольку многие другие вещи можно разделить на куски;

-        дерево -лес, поскольку деревья растут не только в лесу.

Подход к отношениям часть-целое в тезаурусе WordNet принципиально

другой. Как мы уже указывали в статье «Существительные в WordNet», отношения часть-целое устанавливаются в WordNet на основе лингвистического теста:

X является частью Y, если можно сказать, что X - это часть Y (An X is a part of Y) или Y имеет X как часть (A Y has an X as a part).

Внутри отношения часть-целое дополнительно выделяются отношения быть элементом {человек - часть человечества) и быть сделанным из (стекло - часть стеклянного изделия). Синсет-часть может быть сопоставлен большому количеству синсетов-целое, как, например, point (острие) может быть у стрелы, ножа, иголки, карандаша, булавки и т. п.

Приведем еще примеры различных отношений часть-целое из WordNet (табл. 1 - цифры во втором столбце таблицы означают номера значений слов в WordNet):

Таблица 1. Примеры отношений часть-целое в WordNet

Отметим, что к каждой паре приведенных примеров применимы лингвистические тесты, которые используются для диагностики отношения часть-целое (см. «Существительные в WordNet»). При этом очевидно, что многие из приведенных примеров отношений часть-целое в WordNet не могли бы быть установлены, в соответствии с рекомендациями, принятыми для информационно-поисковых тезаурусов, говорящими о том, что отношение часть-целое в информационно-поисковых тезаурусах должно устанавливаться в тех случаях, когда одно понятие включено в другое понятие независимо от контекста. Например, этому правилу не соответствуют такие пары, как:

Air - wind- не всякий воздух обязательно ветер,

Computer - computer network - не всякий компьютер входит в состав сети,

Snow - Snowball - не всякий снег входит в состав снежка,

Iron - Steel - не всякое железо входит в состав стали, и др.

Таким образом, мы видим, что методологии построения тезаурусов разного типа включают в себя существенно разные принципы установления отношений часть-целое.