| Отношения часть-целое в информационно-поисковых тезаурусах и WordNet |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 10.10.2011 18:22 | |||
Отношения часть-целое в информационно-поисковых тезаурусах и WordNetКак было указано в статьях «Иерархические отношения в информационно-поисковых тезаурусах» и «Отношение часть-целое в информационно-поисковых тезаурусах.», в рамках информационно-поисковых тезаурусов отношения часть-целое могут входить в состав иерархических отношений. Иерархические отношения обычно рассматриваются как несимметричные и транзитивные. При установлении иерархических отношений важна независимость от контекста. В частности, в тех случаях, когда имеется множественная принадлежность части к целому, между такими терминами не должно устанавливаться иерархическое отношение. Между такими дескрипторами может быть установлено отношение ассоциации. Например, карбюраторы являются частями не только автомобилей. Поэтому дескрипторы КАРБЮРАТОР и АВТОМОБИЛЬ не должны быть связаны отношением часть-целое в информационно-поисковом тезаурусе (Will, 2004). Таким образом, с точки зрения разработки информационно-поисковых тезаурусов не рекомендуется описывать как отношения часть-целое такие отношения, упомянутые в статье «Классификация отношений часть-целое». в качестве примеров этого отношения, как: - сталь - велосипед, поскольку сталь может быть в разных артефактах, не только в велосипеде; - рука - музыкант, поскольку руки есть не только у музыкантов; - кусок - пирог, поскольку многие другие вещи можно разделить на куски; - дерево -лес, поскольку деревья растут не только в лесу. Подход к отношениям часть-целое в тезаурусе WordNet принципиально другой. Как мы уже указывали в статье «Существительные в WordNet», отношения часть-целое устанавливаются в WordNet на основе лингвистического теста: X является частью Y, если можно сказать, что X - это часть Y (An X is a part of Y) или Y имеет X как часть (A Y has an X as a part). Внутри отношения часть-целое дополнительно выделяются отношения быть элементом {человек - часть человечества) и быть сделанным из (стекло - часть стеклянного изделия). Синсет-часть может быть сопоставлен большому количеству синсетов-целое, как, например, point (острие) может быть у стрелы, ножа, иголки, карандаша, булавки и т. п. Приведем еще примеры различных отношений часть-целое из WordNet (табл. 1 - цифры во втором столбце таблицы означают номера значений слов в WordNet): Таблица 1. Примеры отношений часть-целое в WordNet
Отметим, что к каждой паре приведенных примеров применимы лингвистические тесты, которые используются для диагностики отношения часть-целое (см. «Существительные в WordNet»). При этом очевидно, что многие из приведенных примеров отношений часть-целое в WordNet не могли бы быть установлены, в соответствии с рекомендациями, принятыми для информационно-поисковых тезаурусов, говорящими о том, что отношение часть-целое в информационно-поисковых тезаурусах должно устанавливаться в тех случаях, когда одно понятие включено в другое понятие независимо от контекста. Например, этому правилу не соответствуют такие пары, как: Air - wind- не всякий воздух обязательно ветер, Computer - computer network - не всякий компьютер входит в состав сети, Snow - Snowball - не всякий снег входит в состав снежка, Iron - Steel - не всякое железо входит в состав стали, и др. Таким образом, мы видим, что методологии построения тезаурусов разного типа включают в себя существенно разные принципы установления отношений часть-целое.
|
