| Принципы описания отношений часть-целое |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 13.11.2011 13:02 | |||
Принципы описания отношений часть-целоеОдним из важных свойств, которые часто постулируются у отношения часть-целое, является транзитивность этого отношения. В то же время многие исследователи указывают на нарушения его транзитивности. Мы уже подробно обсуждали разные точки зрения, высказываемые по поводу этой проблемы. Если обсуждать наследование свойств по отношению часть-целое в ресурсе, предназначенном для автоматической обработки текстов в информационно-поисковых приложениях, то наиболее важной операцией, которую необходимо обеспечить, является релевантность обсуждения частей обсуждению целого. То есть необходимо описывать отношения часть-целое так, что если текст или его некоторый фрагмент посвящен обсуждению части, то с большой вероятностью этот текст (или его фрагмент) будет релевантен и обсуждению целого (Лукашевич, 2007а). Здесь может быть приведено следующее возражение: если в тексте говорится о покупке деталей автомобиля, это не означает, что текст обсуждает покупку автомобиля. Мы этого и не утверждаем. Ясно, однако, что текст, обсуждающий покупку деталей автомобиля, релевантен поиску по обобщенному запросу «Автомобили». Важным условием для обеспечения такого наследования, на наш взгляд, является зависимость (см. ««Вертикальные» отношения между частью и целым») существования части от существования целого. Действительно, если все существование некоторой части связано с существованием целого, то и тексты, обсуждающие эту часть, будут иметь непосредственное отношение и к целому, даже если это целое в тексте явно не упомянуто. Этим требованием мы обеспечиваем выполнение рекомендации тезаурусных стандартов в том, что описание иерархических отношений должно быть независимо от контекста их упоминания. Описание таких независимых от контекста, «надежных» отношений в ресурсах, предназначенных для автоматической обработки текстов, имеет большое значение, поскольку в автоматическом режиме часто бывает невозможно использовать контекст для подтверждения существования того или иного отношения. Зависимость части от целого не влечет эксклюзивности части по отношению к целому, т. е. того, что у части ровно одно непосредственное целое. Например, локоть является частью руки человека и одновременно частью костной системы, при этом локоть является зависимой частью и для руки человека, и для костной системы. Накладывая условие зависимости частей от целого, мы не ограничиваем подвиды частей. При таком разнообразии отношений часть-целое важно отделять это отношение от других видов отношений. Для этого мы применяем не лингвистические тесты, которые часто неоднозначны и контекстно-зависимы, а используем принципы, упоминавшиеся в статье «Проблема транзитивности отношения часть-целое», а именно: если уничтожение (изменение) предполагаемой части оказывает влияние на предполагаемое целое, то между ними устанавливается отношение часть-целое; если нет, то данное отношение описывается с помощью других типов тезаурусных отношений. Рассмотрим, например, понятие, соответствующее слову айсберг. Большой толковый словарь русского языка (БТС, 1998) дает следующее толкование значения слова айсберг: Айсберг - плавучая ледяная гора, отколовшаяся от прибрежного ледника, большая часть которой находится под водой. Возникает вопрос, стоит ли описывать понятие АЙСБЕРГ как часть ледника, как часть океана? По предложенному критерию, если проанализировать последствия разрушения, раскалывания конкретного айсберга, то понятно, что ни в каком леднике изменений не произойдет, окружающее море (океан) также не изменятся, поэтому отношение понятий АЙСБЕРГ-ЛЕДНИК, АЙСБЕРГ-ОКЕАН должно описываться с помощью других отношений, а не посредством отношений часть-целое. Рассмотрим другой пример: можно ли использовать отношение часть-целое для описания отношений между понятиями ГОРОЖАНЕ-ГОРОД, ГОРОДСКОЙ СУД-ГОРОД. Город - это, прежде всего, населенный пункт, поэтому если что-то происходит с его жителями, горожанами, то это имеет воздействие и на город - так, если исчезнут все жители, то город перестанет быть населенным пунктом. Таким образом, если в тезаурус вводится понятие ГОРОЖАНЕ, то от этого понятия к понятию ГОРОД должно быть установлено отношение целое. С понятием ГОРОДСКОЙ СУД ситуация иная: есть в городе суд, или нет его, переехал ли этот суд в другой город, само по себе не несет изменений в конкретный город. Поэтому отношение ГОРОДСКОЙ СУД-ГОРОД должно описываться не отношением часть-целое, а другим отношением. Интересно рассмотреть пример из книги (Cruse, 1986), приведенный в разд. 8.4, о том, что не следует описывать отношение между Вестминстерским аббатством и Лондоном как часть-целое, поскольку Вестминстерское аббатство - это здание, а Лондон - это географическое место. Но на самом деле для Лондона как города существенными частями являются здания, постройки. Если уничтожать здания в городе, то и сам город может быть уничтожен. Таким образом, городские здания должны рассматриваться как части города; следовательно, Вестминстерское аббатство должно быть описано как часть Лондона. Итак, описывая отношения часть-целое в информационно-поисковых ресурсах, предназначенных для автоматической обработки текстов, мы опираемся на три основных принципа: 1) часть должна быть зависима от целого; 2) уничтожение или изменение части влечет изменение целого; 3) свойство релевантности наследуется от части к целому: если в тексте обсуждается часть, то этот текст обсуждает и целое. Два первых принципа заменяют в тезаурусе для автоматического индексирования правила, установленные стандартами для традиционных информационно-поисковых тезаурусов: независимость отношения от контекста и соответствие семантических типов части и целого. Однако этим принципам соответствуют также свойства, которые зависят от своих носителей, а также роли, зависимые от своих ситуаций. В качестве примеров таких зависимых свойств можно привести следующие: грузоподъемность - транспортное средство, калорийность - пища, водоизмещение - судно, октановое число - моторное топливо. В качестве примеров зависимых ролей можно привести следующие роли: инвестор - инвестирование, дирижер - дирижирование, дубильщик, дубитель - дубление кожи. Соответственно, такие отношения мы также описываем как часть-целое. Таким образом, мы описываем как части разнообразные внутренние сущности и характеристики объекта, проявляющие зависимость своего существования от существования целого объекта. На основе таким образом определенного отношения часть-целое естественно решается «теннисная» проблема, возникшая перед разработчиками тезауруса WordNet. Все сущности, относящиеся к той или иной сфере деятельности, описываются как ее части. ТЕННИС часть ТЕННИСИСТ часть ТЕННИСНЫЙ КОРТ часть ТЕННИСНЫЙ МАТЧ часть ТЕННИСНЫЙ ИНВЕНТАРЬ Такое решение «теннисной» проблемы не требует наложения искусственной и жесткой системы доменов-областей, подобной системе, созданной для WordNet. Как уже было указано, обобщенные части соответствуют разного рода внутренним характеристикам сущности. Такое решение согласуется, например, с позицией Джона Совы (Sowa, 2000), который объединяет физические части, участников, стадии, а также свойства в одну категорию внутренних сущностей, т. е. сущностей, исчезновение или изменений которых меняет структуру или существование другой сущности. Достаточно широко трактуется отношение часть-целое и в онтологии CYC (см. «Отношение часть-целое в онтологиях верхнего уровня»).
|