| Роли в тезаурусах |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 08.10.2011 08:27 | |||
Роли в тезаурусахПроблемы описания понятий-ролей, отношений тип-роль находят свое отражение и в процессе построения и использования тезаурусов разных типов. Так, одной из проблем WordNet, на которую обращали внимание многие исследователи, является смешение нескольких разных отношений под именем отношения гипонимии-гиперонимии (см. «Проблемы родовидовых отношений WordNet»). Указывая на смешение типов и ролей в Wordnet, Н. Гуарино (Guarino, 1998) привел следующие примеры описания из WordNet: Человек - это живое существо и каузальный агент. Яблоко - это фрукт и еда. Человек всегда живое существо, но он (она) начинает играть роль каузального агента только в некоторых ситуациях. Та же проблема возникает для яблока, которое всегда плод растения и в некоторых ситуациях может быть пищей. Проблема в том, что человек и яблоко - это типы сущностей, в то время как каузальный агент и пища - это роли. Одна из авторов WordNet, К. Феллбаум, отвечая на эту критику Н. Гуарино, заявляет (Fellbaum, 2002), что в таких ресурсах, как WordNet, неоднородные классификации имеют право на существование, поскольку такие ресурсы рассматриваются в настоящее время прежде всего как инструменты для компьютерной обработки текстов, а не только как совершенные онтологии, которые должны соответствовать строгим онтологическим принципам. Во-первых, указывает К. Феллбаум, если уничтожить «неправильные» отношения, то теряется важная информация. В некоторых случаях семантическая информация об отношениях между словами, не отвечающая строгим принципам, может быть более полезна, чем более обоснованное семантическое отношение. Во-вторых, считает К. Феллбаум, для лексических ресурсов, которые используются для компьютерной обработки текстов, полезно иметь подробную сеть отношений. Это важно для разрешения многозначности, разрешения референции, методов выявления лексической связности текстов. Более того, К. Феллбаум предлагает расширить множество отношений, подобных отношением тип-роль. Предлагается ввести и использовать другой тип отношений, который назван в (Cruse, 1986) парагипонимией, а в качестве лингвистического теста установления такого рода отношения применять следующие пары предложений: X's and other Y's & It's an X, but it's not a Y (Xu другие Y, & Это X, но не Y). Однако проблемой такого предложения для описания отношений тип-роль является то, что под вышеуказанные тесты подходят многие экзотические роли, например, в некоторых ситуациях мухи могут стать едой (например, в голодное время), а бутылки - музыкальным инструментом (Trautwein, Grenon, 2004). Лингвистические тесты не препятствуют установлению такого рода отношений, например: Мухи и другие виды еды & Это муха, а не еда. Отметим, что высказанное предложение не было реализовано в WordNet. Вместе с тем понятно, что если использовать отношения вне правильного контекста (что часто возникает в связи с динамичностью ролей), то это может привести к серьезным ошибкам при обработке текстов. Если обратиться к информационно-поисковым тезаурусам, то стоит отметить, что современные руководства и стандарты по информационно-поисковым тезаурусам (Z39.19; Will, 2004) рекомендуют придерживаться строгих принципов в представлении ролей. Как было описано в статье «Родовидовое отношение выше-ниже в информационно-поисковых тезаурусах», рекомендуется устанавливать иерархические отношения в информационно-поисковых тезаурусах в тех случаях, когда отношения истинны независимо от контекста - только в таких случаях дескрипторы информационно-поискового тезауруса могут быть организованы в иерархии. В упомянутом в статье «Родовидовое отношение выше-ниже в информационно-поисковых тезаурусах» примере, обсуждающем правильность установления родовидового отношения от дескриптора МЫШИ к дескриптору ВРЕДИТЕЛИ, последний как раз и является ролью. Авторы руководств и стандартов считают, что представлять такое отношение как родовидовое неправильно, поскольку имеются лабораторные мыши и домашние мыши, которые не являются вредителями.
|