| Принципы описания ролевых отношений в тезаурусе РуТез |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 13.11.2011 12:43 | |||
Принципы описания ролевых отношений в тезаурусе РуТезПроблема смешения таксономических и ролевых отношений связана с тем, что в текстах эти отношения часто выражаются сходными языковыми конструкциями. При разработке ресурса для автоматической обработки текстов много информации приходится вводить в тезаурус на основе знаний, полученных из текстов (Лукашевич, 2007b; Лукашевич, 2007с). Например, следующий фрагмент (http://www.giord.ru/0705211117391.php): наиболее используемыми консервантами являются: поваренная соль, этиловый спирт, уксусная, сернистая, сорбиновая, бензойная кислоты и некоторые их соли может показаться хорошим источником информации для того, чтобы описать виды консервантов. Определение электролита Электролит - проводник второго рода; вещество, обладающие ионной проводимостью. Электролитами являются: - расплавы солей, оксидов или гидроксидов; -растворы солей, кислот или оснований в полярных растворителях; - а также твердые электролиты может показаться основанием, например, для установления отношения, что соль (как химическое соединение) является видом электролита. Однако в таких случаях нужно помнить, что консервант и электролит являются ролями веществ - вещество становится консервантом или электролитом, если только оно попадает в некоторые условия. А поваренная соль и соль как химическое соединение являются типами веществ. Устанавливая родовидовую связь от типа к роли, мы сообщаем системе некорректное знание, состоящее, например, в том, что любое вещество, относящееся к классу солей, в любой момент времени своего существования в любой ситуации является электролитом, что далеко не так. Возникает вопрос, можно ли отразить полученную из вышеприведенных фрагментов информацию, выразив ее набором более «надежных» отношений. В тезаурусе РуТез мы обычно пытаемся применить несколько способов. Во-первых, если мы предполагаем, что в нашей предметной области большинство примеров того или иного типа будут использованы в некоторой роли, то все-таки устанавливается родовидовое отношение от типа как вида к роли как роду, которое снабжается пометкой В - что означает « возможно по умолчанию». Например, мы можем установить такое отношение между понятием СОРБИНОВАЯ КИСЛОТА и КОНСЕРВАНТ, если посчитаем, что это основное применение сорбиновой кислоты в нашей предметной области, и вероятность встретить в текстах обсуждение сорбиновой кислоты в других применениях (например в органическом синтезе) в нашей области не слишком велика: СОРБИНОВАЯ КИСЛОТА Выше_в КОНСЕРВАНТ Однако не рекомендуется устанавливать такое отношение между понятиями ПОВАРЕННАЯ СОЛЬ и КОНСЕРВАНТ, поскольку основное применение поваренной соли совсем другое. Даже если бы мы установили такое отношение (ввели бы еще пометку для неосновных ролей), то нужно учитывать, что для автоматической системы обработки текстов невозможно качественно учитывать контекст употребления поваренной соли в тексте, чтобы разобраться, можно использовать это отношение или нет. Таким образом, в некоторых случаях мы все-таки размещаем понятия-роли выше по иерархии, чем понятия-типы, однако отмечаем такое отношение специальной пометкой. Мы применяем это отношение только для описания знания о предметной области, которое верно по умолчанию, то есть, с одной стороны, оно может пригодиться при обработке текстов, с другой стороны, относительно редко может привести к ошибке вывода. Для каждого типа может быть описано максимум одно такое отношение, а описания многих понятий-типов не включают такие отношения, поскольку могут выступать в самых разных ролях. Именно с использованием отношения выше_в может быть отражено критикуемое Н. Гуарино отношение яблоко-пища, если будет известно, что в рабочей предметной области использование в пищу - это основная роль яблок. В перечисленных в статье «Представление ролей в компьютерных ресурсах» способах представления иерархических отношений между типами и ролями такое решение корректируется дополнительной пометкой. На примере описания понятия ЭЛЕКТРОЛИТ может быть продемонстрирована еще одна возможность описания отношений между ролями и типами в тезаурусе РуТез. Можно попытаться ввести дополнительное понятие для ситуации соли в роли электролита. Если это важно для данной сферы, то это наше желание обычно поддерживается и языком предметной области - для такого понятия существует одно или более употребительных языковых выражений. И в нашем случае существует и активно употребляется такое словосочетание, как солевой электролит. Таким образом, мы можем ввести понятие СОЛЕВОЙ ЭЛЕКТРОЛИТ и установить следующие отношения: СОЛЕВОЙ ЭЛЕКТРОЛИТ выше СОЛИ выше ЭЛЕКТРОЛИТЫ Тем самым мы корректно отражаем знание, полученное нами из прочитанного определения. В перечисленных в статье «Представление ролей в компьютерных ресурсах» способах представления иерархических отношений между типами и ролями такое решение соответствует третьему подходу, провозглашающему необходимость разделения иерархий типов и ролей, однако эти иерархии пересекаются не только на примерах понятий, которые относятся к обеим иерархиям, но в специально введенных понятиях. Если рассмотреть такое решение для отражения отношений между понятиями РАБОТОДАТЕЛЬ, ЧЕЛОВЕК и ОРГАНИЗАЦИЯ, то нужно ввести два дополнительных понятия, например РАБОТОДАТЕЛЬ-ФИЗИЧЕСКОЕ ЛИЦО и РАБОТОДАТЕЛЬ-ЮРИДИЧЕСКОЕ ЛИЦО. Поскольку введение дополнительных понятий может серьезно усложнять описание понятий в ресурсе, такой способ используется лишь в тех случаях, когда такие дополнительные понятия действительно используются в предметной области, как в случае понятия СОЛЕВОЙ ЭЛЕКТРОЛИТ Интересно отметить, что введенные дополнительные понятия РАБОТОДАТЕЛЬ-ФИЗИЧЕСКОЕ ЛИЦО и РАБОТОДАТЕЛЬ-ЮРИДИЧЕСКОЕ ЛИЦО также имеют реальное основание в правовой области, поскольку отношения разных типов работодателей с работниками по-разному регулируются законодательством. Понятия-типы ЧЕЛОВЕК и ОРГАНИЗАЦИЯ могут равным образом выступать во многих ролях, поэтому в тезаурусе РуТез действительно введено понятие СУБЪЕКТ ДЕЯТЕЛЬНОСТИ, и в качестве нижестоящих к нему понятий размещены многие ролевые понятия, в которых могут выступать и примеры понятия ЧЕЛОВЕК, и примеры понятия ОРГАНИЗАЦИЯ. Таким образом, в реальном ресурсе, создаваемом для работы в приложениях в широкой предметной области, приходится применять несколько разных подходов к описанию иерархий типов и ролей, обсуждаемых в литературе как альтернативные. В литературе обсуждаются и более сложные представления для более адекватного описания взаимоотношений между типами и ролями, однако при создании достаточно больших онтологических ресурсов важно сохранить относительно простую схему описания. Кроме того, сложные схемы описания отношений затруднительно использовать при автоматической обработке текстов. Tags: Принципы описания ролевых отношений в тезаурусе РуТез Отношения между понятиями в тезаурусе РуТез
|