| Два основных подхода к построению онтологии |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 06.10.2011 08:32 | |||
Два основных подхода к построению онтологииВ проектировании онтологии условно можно выделить два направления. Первое связано с представлением онтологии как формальной системы, основанной на математически точных аксиомах. Этот подход тесно связан с различными логическими формализмами (предикатов первого порядка, дескриптивной, модальной логики и т. п.). Это направление онтологических исследований является продолжением работ в рамках классического искусственного интеллекта, изучающих способы представления знаний. Второе направление связано с разработкой онтологии для компьютерной обработки текстов. Онтологии дают возможность использовать знания о мире, которые необходимы для выполнения многих этапов анализа текста. При этом, с одной стороны, формальность описания в таких онтологиях значительно ниже, чем в онтологиях, создаваемых в рамках первого подхода. С другой стороны, формальный логический вывод на основе онтологии при анализе текста часто является необходимым, поскольку в связном тексте значительный объем информации не указывается явно (Леонтьева, 1981; Леонтьева, 2006; Chavez и др., 2009). При всей кажущейся важности развития онтологии в рамках первого подхода, именно в рамках второго подхода создаются сверхбольшие ресурсы, используемые в широких предметных областях, в то время как в рамках первого подхода создаются относительно небольшие ресурсы (ресурсы с относительно небольшим числом понятий - экземпляров может быть достаточно много). Так, большое количество широкоизвестных медицинских онтологических ресурсов представляет собой тезаурусы, не обладающие высокой степенью формализации своей структуры (Gene ontology, 2009). Так, в работах (Нерр, 2007; Hovy, 2005) указывается, что исследователи написали очень много работ о потенциальных преимуществах использования формальных онтологии, о необходимости использования онтологии в качестве центральных блоков семантической сети и других семантических систем. Однако количество и качество «реальных», «неигрушечных» онтологии, имеющихся на сегодняшний день, чрезвычайно мало, т. е. не построено практически полезных онтологии для большого количества предметных областей. Здесь часто можно встретиться с мнением, что отсутствие формальных онтологии большой величины происходит из-за того, что это «недалекие» бизнесмены не хотят понять, какие преимущества несет с собой использование формальных онтологии. На самом же деле на пути создания масштабных формальных онтологии существуют реальные технические и социальные проблемы. В работе (Tsujii, Ananiadou, 2005) указывается, что, тогда как небольшие онтологии могут быть построены методом сверху-вниз, разработка подробных онтологии для реальных приложений - нетривиальная задача. Более того, во многих предметных областях знание, нужное для распространения и интеграции, содержится в основном в текстах. Из-за внутренних свойств человеческого языка непростой задачей является связать знания, содержащиеся в текстах, с онтологиями, даже если бы они были построены для данной предметной области. То есть предполагается, что такие однозначные и последовательные концептуальные модели играют менее значительную роль в распространении знаний, чем предполагают сторонники формального онтологического подхода. В работе (Нерр, 2007) описываются следующие существенные проблемы на пути развития формальных онтологии. Во-первых, подавляющее число предметных областей продолжает развиваться, пополняться новыми понятиями, отношения между некоторыми понятиями меняются. Создаваемые онтологии будут всегда отставать от существующего понятийного аппарата предметной области. Чем более подробной является онтология (а для практической применимости она должна быть подробной), тем больше динамика ее изменений. Отсутствие новых понятий в онтологии не позволяет использовать семантические технологии для поиска по запросам, включающим новые понятия, или аннотирования документов. Во-вторых, создание онтологии требует серьезных ресурсов. Для того, чтобы затраты были оправданны, требуется применимость созданных онтологии пользователями. Должны возникнуть реальные пользователи, которые должны поверить в полезность онтологии и начать ее применять, что достаточно сложно на первых этапах появления онтологии. Третьей проблемой является проблема понятности онтологии для пользователей, такой, чтобы она могла правильно применяться и интерпретироваться (Fox, Gruningen, 1997). На основе спецификаций и документации онтологии пользователи должны правильно интерпретировать семантику всех ее элементов. Кроме того, как показывает практика, далеко не всякий специалист в предметной области может хорошо разбираться в формальных онтологических спецификациях. Чем больше степень формализованной онтологии, тем труднее ее понять пользователю. Дж. Сова высказывается по поводу предполагаемой в проекте Семантическая сеть (Semantic Web) разметки сайтов семантическими тегами для обеспечения более качественного поиска информации в Интернет и обращает внимание на следующий вопрос: если теги формально определены, как можно быть уверенным, что люди, которые используют эти теги, реально прочитали и поняли формальные определения? Если пользователи будут проставлять теги различным образом, то в условиях применения процедур формального вывода это может привести к противоречиям: «Если от 5.5 до 33% данных может оказаться неправильными, то утверждения о необходимости формальной точности в аксиомах и процедурах доказывания оказываются под вопросом». В работе (Нерр, 2007) приводится следующий рисунок (см. рис), который показывает, что чем больше формальная выразительность онтологии, тем меньше потенциальный круг ее пользователей, поскольку пользователям трудно понять описания онтологии для того, чтобы применить ее в своей деятельности. Таким образом, вопрос о создании и качественном применении больших строго формализованных онтологии является достаточно сложным, что связано как со сложностью создания таких ресурсов, так и со сложностью их понимания, применения, описания с их помощью реальных материалов. Вышесказанное не означает, что можно пренебречь любой степенью формализации, поскольку неформализованный ресурс сложно использовать в автоматических режимах работы компьютерных приложений, а непоследовательность описаний сущностей ведет к нарушению процедур логического вывода. Осознавая описанные проблемы, каждый разработчик онтологии должен иметь в виду, что существует ряд противоречивых требований к онтологии (формальная строгость, практическая применимость, величина, понятность пользователям), и осознанно делать свой выбор.
|
