| Онтология MicroKosmos |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 06.10.2011 09:15 | |||
Онтология MicroKosmosОнтология МикроКосмос (более позднее название OntoSem) является одним из известнейших онтологических ресурсов. Эта онтология разрабатываются в рамках подхода, называемого «онтологическая семантика» (Nirenburg, Raskin, 2004). Онтология предназначается для использования в приложениях автоматической обработки текста и построения семантического, языково-независимого представления содержания предложений текста. Для поступающего текста производится предобработка, морфологический анализ, синтаксический анализ, семантический анализ, результаты которого представляются как Представление Текст-Смысл (Text-Meaning Representation -TMR). Все сущности в онтологии МикроКосмос разделены на объекты, события и свойства. Объекты, события и свойства являются концептами (понятиями) онтологии, которые описываются фреймами. Фреймы - это наборы слотов с одним или более фасетов. Слоты в совокупности описывают понятия, определяя, как данное понятие соотносится с другими понятиями онтологии (посредством отношений) и буквенными и числовыми ограничениями (посредством атрибутов). Лексикон системы описывает значения слов и словосочетаний, устанавливая ссылки от них на понятия онтологии. Каждый слот - атрибут или отношение - определен как понятие в своей собственной иерархии. Основными особенностями онтологии являются: - независимость от конкретного естественного языка; - независимость мотивации. Добавление понятий в онтологию не диктуется лексиконом языка. Развитие онтологии и пополнение лексикона системы - два равноправных взаимодействующих процесса, которые помогают друг другу и в то же время ограничивают друг друга; - хорошая структурированность; - последовательность и сочетаемость с лексиконом, семантическим анализатором и т.п.; - понятность и простота. Онтологию должно быть легко обходить и представлять. Например, онтология не использует And-Or деревья с дизъюнктивным наследованием, поскольку такое наследование достаточно трудно воспринимать. Имена в онтологии могут выглядеть как английские слова или фразы, но их семантика выражается набором четко определенных отношений между понятиями. Понятие языковой зависимости (независимости) значения демонстрируется на примере существования в немецком языке слова schimmel - белая лошадь. Авторы онтологии подчеркивают, что нет необходимости вводить отдельное понятие для отражения значения данного слова, для описания значения этого слова правильнее ввести словарную статью со ссылкой на понятие ЛОШАДЬ и с описанием значения свойства ЦВЕТ - «белый». Словарная статья языкового значения в онтологии может иметь простую структуру, представляя собой ссылку на понятие онтологии, и достаточно сложную структуру, содержащую и ссылку на понятие онтологии, и особенности конкретной лексической единицы (Nirenburg и др., 2004; Nirenburg, Raskin, 2004). Например, все глаголы изменения в онтологии приписаны одному и тому же понятию Change-event. Особенности слов описываются в словарной статье, например, для глагола увеличить (increase) указывается, что в семантической роли ТЕМА этого глагола должна выступать СКАЛЯР-НАЯВЕЛИЧИНА (например цена или высота) и указывается, что значение этой величины меняется на большее. Значение слова сионист представлено в словаре как POLITICALROLE (политическая роль), которая является агентом (AGENT OF а SUPPORT EVENT события поддержки), темой которого является Израиль. Значение слова асфальтировать описывается как COVEREVENT (событие покрывания), инструментом которого является понятие АСФАЛЬТ. Авторы указывают, что нет необходимости иметь отдельные понятия для описания значений слов sibling (родные брат или сестра), brother (родной брат), sister (родная сестра). Вводится одно понятие SIBLING, и с помощью значений атрибута gender (мужской или женский пол) в словаре системы могут быть описаны значения слов sister и brother. Поскольку авторами сделаны значительные усилия по ограничению величины онтологии, размер онтологии МикроКосмос (OntoSem) составляет порядка 6 тысяч понятий, каждое из которых описывается в среднем 16 свойствами. Лексикон системы составляет несколько десятков тысяч слов и выражений. Основные этапы разработки онтологии, по мнению разработчиков, должны состоять в следующем: 1) установление того, является ли значение слова достаточным основанием для введения нового понятия, 2) нахождение места понятия в онтологии, определение того, какие существующие понятия онтологии могут служить наилучшими родовыми понятиями для нового понятия; 3) описание свойств нового понятия, которые должны отличаться от свойств родовых понятий, видовых понятий, не только заполнением слотов, но и более содержательным образом, наличием других свойств. Таким образом, провозглашаемая языковая независимость не должна вводить в заблуждение. По своей сути онтологии OntoSem и MikroKosmos являются, несомненно, лингвистическими онтологиями, поскольку основным принципом, обосновывающим введение новых понятий, является существование слов с таким значением в большом количестве языков. При этом принцип языковой независимости этих онтологии подчеркивает, что при построении лингвистической онтологии необязательно жесткое следование системе значений конкретного языка. Лингвистическая онтология может учитывать систему значений конкретного языка или совокупности языков и при этом следовать принципам введения понятий, провозглашаемых в формальных онтологиях.
|