Войти



Последние материалы

Золотые партнеры:

Предотвращают выпадение волос и появление перхоти. Средства против перхоти.

Серебряные партнеры:

Время сеанса ультразвуковой кавитации, посол эффект, ультразвуковая кавитация цена процедуры. . Цены коммерческая недвижимость. Недвижимость москвы цена. Экспресс онлайн газета.

Бронзовые партнеры:

Принцип независимости онтологии от естественного языка. Лингвистические онтологии
Статьи
Автор: Лукашевич Н.В.   
06.10.2011 08:55

Принцип независимости онтологии от естественного языка. Лингвистические онтологии.

Одним из важных вопросов формальной организации онтологии является вопрос о связи единиц онтологии со значениями естественного языка. Часто заявляется, что формальные онтологии должны быть независимы от естественного языка.

Авторы работы (Mahesh, Nirenburg, 1995) считают, что онтология должна быть независима от конкретного естественного языка в двух аспектах:

-        она не содержит единиц, специфичных для того или иного языка, хотя названия понятий для удобства могут быть даны на естественном языке;

-        понятия онтологии не имеют взаимнооднозначного соответствия со значениями слов конкретных языков. Многие понятия онтологии не могут быть сопоставлены ни одному конкретному слову в языке, другие понятия могут соответствовать многим словам в языке и наоборот.

Д. Ленат (Lenat и др., 1995), руководитель известного проекта Сус, в рамках которого предполагалось формализовать знания здравого смысла (common sense) и использовать их, в частности, для обработки текстов на естественном языке, считает, что учет значений слов может только запутать («words are often red herrings»), что значения слов делят мир неоднозначно, а линии деления происходят из самых различных причин: исторических, физиологических и т. п.

Однако в настоящее время некоторые исследователи (Brewster и др., 2005) указывают на следующий факт: «... несмотря на то, что все авторы статей по онтологиям подчеркивают, что понятия являются кирпичиками любой онтологии, мы манипулируем понятиями посредством слов. Во всех онтологиях, которые известны, слова используются, чтобы представлять понятия. Следовательно, то множество явлений в мире, которые не вербализованы, не могут быть смоделированы. Мы можем описать это явление как Онтологическая гипотеза Сепира-Уорфа, то есть то, что не описывается словами, не может быть отражено в онтологии...».

Как было уже упомянуто, утверждая независимость онтологии от языка, разработчики для называния понятий и отношений онтологии могут использовать слова естественного языка. Это стандартная практика, которая использовалась еще в системах представления знаний, создаваемых в рамках работ в сфере искусственного интеллекта (McCarthy, Hayes, 1969). Несмотря на мнение Дага Лената о значениях слов, в CYC также названия многих сущностей носят явно языковой характер, например концепт #$Skin (кожа), #$FemaleAnimal (самка), #$mother (предикат мать) и многие другие.

И. Вилке (Wilks, 2002) указывает, что предикаты в языках представления, которые выглядят как слова естественного языка, и есть слова естественного языка, и странно, что этот факт так яростно отрицается. Таким образом, подчеркивает Вилке, символы в языках представления фундаментально базируются на естественном языке, язык представления - это средство человеческой коммуникации с присущим ему динамизмом, многозначностью и возможностью расширенного толкования. Так, ключевые предикаты длительного проекта CYC за годы развития проекта изменили свои значения (Wilks, 2008). Этот факт не учитывается в сообществах разработчиков онтологии, таких как Семантическая сеть, которые напрасно верят, что их онтологии достигнут точности в значениях терминов (понятий и т. п.) (Nirenburg, Wilks, 2001).

С учетом вышеприведенных мнений уже не таким парадоксальным оказывается понятие так называемой лингвистической онтологии, то есть онтологии, понятия которой в значительной мере связаны со значениями языковых единиц, терминов предметной области (Gomez-Perez и др., 2001; Magnini, Speranza, 2002).

Лингвистические онтологии охватывают большинство слов языка или предметной области и одновременно имеют онтологическую структуру, проявляющуюся в отношениях между понятиями. Поэтому лингвистические онтологии могут рассматриваться как особый вид лексической базы данных и особый тип онтологии. При этом лингвистические онтологии являются относительно слабо формализованными, т. е. являются «терминологическими» онтологиями по определению Дж. Совы.

Примерами лингвистических онтологии являются Принстонский WordNet и ворднеты других языков. Также примерами лингвистических онтологии являются информационно-поисковые тезаурусы, поскольку их единицы - дескрипторы - в подавляющем большинстве основываются на реальных терминах предметной области.