Войти



Советуем прочесть

Последние материалы

Золотые партнеры:

Серебряные партнеры:

Бронзовые партнеры:

Итог опубликованных статей о тезаурусе РуТез
Статьи
Автор: Administrator   
19.12.2011 18:32

________________________________________________________________________________________

На этом сайте есть пластиковая упаковка для пищевых продуктов в Туле от компании Комсервис.

___________________________________________________________________________________________________________________

Итог опубликованных статей о тезаурусе РуТез

Таким образом, мы предлагаем модель описания знаний о мире, знаний в некоторой предметной области в форме лингвистической онтологии, предназначенной для использования в приложениях информационного поиска, требующих автоматической обработки текстов.

Модель построена на сочетании принципов трех различных традиций и методологий разработки компьютерных ресурсов:

-        методологии разработки традиционных информационно-поисковых тезаурусов;

-        методологии разработки лингвистических ресурсов типа WordNet (Принстонский университет);

-        методологии созданий формальных онтологии.

Сходство с методологией разработки традиционных информационно-поисковых тезаурусов заключается в следующих решениях:

-        формирование однозначного имени для понятия тезауруса подобно дескрипторам традиционных информационно-поисковых тезаурусов,

-        работа с многословными выражениями, ввод понятий на основе значений многословных выражений подобно принципам ввода дескрипторов традиционных информационно-поисковых тезаурусов,

-        небольшой набор отношений между понятиями тезауруса; набор отношений пригоден для широких неструктурированных предметных областей. Также и система отношений традиционных информационно-поисковых тезаурусов (отношения выше-ниже, ассоциация) при всех их недостатках была хороша тем, что может применяться для многих предметных областей.

Сходство с методами разработки тезаурусов типа WordNet заключается в подробной работе с лексическими единицами, тщательной работой со значениями многозначных слов.

Сходство с методологией разработки онтологии заключается в том, что единицы тезауруса должны быть отличимы от близких единиц в сети тезауруса. Кроме того, большие усилия прикладываются к тому, чтобы набор отношений устанавливался по формальным правилам, с использованием онтологических принципов. Используются процедуры логического вывода, в частности, активно используется транзитивность отношений часть-целое.

Предложенная модель позволяет в короткие сроки создавать онтологические ресурсы в неструктурированных предметных областях. При этом созданный ресурс, с одной стороны, будет содержать подробное описание терминологии предметной области, а также необходимые общелексические единицы и, с другой стороны, будет иметь внутреннюю структуру, соответствующую современным онтологическим принципам разработки онтологии в виде отличимых понятий и формальных отношений между понятиями. Эксперименты по применению созданных по данной модели ресурсов в различных задачах информационного поиска будут рассмотрены в следующих статьях на сайте.