| Итог опубликованных статей о тезаурусе РуТез |
| Статьи | |||
| Автор: Administrator | |||
| 19.12.2011 18:32 | |||
|
________________________________________________________________________________________ На этом сайте есть пластиковая упаковка для пищевых продуктов в Туле от компании Комсервис. ___________________________________________________________________________________________________________________ Итог опубликованных статей о тезаурусе РуТезТаким образом, мы предлагаем модель описания знаний о мире, знаний в некоторой предметной области в форме лингвистической онтологии, предназначенной для использования в приложениях информационного поиска, требующих автоматической обработки текстов. Модель построена на сочетании принципов трех различных традиций и методологий разработки компьютерных ресурсов: - методологии разработки традиционных информационно-поисковых тезаурусов; - методологии разработки лингвистических ресурсов типа WordNet (Принстонский университет); - методологии созданий формальных онтологии. Сходство с методологией разработки традиционных информационно-поисковых тезаурусов заключается в следующих решениях: - формирование однозначного имени для понятия тезауруса подобно дескрипторам традиционных информационно-поисковых тезаурусов, - работа с многословными выражениями, ввод понятий на основе значений многословных выражений подобно принципам ввода дескрипторов традиционных информационно-поисковых тезаурусов, - небольшой набор отношений между понятиями тезауруса; набор отношений пригоден для широких неструктурированных предметных областей. Также и система отношений традиционных информационно-поисковых тезаурусов (отношения выше-ниже, ассоциация) при всех их недостатках была хороша тем, что может применяться для многих предметных областей. Сходство с методами разработки тезаурусов типа WordNet заключается в подробной работе с лексическими единицами, тщательной работой со значениями многозначных слов. Сходство с методологией разработки онтологии заключается в том, что единицы тезауруса должны быть отличимы от близких единиц в сети тезауруса. Кроме того, большие усилия прикладываются к тому, чтобы набор отношений устанавливался по формальным правилам, с использованием онтологических принципов. Используются процедуры логического вывода, в частности, активно используется транзитивность отношений часть-целое. Предложенная модель позволяет в короткие сроки создавать онтологические ресурсы в неструктурированных предметных областях. При этом созданный ресурс, с одной стороны, будет содержать подробное описание терминологии предметной области, а также необходимые общелексические единицы и, с другой стороны, будет иметь внутреннюю структуру, соответствующую современным онтологическим принципам разработки онтологии в виде отличимых понятий и формальных отношений между понятиями. Эксперименты по применению созданных по данной модели ресурсов в различных задачах информационного поиска будут рассмотрены в следующих статьях на сайте.
|