| Краткий итог опубликованных статей о тезаурусе РуТез |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 08.11.2011 17:59 | |||
Краткий итог опубликованных статей о тезаурусе РуТезВ данной главе мы представили особенности структуры тезауруса русского языка РуТез. При разработке тезауруса как ресурса для автоматической обработки текстов были использованы принципы различных традиций и методологий, а именно: методологии разработки традиционных информационно-поисковых тезаурусов, методологии разработки лингвистических ресурсов типа WordNet, методологии созданий формальных онтологии. Особенностью тезауруса РуТез является то, что в нем выделяются две составные части: Общий лексикон и Общественно-политический тезаурус, который содержит тематическую лексику и терминологию, значимую для общества в целом. Такое сочетание в одном ресурсе обычно разделяемых языковых сущностей связано с тем, что граница между лексикой и терминологией представляет собой широкую промежуточную зону. Она содержит лексемы, значения которых совпадают с понятиями конкретных предметных областей, и термины, понятные носителям языка. Эта зона включает в себя понятия, значимые для общества в целом, поэтому мы называем ее Общественно-политической областью. Лексико-терминологические ресурсы, разработанные для общественно-политической области, полезны для приложений по автоматической обработке разнообразных типов текстов. Знания об общественно-политической области очень важны как для создания лингвистических ресурсов в конкретных предметных областях, так и в качестве основы для описания абстрактной лексики языка. Общественно-политический тезаурус может рассматриваться как пример информационно-поискового тезауруса в широкой предметной области, созданный специально как ресурс для автоматической обработки текстов в приложениях информационного поиска и поэтому обладающий рядом специфических характеристик по сравнению с традиционными информационно-поисковыми тезаурусами.
|