| Имя понятия и толкование |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 08.11.2011 18:09 | |||
Имя понятия и толкованиеДля работы с понятиями, анализа результатов автоматической обработки текстов важно, чтобы понятие имело понятное, однозначное и компактное имя, передающее основное содержание этого понятия. С этой точки зрения оперирование длинными рядами синонимов, как в WordNet, не очень удобно. Кроме того, если в WordNet синеет состоит из одного многозначного слова, то пояснить его можно с помощью толкования, что также очень длинно, или с помощью гиперонима, который также может быть неоднозначным. В тезаурусе РуТез каждое понятие должно иметь однозначное имя, которое построено на базе его текстовых входов, и должно быть понятным носителю языка. Имена понятий могут быть следующих видов: - однозначное слово: КАБЕЛЬ, - однозначное словосочетание, являющееся одним из текстовых входов понятия: КАБИНЕТ ВРАЧА, КАБИНЕТ РЕСТОРАНА; - неоднозначное словосочетание с пометой - подобно пометам, используемым в традиционных информационно-поисковых тезаурусах. В качестве пометы используется по возможности текстовый вход одного из вышестоящих понятий: КАБАЧОК (РАСТЕНИЕ), КАБАЧОК (ПЛОД); - пара синонимов - текстовых входов понятия через запятую: ИРРАЦИОНАЛЬНЫЙ, ЛОГИЧЕСКИ НЕОБЪЯСНИМЫЙ; ПОТНЫЙ, МОКРЫЙ ОТ ПОТА. В отличие от ресурсов типа WordNet в тезаурусе РуТез пара синонимов в названии понятия должна однозначно идентифицировать суть понятия. Использование таких названий понятий особенно полезно в тех случаях, когда принимается решение совместить в одном понятии значения несколько различающихся слов. Это решение удобно зафиксировать в названии понятия, например: ПАМЯТНИК, МОНУМЕНТ Если есть такая возможность, т. е. если среди текстовых входов понятия имеется существительное или именная группа, то имя понятия делается на основе существительного (именной группы). Понятие может иметь комментарий, который пишется в случае необходимости и не является частью имени понятия. Это также практика, принятая при разработке традиционных информационно-поисковых тезаурусов.
|