| Описание отношений между значениями многозначного слова в онтологии для автоматической обработки текстов |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 12.11.2011 18:37 | |||
|
Спонсор статьи: Компания "Эталон" осуществляет качественное Продвижение сайта в Туле по самым разумным ценам Описание отношений между значениями многозначного слова в онтологии для автоматической обработки текстовМногозначность слов разделяется на два основных подвида: омонимию и полисемию. В свою очередь, полисемия может быть подразделена на такие подвиды, как метафора, метонимия, автогипонимия, также выделяется регулярная полисемия. Понятно, что проблемы с разбиением на понятия возникают у полисемичных значений. При этом именно полисемия, в отличие от омонимии, рассматривается как явление, коренным образом присущее языку: «Полисемия -это одно из основных средств концептуализации нового опыта. Человек не может понять нового, не имея какого-то "данного", поэтому он вынужден использовать "старые" знаки и приспосабливать их к новым функциям, распространять их на другие ситуации» (Кустова, 2004). Не случайно, поэтому, что термины предметной области, которые в идеале должны быть точными и однозначными, демонстрируют массовые примеры полисемических значений (Шелов, 2003). Именно на полезность вышеперечисленных отношений для описания отношений между значениями в лингвистических онтологиях указывалось в работе (Gonzalo, 2004). Однако здесь нужно не забывать о двух важных обстоятельствах. Во-первых, онтология описывает отношения не между лексемами, а между объектами и сущностями внешнего мира, и, таким образом, между лексемами как текстовыми входами каких-то понятий могут быть установлены только онтологические отношения между понятиями. Так, например, метафорические отношения между значениями не должны находить отражение в онтологии, поскольку есть ассоциация только между названиями - между объектами никаких отношений нет. Мы не будем, таким образом, устанавливать отношения между понятиями СОТОВАЯ СВЯЗЬ и ПЧЕЛИНЫЕ СОТЫ только по той причине, что для названия понятия СОТОВАЯ СВЯЗЬ была использована метафора с пчелиными сотами. Во-вторых, онтология не может описывать все существовавшие ранее миры. Она содержит отношения между сущностями в существующем сейчас мире или существовавшие еще недавно. Тот факт, что когда-то данные сущности были связаны, не может быть отражено в онтологии. Таким образом, в онтологии естественно могут быть отражены такие отношения между значениями, как метонимия, поскольку «метонимическая связь, т. е. связь по смежности, имеет место не между смыслами, а между объектами действительности» (Падучева, 2007), именно такое отношение существует между обсуждавшимися значениями слова окно. Для описания отношений между понятиями, соответствующими метонимии значений, в тезаурусе РуТез используются отношения часть-целое и отношение онтологической зависимости. Другим типом отношения между значениями, которое может быть отображено посредством онтологических отношений между понятиями, является отношение автогипонии (обобщения), поскольку это отношение соответствует родовидовым отношениям между понятиями онтологии. Отметим, что совокупности плохо разделимых значений многозначных слов чаще всего связаны именно с этими типами отношений между значениями. Одной из серьезных проблем взаимоотношений между понятиями лингвистической онтологии и значениями языка является вопрос о том, в каких случаях значения словосочетаний должны быть отражены как понятия онтологии. Проблема описания значений словосочетаний как понятий в лингвистической онтологии относится к более широкой проблеме отбора словосочетаний для описания в компьютерных словарях (Лукашевич, 1995; Bentivogli, Pianta, 2004). С одной стороны, чем больше в компьютерных словарях описано словосочетаний, тем меньше проблем с разрешением многозначности отдельных слов, больше будет зафиксировано специфических случаев сочетаемости. С другой стороны, бесконечное количество существующих словосочетаний все равно требует формулирования каких-либо критериев. Так, в работах И.А. Большакова (Большаков, 2009) предлагается вручную набирать в специальную базу Кросс-лексика все встретившиеся словосочетания. Однако возникают серьезные вопросы о полноте и представительности такой базы. Tags: Описание отношений между значениями многозначного слова в онтологии для автоматической обработки текстов Единицы тезауруса – понятия и их текстовые входы
|