Войти



Советуем прочесть

Последние материалы

Золотые партнеры:

Контактные линзы: солнцезащитные очки. Как выбрать солнцезащитные очки?

Серебряные партнеры:

На этом сайте можно прикупить Аквафор фильтр с запасными картриджами. . Недвижимость Можайский - метро белорусская агентство недвижимости. Недвижимость в Саратове.

Бронзовые партнеры:

Словосочетания как источники понятий в лингвистической онтологии
Статьи
Автор: Лукашевич Н.В.   
12.11.2011 18:40

Спонсор статьи: Компания "Эталон" осуществляет качественное Продвижение сайта в Туле по самым доступным ценам


Словосочетания как источники понятий в лингвистической онтологии

Традиционным подходом является описание в компьютерных словарях семантически связанных словосочетаний (идиом, фразеологизмов), которые демонстрируют какие-либо отклонения в синтаксическом и/или семантическом поведении (Баранов, Добровольский, 1991; Добровольский, 2005). Спектр таких устойчивых словосочетаний очень широк: от жестко фиксированных словосочетаний, которые могут рассматриваться как «слово с пробелами», до словосочетаний, которые подчиняются практически всем синтаксическим и семантическим правилам языка, лишь за некоторым исключением. В последнем случае сразу обнаружить такую особенность может быть весьма сложно.

В работе (Sag и др., 2002) обсуждается еще один важный вид словосочетаний, называемых авторами институциональными выражениями. Для таких выражений характерно то, что по большей части они выглядят как свободные словосочетания, однако их компоненты не всегда могут быть заменены синонимами. Кроме того, частотность такого словосочетания очень высока по сравнению с теми словосочетаниями, которые образованы заменой слов-компонентов на синонимы. Примером таких словосочетаний является словосочетание phone booth (телефонная будка). Так, и в русском, и в английском языках попытка замены слова booth (будка) на другие слова, например кабина, приводит к многократному снижению частотности употребления.

На сложность обнаружения такого рода несвободных словосочетаний указывается в работе (Белоногов, Хорошилов, 2005). Носителям русского языка кажется, что смысл таких словосочетаний, как электронная вычислительная машина, подводная лодка, теория массового обслуживания, сухопутные войска, военно-воздушные силы, и смысл сложного слова пылесос складываются из смыслов входящих в их состав слов. На самом деле это не так.

Например, русский термин электронная вычислительная машина обозначается на английском языке словом computer (вычислитель), в котором ничего «электронного» в явном виде не отмечается; русский термин подводная лодка обозначается сложным словом submarine (буквально «под морем»), в котором понятие «лодка» отсутствует; термин теория массового обслуживания - словосочетанием querying theory (теория очередей), которое не содержит явных признаков понятия «массовое обслуживание»; термин сухопутные войска - сложным словом landforces (наземные силы), без признаков «сухопутное™»; термин военно-воздушные силы - словосочетанием air forces (буквально «воздушные силы»), в котором понятие «военный» в явном виде не обозначено; термин пылесос - словосочетанием vacuum cleaner (буквально «вакуумный очиститель», в составе которого нет понятий «пыль» и «сосать»).

В работе (Белоногов, Хорошилов, 2005) этот феномен объясняется тем, что в словесных формулировках наименований понятий могут быть отображены не все признаки понятий, а только незначительное их число. Часто это бывают не самые важные признаки, характеризующие содержание понятий, а лишь некоторые отличительные признаки, позволяющие выделить эти понятия среди множества других.

В естественном языке, в котором «все связано со всем», понятия, как некоторые социально значимые устойчивые мыслительные образы, могут обладать огромным количеством признаков. Но этим мыслительным образам присваиваются наименования в виде отдельных слов или (значительно чаще) в виде словосочетаний, состоящих из нескольких слов. Наименование понятия, на основе некоторых частичных признаков исходной сущности, приводит к тому, что сущность может быть именована разными способами на основе разных признаков, и тогда возникает синонимия, которая практически никак не следует из значений отдельных слов.

В работе (Белоногов, Хорошилов, 2005) приводятся следующие примеры таких синонимов-словосочетаний:

Абсолютная жесткость - бесконечно большая жесткость,

Абсолютная температура - температура Кельвина,

Наклонный путь для сортировки вагонов - путь сортировочной горки

Наклоны головы в поперечной плоскости - наклоны головы к правому и левому плечу.

В работе (Тер-Минасова, 2007) указывается, что имеется большое количество словосочетаний, которые не являются явно заранее данными, но «свобода» образования которых ограничена какими-либо факторами. Поэтому исследование образований этого рода, то есть таких, которые, с одной стороны, не являются фразеологическими единицами, а с другой - не обладают способностью вполне свободно создаваться в речи, связано с большими трудностями. Так, даже простейшие, казалось бы, абсолютно свободные словосочетания blue sky (голубое небо), white tablecloth (белая скатерть) явно социолингвистически обусловлены. В культурном опыте людей, говорящих по-английски, предметы мысли tablecloth и white сочетаются вполне естественно, привычно, закономерно, так как скатерти белого цвета общеприняты и широко распространены; кроме того, наличие белой скатерти, как правило, свидетельствует о торжественном или официальном приеме, праздничном обеде и т. п. Точно так же сочетание blue sky употребляется в речи настолько регулярно, что вряд ли можно говорить о свободном сочетании элементов blue и sky каждым отдельным носителем языка.

В предметных областях вопрос об извлечении словосочетаний обычно обсуждается как вопрос извлечения терминологических словосочетаний. Имеющиеся терминологические списки, относящиеся к текущей предметной области, обычно охватывают лишь малую часть тех терминоподобных словосочетаний, которые встречаются в текстах. Эксперты предметной области могут иметь очень различные мнения по поводу терминологичности того или иного словосочетания (Браславский, Соколов, 2007).

Таким образом, спектр словосочетаний с особенностями очень широк, и нужны некоторые формализованные принципы для отражения словосочетания в компьютерных словарях и, в частности, в структуре понятий лингвистической онтологии.