Войти



Последние материалы

Золотые партнеры:

Серебряные партнеры:

Бронзовые партнеры:

Описание смысла рубрики понятиями тезауруса
Статьи
Автор: Лукашевич Н.В.   
15.02.2012 05:04

Описание смысла рубрики понятиями тезауруса

При создании лингвистического профиля рубрикатора каждая рубрика R описывается дизъюнкцией альтернатив, каждый дизъюнкт представляет собой конъюнкцию (21.1):

Конъюнкты, в свою очередь, описываются экспертами с помощью так называемых «опорных» понятий тезауруса. Для каждого опорного понятия задается правило его расширения/^, определяющее, каким образом вместе с опорным понятием учитывать подчиненные ему по иерархии понятия: без расширения (обозначается символом «N»), полное расширение по дереву иерархии тезауруса (символ «Е»), расширение только по родовидовым связям (символ «L»), расширение по всем видам отношений на один уровень иерархии (символ «W»), расширение на один уровень иерархии, не включая отношения ниже (символ «V»).

Опорное понятие может быть как «положительным», т. е. добавлять нижерасположенные понятия в описание конъюнкта, так и «отрицательным», т. е. вырезать из описания рубрики свои подчиненные понятия. Последовательность учета положительных и отрицательных опорных понятий регулируется заданием специального атрибута. Результатом применения расширения опорных понятий является совокупность понятий тезауруса, полностью описывающая конъюнкт (21.2):

Отметим, что для рубрикаторов простой структуры, когда рубрики разделяют пространство предметной области на непересекающиеся части, часто возможно обходиться случаем одной альтернативы (одного дизъюнкта) и одного конъюнкта, при этом роль отрицательных опорных понятий может выражать специальная «нулевая» рубрика, задача которой - «выедать» ненужные понятия.

Рассмотрим фрагмент представления рубрики 200.020.020 «Встречи на высшем уровне» из Классификатора правовых актов РФ ((Указ, 2000), более 1000 рубрик). Языковые выражения, записанные курсивом, выводятся на основе исходного описания рубрики автоматически (рис. 21.1):

Важным атрибутом описания рубрики является пометка о необходимости «подтверждения». Понятия, требующие подтверждения, не могут самостоятельно выводить рубрику, но могут усиливать эту рубрику, если в тексте встречаются понятия, не требующие подтверждения. Например, если в тексте говорится о конфликте двух пенсионеров в очереди, еще не должна выводиться рубрика «Пенсионное обеспечение», так как здесь используется только одно свойство понятия ПЕНСИОНЕР - как гражданин преклонного возраста. В нашем описании понятие ПЕНСИОНЕР должно иметь пометку о подтверждении для данной рубрики. Однако если дополнительно в тексте будет сказано, что конфликт произошел из-за маленькой пенсии, низкого жизненного уровня и т. п., то рубрика должна выводиться, причем наличие понятия ПЕНСИОНЕР должно усиливать вес данной рубрики.

По умолчанию пометка подтверждения устанавливается для понятия dijk, если на любом пути от положительного опорного понятия, которому соответствует dyk, имеется пометка на отношении (см. разд. 17.6). При этом эксперт, описывающий рубрику, может задать/снять пометку подтверждения вручную, что распространится на все нижерасположенные понятия.

Следует подчеркнуть, что в данной методологии достаточно хранить только опорные понятия, а также понятия, у которых изменен атрибут подтверждения, полное же описание рубрики может быть каждый раз пересчитано заново при изменении тезауруса. Типичные цифры о параметрах описания: на одну рубрику рубрикатора в среднем приходится 1-2 дизъюнкта, 2-3 конъюнкта, 4-8 опорных понятия, 50-100 понятий полного описания, то есть 100-250 текстовых выражений.