Войти



Последние материалы

Золотые партнеры:

Стоящая коммерческая недвижимость от Real Druzi

Серебряные партнеры:

Квартиры домодедово

Бронзовые партнеры:

Использование отношений между дескрипторами в автоматическом режиме. Часть 3
Статьи
Автор: Лукашевич Н.В.   
03.10.2011 16:59

Использование отношений между дескрипторами в автоматическом режиме. Часть 3.

Рассмотрим два понятия С/ и С2, между которыми установлено отношение R. Выполняя простой запрос SQ(C7), мы хотим узнать, может ли отношение R с понятием С2 быть использовано для расширения этого простого запроса. То есть, можно ли в выдачу по запросу SQ(C7) с некоторыми весами добавить документы, содержащие только С2. Следовательно, чтобы проверить полезность такого расширения для запроса SQ(C7), не нужно выполнять реальное вычисление запроса с расширением, а нужно рассмотреть документы, содержащие С2, и выяснить, какой процент документов релевантен SQ(C7).

Рассмотрим пример тезаурусной статьи из тезауруса EUROVOC для дескриптора ЗЕМЕЛЬНЫЙ КАДАСТР.

По определению российского законодательства, земельный кадастр имеет следующее определение:

Земельный кадастр - это систематизированный свод документированных сведений, получаемых в результате проведения государственного кадастрового учета земельных участков, о местоположении, целевом назначении и правовом положении земель Российской Федерации и сведений о территориальных зонах и наличии расположенных на земельных участках и прочно связанных с этими земельными участками объектов.

Дескриптор ЗЕМЕЛЬНЫЙ КАДАСТР в Тезаурусе EUROVOC имеет ассоциативные связи с такими дескрипторами:

-        ГРАДОСТРОИТЕЛЬНОЕ ЗАКОНОДАТЕЛЬСТВО,

-        МЕСТНЫЕ НАЛОГИ;

-        НАЛОГ НА НЕДВИЖИМОСТЬ;

-        РАЗРЕШЕНИЕ НА СТРОИТЕЛЬСТВО.

Выполним поиск по запросу земельный кадастр в коллекции стенограмм заседаний Государственной Думы РФ в Университетской информационной системе Россия (www.cir.ru), которая соответствует области применения тезауруса EUROVOC, и проанализируем содержание первых десяти документов в выдаче (стенограммы заседаний Государственной Думы ФС РФ 25.10.2000-14.06.2002):

При поиске по стенограммам выяснилось, что:

-        только один фрагмент обсуждения как-либо касается проблемы разрешений на строительство в следующей фразе: «Наконец, кадастровая оценка земли. Посмотрите, что делается вокруг Москвы. Вокруг Москвы - леса первой группы. Эти леса нещадно вырубаются, люди строят дачи. Каким-то хитрым постановлением леса первой группы переводятся в земли общего пользования впрямую, а потом там продаются земли» (выступление Немцова Б.Е. на заседании Государственной Думы ФС РФ от 15 июня 2001 года);

-        только один фрагмент обсуждения касается законов о строительстве,

предлагая рассматривать незавершенный строительный объект как «нормальную недвижимость» (стенограмма от 14 июня 2002 года);

-        только один документ обсуждает земельный кадастр как источник информации для налоговых органов, но обсуждается проблема налогов на доходы: «базовая доходность с единицы площади одного рабочего места» (стенограмма от 6 июня 2002 года).

Проанализировав первые 50 документов выдачи УИС РОССИЯ по словам земельный кадастр, получаем, что 41 документ был релевантен понятию ЗЕМЕЛЬНЫЙ КАДАСТР (остальные 9 документов обсуждали назначения в профильном комитете Государственной Думы). Из них

-        11 документов были релевантны запросу «Налог на недвижимость»;

-        9 документов - запросу «Местные налоги»;

-        9 документов - запросу «Градостроительное законодательство»;

-        3 документа - запросу «Разрешение на строительство».

Если мы на том же множестве документов рассмотрим документы, выданные на запрос «Налог на недвижимость», то среди первых 50 документов мы обнаружим лишь 5 документов, релевантных запросу «Земельный кадастр».

Таким образом, мы видим, что если при поиске по каждому из четырех вышеперечисленных понятий будут автоматически добавлены документы, обсуждающие земельный кадастр, то точность поиска «катастрофически» упадет.

Рассмотрим, что же происходит, чему посвящены другие тексты выдачи. В стенограммах обсуждались такие вопросы, как составление Земельного кадастра, регистрация прав на недвижимость, кадастровая стоимость земельного участка, купля-продажа земли и другие вопросы.

Таким образом, мы видим, что с земельным кадастром связан ряд ситуаций. Только в относительно небольшой части из них земельный кадастр сильно связан с перечисленными выше четырьмя понятиями, а в других связь с этими понятиями отсутствует, тексты же могут обсуждать любую из этих ситуаций, поэтому плохие поисковые характеристики вышеперечисленных ассоциативных связей закономерны.

На наш взгляд, установление таких ассоциативных связей нарушает правило, которое пытается ввести стандарт Z39.19, о том, что «отношение ассоциации стоит устанавливать между двумя дескрипторами, если при употреблении одного термина другой термин как бы подразумевается». В приведенном примере использование каждого дескриптора из пары не подразумевает другого дескриптора этой же пары. Например, для разрешения на строительство необходимо множество документов, а не только выписка из земельного кадастра, а сведения из земельного кадастра могут понадобиться для принятия многих других решений.

При этом, безусловно, правило, устанавливаемое стандартом, абсолютно неформализованно, сформулировано очень нечетко, и его практически невозможно последовательно применять на практике.