Войти



Советуем прочесть

Последние материалы

Золотые партнеры:

Серебряные партнеры:

Бронзовые партнеры:

Отношения ассоциации в информационно-поисковых тезаурусах
Статьи
Автор: Лукашевич Н.В.   
01.10.2011 08:58

Отношения ассоциации в информационно-поисковых тезаурусах

Основным назначением установления ассоциативных отношений между дескрипторами информационно-поискового тезауруса является то, что установление такой связи может указать дополнительные дескрипторы, полезные при индексировании или поиске.

Отношение ассоциации является неиерархическим. Ассоциативное отношение наиболее трудно определить. Российский стандарт на создание информационно-поисковых тезаурусов указывает, что «ассоциативное отношение является объединением отношений, не входящих в иерархические отношения или в отношения синонимии. Допускается включать в ассоциативное отношение все виды отношений, кроме синонимии и отношения род-вид» (ГОСТ 7.25-2001).

Другие источники стараются изложить более подробные принципы установления ассоциативных отношений, поскольку в противном случае отношения будут устанавливаться непоследовательно (Aitchinson, Gilchrist, 1987).

Американский стандарт описывает наиболее общее правило установления ассоциативного отношения между дескрипторами таким образом, что это отношение следует устанавливать между двумя дескрипторами, если при употреблении одного термина другой термин как бы подразумевается. Более того, один термин часто есть необходимый элемент определения другого термина, например, термин клетка составляет необходимую часть определения термина цитология.

Более конкретно типы ситуаций, в которых необходимо установить ассоциативные отношения по версии Американского стандарта, могут быть следующими.

Если дескрипторы принадлежат одной иерархии, то ассоциативные отношения устанавливаются:

-        между видами одного и того же понятия, когда их значения пересекаются, например, английские слова ship и boat, которые не являются эквивалентными, но в то же время во многих контекстах являются взаимозаменимыми;

-        между понятиями, одно из которых происходит от другого, например, поскольку известно, что мул - это помесь осла и лошади, то ассоциативное отношение должно быть установлено между дескрипторами мул - осел и мул - лошадь.

 

Случаи, в которых необходимо установить отношения между дескрипторами, принадлежащими разным иерархиям, являются достаточно разнообразными:

1)      научная дисциплина - объект изучения или специалист в этой

дисциплине:

математика - математик

неврология - нервная система

2)      операции или процессы и их агент или инструмент:

контроль температуры - термостат

охотник - охота

3)      объекты или процессы и их контрагенты:

растения - гербициды

4)      действия и их продукты:

ткачество - ткань

слезоотделение - слеза

5)      действия и их цели:

переплетное дело - книга

6)      объекты и вещества и их свойства (уникальные свойства - unique):

яды - токсичность

жидкость - поверхностное натяжение

7)      понятия, связанные причинно-следственной связью:

смерть - оплакивание

8)      понятия и единицы их измерения

электрический ток - ампер

Авторы конкретных тезаурусов могут вводить свои правила описания ассоциативных отношений. Так, в тезаурусе EUROVOC ассоциативные отношения устанавливаются в случаях, когда между дескрипторами существуют следующие отношения (EUROVOC, 2001):

-        причина;

-        инструмент;

-        иерархические отношения, когда полииерархия возможна, но запрещена и поэтому заменяется на ассоциацию;

-        отношения сопутствия, следования во времени или пространстве;

-        материал;

-        свойство, особенность;

-        предмет действия, процесса, отрасли знаний;

-        локализация;

-        сходство, подобие;

-        антонимия.

При такой расплывчатости отношения ассоциации возникает вопрос, на какие источники можно опереться при описании этих отношений.

При создании тезауруса конкретной предметной области может использоваться несколько различных источников ассоциативных отношений.

Во-первых, используются тексты данной предметной области. Анализ таких текстов позволяет вскрыть реальные типы смысловых отношений, характерных для данной предметной области. При таком подходе ассоциативные отношения, выделяемые в информационно-поисковом тезаурусе, будут соответствовать смысловым отношениям, существующим в тексте (Герд, 2005).

По текстам также может изучаться совместная встречаемость различных терминов в конкретных текстах, что не является достаточно надежным критерием установления правильных ассоциативных отношений (Мдивани, 2004).

Второй путь - это установление ассоциативных отношений через обращение к энциклопедиям, терминологическим словарям, справочникам для логического анализа определений терминов. Вместе с тем в случаях широких предметных областей, неустоявшихся терминологий определения терминов могут значительно различаться, отражать разные особенности концепций авторов словарей, что может привести к появлению ложных ассоциативных связей в тезаурусе.

Серьезной проблемой является также и то, что словарная статья термина в словаре, энциклопедии может упоминать достаточно много других терминов. Возникает вопрос, какие из них нужно ассоциировать с заглавным термином.

Третий путь - обращение к специалистам, которые могут дать обоснованную оценку отношениям между терминами.

 

Наконец, на основе всех источников может быть создан четкий перечень наиболее важных смысловых отношений данной предметной области. Как ассоциативные отношения могут рассматриваться лишь те отношения, которые соответствуют составленному списку.

В целом, можно отметить, что установление отношения АССОЦИАЦИИ, несмотря на все попытки ограничить установление этого отношения, являются наиболее субъективными (Мдивани, 2004), часто встречается искусственное и надуманное конструирование ассоциативных отношений (Герд, 2005). Особые проблемы установления ассоциативных отношений возникают при создании тезауруса для больших, гетерогенных областей, не позволяющих четко зафиксировать типы смысловых отношений, соответствующих ассоциативным отношениям тезауруса.

Из приведенных примеров также очевидно, что хотя отношения ассоциации рассматриваются как симметричные, по сути, многие типы упомянутых отношений явно несимметричны, по крайней мере, в тех случаях, когда в качестве определяемого термина служит один из этих терминов.