Войти



Последние материалы

Серебряные партнеры:

Термоусадочная пленка, армированная. Трехслойная термоусадочная пленка.

Бронзовые партнеры:

Общественно-политическая область
Статьи
Автор: Лукашевич Н.В.   
07.11.2011 18:24

Общественно-политическая область

Из предшествующего рассмотрения мы можем сделать следующие выводы (Loukachevitch, Dobrov, 2004d; Лукашевич, Добров, 2004а).

1)      В общеупотребительном языке существует лексика, которая может быть употреблена во многих предметных областях, не связана с той или иной предметной областью. Это лексика, связанная с общими процессами, действиями, стадиями, отношениями, оценками. Мы называем такое множество лексики Общий лексикон. При разметке тезауруса WordNet предметными областями такое множество нетематической лексики также было выделено и названо областью Factotum (см. ««Теннисная проблема» в WordNet»).

2)      Мы считаем, что человек разрезает мир на более узкие или более широкие области, понятийные системы, терминосистемы для удобства. Понятие в большой степени не зависит от того, какую предметную область мы рассматриваем (см. также концепцию «универсального терминологического пространства» в (Мальковский, Соловьев, 2002)).

Так, понятие «ценные бумаги» может входить в разные частично пересекающиеся предметные области, такие как:

-        предметная область «ценные бумаги»,

-        предметная область «биржевая торговля»,

-        предметная область «инвестиции»,

-        предметная область «финансы» и т. п.

Если взять тексты, которые относятся к данным предметным областям, то выяснится, что помимо терминологии этих областей в текстах содержится значительное количество терминологии из более общей предметной области, из «соседних» предметных областей и др. Таким образом, чтобы качественно обрабатывать тексты в той или иной предметной области, нужно описать в тезаурусном ресурсе значительно большее количество языковых единиц. Поэтому мы не создаем отдельные тезаурусы для большого количества предметных областей, а делаем ресурс на максимально широкую предметную область. Одной из таких областей является так называемая общественно-политическая область,

3)      Общественно-политическая область включает в себя лексику и терминологию, которая, с одной стороны, известна достаточно широкому слою на

селения, с другой стороны, соответствует понятиям профессиональных сфер

деятельности.

На такую особенность Общественно-политической области указывают также разработчики Тезауруса Исследовательской службы Конгресса США (L1V, 1994), которые пишут, что для описания широкой области общественных отношений приходится использовать разные типы лексических единиц, в том числе как специальную терминологию, так и тематическую лексику общего языка (popular terminology).

Рассмотрим состав и особенности общественно-политической области на примере реализации тезауруса РуТез как модели понятийной системы русского языка.

Если представить себе иерархию понятий от более общего к более частному, то наиболее верхние уровни занимает зона общей лексики - Общий лексикон, более нижние уровни занимает Общественно-политическая область (рис. 15.2). Одновременно именно в общественно-политической области находятся верхние уровни профессиональных понятийных систем (рис. 15.3).

Разные предметные области имеют различные по величине пересечения с Общественно-политической областью. Так, понятийная система предметной области «Выборы» практически полностью находится в Общественно-политической области, в то время как сферы различных промышленных производств пересекаются с общественно-политической областью лишь по небольшому числу понятий (рис. 15.3).

Можно выделить совокупность непроизводственных регулирующих сфер деятельности, которые значимы в повседневной деятельности многих людей и, стало быть, в значительной степени пересекаются с общественно-политической областью, такие как Налоги, Бухгалтерия, Право, Таможня, Банковская сфера, образуя правовой и финансовый блоки областей (рис. 15.4).

Научные понятийные системы пересекаются с общественно-политической областью сложнее. Общественно-политическая область включает основные виды наук, научных учреждений, общенаучные понятия. Однако каждая наука задает свою категоризацию изучаемых явлений, в связи с чем ее верхние уровни классификации могут значительно отличаться от классификации на базе общей лексики (рис. 15.5). Наиболее значительно общественно-политическая область пересекается со сферой общественных наук. Общественно-политическая область содержит понятия общественной жизни, которые изучаются общественными науками. При этом каждая общественная наука может иметь свою собственную классификацию рассматриваемых явлений.

Выделение такой области, а также выделение среди общеупотребительной лексики лексем, принадлежащих этой области, является чрезвычайно полезным для разработки лингвистических ресурсов и технологий автоматической обработки больших электронных коллекций.

Прежде всего, терминология и лексика из этой области активно используется в самых разных по жанру, но значимых для жизни общества текстах, таких как законы, международные договоры, другие официальные документы, газетные сообщения, экономические документы (Loukachevitch, Dobrov, 2002). Таким образом, создание лингвистического ресурса в общественно-политической области может значительно повысить эффективность и содержательность обработки всех этих видов документов.

Поскольку общественно-политическая область содержит наиболее общеизвестные понятия многих профессиональных предметных областей, то лингвистический ресурс, разработанный для общественно-политической области, может стать источником существенного понятийно-терминологического материала для создания лингвистических ресурсов в конкретных предметных областях.

Одновременно общественно-политическая область - это область общезначимая, она содержит значительное количество общелексического материала, который относится к нижним и средним наиболее конкретным уровням языковой системы языка, поэтому понятийная структура общественно-политической области является и существенным базисом, на который можно опираться, например, выстраивая понятийную иерархическую систему языка типа WordNet (Miller и др., 1990). Кроме того, если рассмотреть количество многозначных общеупотребительных слов внутри общественно – политической области и в общем лексиконе, то многозначных слов в общественно-политической области значительно меньше, а процедура автоматического разрешения многозначности работает эффективнее, поскольку часто значения относятся к различным подобластям общественной жизни. Например, в подавляющем большинстве текстов контексты разных значений словоформы судов как средства водного транспорта и судебного органа существенно различаются. Это различие можно также эффективно использовать при автоматической обработке текстов, используя, например, комбинированную обработку текстов и запросов при решении информационно-поисковых задач, а именно, пытаться разрешать многозначность для слов и терминов, относящихся к общественно-политической области, и использовать пословную обработку для остальной общеупотребительной.

Таким образом, мы считаем, что описание общей лексики должно сочетаться с описанием терминологии предметных областей общественно-политической области.

В настоящее время Общественно-политический тезаурус интегрирует в себе значительную долю терминологии следующих предметных областей, которая была введена в него в течение деятельности в ряде проектов по автоматической обработке текстов: экономика, право, социология, демография, банковское дело, государственный финансовый контроль, выборы.