Войти



Последние материалы

Золотые партнеры:

чехлы для iphone 4

Серебряные партнеры:

hansgrohe raindance

Бронзовые партнеры:

Описание предметных областей (domains) и межъязыковой индекс ILI
Статьи
Автор: Лукашевич Н.В.   
04.10.2011 09:38

Описание предметных областей (domains) и межъязыковой индекс ILI.

Domains.

EuroWordNet включает в свою структуру также описание предметных областей - доменов. Это нововведение призвано преодолеть проблему WordNet, описываемую как теннисная проблема, когда принадлежащие одной сфере деятельности синсеты оказываются далеко друг от друга в структуре WordNet. Именно в рамках проекта EuroWordNet было предложено упоминавшееся решение сгруппировать синсеты в домены. Предполагалось, что введение доменов должно быть особенно полезно для нформационно-поисковых задач. Домены представляют собой отдельные объекты и могут быть организованы между собой в иерархии.

Эксперименты с доменами в ворднетах были продолжены и в следующем европейском проекте, связанном с ворднетами, Meaning (Atserias и др., 2004; Castillo и др., 2004).

 

Межъязыковой индекс ILI

Для того чтобы установить связи между различными языками, в проекте EuroWordNet синсеты каждого ворднета имеют отсылку на так называемый межъязыковой индекс (interlingual index - ILI), в качестве которого выбираются синсеты Принстонского WordNet. Индекс представляет собой неупорядоченный список синсетов с толкованиями.

Для более точного описания соответствия конкретных синсетов каждого языка и преодоления лексических пропусков, которые могут возникнуть в том или ином языке, предоставляется возможность использования нескольких разных отношений эквивалентности от синсетов конкретного языка к индексу ILI:

-        EQ SYNONYM: имеется прямое соответствие между синсетом языка и синсетом индекса;

-        EQNEARSYNONYM: синсету соответствует несколько синсетов индекса;

-        HAS EQHYPERONYM: синеет является более специфичным, чем

имеющиеся синсеты индекса;

-        HASEQHYPONYM: синеет может быть связан только с более специфичными синсетами индекса.

Так, испанское слово dedo, соответствующее русскому слову палец, находится в отношении HASEQHYPONYM к таким английским синсетам из индекса ILI, как toe (палец ноги) и finger (палец руки).