Войти



Последние материалы

Золотые партнеры:

доставка грузов по россии

Серебряные партнеры:

Бронзовые партнеры:

Краткий итог опубликованных статей о тезаурусе английского языка WordNet
Статьи
Автор: Лукашевич Н.В.   
04.10.2011 08:54

Краткий итог опубликованных статей о тезаурусе английского языка WordNet.

Тезаурус WordNet как общедоступный лингвистический ресурс большой величины вызвал огромный интерес во всем мире.

Часть исследователей видит проблемы WordNet в чрезмерной простоте его структуры. Однако эта простота позволила обеспечить большой объем тезауруса, что, в свою очередь, позволило организовать многочисленные эксперименты по применению этого ресурса в реальных приложениях автоматической обработки текстов.

Результаты экспериментов позволили исследователям увидеть проблемы WordNet с точки зрения практических приложений, описать те подводные камни, которые могут поджидать разработчиков новых больших лингвистических ресурсов, предназначенных для автоматической обработки текстов.

Именно поэтому всем исследователям, которые разрабатывают или собираются  разрабатывать  новые лингвистические ресурсы для  практических приложений, в настоящее время очень важно хорошо владеть сведениями о принципах устройства WordNet, о возникших проблемах, об экспериментах, направленных на изучение и преодоление этих проблем. Кроме того, WordNet продолжает свое развитие, его разработчики реагируют на критику, учитывают результаты экспериментов, проводимых с WordNet, вводят новые типы информации в свой ресурс, уточняют имеющиеся описания.

Ценность WordNet состоит еще и в том, что формализованные отношения между значениями слов позволяют исследователям быстро составлять свои собственные словари, списки слов и выражений для решения частных задач.

Ресурсы типа WordNet разрабатываются в настоящее время для многих языков мира. При этом разработчики стараются учесть выявленные проблемы, предложить новые решения. Принципы реализации новых ресурсов типа WordNet мы рассмотрим в следующих статьях.