| Краткий итог опубликованных статей о тезаурусах типа WordNet |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 04.10.2011 10:31 | |||
Краткий итог опубликованных статей о тезаурусах типа WordNetЗадача разработчиков новых ворднетов для своих языков может показаться более легкой, чем задача разработчиков первого тезауруса WordNet, поскольку модель ресурса уже известна. Однако при разработке новых ресурсов необходимо учесть критику Принстонского WordNet, удачи и неудачи в прикладных экспериментах. Поскольку было высказано много критических замечаний, каждый разработчик должен выбрать для себя наиболее необходимые изменения в структуре и составе своего создаваемого ворднета, что является непростой задачей. Можно заметить, что по величине ворднеты других языков значительно меньше, чем Принстонский WordNet. Частично это объясняется тем, что Принстонский WordNet включает достаточно много специальной терминологии, особенно в области биологии (что можно видеть по количеству синсетов в домене биологии - более 20 тысяч, а также значительный блок синсетов именованных объектов - более 7.5 тысяч. Разработчики новых ворднетов включают лексику именно общеупотребительного языка, минимизируют включение синсетов, соответствующих именованным сущностям. Также во вновь создаваемых ворднетах значительно более ограничен ввод синсетов, базирующихся на значениях словосочетаний, чем в Принстонском WordNet.
|