\//\

О тезаурусе




Данный электронный ресурс представляет русско-английский тезаурус по компьютерной лингвистике (КЛ), который разработан в соответствии с отечественными и международными стандартами, регламентирующими построение информационно-поисковых тезаурусов, а также на основе анализа и обобщения опыта создания тезаурусов для областей, близких к компьютерной лингвистике.

Тезаурус ориентирован как на непосредственное использование людьми, желающими обратиться к системе понятий из области КЛ, так и для решения задач индексирования, тематического рубрицирования и информационного поиска.

Тезаурус покрывает своими терминами все основные направления компьютерной лингвистики: теоретическая компьютерная лингвистика, автоматическая обработка текста, речевые технологии, корпусная лингвистика, лингвистические ресурсы, включая компьютерную лексикологию и лексикографию, и прикладные системы КЛ, включая информационный поиск, машинный перевод, извлечение информации и интеллектуальный анализ текста.

Понятия тезауруса представляются терминами на русском и английском языках. Различается два типа терминов: дескрипторы (предпочтительные термины) и аскрипторы (текстовые входы). Дескрипторы могут использоваться при индексировании документов и в поисковых запросах, а аскрипторы – при выполнении этих задач подлежат замене одним или несколькими дескрипторами. Все дескрипторы снабжены определениями. Каждый дескриптор связывается со своим эквивалентом на другом языке, с релевантными подобластями как самой КЛ, так и смежных дисциплин, что обусловлено междисциплинарным характером КЛ, а также с источниками, т.е. текстовыми документами или коллекциями текстов, в которых он встречается или определяется. Кроме того, дескрипторы связаны между собой отношением симметричной ассоциации.

Доступ к содержимому тезауруса обеспечивает эргономичный пользовательский интерфейс, который предоставляет пользователю удобные средства навигации по тезаурусу, поиска и фильтрации терминов. При этом содержимое тезауруса представляется пользователю в виде сети взаимосвязанных информационных объектов – терминов и описаний источников терминов и их определений. При навигации по тезаурусу обеспечивается возможность выбора необходимых пользователю терминов, детального просмотра их описаний (тезаурусных статей), а также описаний источников (публикаций или коллекций текстов), в которых встречается термин и/или его определение.

Русско-английский тезаурус по компьютерной лингвистике разрабатывается с 2010 года на базе Института систем информатики им. А.П. Ершова СО РАН (http://www.iis.nsk.su) при участии лингвистов из РГГУ, МГУ, СПбГУ, ИНИОН РАН.

Тезаурус разработан при финансовой поддержке РГНФ (№ 10-04-12108в).

Руководитель проекта:
Загорулько Юрий Алексеевич