Свойства объекта
Дескриптор | |
название | n-gram |
язык | русский |
релятор | информатика |
определение 1 | n-буквенные последовательности, извлеченные из документа. Например, слово «констебль», разложенное в триграммы (трехбуквенные последовательности) будет выглядеть так: {«кон», «онс», «нст», «сте», «теб», «ебл», «бль»}. Существует большое количество способов извлечения таких последовательностей. По умолчанию обычно извлекаются триграммы. |
автор словарной статьи | Соколова Е.Г. |
комментарий | В определениях английских терминов trigram, bigram и n-gram в качестве лингвистических единиц выступают слова – токены. Здесь речь идет о символах, буквах. Надо преобразовать эти определения в более общую форму. |
Связи объекта |
|
Ассоциируется с (RelatedTerm) | |
Дескриптор | |
триграмм (информатика) | |
Дается определение в (SourceDef) | |
Источник | определение |
Статья Barber I. 2009 | 1 |
Подобласть знаний(SubArea) | |
Подобласть знаний | |
2.1. Автоматическая обработка текста – Automatic text processing | |
2.3.1. Машинный перевод – Machine translation | |
СО3.1. Статистические методы – Statistical techniques | |
Эквивалент на другом языке (Trans) | |
Дескриптор | |
n-gram | |