Свойства объекта
| Дескриптор | |
| название | n-gram |
| язык | русский |
| релятор | информатика |
| определение 1 | n-буквенные последовательности, извлеченные из документа. Например, слово «констебль», разложенное в триграммы (трехбуквенные последовательности) будет выглядеть так: {«кон», «онс», «нст», «сте», «теб», «ебл», «бль»}. Существует большое количество способов извлечения таких последовательностей. По умолчанию обычно извлекаются триграммы. |
| автор словарной статьи | Соколова Е.Г. |
| комментарий | В определениях английских терминов trigram, bigram и n-gram в качестве лингвистических единиц выступают слова – токены. Здесь речь идет о символах, буквах. Надо преобразовать эти определения в более общую форму. |
Связи объекта |
|
| Ассоциируется с (RelatedTerm) | |
| Дескриптор | |
| триграмм (информатика) | |
| Дается определение в (SourceDef) | |
| Источник | определение |
| Статья Barber I. 2009 | 1 |
| Подобласть знаний(SubArea) | |
| Подобласть знаний | |
| 2.1. Автоматическая обработка текста – Automatic text processing | |
| 2.3.1. Машинный перевод – Machine translation | |
| СО3.1. Статистические методы – Statistical techniques | |
| Эквивалент на другом языке (Trans) | |
| Дескриптор | |
| n-gram | |

