Свойства объекта
| Дескриптор | |
| название | графематический анализ |
| язык | русский |
| релятор | |
| определение 1 | Один из этапов обработки текстовых данных, предполагающий проведение следующих операций: разделение входного текста на элементы (слова, разделители и т.д.), удаление нетекстовых элементов, выделение и оформление нестандартных (нелексических) элементов, обработка специальных текстовых элементов (имен (имя, отчество), написанных инициалами, иностранных лексем, записанных латиницей, названий рисунков, примечаний, страниц форзаца, зачеркиваний, титульных листов, списков литературы и т.д.). |
| определение 2 | Графематический анализ (графематика) - достаточно простая программа, выполняющая первые предварительные действия над текстом. На вход графематике подается текст в кодировке Windows, на выходе строится графематическая таблица, в которой на каждой строке стоит слово или разделитель из входного текста. Программа выделяет некоторые аббревиатуры, имена с инициалами, даты и пр. Кроме деления текста на слова, графематика разбивает текст на абзацы и предложения (макросинтаксический анализ). |
| автор словарной статьи | Хохлова М.В. |
Связи объекта |
|
| Ассоциируется с (RelatedTerm) | |
| Дескриптор | |
| корпус | |
| лемматизация | |
| токен (корпусная лингвистика) | |
| Встречается дескриптор в (SourceDescriptor) | |
| Источник | частота |
| Коллекция текстов Диалог 2000-2010 | 8 |
| Дается определение в (SourceDef) | |
| Источник | определение |
| Сайт проекта АОТ | 2 |
| Учебник Захарова В.П., Богдановой С.Ю. | 1 |
| Подобласть знаний(SubArea) | |
| Подобласть знаний | |
| 2.1.1. Сегментация текста – Text Segmentation | |
| 2.1.2. Морфологический анализ/синтез - Morphological analysis/synthesis | |
| Синоним (Syn) | |
| Аскриптор | |
| токенизация | |
| Эквивалент на другом языке (Trans) | |
| Дескриптор | |
| tokenization | |

