Свойства объекта
Дескриптор | |
название | TF-IDF |
язык | русский |
релятор | |
определение 1 | (от англ. TF — term frequency, IDF — inverse document frequency) — статистическая мера, используемая для оценки важности слова в контексте документа, являющегося частью коллекции документов или корпуса. Вес некоторого слова пропорционален количеству употребления этого слова в документе, и обратно пропорционален частоте употребления слова в других документах коллекции. |
автор словарной статьи | Соколова Е.Г. |
комментарий | Смысл метода TF-IDF сводится к тому, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (то есть чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину. Авторы - Gerard Salton и Karen Sparck Jones.
Мера TF-IDF часто используется в задачах анализа текстов и информационного поиска, например, как один из критериев релевантности документа поисковому запросу, при расчёте меры близости документов при кластеризации. (http://ru.wikipedia.org/wiki/TF-IDF) |
Связи объекта |
|
Ассоциируется с (RelatedTerm) | |
Дескриптор | |
вес (информационный поиск) | |
Встречается дескриптор в (SourceDescriptor) | |
Источник | частота |
Интернет энциклопедия «Википедия» | |
Дается определение в (SourceDef) | |
Источник | определение |
Интернет энциклопедия «Википедия» | 1 |
Подобласть знаний(SubArea) | |
Подобласть знаний | |
2.3.2. Информационный поиск – Information retrieval | |
СО3.1. Статистические методы – Statistical techniques | |
Эквивалент на другом языке (Trans) | |
Дескриптор | |
tf–idf | |