TF-IDF(Term Frequency–InverseDocument Frequency)是一种用于资讯检索与文本挖掘的常用加权技术。TF-IDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。

完整内容请阅读:https://blog.csdn.net/Gamer_gyt/article/details/85690389


打开微信扫一扫,关注微信公众号【搜索与推荐Wiki】