以下内容皆为原创,制作实属不易,请点点关注和赞赞❥(^_^)
这一关,我们学习stop_words的用法和中文分词和特征提取。
一.停用词stop_words
这个参数是CountVectorizer里面的参数,所谓停用词,就是不想看见的词。为什么不想看见?说明没有意义呗。有意义的我肯定想看啊。接下来看有无参数之前和之后的代码。
from sklearn.feature_extraction.text import CountVect
以下内容皆为原创,制作实属不易,请点点关注和赞赞❥(^_^)
这一关,我们学习stop_words的用法和中文分词和特征提取。
这个参数是CountVectorizer里面的参数,所谓停用词,就是不想看见的词。为什么不想看见?说明没有意义呗。有意义的我肯定想看啊。接下来看有无参数之前和之后的代码。
from sklearn.feature_extraction.text import CountVect