- 博客(51)
- 收藏
- 关注
原创 新闻分类作业
分为三部分,第一部分,要内容有数据整理、加载数据、文本预处理(缺失值处理、重复值处理、文本内容清洗、分词、停用词处理)、数据可视化。第二部分,主要内容有构建训练集与测试集、特征选择、分类模型评估、逻辑回归、KNN、决策树、多层感知器、朴素贝叶斯。第三部分,主要根据5中分类模型:逻辑回归、KNN、决策树、多层感知器、朴素贝叶斯,进行对比。其主要内容有,讨论准确率、在每个领域都列表对比F1-score,整体讨论。通过实验发现多层感知器在整个新闻文本分类中较好,朴素贝叶斯在我这个数据集中相对较差。......
2022-06-20 17:41:51
2837
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人