1.项目代码功能经验证ok,确保稳定可靠运行。欢迎下载使用!在使用过程中,如有问题或建议,请及时私信沟通,帮助解答。 2.主要针对各个计算机相关专业,包括计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网等领域的在校学生、专业教师或企业员工使用。 3.项目具有丰富的拓展空间,不仅可作为入门进阶,也可直接作为毕设、课程设计、大作业、初期项目立项演示等用途。 基于机器学习贝叶斯算法实现垃圾邮件分类python源码+项目说明+数据集.zip Python3 - pandas - 用于保存自定义测试集下训练邮件内的单词 - pyecharts>=1.0.0 - 个人喜欢用pyecharts来做图,如果你希望使用其他作图工具,可以自动修改draw_result()函数,如果您不希望作图,可以手动注释掉bayesian.draw_result()这条语句,位于751行。注意的是,pyecharts最后保存出来的是html文件 - snapshot_selenium - 将pyecharts保存的html文件生成图片,您需要使用到chromedriver,请手动下载,如果不下载的话,您可以注释掉所有make_snapshot()语句,或者忽略终端报出来的错误 - skleran - 贝叶斯分类器是自己实现的,但SVM调用的是现成的库函数 - nltk - 用于去停用词和词性还原,需要下载一些包,您可以去官网下载,或者在百度云里下载:链接:https://pan.baidu.com/s/1_eU5sTe2bMWMJaqxA7IO8w 提取码:0pc9 ,您可以不用下载所有的包,只需要下载corpora中的stopwords和wordnet、stemmers中的porter_test和rslp、taggers中的averaged_perceptron_tagger。然后将这些文件放于C:\Users\xxxxx\AppData\Roaming\nltk_data即可) 参数解释: ``` --model:模型的选择,默认为5 - 单使用伯努利模型为1 - 单使用多项式模型为2 - 单使用SVM为3 - 三个模型同时测试,并且你已经将邮件的测试集和训练集准备好的,为4 - 三个模型同时测试,并且邮件的训练集和测试集为随机生成,为5 --train_path:训练集(或总文件)的路径,默认为'train' --test_path:测试集路径,默认为'test' --test_times:测试的次数,每次测试随机生成的测试集均不一样,默认为1 --test_file_num:每一类进行测试的邮件数目,默认为5 注意,train和test文件夹下,各自建立子文件夹spam和ham来分别存放垃圾邮件和正常邮件 ``` - 使用方法为: ``` python bayes.py --model 5 --test_times 70 ``` ```python python bayes.py --model 5 --train_path 'train' --test_times 70 --test_file_num 5 ``` ```python python bayes.py --model 5 --train_path 'train' --test_path 'test' --test_file_num 5 ``` - 结果: 如果你使用第一条命令来进行训练和测试,那么你将会得到三个模型测试后的正确率、错误邮件个数,以及三个模型对应的识别错误的邮件分布情况,如下所示:      除此之外,在终端上,你可以看到用来作出这些图片的数据。































































































































- 1
- 2

- 2201_757635562024-05-06资源太好了,解决了我当下遇到的难题,抱紧大佬的大腿~

- 粉丝: 5107
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 新医改背景下医院档案信息化建设分析.docx
- 知名地产物业管理就是服务.ppt
- 中国工程造价咨询业发展报告.ppt
- 阿里巴巴绩效考核制度.doc
- 给水管材-钢塑复合管.doc
- 基于行动导向的办公软件教学探究.docx
- 学校运动场塑胶跑道工程竣工报告.doc
- 房地产开发流程培训.ppt
- WizdomCloudUrban-EP-RM-034-监督指挥系统(标准版)用户操作手册v1.0.doc
- [北京]住宅楼木胶合板模板施工方案.doc
- 桩基施工中常见质量问题的分析与处理.doc
- 桥梁工程概预算设计.doc
- 【无线通信测试工程师认证II级】ATMCWTC.doc
- 基于质量视角下的工程监理项目管理策略.docx
- 有限元法计算双层框架.doc
- 家用护理设备行业发展趋势分析-随着家用护理设备电子化自动化时代到来推动.docx


