# Douban-book-info-crawl-and-visualize
一个基于 neo4j 和 flask 的豆瓣图书数据采集分析及可视化平台。结合基于python bs4的豆瓣图书数据爬取,使用neo4j图数据库进行储存分析,并使用flask进行可视化展示,前端视图可视化使用了基于webgl的 [force-graph](https://github.com/vasturiano/3d-force-graph) 库
新增对csv支持
爬虫使用方法:
DbBot_scheduler.py [-h] [-b BID] [-run] [-m MODE] [-clr] [-p]
命令行参数含义: -run: 启动爬虫,-b:书籍在豆瓣上的ID,-m 爬虫运行模式,1代表从某本书开始爬取,2代表从边缘节点扩充, -clr 清空数据库, -p 使用代理服务器, -use_db 使用数据库
使用方法举例:
从ID为21979017的书开始进行广度优先爬取,并使用代理:
python Douban_robot\DbBot_scheduler.py -run -m 1 -b 21979017 -p
在数据库已经有多于一个节点的情况下,从边缘节点扩充数据库:
python Douban_robot\DbBot_scheduler.py -run -m 2
CSV模式,不使用数据库,将爬取数据存入CSV :(不推荐)
python Douban_robot\DbBot_scheduler.py -run -m 1 -b 21979017 -p -use_db 0
启动可视化服务器,使用neo4j作为后台数据库:
python Douban_book_visulization\book_vis_server.py
启动可视化服务器,不使用数据库,仅读取CSV文件:(不推荐)
python Douban_book_visulization\book_vis_server.py -csv
效果1(neo4j browser):

效果2(使用flask+force-graph进行前端查询和展示):

没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 1、该资源内项目代码都是经过测试运行成功,功能正常的情况下才上传的,请放心下载使用。 2、适用人群:主要针对计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、数学、电子信息等)的同学或企业员工下载使用,具有较高的学习借鉴价值。 3、不仅适合小白学习实战练习,也可作为大作业、课程设计、毕设项目、初期项目立项演示等,欢迎下载,互相学习,共同进步! 一个基于 neo4j 和 flask+webgl 的豆瓣图书数据采集分析及可视化平台(python源码+项目说明)(基于python bs4的豆瓣图书数据爬取,使用neo4j图数据库进行储存分析,并使用flask + webgl 进行可视化展示).zip
资源推荐
资源详情
资源评论






























收起资源包目录



























共 19 条
- 1
资源评论

- m0_577437232024-04-08只有源码没有说明

龙年行大运
- 粉丝: 1418
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 基于城市大数据的城乡规划专业课程思考.docx
- 单片机模拟红外编码解码设计方案.doc
- 基于单片机的步进电机伺服控制器的设计.doc
- 注塑机PLC控制南京工程.doc
- 传感器网络传感节点标识符注册管理设计.docx
- 探讨现阶段计算机网络安全管理方法.doc
- 基于PLC的自动售货机控制系统的方案设计书.doc
- 单片机的电池监控系统设计本科课程设计.doc
- 软件实习内容总结.docx
- Java毕业设计方案外文翻译.doc
- 基于PowerMILL的底座模具型腔数控编程.docx
- 大数据环境下的医院统计工作变革探索.docx
- 城镇供热系统安全运行技术规程.docx
- C#作业参考标准答案.docx
- 智慧交通行业解决方案.docx
- 基于机器学习技术的体育视频类型分类研究.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制
