## Pandas Express
###An Express Guide to becoming a Kung Fu Pandas Master
After defeating the evil snow leopard Tai Lung, our favorite kung fu panda master Po returns to the Valley of Peace to help his father Mr. Ping with his noodle restaurant. Mr. Ping's noodle restaurant hasn't been doing so well, so Po is determined to help his dad figure out what he can do to improve his restaurant. Luckily, Po has been trained in the revered and ancient Python style of Shaolin martial arts and will analyze a dataset from Yelp to save his father's restaurant, like a true Kung Fu Pandas master.
This is a Python tutorial for cleaning and analyzing the Yelp Data Challenge dataset with Pandas and other Python machine learning tools
### The Dataset
We will be using a dataset of Yelp reviews provided by the [Yelp Dataset Challenge](http://www.yelp.com/dataset_challenge). The download consists of the following files in JSON format:
* business.json - information on businesses
* review.json - text and metadata of reviews
* tip.json - text and metadata of tips
* user.json - information on users
* checkin.json - number of checkins at each business
###The Tools
This tutorial will walk you through doing some basic data cleaning and exploratory analysis with Pandas and a suite of other Python data analysis tools. Below are a few of the tools we will be using:
* [numpy](http://docs.scipy.org/doc/numpy-dev/user/index.html), for arrays
* [pandas](http://pandas.pydata.org/), for data frames
* [matplotlib](http://matplotlib.org/), for plotting
* [seaborn](http://stanford.edu/~mwaskom/software/seaborn/), for making plots pretty
* [statsmodels](http://statsmodels.sourceforge.net/), for statistical analysis
* [sklearn](http://scikit-learn.org), for machine learning
Follow-up tutorials on NLP, sentiment analysis, and more coming soon!
没有合适的资源?快使用搜索试试~ 我知道了~
pandas-express:使用Pandas和其他Python机器学习工具清理和分析Yelp数据的Python教程

共3个文件
ipynb:2个
md:1个

需积分: 9 2 下载量 159 浏览量
2021-05-05
20:27:13
上传
评论
收藏 14KB ZIP 举报
温馨提示
熊猫快车 ###成为功夫熊猫大师的快速指南在击败邪恶的雪豹大龙之后,我们最喜欢的功夫熊猫大师Po返回和平谷,帮助父亲Ping先生和他的面馆。 平先生的面馆状况一直不太好,因此蒲先生决心帮助他的父亲弄清楚他可以做些什么来改善自己的餐厅。 幸运的是,Po受到了少林武术的崇敬和古老的Python风格的培训,并将像Ye功夫熊猫的真正主人一样,分析Yelp的数据集来保存他父亲的餐厅。 这是一个Python教程,用于使用Pandas和其他Python机器学习工具清理和分析Yelp Data Challenge数据集 数据集 我们将使用提供的Yelp评论。 下载内容包含JSON格式的以下文件: business.json-有关企业的信息 review.json-评论的文本和元数据 tip.json-提示的文本和元数据 user.json-用户信息 checkin.json-每个企业的签到数量 ###
资源推荐
资源详情
资源评论

格式:zip 资源大小:250.7MB

格式:zip 资源大小:34.6MB

























格式:zip 资源大小:31.1KB



收起资源包目录





共 3 条
- 1
资源评论


秦风明
- 粉丝: 52
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 西安某高层住宅楼工程项目策划书(创长安杯).doc
- 第十四章-电梯电气装置.doc
- BIM技巧BIM装饰族不再是硬伤.docx
- 综合管沟施工技术总结.doc
- 海外投资一部工作指导书.pdf
- 预制外墙板安装工艺.doc
- 智能建筑电气设备安装技术.doc
- 物流信息系统开发9√.ppt
- 简约IOS风格商务PPT模板.pptx
- 湖南装饰造价员培训--装饰其他工程.ppt
- 土建阶段成品保护作业指引.doc
- 医学解决图的编程问题培训课件.ppt
- 现代地下商业建筑环境空间设计探讨.doc
- 生物智慧城市建设方案设计.docx
- 装配式剪力墙结构住宅施工技术与管理图文.pdf
- 国培计划xx海南省网络研修与能力提升工程综合项目.doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制
