大数据共享单车数据分析与可视化(源码分享)
大数据共享单车数据分析与可视化(源码分享)
文章目录
✍🏻作者简介:机器学习,深度学习,卷积神经网络处理,图像处理
🚀B站项目实战:https://space.bilibili.com/364224477
😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+
🤵♂代码获取:@个人主页
1 课题背景
前几年共享单车项目在国内大热,五颜六色的单车一夜之间遍布城市的各个角落。其实,早在3年前国外就有类似的项目兴起:通过历史用车记录结合天气等数据预测共享单车项目在华盛顿的需求
数据的特征解释
2 数据清洗
导库
import datetime
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from pyecharts.charts import *
import pyecharts.options as opts
from pyecharts.faker import Faker
from pyecharts.commons.utils import JsCode
读数据
df=pd.read_csv('data.csv')
提出假设
这里我们将研究决定单车租借的因素,上面给出了各个特征的解释,首先我们先大胆的提出假设:
查看有无缺失值和数据类型的情况
发现并无缺失值,不过时间的数据类型是object 需要转化为时间类型,同时为了更方便的分析数据,将datetime拆为 Year Month Weekday Hour
特征提取
#数据预处理
data['season'] = data['season'].map({1:'spring',2:'summer',3:'fall',4:'winner'})
data['weather'] = data['weather'].map({1:'Good',2:'Normal',3:'Bad',4:'ver Bad'})
#特征衍生
data['datetime'] = pd.to_datetime(data['datetime'])
data['year'] = data.datetime.apply(lambda d:d.year)
data['month'] = data.datetime.apply(lambda d:d.month)
data['day'] = data.datetime.apply(lambda d:d.day)
data['hour'] = da