基于Python的学生校园消费行为分析源码+数据+报告（高分项目）资源-CSDN下载

共6个文件

py：5个

zip：1个

版权申诉

Python

期末大作业

课程设计

源码

184 浏览量 2024-12-31 18:44:24 上传评论收藏 4.89MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

基于Python的学生校园消费行为分析 (高分项目).zip （6个子文件）

-主master-

task1_X.py 4KB

task3_X_1.py 10KB

task3_X_2.py 18KB

task2_X2.py 13KB

项目数据.zip 4.87MB

task2_X1.py 10KB

# -*- coding: utf-8 -*- """ Created on Mon Dec 2 19:22:54 2019 @author: lenovo """ import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.cluster import KMeans plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False df1=pd.read_csv('C:/Users/lenovo/.spyder-py3/大学生消费行为分析/项目实操/data1.csv',encoding='gbk') df2=pd.read_csv('C:/Users/lenovo/.spyder-py3/大学生消费行为分析/项目实操/data2.csv',encoding='gbk') print('表格行列值为：',df2.shape)#查看表格数据共有多少条 #——————————————————————————————————————————————————————————————————————————— ######数据预处理————缺失值###### print(df2.isnull().any())#检查表格数据是否有缺失值 #——————————————————————————————————————————————————————————————————————————— ######数据预处理————转换日期格式##### print('进行转换前表的类型为：\n', df2['Date'].dtypes) df2['Date'] = pd.to_datetime(df2['Date'])#转换日期格式 print('进行转换后表的类型为：\n', df2['Date'].dtypes) #——————————————————————————————————————————————————————————————————————————— ######数据预处理————异常值##### df2_dec=df2.describe()#对统计字段进行描述统计 print(df2_dec) #plt.scatter(df2['Index'], df2['Money'])#画图观察消费金额分布 #plt.show() datetimes=df2 datetimes=datetimes.set_index('Date')#重设索引将日期定为索引 #locs = datetimes.index.indexer_at_time('00:00:00')#提取特定时间点的消费数据 #print(locs) start_time = '00:00:00' end_time = '06:00:00' locs2 = datetimes.index.indexer_between_time(start_time, end_time, include_start=True, include_end=False) df2_night=datetimes.iloc[locs2]#提取出时间位于凌晨的消费数据 print("消费时间在0点至6点的消费数据量有：",df2_night.shape) df2_night=df2_night.reset_index() print("凌晨时间消费的地点为:\n",df2_night['Dept'].unique()) print("凌晨时间消费的地点频次数为:\n",df2_night['Dept'].value_counts()) #提取出在食堂消费的数据 #df2_loc=df2.loc[df2['Dept']=="第一食堂"] df2_outlier=[] for i in range(len(df2_night)):#提取出消费地点异常的数据 word1 = "食堂" word2="教学楼" word3="基础课部" if word1 in df2_night.loc[i,'Dept']: df2_outlier.append(df2_night.loc[i,:]) if word2 in df2_night.loc[i,'Dept']: df2_outlier.append(df2_night.loc[i,:]) if word3 in df2_night.loc[i,'Dept']: df2_outlier.append(df2_night.loc[i,:]) df2_outlier=pd.DataFrame(df2_outlier) print("消费地点异常的数据量有：",df2_outlier.shape) new_df2 = df2[~ df2['Index'].isin(df2_outlier['Index'])]#在原表中删除异常数据的行 print("数据清洗完成后剩余的有效数据量为：",new_df2.shape) new_df2.drop('TermSerNo',axis=1,inplace=True)#删除TermSerNo和conOperNo两列 new_df2.drop('conOperNo',axis=1,inplace=True)#删除TermSerNo和conOperNo两列 #——————————————————————————————————————————————————————————————————————————— #####表格合并##### all_data = pd.merge(new_df2,df1,left_on ='CardNo',right_on = 'CardNo') print(all_data) #——————————————————————————————————————————————————————————————————————————— #计算刷卡的学生数目 student=len(all_data['CardNo'].unique()) print("18级学生总数为:",student) #依照卡号进行分组，并计算均值 #student= all_data.groupby(['Major'])#根据校园卡进行分组 #人均刷卡频次=本月刷卡总数/人数 #student_month_count=all_data['CardNo'].value_counts()#学生的本月各学生刷卡频次 Times=len(all_data)#刷卡记录总数 student_month_count= Times / student#人均刷卡频次 print("整体18级学生的本月人均刷卡频次为:",student_month_count) #人均消费=总消费金额/人数 student_spend=all_data['Money'].sum()#学生本月消费总额 student_e_money= student_spend / student#学生本月人平均消费 print("整体18级学生的本月人均消费为:",student_e_money) #———————————————————————————————任务3.1开始————————————————————————————————— #—————————————————————————————————————————————————————————————————————————— #专业&性别 #—————————————————————————————————————————————————————————————————————————— #专业数目 Majors=len(all_data['Major'].unique()) Majors_name=all_data['Major'].unique() print("18级包含专业数为:",Majors) print("18级包含的专业为:\n",Majors_name) '''['18工业设计' '18机械制造' '18计算机应用' '18电气自动化' '18国贸实务' '18软件技术' '18宝玉石鉴定' '18电子商务' '18模具设计' '18连锁经营' '18旅游管理' '18视觉传播' '18国际金融' '18会计' '18商务英语' '18金融管理' '18审计' '18嵌入式技术' '18建筑设计' '18皮具艺术' '18国际商务' '18计算机网络' '18工商企管' '18市场营销' '18首饰设计' '18工程造价' '18工业工程' '18物流管理' '18商务日语' '18建筑工程' '18艺术设计' '18工业机器人' '18社会工作' '18汽车检测' '18市政工程' '18酒店管理' '18产品艺术' '18机械制造（学徒）' '18动漫设计' '18环境艺术' '18投资与理财']''' #男女生总数 girls=all_data.loc[all_data['Sex']=='女'] boys=all_data.loc[all_data['Sex']=='男'] print("18级女生总数为：",girls) print("18级男生总数为：",boys) #groupby方法 Majors_grouped= all_data.groupby(['Major','Sex'])#根据专业和性别进行分组 Majors_group= all_data.groupby(['Major','Sex','Dept'])#根据专业和性别进行分组 def CardTimes(data): students=len(data['CardNo'].unique())#计算学生总数 Times=len(data)#刷卡记录总数 s_month_count= Times / students#人均刷卡频次 #print("本月人均刷卡频次为:",student_month_count) return s_month_count def EPeopleSpend(data): students=len(data['CardNo'].unique())#计算学生总数 student_spend=data['Money'].sum()#学生本月消费总额 s_e_money= student_spend / students#学生本月人平均消费 #print("整体18级学生的本月人均消费为:",student_e_money) return s_e_money #—————————————————————————————————————————————————————————————————————————— #各专业、不同性别学生的本月人均刷卡频次和人均消费 staff_C=Majors_grouped.apply(CardTimes)#人均刷卡频次 #staff_C

评论收藏

内容反馈

版权申诉