[每日一练]关于数据透视表的创建(数据结构重组的MySQL和pandas实现)

#该题目来源于力扣:

1777. 每家商店的产品价格 - 力扣(LeetCode)

一:关于数据透视表的理解:

数据透视表就是一种数据的重塑过程,改变原有的数据结构,针对不同类别(如时间、地点、产品等)进行分组、汇总和比较。

从数据程序员的角度来看,数据透视主要是通过 行和列的重构 来聚合数据,生成一种更直观、更易于分析的格式。

核心概念

数据透视的关键是:

  1. 行转列:在数据透视过程中,某些列的值(如类别、时间、地点等)会变成新的列名。
  2. 数据汇总:通常会对行或列的数据进行汇总,比如计算总和、均值、计数等。
  3. 缺失值处理:对于某些组合可能没有值,数据透视会填充 NaN 或其他自定义的缺失值

为什么需要数据透视?

数据透视通常用来将 长格式 的数据(每行代表一个观测)转化为 宽格式(每行代表一个类别或聚合单元),以便于:

  • 进行更加直观的比较。
  • 提供更加结构化的数据形式。
  • 简化后续的计算和分析工作。

数据透视表的代码总结:

  • pivot:将长格式的数据转化为宽格式的数据,就是改变元数据集的数据结构,让某些列作为新的索引,让某些列数据作为行标签
  • melt:将宽格式的数据转换为长格式,可以理解为还原pivot制作的数据透视表为元数据。

二:题目要求:

表:Products

+-------------+---------+
| Column Name | Type    |
+-------------+---------+
| product_id  | int     |
| store       | enum    |
| price       | int     |
+-------------+---------+
在 SQL 中,(product_id,store) 是这个表的主键。
store 字段是枚举类型,它的取值为以下三种 ('store1', 'store2', 'store3') 。
price 是该商品在这家商店中的价格。
 

找出每种产品在各个商店中的价格。

可以以 任何顺序 输出结果。

返回结果格式如下例所示。

 

示例 1:

输入:
Products 表:
+-------------+--------+-------+
| product_id  | store  | price |
+-------------+--------+-------+
| 0           | store1 | 95    |
| 0           | store3 | 105   |
| 0           | store2 | 100   |
| 1           | store1 | 70    |
| 1           | store3 | 80    |
+-------------+--------+-------+
输出:
+-------------+--------+--------+--------+
| product_id  | store1 | store2 | store3 |
+-------------+--------+--------+--------+
| 0           | 95     | 100    | 105    |
| 1           | 70     | null   | 80     |
+-------------+--------+--------+--------+
解释:
产品 0 的价格在商店 1 为 95 ,商店 2 为 100 ,商店 3 为 105 。
产品 1 的价格在商店 1 为 70 ,商店 3 的产品 1 价格为 80 ,但在商店 2 中没有销售。

三:pandas解法:

很经典的宽格式数据转换为行格式数据,可见题目要求produce_id不变,还是作为列索引,需要将列数据store中的店名转换为行标签,最后用price列中的数据便会根据列索引product_id和行标签店名进行分组聚合的处理:

import pandas as pd

def products_price(products: pd.DataFrame) -> pd.DataFrame:
    data=products.pivot(index='product_id', columns='store', values='price').reset_index()
    return data

四:MySQL解法:

MySQL中没有特定的数据透视表的现成代码,但是我们可以通过casewhen逻辑判断语句手搓:

case when 根据不同值转化为列 的列名 = 对应的不同值 then 要返回的对应数据

然后按照响应的列索引进行分组。当然,在分组后,我们要对select字段里的casewhen语句添加随意的聚合语句,不然按照MySQL的特性,可能会随机返回一个值,造成不必要的数据谬误

# Write your MySQL query statement below
SELECT product_id,
SUM(CASE WHEN store = 'store1' THEN price END) AS store1,
SUM(CASE WHEN store = 'store2' THEN price END) AS store2,
SUM(CASE WHEN store = 'store3' THEN price END) AS store3
FROM Products 
GROUP BY product_id  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值