Darling_00-CSDN博客

原创 Leetcode_灵神题单刷题(1052.爱生气的书店老板)

定长滑动窗口

2025-08-18 13:59:42 284

原创 LeetCode_sql刷题(3482.分析组织层级)

递归查询

2025-05-14 15:56:55 885

原创 Pandas刷题（LeetCode 601.体育馆的人流量）

类似sql窗口函数的应用groupby('r3')['r3'].transform('count') 以及连续问题

2025-05-13 11:32:32 597

原创 SQL&Pandas刷题(LeetCode3451.查找无效的IP地址)

①substring_index 括号里的3 指的是符号"."分割之后的前三位-1是指分割后从右往左数第一位②判断为八位字节ip 即分隔符为三个= 3③loc和iloc区别 iloc是索引位置 loc是索引，列名④reset_index是重置索引⑤正则表达式10-99（无前导零）：[1-9][0-9]0-9：[0-9]开头 ^结尾 $

2025-04-24 15:36:34 991

原创 Pandas刷题(LeetCode185. 部门工资前三高的所有员工)

①排名函数的用法积累dense_rankrow_number在python中的应用②根据多列进行排序。

2025-04-23 13:55:37 815

原创 pandas刷题（LeetCode184.部门工资最高的员工）

sql里窗口函数在pandas里的应用

2025-04-22 10:43:59 744

原创 Pandas刷题(607.销售员)

③去重 df[列].drop_duplicates()

2025-04-21 11:35:45 692

原创 SQL数据库刷题sql_day35(每个人的staytime的拼接)

①在hql中没有 ifnull函数可以用nvl 函数代替但是类型得是字符串（mysql中无要求）②collect_list()的妙用只有hivesql有是一个列转行的区别collect_set()也可以实现后者会自动去重。

2024-10-24 23:46:33 774

原创 SQL数据库刷题sql_day34(移动平均值、累计求和)

①rows 是根据该行的上下行划定范围的range是根据该行的值的邻近值划定范围（所以注意格式）②pandas里的cumsum函数的积累求累计和pands求近三行数据用rolling（window=3，min_periods=1）window：指定窗口的大小，即参与计算的连续数据点的数量。：指定窗口中至少需要有多少个非缺失值数据点才进行计算，默认为None，表示窗口大小的所有数据点都必须存在才进行计算。center：如果为True，则将窗口的标签设置为居中在当前位置。

2024-10-16 22:48:11 1152 1

原创 SQL数据库刷题sql_day33(连续3次为球队得分的球员名单)

①对数据进行去重可以使用distinctgroup by 分组窗口函数对去重列排序（row_number）和编号再筛选子查询 in 、 exists创建一个临时表或派生表，其中只包含唯一的记录，然后从这个临时表中查询数据。

2024-10-15 20:08:16 901

原创 Pandas -----------------------案例（九）

一些pandas案例

2024-10-10 21:20:38 1038

原创 Pandas -----------------------基础知识（八）

【代码】Pandas -----------------------基础知识（八）

2024-10-07 15:15:31 275

原创 Pandas -----------------------基础知识（主要matplotlib知识）（七）

①df.T 行变列、列变行②透视表以列名1作为索引根据列名2进行分组对列名3使用pandas内置的聚合函数进行计算返回新的df对象index='列名1',columns='列名2',values='列名3',aggfunc='内置聚合函数名'，margins=True # 默认是False, 如果为True，就在最后一行和最后一列，按行按列分别执行aggfunc参数规定的聚合函数# index：返回df的行索引，并依据其做分组；传入原始数据的列名。

2024-10-05 23:58:43 436

原创 Pandas -----------------------基础知识（六）

①类型Pandas数据类型Python类型说明objectstr字符串int64int整数float64float浮点数boolbool布尔值category无原生类型分类类型datetime无原生类型时间日期类型timedelta无原生类型时间差类型②数据结构中的数据类型object --> python str 字符串【数据类型】int64 --> python int 整数【数据类型】

2024-10-05 02:30:39 1218

原创 Pandas -----------------------基础知识（五）

Index(['区域', '地址', '户型', '面积', '价格', '朝向', '更新时间', '看房人数'], dtype='object')print(df2.sort_values(['价格', '看房人数'], ascending=[True, False]))# 2.2 使用索引下标df2.index[0]和s.index[0]可以获取具体的某一个索引值。new_df.columns = ['列名1','列名2']new_df = df[['区域','价格']]

2024-09-27 21:22:03 1118

原创 LeetCode_sql_day33(177.第N高的薪水)

limit 2，1 就是第三高那么 limit n-1，1 就是第N个。法二用窗口函数给工资排名取第N个。该表的每一行都包含有关员工工资的信息。法一可以使用limit 取第N个。在 SQL 中，id 是该表的主键。个最高工资，查询结果应该为。查询结果格式如下所示。

2024-09-27 11:44:04 371

原创 Pandas -----------------------基础知识（四）

自定义函数Series加载数据import pandas as pddf = pd.DataFrame({'Age': [20, 25, 30, 35, 40]})df# 目标: 让 Age 列的每个元素 + num1 + num2def add_nums(x,num1,num2): return x + num1 + num2df['Age'].apply(add_nums,num1 =2,num2 =3)法二df['Age'].apply(lamb

2024-09-27 11:35:51 365

原创 Pandas -----------------------基础知识（三）

df.insert(loc=area_index+1,column='区县',value=['朝阳区', '朝阳区', '西城区', '昌平区', '朝阳区','朝阳区', '朝阳区', '西城区', '昌平区', '朝阳区'])print('============修改前===================')print('============修改后===================')对 '户型', '朝向' 去重, 保留第一条, 不影响原始数据。

2024-09-23 23:57:16 804

原创 LeetCode_sql_day32(1479.周内每天的销售情况)

weekday(order_date) 范围是0-6 对应着周一到周日。

2024-09-22 21:54:26 1058

原创 Pandas -----------------------基础知识（二）

((new_df['区域']=='天通苑租房') | (new_df['区域']=='望京租房') | (new_df['区域']=='北苑租房')) & ((new_df['朝向']=='东') | (new_df['朝向']=='南'))new_df['价格'].to_frame()[(new_df['区域'].isin(['天通苑租房', '北苑租房', '小西天租房'])) & (new_df['朝向'].isin(['南', '东南']))]

2024-09-22 21:30:50 1339

原创 LeetCode_sql_day31(1384.按年度列出销售总额)

①加深对recursive循环的理解②对于法二所展现的思想需要积累先求出最大的时间差然后用开始时间相加获取每一天的年份省去了复杂的条件判断。

2024-09-22 10:55:02 727

原创 LeetCode_sql_day30(1264.页面推荐)

case when 的用法很奇妙可以积累一下遇到涉及到两列的数据可以考虑使用union 和 case when。

2024-09-20 20:12:43 804

原创 MapReduce基本原理

读取数据--> 定义map --> 分区 --> 排序 --> 规约 --> 分组 --> 定义reduce --> 输出数据。

2024-09-20 17:03:43 644

原创 LeetCode_sql_day29（1501.可以放心投资的国家）

①除了substr(phone_number,1,3)截取电话号前三位之外还能使用left函数② 也可以先union all 再做连接这样会少一次连接。

2024-09-20 16:24:41 1108

原创 Pandas -----------------------基础知识（一）

s/df>表示s对象或df对象<s/df>.size # 返回数据个数<s/df>.shape # s返回(行数,)，df返回(行数,列数)<s/df>.dtypes # s返回数据类型，df返回列名和该列数据的类型<s/df>.values # 返回全部值<s/df>.index # 查看索引<s/df>.head() # s返回前5个数据，df返回前5行数据<s/df>.tail() # s返回后5个数据，df返回后5行数据。

2024-09-20 12:36:40 1632

原创数据库基础知识---------------------------（3）

MYSQL的事务索引优化视图以及常见的窗口函数

2024-09-19 23:49:09 1474

原创 LeetCode_sql_day28（1767.寻找没有被执行的任务对）

掌握用recursive循环构造数列先用1作为起点再将一个值作为where 终点此处来源表为recursive后的表。

2024-09-19 21:27:19 843

原创数据库基础知识---------------------------（2）

就在于，对全局变量的修改会影响到整个服务器，但是对会话变量的修改，只会影响到当前的会话（也就是当前的数据库连接）在语法中，变量声明、游标声明、handler声明是必须按照先后顺序书写的，否则创建存储过程出错。用来存储查询结果集的数据类型，在存储过程中可以使用光标对结果集进行循环的处理。iterate类似于 continue，继续，结束本次循环，继续下一次。即使传入变量也不会更改变量的值，可以内部更改，仅仅作用在函数范围内。in 输入参数，参数要传到存储过程的过程里面去，if 条件表达式 then。

2024-09-19 00:02:21 1208

空空如也

空空如也