- 博客(18)
- 收藏
- 关注
原创 利用pandas处理当天内交易金额快进快出的次数
利用pandas处理当天内交易金额快进快出的次数。业务描述:借钱和贷钱为一组,比如:第一组 2022年12月28日 借100,贷99;第二组 2022年12月28日借100,借100,贷200,就是当天内两次快进快出。
2022-12-27 17:53:55
396
原创 k-means聚类后,利用python计算每个节点到自身聚类中心的欧式距离
利用spark的k-means算子跑完模型后,得到中心节点,计算每个节点到中心节点的距离,用于选择每个聚类中更加典型的节点
2022-11-10 17:16:14
1083
原创 python 利用box-cox、log对数做数据预处理,重点处理数据中的极端分布,并实现可视化
python 利用box-cox、log对数做数据预处理,重点处理数据中的极端分布,并实现可视化
2022-11-09 17:15:04
1029
转载 矩阵向量、向量与向量、矩阵与矩阵、常数与向量、常数与矩阵求导(Vector derivation)
矩阵向量、向量与向量、矩阵与矩阵、常数与向量、常数与矩阵求导
2022-09-27 15:36:07
232
转载 解决Hadoop集群:Error: Could not find or load main class org.apache.hadoop.mapreduce.v2.app.MRAppMaster
解决Hadoop集群不能执行wordcount问题
2022-09-17 11:06:26
315
原创 java\scala实现获取某文件夹下以日期命名的包含当前日期的所有文件
java\scala 通过ssh 实现获取远程服务器某文件夹下,以日期命名的所有指定日期文件
2022-09-05 21:15:56
581
原创 集群hive fail to get schema version MySql远程访问Access denied for user: xxx@%‘ to database ‘datatest’ 问题
集群搭建中hive的配置问题,解决MySQL远程登录失败问题(Failed to get schema version)
2022-08-24 16:56:52
763
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人