梦如汐-CSDN博客

原创 Python入门基础练习

2、打印9*9乘法口诀表。5、小游戏唐僧大战白骨精。3、100内所有的质数。

2025-07-07 15:29:42 190

原创 python中时间函数

Python 提供了多个内置模块来处理日期和时间，其中最常用的是 datetime 模块。这个模块提供了类来操作日期、时间、日期和时间间隔。二、时间元组（struct_time）一、Python 日期和时间。

2025-07-04 15:53:22 269

而生成器（Generator）和迭代器（Iterator），正是Python为解决这类问题提供的“秘密武器”。它像一个“智能指针”，能记住遍历的位置，逐项返回数据，直到所有元素处理完毕。迭代器的核心特点是惰性计算——只在需要时生成数据，避免一次性加载所有内容到内存。1、生成器的核心优势生成器是一种特殊迭代器，通过yield关键字实现。与迭代器相比，生成器的代码量减少80%，却能实现相同功能！()：返回迭代器自身__next__()：返回下一个元素，无元素时抛出StopIteration异常。

2025-07-04 15:03:21 149

原创阿里云Transactional Table(事务表)创建和使用

阿里云事务表的使用

2024-12-05 10:50:30 439

原创 MaxCompute表操作相关命令

1.4.1 添加分区----为已经存在的分区表新增分区。1.4.2 删除分区----为已存在的分区表删除分区。1.4.4 清空非分区表。1.4.3 清空分区表。

2024-03-29 14:55:06 1052

原创 MaxCompute、Hive、MySQL以及Oracle的函数对比

【代码】MaxCompute、Hive、MySQL以及Oracle的函数对比。

2024-03-28 10:14:49 1125 1

原创阿里云实际项目应用01--创建表并写入数据

在对应的目录下创建一个新的odps文件然后敲代码，这里我构建一个eboard_test的文件![在这里插入图片描述](https://img-blog.csdnimg.cn/f5cefac3c8e64cc7b8f53b178b91b244.png运行完成就表明表创建成功。

2024-03-22 10:43:38 481 1

原创 FlinkSQL在阿里平台的使用

FlinkSQL在阿里平台入门使用

2023-09-15 18:11:57 334 1

原创 Flume采集数据Sink到S3

flume数据落地到S3

2023-09-01 14:18:27 361 1

原创 MySQL列转行

MySQL实现列转行

2023-08-30 13:55:24 1297 1

原创 Flink入门

flink基础

2023-08-23 14:54:52 241

原创 hive基础和入门

hive基础和常见数据类型

2023-08-22 14:25:32 103 1

原创 Spark数据倾斜和调优

spark数据倾斜和调优

2023-08-18 15:42:25 782 1

原创 spark Core缓存广播变量

spark缓存和广播变量

2023-08-17 18:30:03 126 1

原创 RDD----常用算子

RDD常用算子

2023-08-17 18:12:13 174 1

原创 Spark入门

Spark简述

2023-08-17 16:41:00 70 1

原创 Sqoop

Sqoop基础

2023-08-17 11:01:39 90 1

原创 Flume

Flume简述和使用

2023-08-16 13:36:44 102 1

原创 02_基于用户点击推荐

基于用户点击推荐

2023-03-02 15:29:40 1478 1

原创实时推荐项目

flink基于用户实时推荐

2023-03-02 14:48:02 291

原创 MapReduce运行过程

MapReduce是运行在yarn集群上的主要分resourcemanger和nodemanger两类一个完整的MapReduce程序分为三个部分MRAppMaster 负责整个程序的过程调度及状态协调MapTesk 负责map阶段的整个数据处理流程ReduceTesk 负责reduce阶段的整个数据处理流程MapReduc...

2019-10-10 14:14:41 231

原创大数据 ------hadoop(HDFS文件写的过程)

1. Client 发起文件上传请求, 通过 RPC 与 NameNode 建立通讯, NameNode 检查目标文件是否已存在, 父目录是否存在, 返回是否可以上传2. Client 请求第一个 block 该传输到哪些 DataNode 服务器上3. NameNode 根据配置文件中指定的备份数量及机架感知原理进行文件分配, 返回可用的DataNode 的地址如: A, B,...

2019-09-26 21:55:10 469

原创大数据之--------hadoop存储(HDFS)

Hadoop 的存储系统是 HDFS(Hadoop Distributed File System)分布式文件系统，对外部客户端而言，HDFS 就像一个传统的分级文件系统，可以进行创建、删除、移动或重命名文件或文件夹等操作，与 Linux 文件系统类似。Client客户端文件切片,文件上传的时候,Client对上传的文件进行切片成一个一个block,然后进行存储与namenode交互,获取文...

2019-09-21 20:49:55 321

原创大数据之--------hadoop(简介)

简介:Hadoop 是一个由 Apache 基金会所开发的分布式系统基础架构，它可以使用户在不了解分布式底层细节的情況下开发分布式程序，充分利用集群的威力进行高速运算和存储。从其定义就可以发现，它解決了两大问题：大数据存储、大数据分析。也就是 Hadoop 的两大核心：HDFS 和 MapReduce。(1)HDFS(Hadoop Distributed File System)是可扩展、容...

2019-09-21 20:49:02 182

原创大数据入门-----zookeeper

Shell 编程一般指编写 shell 脚本。1：基本语法:使用 vi 编辑器新建一个文件 hello.sh 1 2 #!/bin/bash echo"Hello World !" 执行方式：方式1：sh hello.sh方式2chmod +x ./hello.sh #使脚本具有执行权限./hell...

2019-09-10 15:05:26 104

weixin_45629153的博客