- 博客(25)
- 收藏
- 关注
原创 python中时间函数
Python 提供了多个内置模块来处理日期和时间,其中最常用的是 datetime 模块。这个模块提供了类来操作日期、时间、日期和时间间隔。二、时间元组(struct_time)一、Python 日期和时间。
2025-07-04 15:53:22
269
原创 python中的迭代器和生成器
而生成器(Generator)和迭代器(Iterator),正是Python为解决这类问题提供的“秘密武器”。它像一个“智能指针”,能记住遍历的位置,逐项返回数据,直到所有元素处理完毕。迭代器的核心特点是惰性计算——只在需要时生成数据,避免一次性加载所有内容到内存。1、生成器的核心优势生成器是一种特殊迭代器,通过yield关键字实现。与迭代器相比,生成器的代码量减少80%,却能实现相同功能!():返回迭代器自身__next__():返回下一个元素,无元素时抛出StopIteration异常。
2025-07-04 15:03:21
149
原创 MaxCompute表操作相关命令
1.4.1 添加分区----为已经存在的分区表新增分区。1.4.2 删除分区----为已存在的分区表删除分区。1.4.4 清空非分区表。1.4.3 清空分区表。
2024-03-29 14:55:06
1052
原创 MaxCompute、Hive、MySQL以及Oracle的函数对比
【代码】MaxCompute、Hive、MySQL以及Oracle的函数对比。
2024-03-28 10:14:49
1125
1
原创 阿里云实际项目应用01--创建表并写入数据
在对应的目录下创建一个新的odps文件然后敲代码,这里我构建一个eboard_test的文件
1. Client 发起文件上传请求, 通过 RPC 与 NameNode 建立通讯, NameNode 检查目标文件是否已存在, 父目录是否存在, 返回是否可以上传2. Client 请求第一个 block 该传输到哪些 DataNode 服务器上3. NameNode 根据配置文件中指定的备份数量及机架感知原理进行文件分配, 返回可用的DataNode 的地址如: A, B,...
2019-09-26 21:55:10
469
原创 大数据之--------hadoop存储(HDFS)
Hadoop 的存储系统是 HDFS(Hadoop Distributed File System)分布式文件系统,对外部客户端而言,HDFS 就像一个传统的分级文件系统,可以进行创建、删除、移动或重命名文件或文件夹等操作,与 Linux 文件系统类似。Client客户端文件切片,文件上传的时候,Client对上传的文件进行切片成一个一个block,然后进行存储与namenode交互,获取文...
2019-09-21 20:49:55
321
原创 大数据之--------hadoop(简介)
简介:Hadoop 是一个由 Apache 基金会所开发的分布式系统基础架构,它可以使用户在不了解分布式底层细节的情況下开发分布式程序,充分利用集群的威力进行高速运算和存储。从其定义就可以发现,它解決了两大问题:大数据存储、大数据分析。也就是 Hadoop 的两大核心:HDFS 和 MapReduce。(1)HDFS(Hadoop Distributed File System)是可扩展、容...
2019-09-21 20:49:02
182
原创 大数据入门-----zookeeper
Shell 编程一般指编写 shell 脚本。1:基本语法:使用 vi 编辑器新建一个文件 hello.sh 1 2 #!/bin/bash echo"Hello World !" 执行方式:方式1:sh hello.sh方式2chmod +x ./hello.sh #使脚本具有执行权限./hell...
2019-09-10 15:05:26
104
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人