【HIVE】大数据框架hive——自定义函数(UDF)

本文介绍了Hive中的三种自定义函数类型:UDF(一对一)、UDAT(多对一)和UDTF(一对多),并详细讲解了如何实现自定义UDF,包括继承UDF类、规定evaluate方法等步骤。同时,提供了实现UDF的流程,包括打包、添加到ClassPath、创建函数和测试等环节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

hive 中的自定义函数类型
UDF(User-defined function)

一对一:
传递一个参数,然后对应一个值,例如:substring

UDAT (Aggregate Functions)

多对一:
传递多个参数,返回一个参数 例如聚合函数:max
通常group by连用

UDTF(Table-Generating Functions )

一对多:
传入1个值,返回多个值 例如:
ip:省 市 区
[email protected] :QQ 号,邮箱类型

实现自定义函数 ——UDF

(1)继承于 UDF 类
(2)方法规定(摘自hive官网中文档)
a、Implement one or more methods named evaluate:必须实现 evaluate 方法(方法名为evaluate)
b、evaluate should never be a void method.:返回值类型不能为空
c、方法的参数和返回值的类型:Java 类型或者 Hadoop 类型。
推荐使用 Hadoop 类型,这样在 hive 中执行自定义函数时,就不需要对数据类型进行转换
速度可以更快

实例:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值