当前位置:网站首页>自定义UDF函数
自定义UDF函数
2022-08-02 14:05:00 【大学生爱编程】
一.自定义UDF函数以及加载到Linux上运行
1.引入依赖
<dependency>
<groupId>org.apache.hive</groupId>
<artifactId>hive-exec</artifactId>
<version>1.2.1</version>
</dependency>
注意:可能会出现引入依赖失败的情况,在settings文件中修改镜像
tab键与空格键的问题,此处用的是tab键开头,此点可能影响打包
<mirror>
<id>alimaven</id>
<name>aliyun maven</name>
<url>http://maven.aliyun.com/nexus/content/groups/public/</url>
<mirrorOf>central</mirrorOf>
</mirror>
<mirror>
<id>aliyunmaven</id>
<mirrorOf>*</mirrorOf>
<name>spring-plugin</name>
<url>https://maven.aliyun.com/repository/spring-plugin</url>
</mirror>
2.写代码,继承UDF,导包,实现逻辑,在文件夹中把jar包上传到Linux上
3.打jar包上传到Linux (后面跟jar包的完整路径)
add jar /usr/local/soft/jars/HiveUDF2-1.0.jar;
4.使用jar包资源注册一个临时函数
create temporary function 函数名 as ‘主类名’;
create temporary function fxxx1 as 'MyUDF';
5.使用所起的函数名处理数据
二.实现函数永久生效
(继上面3步骤进行)
把jar包放到HDFS上,不用手动add jar 直接使用函数
1.hdfs上创建一个文件夹存放jar包,将jar包上传至该目录
2.在hive shell中执行命令
三个参数分别为:永久函数名,主类名,jar包在hdfs上的路径
create function hxudf as 'com.shujia.hivefun.MyUDF' using jar 'hdfs:/shujia/bigdata17/jar/hive-udf1.jar';
3.退出hive,执行函数进行测试
边栏推荐
猜你喜欢
Flink-独立集群/Yarn
二级指针,数组指针,指针数组和函数指针
每周招聘|PostgreSQL专家,年薪60+,高能力高薪资
加减法运算及其溢出处理
字符串的小知识
无人驾驶综述:等级划分
C语言日记 5 运算符和表达式
MySQL知识总结 (八) InnoDB的MVCC实现机制
无人驾驶综述:国外国内发展历程
Using the cloud GPU + pycharm training model to realize automatic background run programs, save training results, the server automatically power off
随机推荐
Flask-SQLAlchemy
drf source code analysis and global catch exception
Steps to connect the virtual machine with xshell_establish a network connection between the host and the vm virtual machine
C语言一级指针(补)
VS Code远程开发及免密配置
C语言一维数组练习——将一个字符串中的某个字符替换成其它字符
标签加id 和 加号 两个文本框 和一个var 赋值
Paddle window10 environment using conda installation
云GPU(恒源云)训练的具体操作流程
C语言一维数组练习——将m个元素移动到数组尾部
OpenCart迁移到其他服务器
verilog学习|《Verilog数字系统设计教程》夏宇闻 第三版思考题答案(第九章)
浮点数的运算方法
加减法运算及其溢出处理
binlog与iptables防nmap扫描
Unit 6 meet ORM
c语言用scanf出错不安全的解决办法
redis基础
我理解的学习金字塔
浏览器报错数字代表的大概意思