当前位置:网站首页>解决小文件处过多
解决小文件处过多
2022-07-06 09:01:00 【棱镜7】
1. 使用hive自带的concatenate命令,自动合并小文件
使用方法:
2. 调整参数减少map数量
在执行map前进行小文件合并,在 mapper 中将多个文件合成一个 split 作为输入。调整split 的至少大小
3. 减少Reduce的数量
reduce 的个数决定了输出的文件的个数,所以可以调整 reduce 的个数控制 hive表的文件数量。
4. HAR归档
使用hadoop的archive将小文件归档,能够将多个小文件打包成一个har文件
5. jvm重用
Hadoop的默认配置通常是使用派生JVM来执行map和Reduce任务的。这时JVM的启动过程可能会造成相当大的开销,尤其是执行的job包含有成百上千task任务的情况。JVM重用可以使得JVM实例在同一个job中重新使用N次。
这个功能的缺点是,开启JVM重用将一直占用使用到的task插槽,以便进行重用,直到任务完成后才能释放。
边栏推荐
- Selenium+pytest automated test framework practice
- Redis之五大基础数据结构深入、应用场景
- 英雄联盟轮播图手动轮播
- Advance Computer Network Review(1)——FatTree
- 不同的数据驱动代码执行相同的测试场景
- Design and implementation of film and television creation forum based on b/s (attached: source code paper SQL file project deployment tutorial)
- Heap (priority queue) topic
- What is an R-value reference and what is the difference between it and an l-value?
- Implement window blocking on QWidget
- postman之参数化详解
猜你喜欢
一改测试步骤代码就全写 为什么不试试用 Yaml实现数据驱动?
IJCAI2022论文合集(持续更新中)
In depth analysis and encapsulation call of requests
Advanced Computer Network Review(3)——BBR
CUDA realizes focal_ loss
The five basic data structures of redis are in-depth and application scenarios
Redis之cluster集群
基于WEB的网上购物系统的设计与实现(附:源码 论文 sql文件)
Redis之哨兵模式
How to intercept the string correctly (for example, intercepting the stock in operation by applying the error information)
随机推荐
Redis cluster
英雄联盟轮播图手动轮播
[text generation] recommended in the collection of papers - Stanford researchers introduce time control methods to make long text generation more smooth
[shell script] - archive file script
Chapter 1 :Application of Artificial intelligence in Drug Design:Opportunity and Challenges
[oc]- < getting started with UI> -- common controls - prompt dialog box and wait for the prompt (circle)
Global and Chinese markets of SERS substrates 2022-2028: Research Report on technology, participants, trends, market size and share
Intel distiller Toolkit - Quantitative implementation 2
Advance Computer Network Review(1)——FatTree
MapReduce工作机制
面渣逆袭:Redis连环五十二问,图文详解,这下面试稳了
基于WEB的网上购物系统的设计与实现(附:源码 论文 sql文件)
Le modèle sentinelle de redis
Redis cluster
Redis之持久化实操(Linux版)
QML type: overlay
[oc]- < getting started with UI> -- common controls uibutton
[OC foundation framework] - [set array]
Selenium+Pytest自动化测试框架实战
Mise en œuvre de la quantification post - formation du bminf