当前位置:网站首页>Adding data nodes and decommissioning data nodes in the cluster
Adding data nodes and decommissioning data nodes in the cluster
2022-07-31 12:32:00 【Bagnepokhov】
1 服役新数据节点
1.1 需求
随着业务的增长,数据量会越来越大,原有的数据节点的容量已经不能满足存储数据的需求,需要在原有集群基础上动态添加新的数据节点.
1.2 环境准备
Clone a new virtual machine host,The original data to be cloned(./hadoop-3.1.3/data和logs)删除,再source一下配置文件:
[[email protected] hadoop-3.1.3]$ source /etc/profile
1.2 Specific steps for commissioning a new node
- 直接启动DataNode,即可关联到集群(A new node has been added)
[[email protected] hadoop-3.1.3]$ hdfs --daemon start datanode
[[email protected] hadoop-3.1.3]$ yarn --daemon start nodemanager
- 在企业开发中,如果经常在hadoop102和hadoop104上提交任务,且副本数为2,由于数据本地性原则,就会导致hadoop102和hadoop104数据过多,hadoop103存储的数据量小.开启数据均衡:
[[email protected] hadoop-3.1.3]$ sbin/start-balancer.sh -threshold 10
对于参数10,代表的是集群中各个节点的磁盘空间利用率相差不超过10%,可根据实际情况进行调整.
停止数据均衡命令:
[[email protected] hadoop-3.1.3]$ sbin/stop-balancer.sh
2 退役旧数据节点
2.1 添加白名单和黑名单
白名单和黑名单是 hadoop 管理集群主机的一种机制.
添加到白名单的主机节点,都允许访问 NameNode,不在白名单的主机节点,都会被退出.添加到黑名单的主机节点,不允许访问 NameNode,会在数据迁移后退出.
实际情况下,白名单用于确定允许访问 NameNode 的 DataNode 节点,内容配置一般与workers 文件内容一致. 黑名单用于在集群运行过程中退役 DataNode 节点.
配置白名单和黑名单的具体步骤如下:
- 在 NameNode 节点的/opt/module/hadoop-3.1.3/etc/hadoop 目录下分别创建 whitelist 和
blacklist 文件
[[email protected] hadoop]$ pwd
/opt/module/hadoop-3.1.3/etc/hadoop
[[email protected] hadoop]$ touch whitelist
[[email protected] hadoop]$ touch blacklist
在 whitelist 中添加如下主机名称,假如集群正常工作的节点为 102 103 104 105
hadoop102
hadoop103
hadoop104
hadoop105
- 在 hdfs-site.xml 配置文件中增加 dfs.hosts 和 dfs.hosts.exclude 配置参数
<!-- 白名单 -->
<property>
<name>dfs.hosts</name>
<value>/opt/module/hadoop-3.1.3/etc/hadoop/whitelist</value>
</property>
<!-- 黑名单 -->
<property>
<name>dfs.hosts.exclude</name>
<value>/opt/module/hadoop-3.1.3/etc/hadoop/blacklist</value>
</property>
- 分发配置文件 whitelist,blacklist,hdfs-site.xml
- 重新启动集群
- 在 web Viewing on the browser currently works fine DN 节点
2.2 黑名单退役
- 编辑/opt/module/hadoop-3.1.3/etc/hadoop 目录下的 blacklist 文件,Add the hostname of the node to be retired(以hadoop105为例)
- 分发blacklist到所有节点
- 刷新NameNode、刷新ResourceManager
[[email protected] hadoop-3.1.3]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful
[[email protected] hadoop-3.1.3]$ yarn rmadmin -refreshNodes
17/06/24 14:55:56 INFO client.RMProxy: Connecting to ResourceManager at
hadoop103/192.168.1.103:8033
- 检查 Web 浏览器,退役节点的状态为 decommission in progress(退役中),说明数据节点正在复制块到其他节点
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JRBWekBO-1658999436556)(…/DataNode工作机制/imgs/The fourth step of blacklist retirement.png)]
- 等待退役节点状态为 decommissioned(所有块已经复制完成),停止该节点及节点资源管理器.注意:如果副本数是 3,服役的节点小于等于 3,是不能退役成功的,需要修改副本数后才能退役
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ft9ampGP-1658999436557)(…/DataNode工作机制/imgs/The fifth step of blacklist retirement.png)]
[[email protected] hadoop-3.1.3]$ hdfs --daemon stop datanode
stopping datanode
[[email protected] hadoop-3.1.3]$ yarn --daemon stop nodemanager
stopping nodemanager
- 如果数据不均衡,可以用命令实现集群的再平衡
注意:不允许白名单和黑名单中同时出现同一个主机名称,Since a blacklist is used blacklistsuccessfully retired hadoop105 节点,So to whitelist whitelist 里面的 hadoop105 去掉.
边栏推荐
- JVM 运行时数据区与JMM 内存模型详解
- 数据湖(十九):SQL API 读取Kafka数据实时写入Iceberg表
- Chrome开发自定义右键菜单实现快速跳转到指定页面
- JVS低代码能力简介及功能清单
- The 2nd activity of the TOGAF10 Standard Reading Club continues wonderfully, and the highlights will be reviewed!
- 架构实战营|模块8
- 0x80070570文件或目录损坏且无法删除(0x80070091怎么删除)
- 带有对称约束切换线性系统的结构可控性
- 基于姿态估计的护具佩戴检测与动作识别
- vivado里那些看不懂的原语
猜你喜欢
vb.net 画曲线
Selenium自动化测试之Selenium IDE
使用docker搭建mysql主从
golang八股文整理(持续搬运)
这款悄然崛起的国产API接口管理工具,你一定要晓得
攻防演练丨赛宁红方管控平台走进广东三地 助力数字政府网络安全建设
Exploring Plain Vision Transformer Backbones for Object Detection Paper Reading Notes
ASM module in SAP Ecommerce Cloud Spartacus UI and Accelerator UI
JVS轻应用的组成与配置
AMBA APB学习记录(AMBA 3/4)
随机推荐
How does the SAP ABAP OData service support the $filter (filter) operation trial version
alert(1) (haozi.me)靶场练习
PyQt5快速开发与实战10.2 复利计算 && 10.3 刷新博客点击量
行业案例 | 全面防护 赛宁助力能源工控安全建设
PyQt5 rapid development and actual combat 10.1 Get city weather forecast
列表页优化思路
PyQt5快速开发与实战 9.7 UI层的自动化测试
基于生物激励神经网络的室内实时激光SLAM控制方法
CWE4.8 -- 2022年危害最大的25种软件安全问题
认知—运动康复医疗机器人应用设计
Different lower_case_table_names settings for server ('1') and data dictionary ('0') solution
Use ODBC in Excel to read data from CDS view on SAP BTP platform
LRU缓存[线性表 -> 链表 -> hash定位 -> 双向链表]
快速学完数据库管理
docker部署完mysql无法连接
[core]-ARMV7-A、ARMV8-A、ARMV9-A 架构简介「建议收藏」
MySQL日志中“binlog”的三种格式玩起来真爽
AMBA APB学习记录(AMBA 3/4)
CameraToolUnity中两种摄像机的两种观察控制方式
Use Excel to read data exposed by SAP ABAP CDS View through ODBC