当前位置:网站首页>Adding data nodes and decommissioning data nodes in the cluster
Adding data nodes and decommissioning data nodes in the cluster
2022-07-31 12:32:00 【Bagnepokhov】
1 服役新数据节点
1.1 需求
随着业务的增长,数据量会越来越大,原有的数据节点的容量已经不能满足存储数据的需求,需要在原有集群基础上动态添加新的数据节点.
1.2 环境准备
Clone a new virtual machine host,The original data to be cloned(./hadoop-3.1.3/data和logs)删除,再source一下配置文件:
[[email protected] hadoop-3.1.3]$ source /etc/profile
1.2 Specific steps for commissioning a new node
- 直接启动DataNode,即可关联到集群(A new node has been added)
[[email protected] hadoop-3.1.3]$ hdfs --daemon start datanode
[[email protected] hadoop-3.1.3]$ yarn --daemon start nodemanager
- 在企业开发中,如果经常在hadoop102和hadoop104上提交任务,且副本数为2,由于数据本地性原则,就会导致hadoop102和hadoop104数据过多,hadoop103存储的数据量小.开启数据均衡:
[[email protected] hadoop-3.1.3]$ sbin/start-balancer.sh -threshold 10
对于参数10,代表的是集群中各个节点的磁盘空间利用率相差不超过10%,可根据实际情况进行调整.
停止数据均衡命令:
[[email protected] hadoop-3.1.3]$ sbin/stop-balancer.sh
2 退役旧数据节点
2.1 添加白名单和黑名单
白名单和黑名单是 hadoop 管理集群主机的一种机制.
添加到白名单的主机节点,都允许访问 NameNode,不在白名单的主机节点,都会被退出.添加到黑名单的主机节点,不允许访问 NameNode,会在数据迁移后退出.
实际情况下,白名单用于确定允许访问 NameNode 的 DataNode 节点,内容配置一般与workers 文件内容一致. 黑名单用于在集群运行过程中退役 DataNode 节点.
配置白名单和黑名单的具体步骤如下:
- 在 NameNode 节点的/opt/module/hadoop-3.1.3/etc/hadoop 目录下分别创建 whitelist 和
blacklist 文件
[[email protected] hadoop]$ pwd
/opt/module/hadoop-3.1.3/etc/hadoop
[[email protected] hadoop]$ touch whitelist
[[email protected] hadoop]$ touch blacklist
在 whitelist 中添加如下主机名称,假如集群正常工作的节点为 102 103 104 105
hadoop102
hadoop103
hadoop104
hadoop105
- 在 hdfs-site.xml 配置文件中增加 dfs.hosts 和 dfs.hosts.exclude 配置参数
<!-- 白名单 -->
<property>
<name>dfs.hosts</name>
<value>/opt/module/hadoop-3.1.3/etc/hadoop/whitelist</value>
</property>
<!-- 黑名单 -->
<property>
<name>dfs.hosts.exclude</name>
<value>/opt/module/hadoop-3.1.3/etc/hadoop/blacklist</value>
</property>
- 分发配置文件 whitelist,blacklist,hdfs-site.xml
- 重新启动集群
- 在 web Viewing on the browser currently works fine DN 节点
2.2 黑名单退役
- 编辑/opt/module/hadoop-3.1.3/etc/hadoop 目录下的 blacklist 文件,Add the hostname of the node to be retired(以hadoop105为例)
- 分发blacklist到所有节点
- 刷新NameNode、刷新ResourceManager
[[email protected] hadoop-3.1.3]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful
[[email protected] hadoop-3.1.3]$ yarn rmadmin -refreshNodes
17/06/24 14:55:56 INFO client.RMProxy: Connecting to ResourceManager at
hadoop103/192.168.1.103:8033
- 检查 Web 浏览器,退役节点的状态为 decommission in progress(退役中),说明数据节点正在复制块到其他节点
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JRBWekBO-1658999436556)(…/DataNode工作机制/imgs/The fourth step of blacklist retirement.png)]
- 等待退役节点状态为 decommissioned(所有块已经复制完成),停止该节点及节点资源管理器.注意:如果副本数是 3,服役的节点小于等于 3,是不能退役成功的,需要修改副本数后才能退役
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ft9ampGP-1658999436557)(…/DataNode工作机制/imgs/The fifth step of blacklist retirement.png)]
[[email protected] hadoop-3.1.3]$ hdfs --daemon stop datanode
stopping datanode
[[email protected] hadoop-3.1.3]$ yarn --daemon stop nodemanager
stopping nodemanager
- 如果数据不均衡,可以用命令实现集群的再平衡
注意:不允许白名单和黑名单中同时出现同一个主机名称,Since a blacklist is used blacklistsuccessfully retired hadoop105 节点,So to whitelist whitelist 里面的 hadoop105 去掉.
边栏推荐
- ERROR 2003 (HY000) Can‘t connect to MySQL server on ‘localhost3306‘ (10061)
- Banyan Tree Loan GPU Hardware Architecture
- Spark GC日志分析
- JVS设置不同应用的登录时效时间
- SAP 电商云 Spartacus UI 和 Accelerator UI 里的 ASM 模块
- 立一个flag
- Encapsulation of conversion between Json and objects (Gson)
- 一周精彩内容分享(第14期)
- SAP message TK 248 solved
- 架构实战营|模块8
猜你喜欢
随机推荐
ESP8266-Arduino编程实例-PIR(被动红外)传感器驱动
centos7安装mysql5.7
SAP ABAP OData 服务如何支持 $filter (过滤)操作试读版
消息队列面试题(2022最新整理)
PyQt5快速开发与实战10.2 复利计算 && 10.3 刷新博客点击量
关于我放弃考研这件事儿
Wearing detection and action recognition of protective gear based on pose estimation
alert(1) (haozi.me)靶场练习
Exploring Plain Vision Transformer Backbones for Object Detection 论文阅读笔记
JVS开发套件产品定位
Quickly learn database management
Two methods of NameNode failure handling
busybox之reboot命令流程分析
数据湖(十九):SQL API 读取Kafka数据实时写入Iceberg表
[Shader] Shader official example [easy to understand]
golang八股文整理(持续搬运)
kubernetes之服务发现
chroot命令
串的基本概念与操作
SAP message TK 248 solved








