当前位置:网站首页>TiUP 故障排查
TiUP 故障排查
2022-07-30 14:50:00 【添香小铺】
本文介绍 TiUP 使用过程中一些常见的故障及排查方式,如果本文不包含你目前遇到的问题,可以通过以下方式求助:
- Github Issues 新建一个 Issue。
- 在 AskTUG 提交你的问题。
1. TiUP 命令故障排查
1.1 使用 tiup list
看不到最新的组件列表
TiUP 并不会每次都从镜像服务器更新最新的组件列表,可以通过 tiup list
来强制刷新组件列表。
1.2 使用 tiup list <component>
看不到一个组件的最新版本信息
同 1.1 一样,组件的版本信息只会在本地无缓存的情况下从镜像服务器获取,可以通过 tiup list <component>
刷新组件列表。
1.3 下载组件的过程中中断
如果下载组件的过程中网络中断,可能是由于网络不稳定导致的,可以尝试重新下载,如果多次不能成功下载,请反馈到 Github Issues,可能是由于 CDN 服务器导致的。
1.4 下载组件过程中出现 checksum 错误
由于 CDN 会有短暂的缓存时间,导致新的 checksum 文件和组件包不匹配,建议过 5 分钟后重试,如果依然不匹配,请反馈到 Github Issues。
2. TiUP Cluster 组件故障排查
2.1 部署过程中提示 unable to authenticate, attempted methods [none publickey]
由于部署时会向远程主机上传组件包,以及进行初始化,这个过程需要连接到远程主机,该错误是由于找不到连接到远程主机的 SSH 私钥导致的。请确认你是否通过 tiup cluster deploy -i identity_file
指定该私钥。
- 如果没有指定
-i
参数,可能是由于 TiUP 没有自动找到私钥路径,建议通过-i
显式指定私钥路径。 - 如果指定了
-i
参数,可能是由于指定的私钥不能登录,可以通过手动执行ssh -i identity_file [email protected]
命令来验证。 - 如果是通过密码登录远程主机,请确保指定了
-p
参数,同时输入了正确的登录密码。
2.2 使用 TiUP Cluster 升级中断
为了避免用户误用,TiUP Cluster 不支持指定部分节点升级,所以升级失败之后,需要重新进行升级操作,包括升级过程中的幂等操作。
升级操作会分为以下几步:
- 首先备份所有节点的老版本组件
- 分发新的组件到远程
- 滚动重启所有组件
如果升级操作在滚动重启时中断,可以不用重复进行 tiup cluster upgrade
操作,而是通过 tiup cluster restart -N <node1> -N <node2>
来重启未完成重启的节点。如果同一组件的未重启节点数量比较多,也可以通过 tiup cluster restart -R <component>
来重启某一个类型的组件。
2.3 升级发现 node_exporter-9100.service/blackbox_exporter-9115.service
不存在
这种情况可能是由于之前的集群是由 TiDB Ansible 迁移过来的,且之前 TiDB Ansible 未部署 exporter 导致的。要解决这种情况,可以暂时通过手动从其他节点复制缺少的文件到新的节点。后续我们会在迁移过程中补全缺失的组件。
边栏推荐
猜你喜欢
JUC common thread pool source learning 02 ( ThreadPoolExecutor thread pool )
Excel使用Visual Basic Editor对宏进行修改
嵌入式开发:嵌入式基础知识——正确启动固件项目的 10 条建议
481-82(105、24、82、34、153)
Mysql database query is very slow. Besides the index, what else can be caused?
Go to Tencent for an interview and let people turn left directly: I don't know idempotency!
【云原生 • DevOps】influxDB、cAdvisor、Grafana 工具使用详解
Mysql数据库查询好慢,除了索引,还能因为什么?
【云原生】灰度发布、蓝绿发布、滚动发布、灰度发布解释
Alluxio for Presto fu can across the cloud self-service ability
随机推荐
Normal and escaped strings for postgresql
Alluxio for Presto fu can across the cloud self-service ability
[Cloud native] Grayscale release, blue-green release, rolling release, grayscale release explanation
Example of video switching playback (video switching example) code
localhost with 127.0.0.1
元宇宙的前景及四大赛道
难道Redis真的变慢了吗?
Sleuth+Zipkin(可视化) 服务链路追踪
Flink实时仓库-DWS层(关键词搜索分析-自定义函数,窗口操作,FlinkSql设置水位线,保存数据到Clickhouse)模板代码
Configuration - Notes
4 senior experts share the insider architecture design and implementation principles of Flink technology with years of experience in large factories
数字量输入模块io
(科普文)什么是碎片化NFT(Fractional NFT)
【嵌入式】适用于Cortex-M3(STM32F10x)的IQmath库
tiup env
Memory-mapped, bit-band operations
JHM:芳环羟化双加氧酶数据库DARHD建立及相关引物评价
Kubernetes应用管理深度剖析
golang modules initialization project
EST综述:eDNA的多种状态以及在水环境中持久性的认知