当前位置:网站首页>DataKit——真正的统一可观测性 Agent
DataKit——真正的统一可观测性 Agent
2022-07-04 15:25:00 【InfoQ】
前言

多维度可观测性数据采集
1、实时基础设施对象
- DataKit hostobject 用于收集主机基本信息,如硬件型号、基础资源消耗等。
- 进程采集器可以对系统中各种运行的进程进行实施监控, 获取、分析进程运行时各项指标,包括内存使用率、占用CPU时间、进程当前状态、进程监听的端口等,并根据进程运行时的各项指标信息,用户可以在观测云中配置相关告警,使用户了解进程的状态,在进程发生故障时,可以及时对发生故障的进程进行维护。
2、指标
3、日志
从磁盘文件获取日志

- 序列式写入:一般的日志框架,都能保证磁盘文件中的日志,保持时间的序列性
- 自动切片:由于磁盘日志文件都是物理递增的,为避免日志将磁盘打爆,一般日志框架都会自动做切割,或者通过一些外部常驻脚本来实现日志切割
通过调用环境 API 获取日志

远程推送日志给 DataKit
- 开发者直接将应用日志推送到 DataKit 指定的服务上,比如 Java 的 log4j 以及 Python 原生的 SocketHandler 均支持将日志发送给远端服务。
- 第三方平台日志接入

Sidecar 形式的日志采集

4、链路追踪
5、端行为
6、云原生安全
7、基于 eBPF的网络监控
- ebpf-net:
- ebpf-bash:
8、CICD 追踪
9、支持通过选举来进行差异化采集
完整的数据处理语言 Pipeline
- 简单,每一行就是数据处理,支持逻辑判断
- 全领域的数据处理,所有的收集数据均可以通过编写 Pipeline实现动态的数据预处理
- 丰富的函数支持
支持通过 git 来进行配置管理
强大的扩展性&开源兼容
自定义采集器
第三方接入
- Prometheus Exporter 与 Remote_Endpoint
- Filebeat/Flenutd
- OpenTelemetry,Skywalking
灵活的部署模型,简单易用
基于主机
- 若目标机器没有公网访问出口,DataKit 支持离线部署
- 支持通过 Ansible 等方式来批量安装 DataKit
基于 Kubernetes
- 支持在 K8s 中通过 DaemonSet 方式安装 DataKit
DataSinker-将数据写入到其他开源协议下的产品中
- InfluxDB:目前支持将 DataKit 采集的时序数据(M)发送到本地的 InfluxDB 存储
- M3DB:目前支持将 DataKit 采集的时序数据(M)发送到本地的 InfluxDB 存储(同 InfluxDB)
- Logstash:目前支持将 DataKit 采集的日志数据(L)发送到本地 Logstash 服务
更多功能
自监控调试能力
- DataKit 支持以交互式方式执行 DQL 查询,在交互模式下,DataKit 自带语句补全功能。
- DataKit 提供了相对完善的基本可观测信息输出,通过查看 DataKit 的 monitor 输出,我们能清晰的知道当前 DataKit 的运行情况。
- DataKit self 采集器用于 DataKit 自身基本信息的采集,包括运行环境信息、CPU、内存占用情况等。
联邦模式与代理模式
- 通过 DataKit 内置的正向代理服务
- 通过 Nginx 反向代理服务
全方位开源,安全保障
DataKit 开源地址
- github:https://github.com/GuanceCloud/datakit
- 极狐:https://jihulab.com/guance-cloud/datakit
DataKit 官方网站
- https://www.datakit.tools/
边栏推荐
- [Acwing] 58周赛 4489. 最长子序列
- China's plastic processing machinery market trend report, technological innovation and market forecast
- Understand Alibaba cloud's secret weapon "dragon architecture" in the article "science popularization talent"
- Array filter fliter in JS
- S2b2b solution for lighting industry: efficiently enable the industrial supply chain and improve the economic benefits of enterprises
- Median and order statistics
- SQL implements split
- 《吐血整理》保姆级系列教程-玩转Fiddler抓包教程(2)-初识Fiddler让你理性认识一下
- C# 实现 FFT 正反变换 和 频域滤波
- 时序图数据建模与产业链分析
猜你喜欢
How to decrypt worksheet protection password in Excel file
Go micro tutorial - Chapter 2 go micro V3 using gin and etcd
leetcode:421. 数组中两个数的最大异或值
NoSQL之readis配置与优化(终章)
Object. Usage of keys()
被PMP考试“折磨”出来的考试心得,值得你一览
Capvision Rongying's prospectus in Hong Kong was "invalid": it was strictly questioned by the CSRC and required supplementary disclosure
Why do you say that the maximum single table of MySQL database is 20million? Based on what?
go-micro教程 — 第二章 go-micro v3 使用Gin、Etcd
Learn more about the basic situation of 2022pmp examination
随机推荐
Go language loop statement (under Lesson 10)
Lv166 turned over
被PMP考试“折磨”出来的考试心得,值得你一览
Array filter fliter in JS
[Acwing] 58周赛 4489. 最长子序列
Research Report on market supply and demand and strategy of China's well completion equipment industry
7 RSA密码体制
Transformer中position encoding实践
Height residual method
NoSQL之readis配置与优化(终章)
如何为ONgDB核心项目源码做贡献
Years of training, towards Kata 3.0! Enter the safe container experience out of the box | dragon lizard Technology
Cypher task design and task locking mechanism of isomorphic and heterogeneous graphs
js中的数组筛选fliter
Research Report on market supply and demand and strategy of China's plastics and polymer industry
Inside and outside: flow chart drawing elementary: six common mistakes
World Environment Day | Chow Tai Fook serves wholeheartedly to promote carbon reduction and environmental protection
Position encoding practice in transformer
"Cannot initialize Photoshop because the temporary storage disk is full" graphic solution
[glide] cache implementation - memory and disk cache