当前位置:网站首页>TensorFlow Serving 高性能的机器学习模型服务系统
TensorFlow Serving 高性能的机器学习模型服务系统
2022-07-29 15:58:00 【人工智能曾小健】
架构
TensorFlow Serving 是一个灵活、高性能的机器学习模型服务系统,专为生产环境而设计。 TensorFlow Serving 可以轻松部署新算法和实验,同时保持相同的服务器架构和 API。 TensorFlow Serving 提供与 TensorFlow 模型的开箱即用集成,但可以轻松扩展以服务于其他类型的模型。
关键概念
要了解 TensorFlow Serving 的架构,您需要了解以下关键概念:
可服务Servables
Servables 是 TensorFlow Serving 中的核心抽象。 Servables 是客户端用来执行计算(例如,查找或推理)的底层对象。
Servable 的大小和粒度是灵活的。单个 Servable 可能包含从查找表的单个分片到单个模型再到推理模型元组的任何内容。 Servables 可以是任何类型和接口,从而实现灵活性和未来改进,例如:
流式传输结果
实验性 API
异步操作模式
Servables 不管理自己的生命周期。
典型的可服务包括以下内容:
一个 TensorFlow SavedModelBundle (tensorflow::Session)
用于嵌入或词汇查找的查找表
可服务版本
TensorFlow Serving 可以在单个服务器实例的生命周期内处理一个或多个版本的 servable。这使得随着时间的推移加载新的算法配置、权重和其他数据。版本可以同时加载多个版本的 servable,支持逐步推出和试验。在服务时,客户端可以请求特定模型的最新版本或特定版本 ID。
可服务的流
可服务流是可服务的版本序列,按版本号递增排序。
楷模
TensorFlow Serving 将模型表示为一个或多个可服务对象。机器学习模型可能包括一个或多个算法(包括学习的权重)和查找或嵌入表。
您可以将复合模型表示为以下任意一种:
多个独立的可服务对象
单一复合可服务(single composite servable)
一个可服务对象也可能对应于模型的一部分。例如,一个大型查找表可以跨多个 TensorFlow Serving 实例进行分片。
Loaders
加载器管理 servable 的生命周期。 Loader API 支持独立于所涉及的特定学习算法、数据或产品用例的通用基础架构。具体来说,Loaders 标准化了用于加载和卸载 servable 的 API。
边栏推荐
- 易基因:人类tRNA基因位点表现出与衰老相关的DNA高甲基化|研究文章
- 【软考软件评测师】自动化测试章节上篇
- 中国厂商统治印度智能手机市场,份额提升至77%
- Moving forward steadily without forgetting the original intention, Volvo's sense of security comes from the public's recognition
- Go语言结构体Go range怎么使用
- 参与造谣传谣,华为宣布开除五名员工
- 国内EDA领导者芯和半导体完成最新一轮超亿元融资
- [PCL study notes] Commonly used libraries and APIs for point cloud processing (PCL library Eigen)
- Staggered question explanation
- 中国大学慕课mooc答题/自动播放脚本(domooc)使用教程
猜你喜欢

官宣,又一上市公司杀入数据库市场

This article penetrates the architecture design and cluster construction of the distributed storage system Ceph (hands-on)

重磅来袭!豆瓣评分9.9,万人血书的多线程与高并发v2.0版本

干货!如何使用仪表构造SRv6-TE性能测试环境

Twin all things digital visual | join the real world and the digital space

AI全流程开发难题破解之钥

面试官:小伙子你来说说MySQL底层架构设计

一文看懂分布式存储架构

MySQL外键约束怎么创建

基于全志D1-H和XR806的名贵植物监控装置
随机推荐
如何写好设计文档
Google Play 政策更新 | 2022 年 7 月
Sentinel热门词汇限流如何实现
MUD DAO火爆入世,DAO主轮募集蓄势待发
R语言中给数据框增加分组/根据样本名称添加分组的代码
3. SAP ABAP OData 服务诊断工具 /IWFND/ERROR_LOG 的使用方法
Rust P2P网络应用实战-1 P2P网络核心概念及Ping程序
Property (Property Animation Animation), the basic use of Butterknife butter knife
PL5902 SOT-23-5 高效1MHz2A同步DC-DC降压调节器 百盛电子代理商
Do you really understand the persistence mechanism of Redis?
高通发布全新屏下指纹传感器:识别区域增大77%,识别速度提升50%
MySQL外键约束怎么创建
BUUCTF——MISC(流量分析)
[Designers must learn] Lighting skills of Enscape in SketchUp
Twin all things digital visual | join the real world and the digital space
大规模线上应用TiDB会遇到的坑,本文都帮你排除好了
Tess4J 图片文字识别
MySQL数据库————数据库语言(DDL与DML)
风格迁移篇----艺术风格转换的内容与风格解构
显微镜LED补光可调光源