当前位置:网站首页>TensorFlow Serving 高性能的机器学习模型服务系统
TensorFlow Serving 高性能的机器学习模型服务系统
2022-07-29 15:58:00 【人工智能曾小健】
架构
TensorFlow Serving 是一个灵活、高性能的机器学习模型服务系统,专为生产环境而设计。 TensorFlow Serving 可以轻松部署新算法和实验,同时保持相同的服务器架构和 API。 TensorFlow Serving 提供与 TensorFlow 模型的开箱即用集成,但可以轻松扩展以服务于其他类型的模型。
关键概念
要了解 TensorFlow Serving 的架构,您需要了解以下关键概念:
可服务Servables
Servables 是 TensorFlow Serving 中的核心抽象。 Servables 是客户端用来执行计算(例如,查找或推理)的底层对象。
Servable 的大小和粒度是灵活的。单个 Servable 可能包含从查找表的单个分片到单个模型再到推理模型元组的任何内容。 Servables 可以是任何类型和接口,从而实现灵活性和未来改进,例如:
流式传输结果
实验性 API
异步操作模式
Servables 不管理自己的生命周期。
典型的可服务包括以下内容:
一个 TensorFlow SavedModelBundle (tensorflow::Session)
用于嵌入或词汇查找的查找表
可服务版本
TensorFlow Serving 可以在单个服务器实例的生命周期内处理一个或多个版本的 servable。这使得随着时间的推移加载新的算法配置、权重和其他数据。版本可以同时加载多个版本的 servable,支持逐步推出和试验。在服务时,客户端可以请求特定模型的最新版本或特定版本 ID。
可服务的流
可服务流是可服务的版本序列,按版本号递增排序。
楷模
TensorFlow Serving 将模型表示为一个或多个可服务对象。机器学习模型可能包括一个或多个算法(包括学习的权重)和查找或嵌入表。
您可以将复合模型表示为以下任意一种:
多个独立的可服务对象
单一复合可服务(single composite servable)
一个可服务对象也可能对应于模型的一部分。例如,一个大型查找表可以跨多个 TensorFlow Serving 实例进行分片。
Loaders
加载器管理 servable 的生命周期。 Loader API 支持独立于所涉及的特定学习算法、数据或产品用例的通用基础架构。具体来说,Loaders 标准化了用于加载和卸载 servable 的 API。
边栏推荐
- Moving forward steadily without forgetting the original intention, Volvo's sense of security comes from the public's recognition
- ByteArrayOutputStream 类源码分析
- 6月阿里遭拒,90天深造357页微服务手册,获京东offer
- 再见Postman!一款更适合国人的接口管理工具
- 一文参透分布式存储系统Ceph的架构设计、集群搭建(手把手)
- 面试官:小伙子你来说说MySQL底层架构设计
- 使用DataEase开源工具制作一个高质量的数据大屏
- QT连接Mysql数据库(详细成功版)
- 分布式前修课:MySQL实现分布式锁
- 传输层 TCP的连接管理-释放连接四次握手
猜你喜欢

BUUCTF——MISC(流量分析)

【PCL学习笔记】点云处理常用的库和API(PCL库+Eigen)

一文参透分布式存储系统Ceph的架构设计、集群搭建(手把手)

Android Studio 实现登录注册-源代码 (连接MySql数据库)

蚂蚁三面滑铁卢!遭分布式截胡,靠这些笔记潜修 30 天,挺进京东

风格迁移篇----艺术风格转换的内容与风格解构

Moving forward steadily without forgetting the original intention, Volvo's sense of security comes from the public's recognition

如何在C语言中定义自己的数据类型?

设置工作模式与环境

MySQL数据库————数据库语言(DDL与DML)
随机推荐
货比三家 tb1.3
中国大学慕课mooc答题/自动播放脚本(domooc)使用教程
官宣,又一上市公司杀入数据库市场
异步请求池的实现
6月阿里遭拒,90天深造357页微服务手册,获京东offer
浅谈程序的内存布局
传输层 TCP的连接管理-释放连接四次握手
[Server Storage Data Recovery] A data recovery case of a RAID 5 crash caused by the failure of a certain model of Huawei OceanStor storage RAID 5 hard disk and the failure to synchronize data with the
Alibaba 开源内网高并发编程手册
高通发布全新屏下指纹传感器:识别区域增大77%,识别速度提升50%
Contribution and writing required documents - OpenHarmony developer documentation style guide
R语言中给数据框增加分组/根据样本名称添加分组的代码
数字孪生万物可视 | 联接现实世界与数字空间
718. The longest repeat subarray
属性动画(Property Animation) 、 Butterknife黄油刀的基本使用
联想集团宣布在科创板上市!杨元庆:进一步释放联想的价值!
AI全流程开发难题破解之钥
Recommended Remote Desktop Tools
中国厂商统治印度智能手机市场,份额提升至77%
溢价20%,瑞萨电子宣布拟以60亿美元收购Dialog