当前位置:网站首页>TensorFlow Serving 高性能的机器学习模型服务系统
TensorFlow Serving 高性能的机器学习模型服务系统
2022-07-29 15:58:00 【人工智能曾小健】
架构
TensorFlow Serving 是一个灵活、高性能的机器学习模型服务系统,专为生产环境而设计。 TensorFlow Serving 可以轻松部署新算法和实验,同时保持相同的服务器架构和 API。 TensorFlow Serving 提供与 TensorFlow 模型的开箱即用集成,但可以轻松扩展以服务于其他类型的模型。
关键概念
要了解 TensorFlow Serving 的架构,您需要了解以下关键概念:
可服务Servables
Servables 是 TensorFlow Serving 中的核心抽象。 Servables 是客户端用来执行计算(例如,查找或推理)的底层对象。
Servable 的大小和粒度是灵活的。单个 Servable 可能包含从查找表的单个分片到单个模型再到推理模型元组的任何内容。 Servables 可以是任何类型和接口,从而实现灵活性和未来改进,例如:
流式传输结果
实验性 API
异步操作模式
Servables 不管理自己的生命周期。
典型的可服务包括以下内容:
一个 TensorFlow SavedModelBundle (tensorflow::Session)
用于嵌入或词汇查找的查找表
可服务版本
TensorFlow Serving 可以在单个服务器实例的生命周期内处理一个或多个版本的 servable。这使得随着时间的推移加载新的算法配置、权重和其他数据。版本可以同时加载多个版本的 servable,支持逐步推出和试验。在服务时,客户端可以请求特定模型的最新版本或特定版本 ID。
可服务的流
可服务流是可服务的版本序列,按版本号递增排序。
楷模
TensorFlow Serving 将模型表示为一个或多个可服务对象。机器学习模型可能包括一个或多个算法(包括学习的权重)和查找或嵌入表。
您可以将复合模型表示为以下任意一种:
多个独立的可服务对象
单一复合可服务(single composite servable)
一个可服务对象也可能对应于模型的一部分。例如,一个大型查找表可以跨多个 TensorFlow Serving 实例进行分片。
Loaders
加载器管理 servable 的生命周期。 Loader API 支持独立于所涉及的特定学习算法、数据或产品用例的通用基础架构。具体来说,Loaders 标准化了用于加载和卸载 servable 的 API。
边栏推荐
猜你喜欢

中国大学慕课mooc答题/自动播放脚本(domooc)使用教程

分布式前修课:MySQL实现分布式锁

Alibaba 开源内网高并发编程手册

ByteArrayOutputStream 类源码分析

属性动画(Property Animation) 、 Butterknife黄油刀的基本使用

如何写好设计文档

MLX90640 红外热成像仪开发笔记(九)

【设计师必学】在SketchUp中Enscape的灯光照明技巧

Unable to open the source file in qt vs2015 "QtWidgets" solution

Compose要是不 `remember`,相关功能就实现不了了吗?
随机推荐
LG卷轴屏手机曝光;三星屏下摄像头新机曝光
1802. 有界数组中指定下标处的最大值【贪心 +二分】
如何写好设计文档
zabbix邮件发送告警信息
泰芯TXW8301打造新一代8路无线监控NVR套装解决方案
linux 安装mysql8.0 超详细教程(实战多次)
pjax无法生效解决办法,butterfly主题维护你的pjax
异步请求池的实现
MySQL笔记下
Jenkins 如何玩转接口自动化测试?
可行性研究报告模板
718. The longest repeat subarray
基于全志D1-H和XR806的名贵植物监控装置
Floating point memory storage problem
uni-app进阶之Weex/nvu
蚂蚁三面滑铁卢!遭分布式截胡,靠这些笔记潜修 30 天,挺进京东
ByteArrayOutputStream class source code analysis
MySQL数据库安装配置保姆级教程(以8.0.29为例)有手就行
Qt combat | how to access the USB device information?
【Go语言刷题篇】Go完结篇函数、结构体、接口、错误入门学习