当前位置:网站首页>TensorFlow Serving 高性能的机器学习模型服务系统
TensorFlow Serving 高性能的机器学习模型服务系统
2022-07-28 20:32:00 【人工智能曾小健】
架构
TensorFlow Serving 是一个灵活、高性能的机器学习模型服务系统,专为生产环境而设计。 TensorFlow Serving 可以轻松部署新算法和实验,同时保持相同的服务器架构和 API。 TensorFlow Serving 提供与 TensorFlow 模型的开箱即用集成,但可以轻松扩展以服务于其他类型的模型。
关键概念
要了解 TensorFlow Serving 的架构,您需要了解以下关键概念:
可服务Servables
Servables 是 TensorFlow Serving 中的核心抽象。 Servables 是客户端用来执行计算(例如,查找或推理)的底层对象。
Servable 的大小和粒度是灵活的。单个 Servable 可能包含从查找表的单个分片到单个模型再到推理模型元组的任何内容。 Servables 可以是任何类型和接口,从而实现灵活性和未来改进,例如:
流式传输结果
实验性 API
异步操作模式
Servables 不管理自己的生命周期。
典型的可服务包括以下内容:
一个 TensorFlow SavedModelBundle (tensorflow::Session)
用于嵌入或词汇查找的查找表
可服务版本
TensorFlow Serving 可以在单个服务器实例的生命周期内处理一个或多个版本的 servable。这使得随着时间的推移加载新的算法配置、权重和其他数据。版本可以同时加载多个版本的 servable,支持逐步推出和试验。在服务时,客户端可以请求特定模型的最新版本或特定版本 ID。
可服务的流
可服务流是可服务的版本序列,按版本号递增排序。
楷模
TensorFlow Serving 将模型表示为一个或多个可服务对象。机器学习模型可能包括一个或多个算法(包括学习的权重)和查找或嵌入表。
您可以将复合模型表示为以下任意一种:
多个独立的可服务对象
单一复合可服务(single composite servable)
一个可服务对象也可能对应于模型的一部分。例如,一个大型查找表可以跨多个 TensorFlow Serving 实例进行分片。
Loaders
加载器管理 servable 的生命周期。 Loader API 支持独立于所涉及的特定学习算法、数据或产品用例的通用基础架构。具体来说,Loaders 标准化了用于加载和卸载 servable 的 API。
边栏推荐
- Desai wisdom number - line chart (stacking area chart): ranking of deposits of different occupational groups in the proportion of monthly income in 2022
- Hcip experiment (14)
- typeof原理
- The applet listens for the target node to appear on the screen
- Lvs+keepalived high availability deployment practical application
- 罗克韦尔AB PLC RSLogix数字量IO模块基本介绍
- Learn kotlin - extension function
- 40. Combined sum II
- Pyqt5 rapid development and actual combat 5.4 web page interaction
- 局域网添加DNS服务器进行域名解析
猜你喜欢
Lvs+keepalived high availability deployment practical application
How does MySQL archive data?
阿里云CDN实践
In Kingbase, the user is specified to search the schema by default, or the user cannot use the function under the public schema
How to establish a decentralized community in Web3
使用百度EasyDL实现明厨亮灶厨师帽识别
Using Baidu easydl to realize chef hat recognition of bright kitchen and stove
Open earphone which air conduction earphone with good sound quality and recognized sound quality is recommended
2021数学建模B组练习
[hero planet July training leetcode problem solving daily] dynamic planning on the 28th
随机推荐
Miscellaneous records of powersploit, evaluation, weevery and other tools in Kali
科大讯飞笔试
什么是质因数,质因数(素因数或质因子)在数论里是指能整除给定正整数的质数
Explain the remote debugging program of visual studio 2015 in LAN
[CS231N]Lecture_2:Image Classification pipelin
display 各值的区别
数据可视化新闻,不一样的新闻报道形式
HCIP(14)
乌官员:乌克兰一半农产品经多瑙河港口出口
Chapter 7: drawing rotating cubes
Why is 0.1 + 0.2 not equal to 0.3? How to solve this problem?
Apifox:满足你对 Api 的所有幻想
ESP8266-Arduino编程实例-SPIFFS及数据上传(Arduino IDE和PlatformIO IDE)
Have you seen the management area decoupling architecture? Can help customers solve big problems
HCIP(9)
Summary of the use of hash table set and map when leetcode brushes questions
hcip实验(15)
Brief introduction to PCB materials
39. Combined sum
array_diff_assoc 元素是数组时不比较数组值的办法