当前位置:网站首页>TensorFlow Serving 高性能的机器学习模型服务系统
TensorFlow Serving 高性能的机器学习模型服务系统
2022-07-28 20:32:00 【人工智能曾小健】
架构
TensorFlow Serving 是一个灵活、高性能的机器学习模型服务系统,专为生产环境而设计。 TensorFlow Serving 可以轻松部署新算法和实验,同时保持相同的服务器架构和 API。 TensorFlow Serving 提供与 TensorFlow 模型的开箱即用集成,但可以轻松扩展以服务于其他类型的模型。
关键概念
要了解 TensorFlow Serving 的架构,您需要了解以下关键概念:
可服务Servables
Servables 是 TensorFlow Serving 中的核心抽象。 Servables 是客户端用来执行计算(例如,查找或推理)的底层对象。
Servable 的大小和粒度是灵活的。单个 Servable 可能包含从查找表的单个分片到单个模型再到推理模型元组的任何内容。 Servables 可以是任何类型和接口,从而实现灵活性和未来改进,例如:
流式传输结果
实验性 API
异步操作模式
Servables 不管理自己的生命周期。
典型的可服务包括以下内容:
一个 TensorFlow SavedModelBundle (tensorflow::Session)
用于嵌入或词汇查找的查找表
可服务版本
TensorFlow Serving 可以在单个服务器实例的生命周期内处理一个或多个版本的 servable。这使得随着时间的推移加载新的算法配置、权重和其他数据。版本可以同时加载多个版本的 servable,支持逐步推出和试验。在服务时,客户端可以请求特定模型的最新版本或特定版本 ID。
可服务的流
可服务流是可服务的版本序列,按版本号递增排序。
楷模
TensorFlow Serving 将模型表示为一个或多个可服务对象。机器学习模型可能包括一个或多个算法(包括学习的权重)和查找或嵌入表。
您可以将复合模型表示为以下任意一种:
多个独立的可服务对象
单一复合可服务(single composite servable)
一个可服务对象也可能对应于模型的一部分。例如,一个大型查找表可以跨多个 TensorFlow Serving 实例进行分片。
Loaders
加载器管理 servable 的生命周期。 Loader API 支持独立于所涉及的特定学习算法、数据或产品用例的通用基础架构。具体来说,Loaders 标准化了用于加载和卸载 servable 的 API。
边栏推荐
- For the first time, Chinese scientists used DNA to construct convolutional artificial neural network, which can complete 32 types of molecular pattern recognition tasks, or be used for biomarker signa
- SQL注入 Less42(POST型堆叠注入)
- Oracle, SQL Foundation
- Miscellaneous records of powersploit, evaluation, weevery and other tools in Kali
- 从 Web3到Web2.5,是倒退还是另辟蹊径?
- How to search images efficiently and accurately? Look at the lightweight visual pre training model
- Matlab from introduction to mastery Chapter 1 Introduction to matlab
- The difference between get and post
- Desai wisdom number - line chart (stacking area chart): ranking of deposits of different occupational groups in the proportion of monthly income in 2022
- Form validation and cascading drop-down lists (multiple implementations)
猜你喜欢
![[CS231N]Lecture_2:Image Classification pipelin](/img/4f/de56b071560ada746c587a9dbc5f02.jpg)
[CS231N]Lecture_2:Image Classification pipelin

hcip实验(12)

Kubeedge releases white paper on cloud native edge computing threat model and security protection technology

熊市下 DeFi 的未来趋势

Bugku, Web: all filtered

HCIP(12)

数据可视化新闻,不一样的新闻报道形式

Add DNS server to LAN for domain name resolution

Official document of kubevela 1.4.x

第 8 篇:创建摄像机类
随机推荐
The binary search boundary value processing based on leetcode35 is used to clarify the boundary value of the judgment condition using the idea of interval
Pyqt5 rapid development and actual combat 5.4 web page interaction
90. Subset II
HCIP(10)
Esp8266 Arduino programming example - timer and interrupt
HCIP(8)
Principle of object. Prototype. ToString. Call()
[LiteratureReview]Object Detection and Mapping with Bounding Box Constraints
ESP8266-Arduino编程实例-定时器与中断
搞事摸鱼一天有一天
HCIP(11)
Esp8266 Arduino programming example - SPIFs and data upload (Arduino IDE and platformio IDE)
Esp8266 Arduino programming example - deep sleep and wake up
【机器学习】朴素贝叶斯对文本分类--对人名国别分类
腾讯云数据库负责人林晓斌借一亿元炒股?知情人士:金额不实
Hcip experiment (15)
Practice and exploration of overseas site Seata of ant group
熊市下 DeFi 的未来趋势
Make trouble fishing day by day
Summary of the use of hash table set and map when leetcode brushes questions