tensorflow serving docker-低调大师

tensorflow serving docker

2019-03-02 689

背景介绍

TensorFlow Serving 是一个用于机器学习模型 serving 的高性能开源库。它可以将训练好的机器学习模型部署到线上，使用 gRPC 作为接口接受外部调用。更加让人眼前一亮的是，它支持模型热更新与自动模型版本管理。这意味着一旦部署 TensorFlow Serving 后，你再也不需要为线上服务操心，只需要关心你的线下模型训练。

TensorFlow Serving的典型的流程如下：学习者(Learner，比如TensorFlow)根据输入数据进行模型训练。等模型训练完成、验证之后，模型会被发布到TensorFlow Serving系统服务器端。客户端提交请求，由服务端返回预测结果。客户端和服务端之间的通信采用的是RPC/REST协议。

官方资料

TensorFlow Serving的中文版资料不多，所以能做的基本上就是参考英文官网的文档，一个是tensorflow serving github官网，一个是tensorflow serving web官网，前者能够稳定打开，后者看天看心情能否打开。

建议选型tensorflow serving作为tensorflow服务容器的一定要熟读tensorflow serving web官网，要对每个细节扣的很细，这样才能了解TFS能够提供的核心能力。

补充一点，之前在调研资料的时候发现阿里云也提供基于TFS提供在线预测的云能力，特想了解他们如何解决cpu高消耗的问题。

安装选型

tensorflow serving提供三种安装方式：1、docker安装、2、通过APT安装、3、编译源码，本着快速验验证的原则我们自然而然的选择了docker安装。

其实按照我们当时的试想如果TFS在性能上有比较明显优势我们可以通过K8S管理docker这样能够非常方便的升级TFS的版本。

TFS的官方提供的docker可以在TFS的docker官网找到，根据不同的TF版本和是否GPU进行选型，参考当时情况的是TF是1.6.0版本，TFS选型1.12.0，没仔细研究过TFS和TF之间的关系，但是按照TF的版本逻辑在同一个大版本1.X的情况下兼容低版本的API，所以TFS版本更高兼容。

补充一点，一开始使用TFS最新版本的时候在java API调用方面有些兼容性问题（具体原因没仔细分析），个人建议是TFS的docker版本和编译java api的TFS版本保持一致。

安装命令

TFS的启动命令需要参考TFS本身的命令和docker相关的命令，前者指定TFS的启动参数，后者指定docker的端口和目录映射问题。

docker run -t --rm -p 8500:8500 -p 8501:8501 
-v /home/zhi.wang/tensorflow-serving/model:/models 
-e MODEL_NAME=wdl_model tensorflow/serving:1.12.0 
--enable_batching=true 
--batching_parameters_file=/models/batching_parameters.txt &

说明：

-p 8500:8500 -p 8501:8501 用于绑定rpc和rest端口。
-v /home/zhi.wang/tensorflow-serving/model:/models 用于绑定目录映射。
-e MODEL_NAME=wdl_model指定TFS加载模型名字，和目录tensorflow-serving/model下的模型名字保持一致， 如/home/zhi.wang/tensorflow-serving/model/wdl_model。
--enable_batching=true 设置TFS开启batch功能。
--batching_parameters_file=/models/batching_parameters.txt 绑定批量参数。

batching_parameters

num_batch_threads { value: 40 }
batch_timeout_micros { value: 0 }
max_batch_size { value: 1024 }

说明：

参考github issue设置的TFS的批量参数。

model directory

[wdl_model]# tree
.
├── 1
│   ├── saved_model.pb
│   └── variables
│       ├── variables.data-00000-of-00001
│       └── variables.index
├── 10
│   ├── saved_model.pb
│   └── variables
│       ├── variables.data-00000-of-00001
│       └── variables.index
├── 2
│   ├── saved_model.pb
│   └── variables
│       ├── variables.data-00000-of-00001
│       └── variables.index
├── 3
│   ├── saved_model.pb
│   └── variables
│       ├── variables.data-00000-of-00001
│       └── variables.index
├── 4
│   ├── saved_model.pb
│   └── variables
│       ├── variables.data-00000-of-00001
│       └── variables.index

说明：

TFS支持多版本的模型加载，默认会加载数字最大的版本。
TFS加载的模型通过export_savedmodel的api生成。

微信关注我们

原文链接：https://yq.aliyun.com/articles/692124

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Kubernetes + CRI + Kata + Firecracker

Kata Kata源自希腊文Καταπίστευμα(ka-ta-PI-stev-ma)，原意是值得信任的人，kata container正是解容器安全的问题而诞生的。传统的容器是基于namespace和cgroup进行隔离，在带来轻量简洁的同时，也带来了安全的隐患。事实上容器虽然提供一个与系统中的其它进程资源相隔离的执行环境，但是与宿主机系统是共享内核的，一旦容器里的应用逃逸到内核，后果不堪设想，尤其是在多租户的场景下。Kata就是在这样的背景下应运而生，kata很好的权衡了传统虚拟机的隔离性、安全性与容器的简洁、轻量。这一点和firecracker很相似，都是轻量的虚拟机。但是他们的本质的区别在于：kata虽然是基于虚机，但是其表现的却跟容器是一样的，可以像使用容器一样使用kata；而firecracker虽然具备容器的轻量、极简性，但是其依然是虚机，一种比QEMU更轻量的VMM，暂时不能兼容容器生态。Kata的基本原理是，为每一个容器单独开一个虚机（如果是k8s下作为runtime，则是一个pod对应一个虚机而不是容器），具有独立的内核，这样交付的容器就具备了虚机级别的隔离和安全...

2019-03-02

933

Asp.NetCore轻松学-使用Docker进行容器化托管目录前言 1. 为什么要使用 docker 2 Centos 服务器安装前置条件 2.2 使用安装脚本安装 docker 3. 开始使用 Dockerfile 4. 扩展的 docker 学习 4.2 进入镜像结束语前言没有 docker 部署的程序是不完整的，在写了 IIS/Centos/Supervisor 3篇托管介绍文章后，终于来到了容器化部署，博客园里面有关于 docker 部署的文章比比皆是，作为硬核实战派，这里做的一定是一套打完带走的功法。本文使用的学习机器是由 Azure 倾情提供的 30 天试用版本，大家都可以申请的哈。 1. 为什么要使用 docker 1.1 docker 介绍 docker 带来的好处是显而易见的，使用 docker 可以在同一台服务器上部署多个版本的应用，彼此间不会引起冲突，更快的迁移过程，当需要增加服务实例的时候，只需要下载 docker 镜像即可部署运行，无需担心环境初始化等一系列前置工作，目前使用 docker 基于阿里云弹性计算的应用已经非常广泛，docker 容器...

2019-03-02

609

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。