BentoML —— 统一模型部署框架-低调大师

BentoML —— 统一模型部署框架

2023-05-28 918

BentoML 是 AI 应用程序开发人员的平台，提供工具和基础架构来简化整个 AI 产品开发生命周期。BentoML 使创建准备好部署和扩展的机器学习服务变得容易。

数据科学家和 ML 工程师可以使用 BentoML：

加速并标准化将 ML 模型投入生产的过程
构建可扩展的高性能预测服务
在生产中持续部署、监控和运行预测服务

BentoML 原生支持所有流行的 ML 框架，包括 Pytorch、Tensorflow、JAX、XGBoost、HuggingFace、MLFlow，以及最新的预构建开源 LLM（大型语言模型）和生成式 AI 模型。

BentoML 可扩展你使用 Python 构建的 AI 工作负载。多模型图推理、并行模型推理和自适应批处理，以及许多高级 AI 功能，都包含在易于使用的 Python 原语中。

BentoML 是一个统一的 online、offline 和 streaming 框架；使用一个统一接口进行开发，该接口可以作为 REST API endpoin 或 gRPC service 轻松推出，集成到批处理工作负载的数据管道中，或使用流式架构进行实时处理。

BentoML 是用于创建 AI 应用程序的开放标准，它带来了一致性，使开发人员能够在所有 AI 产品团队中变得更加敏捷、创新和高效。

Highlights

Unified Model Serving API

适用于Tensorflow、PyTorch、XGBoost、Scikit-Learn、ONNX等的框架无关的模型打包
为预处理/后处理和业务逻辑编写自定义 Python 代码以及模型推理
为在线（REST API 或 gRPC）、离线批处理和流式推理应用相同的代码
用于构建多模型推理管道或图形的简单抽象

无摩擦过渡到生产的标准化流程

将Bento构建为 ML 服务的标准可部署工件
自动生成具有所需依赖项的 docker 镜像
使用 GPU 进行推理的简单 CUDA 设置
与 MLOps 生态系统的丰富集成，包括 Kubeflow、Airflow、MLFlow、Triton

具有强大的性能优化的可扩展性

自适应批处理根据服务器端最佳性能动态分组推理请求
Runner 抽象将模型推理与你的自定义代码分开进行 scales
通过自动配置最大化你的 GPU和多核 CPU 利用率

以 DevOps 友好的方式部署到任何地方

通过以下方式简化生产部署工作流程：
- BentoML Cloud：部署便当的最快方式，简单且大规模
- Yatai：在 Kubernetes 上大规模部署模型
- bentoctl：在 AWS SageMaker、Lambda、ECE、GCP、Azure、Heroku 等平台上快速部署模型！
使用 Spark 或 Dask 运行离线批量推理作业
对 Prometheus 指标和 OpenTelemetry 的内置支持
用于高级 CI/CD 工作流程的灵活 API

微信关注我们

原文链接：https://www.oschina.net/p/bentoml

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

每日一博 | Flutter 热更新技术探索

一，需求背景： APP发布到市场后，难免会遇到严重的BUG阻碍用户使用，因此有在不发布新版本APP的情况下使用热更新技术立即修复BUG需求。原生APP（例如：Android & IOS）的热更新需求已经比较成熟，但Flutter技术栈目前还缺少类似的技术方案，因此Flutter研发团队，也需要类似的热更新技术。二，Flutter热更新技术方向分析：经过分析目前可能有三种可行的方案： 1）类似RN框架； 2）页面动态组件框架； 3）Dart虚拟机定制方案；方案名称原理优点缺点开源方案类似RN的方案用JS以Flutter语法写dart，然后用JavaScript把XML DSL转为Flutter的原子widget组件，然后再让Flutter来渲染由于ios系统内置支持js，ios上完全可以实现更新 1)由于跨语言执行，对于性能有影响；学习成本高 2)Android 端需要额外引入JS库手Q的MXFlutter，58同城的Fair 页面动态组件方案编译期时插桩/预埋好DynamicWidget到代码中，然后动态下发Json 数据，通过协定好的语义匹配到JSON...

2023-05-28

865

Angular发布了最新的面向 Angular 用户的 2022 开发者调查报告，基于来自 12000 名开发人员的反馈意见。调查发现：超过 82% 的开发者表示对 Angular 感到满意；89% 开发人员对 Angular 不同组件之前的协同工作表示满意，相较2021 年的 85% 有所提高。接近 70% 的开发人员正在使用该框架的最新两个版本，只有 9% 的人使用 v11 或更早版本。大多数人是从社交媒体和 Angular 网站上了解最新的 Angular 功能，其次是博客、在线社区，如 StackOverflow 和在线教育网站受访者最喜欢的Angular 特性是依赖注入，其次是 IDE 支持、CLI 构建工具以及与 Angular 版本保持同步。他们认为最需要改进的领域是服务器端渲染、测试、调试和分析、初始加载性能和组件编写格式。此外，Angular 团队还探讨了一些与其路线图相对应的内容：文档和示例代码 — 为了解决此反馈，他们开发了一个新的入门教程，逐步介绍了概念。同时还一直在审查文档内容，以查找缺少的主题和改进机会。预计明年将有大量关于独立组件、服务器端呈现...

2023-05-28

406

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。