利用OpenVINO™ 实现混合式AI部署:迈向无所不在的人工智能
点击蓝字
关注我们,让开发变得更有趣
作者:武卓 博士
英特尔AI软件布道师
随着人工智能技术的飞速发展,AI的应用已经渗透到日常生活的各个方面。为了更有效地利用AI技术,混合式AI部署成为了一个重要趋势。这种部署方式结合了云端和边缘计算的优势,使得AI应用更为灵活和高效。本文将探讨OpenVINO™ 如何助力混合式AI部署,实现AI的无所不在。
混合式AI部署简介
混合式AI部署是指将AI模型同时部署在云端和边缘设备上。这种方法结合了云端部署具有的海量数据强大处理能力、无限按需计算能力以及集中化处理等优点,以及边缘部署的实时数据处理能力、更广阔的场景触达、完全的数据主权以及良好的成本效益等优点。通过这种方式,可以在云端处理大规模、复杂的数据分析任务,同时在边缘设备上快速响应实时数据处理需求。
虽然混合式AI部署具有以上种种优势,但我们看到它仍然面临着时延、数据带宽、数据隐私和安全、以及可扩展成本和能源效率的种种挑战。
OpenVINO™ 平台的优势
OpenVINO™ 是英特尔开源的深度学习模型优化以及快速部署的工具套件,旨在加速深度学习模型推理工作流程。它借由模型、优化、部署三个简单的开发者旅程步骤,即可以实现深度学习模型的优化,以及“一次编写,任意部署” 。
在模型方面,OpenVINO™ 支持市面上所有主流的深度学习框架训练出来的深度学习模型,包括Tensorflow、PyTorch、Paddlepaddle等。在优化方面,OpenVINO™ 提供了模型转换器、神经网络压缩框架(NNCF)等一系列优化工具,可以对模型进行优化、量化压缩,从而可以显著减小模型体积、推理时所需的内存大小、以及提升推理速度。在部署方面,OpenVINO™ 能够方便地将模型部署在CPU、GPU、NPU以及FPGA上,实现模型的快速落地部署。
OpenVINO™ 助力混合式AI边缘部署
在边缘设备上,OpenVINO™ 的高效推理和模型快速部署能力显得尤为重要。它使得用户可以根据使用场景、AI工作负载的实际需求,灵活地选择不同的硬件设备,并完成在这些硬件设备上的快速的模型部署、以及模型推理加速,实现深度学习模型在边缘的快速落地。
结论
混合式AI部署是实现AI无所不在的重要一步。通过OpenVINO™ 的高效、灵活的特点,可以在边缘设备上,更具不同的使用场景、工作负载情况,选用不同的硬件设备,快速完成模型部署和运行模型推理,提高整体的运算效率和响应速度。随着技术的不断进步,我们期待看到更多创新的AI应用,让人工智能真正融入我们的生活。
OpenVINO™
--END--
你也许想了解(点击蓝字查看)⬇️ ➡️ 隆重介绍 OpenVINO™ 2024.0: 为开发者提供更强性能和扩展支持 ➡️ 隆重推出 OpenVINO 2023.3 ™ 最新长期支持版本 ➡️ OpenVINO™ 2023.2 发布:让生成式 AI 在实际场景中更易用 ➡️ 开发者实战 | 基于 OpenVINO™ 和 LangChain 构建 RAG 问答系统 ➡️ 开发者实战 | 如何利用低比特量化技术进一步提升大模型推理性能 ➡️ 开发者实战 | 介绍OpenVINO™ 2023.1:在边缘端赋能生成式AI ➡️ 基于 ChatGLM2 和 OpenVINO™ 打造中文聊天助手 ➡️ 基于 Llama2 和 OpenVINO™ 打造聊天机器人 ➡️ OpenVINO™ DevCon 2023重磅回归!英特尔以创新产品激发开发者无限潜能 ➡️ 5周年更新 | OpenVINO™ 2023.0,让AI部署和加速更容易 ➡️ OpenVINO™5周年重头戏!2023.0版本持续升级AI部署和加速性能 ➡️ OpenVINO™2023.0实战 | 在 LabVIEW 中部署 YOLOv8 目标检测模型 ➡️ 开发者实战系列资源包来啦! ➡️ 以AI作画,祝她节日快乐;简单三步,OpenVINO™ 助你轻松体验AIGC
扫描下方二维码立即体验
OpenVINO™ 工具套件 2024.0
![]()
![]()
本文分享自微信公众号 - OpenVINO 中文社区(openvinodev)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
苹果放宽欧盟 App Store 软件分发规则
苹果公司宣布计划放宽欧盟 App Store 的部分软件分发规则。“我们为在欧盟 (EU) 分发应用程序的开发者提供了更大的灵活性,包括引入一种直接从开发者网站分发应用程序的新方法。” 据悉,此举将使该公司更容易遵守欧盟立法者于 2022 年通过的《数字服务法》和《数字市场法》这两部反垄断法,分别于上个月和上周生效。 公告指出,已同意欧盟应用程序替代条款附录的开发者可以为其在欧盟的应用程序提供新选项: 备选应用市场(Alternative app marketplaces)。市场可以选择仅提供来自市场开发商的应用程序目录。 Linking out to purchase。修订后的应用商店规则允许欧盟的开发者自定义指向外部网站的应用内链接。软件团队现在可以“选择如何设计促销、折扣和其他交易”。此前,应用程序仅限于使用 Apple 提供的一组界面模板,更新后这些模板将继续作为可选的开发人员资源提供。 预计今年春季晚些时候还将会推出 Web Distribution 功能,授权开发者可以直接通过开发者拥有的网站向欧盟用户分发 iOS 应用程序。Apple 将为授权开发者提供 API 访问权限...
- 下一篇
隆重介绍 OpenVINO™ 2024.0: 为开发者提供更强性能和扩展支持
点击蓝字 关注我们,让开发变得更有趣 作者| YuryGorbachev英特尔院士OpenVINO™ 产品架构师 翻译|武卓英特尔 AI软件布道师 排版 | 李擎 Hello, OpenVINO™ 2024.0 欢迎来到 OpenVINO™ 2024.0,我们很高兴在这里推出一系列增强功能,旨在在快速发展的人工智能领域为开发者赋能!此版本通过动态量化、改进优化 GPU 以及对混合专家架构的支持,增强了大语言模型(LLM)的性能。OpenVINO™ 2024.0 使开发者能够有效利用人工智能加速,并对来自社区的持续贡献表示感谢。 OpenVINO™ 大语言模型推理的提升 大语言模型(LLM)没有消失的迹象,模型和使用用例不断涌现。我们将继续我们的使命,以便加速模型,并使这些模型的推理更加经济实惠。 性能和准确性的提升 在本版本中,我们一直致力于提高 LLM 的开箱即用性能,并对运行时和工具进行了一些重要更改。 首先,我们介绍了 CPU 平台的动态量化和缓存压缩机制。KV 缓存压缩功能使我们能够更高效地生成大序列。动态量化通常会提高模型其它部分(嵌入映射和前馈网络)的计算和内存消耗。 对于...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS6,CentOS7官方镜像安装Oracle11G
- Mario游戏-低调大师作品
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS关闭SELinux安全模块
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果