【直播】如何让 AI “跑得快” 又 “用得好”?
当前,人工智能技术正加速向大模型时代迈进,在政务、金融、医疗、工业等领域展现出颠覆性潜力。然而,大模型的训练与部署面临算力成本高、技术生态依赖性强、行业落地门槛高三大挑战。在此背景下,昇腾与国产大模型的深度结合,为破解上述瓶颈提供了新路径。
为加速技术普惠,4月23日晚,开源中国直播栏目《数智漫谈》邀请昇腾生态技术专家与行业先行者,分享一线开发经验,聊一聊昇腾结合大模型,如何促进创新,助力开发者与企业用户抓住国产 AI 新红利。
🌞微信扫码,预约直播:
🌟演讲议题1:昇腾插件化接入vLLM加速大模型推理创新最佳实践
演讲专家:姚圣伟,华为云 HCDE、微软 Insider Dev Tour China
议题简介:随着大模型技术的快速发展,如何高效部署与加速推理成为业界核心挑战。基于自主研发的昇腾处理器及CANN异构计算架构,昇腾推出插件化接入方案,与开源推理框架vLLM深度适配,为大模型推理提供高性能、低时延的创新实践。用户可以实现自己的Woker、ModelRunner、Attention、Communicator以及自定义算子。在进一步促进vLLM多样性发展的同时,尽可能的解决了兼容性、可维护性的问题。实践案例覆盖自然语言处理、多模态交互等场景,验证了昇腾生态的开放性与技术普适性,为行业提供可复用的国产化大模型部署范式,推动AI基础设施高效进化。
🌟演讲议题2:基于昇腾+大模型的国内智慧园区项目实践
演讲专家:李小雨,唐山爱尚产品总监,AI应用探索者与出海实践者
议题介绍:年初Deepseek引发了国产大模型浪潮,国内涌现大量需要通过AI提效、优化体验的需求。但是目前大部分传统行业对于AI提效的具体实践还在探索中,没有明确的AI落地场景。智慧园区为我们为某国企开发的系统,包括车辆道闸、人脸终端消费、考勤机、监控筒机等多种类业务、多种类设备,是集成一脸通、一平台、数据共享、数据可视的完整解决方案。本次分享,我们站在企业的角度分析AI,能给实际业务带来哪些方式的效率提升,并结合实际的某智慧园区项目,分享如何结合昇腾与大模型,在产品体验和功能形态上做出创新和提效。
🌟演讲议题3:基于香橙派 AI Studio 实现本地大模型部署和应用最佳实践
演讲专家:徐洋帆,香橙派系统工程师,昇腾社区核心开发者
议题简介:随着大模型技术的快速发展,个人和企业对大模型的需求呈现爆发式增长。在云端大模型层出不穷的同时,隐私安全问题也日渐严峻。因此实现低成本的本地化AI大模型部署和应用势在必行。香橙派携手华为昇腾,推出了orangePi AI studio和orangePi AI studio Pro产品,旨在为用户提供低成本的本地化AI大模型部署能力。在本次议题中,香橙派将展示算力高达352Tops,超大的192G显存的orangePi AI studio Pro产品上极简部署AI大模型的步骤,半小时实现从0到体验本地AI聊天机器人。
【数智漫谈】
OSCHINA 视频号直播畅聊栏目【数智漫谈】,每期一个技术话题,三五位专家围坐,各抒己见,畅聊开源。给大家带来最新的行业前沿、最热门的技术话题、最有趣的开源项目、最犀利的思想交锋。如果你手上也有新点子、好项目,想要跟同行交流分享,欢迎联系我们,讲坛随时开放~

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
GoFr —— 微服务开发框架
GoFr 旨在简化微服务开发,重点关注Kubernetes 部署和开箱即用的可观察性。虽然它能够构建通用应用程序,但微服务仍然是其核心。 主要特点 简单的 API 语法 默认的 REST 标准 配置管理 可观察性(日志、跟踪、指标) 内置身份验证中间件和自定义中间件支持 gRPC 支持 支持断路器的HTTP 服务 发布/订阅 所有数据源的健康检查 数据库迁移 计划任务 支持无需重启即可更改日志级别 Swagger 渲染 Abstracted File Systems WebSockets
- 下一篇
Intel 开源专为本地生成式 AI 设计的 AI Playground
Intel近日宣布,其专为本地生成式AI设计的AI Playground软件正式开源,为Intel Arc GPU用户提供了一个强大的AI模型运行平台。AI Playground支持多种图像、视频生成模型以及大型语言模型(LLMs),通过优化本地计算资源,显著降低了AI应用的硬件门槛。 核心功能:多模态AI模型一站式支持 AI Playground作为一款用户友好的“AI中心”,集成了丰富的生成式AI功能,涵盖图像生成、图像风格化、文本生成与聊天机器人等场景。AIbase梳理了其支持的模型与功能: 图像与视频生成:支持Stable Diffusion1.5、SDXL、Flux.1-Schnell和LTX-Video模型,可实现文本到图像、图像风格化以及文本到视频生成,生成结果在分辨率与细节上表现出色。 大型语言模型:兼容Safetensor PyTorch格式的DeepSeek R1、Phi3、Qwen2、Mistral,以及GGUF格式的Llama3.1、Llama3.2,结合OpenVINO优化的TinyLlama、Mistral7B、Phi3mini和Phi3.5mini,提供高...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Red5直播服务器,属于Java语言的直播服务器
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- CentOS7,CentOS8安装Elasticsearch6.8.6
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS7设置SWAP分区,小内存服务器的救世主
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS6,CentOS7官方镜像安装Oracle11G
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7安装Docker,走上虚拟化容器引擎之路