【直播】如何让 AI “跑得快” 又 “用得好”？-低调大师

【直播】如何让 AI “跑得快” 又 “用得好”？

2025-04-21 438

当前，人工智能技术正加速向大模型时代迈进，在政务、金融、医疗、工业等领域展现出颠覆性潜力。然而，大模型的训练与部署面临算力成本高、技术生态依赖性强、行业落地门槛高三大挑战。在此背景下，昇腾与国产大模型的深度结合，为破解上述瓶颈提供了新路径。

为加速技术普惠，4月23日晚，开源中国直播栏目《数智漫谈》邀请昇腾生态技术专家与行业先行者，分享一线开发经验，聊一聊昇腾结合大模型，如何促进创新，助力开发者与企业用户抓住国产 AI 新红利。

🌞微信扫码，预约直播：

🌟演讲议题1：昇腾插件化接入vLLM加速大模型推理创新最佳实践

演讲专家：姚圣伟，华为云 HCDE、微软 Insider Dev Tour China

议题简介：随着大模型技术的快速发展，如何高效部署与加速推理成为业界核心挑战。基于自主研发的昇腾处理器及CANN异构计算架构，昇腾推出插件化接入方案，与开源推理框架vLLM深度适配，为大模型推理提供高性能、低时延的创新实践。用户可以实现自己的Woker、ModelRunner、Attention、Communicator以及自定义算子。在进一步促进vLLM多样性发展的同时，尽可能的解决了兼容性、可维护性的问题。实践案例覆盖自然语言处理、多模态交互等场景，验证了昇腾生态的开放性与技术普适性，为行业提供可复用的国产化大模型部署范式，推动AI基础设施高效进化。

🌟演讲议题2：基于昇腾+大模型的国内智慧园区项目实践

演讲专家：李小雨，唐山爱尚产品总监，AI应用探索者与出海实践者

议题介绍：年初Deepseek引发了国产大模型浪潮，国内涌现大量需要通过AI提效、优化体验的需求。但是目前大部分传统行业对于AI提效的具体实践还在探索中，没有明确的AI落地场景。智慧园区为我们为某国企开发的系统，包括车辆道闸、人脸终端消费、考勤机、监控筒机等多种类业务、多种类设备，是集成一脸通、一平台、数据共享、数据可视的完整解决方案。本次分享，我们站在企业的角度分析AI，能给实际业务带来哪些方式的效率提升，并结合实际的某智慧园区项目，分享如何结合昇腾与大模型，在产品体验和功能形态上做出创新和提效。

🌟演讲议题3：基于香橙派 AI Studio 实现本地大模型部署和应用最佳实践

演讲专家：徐洋帆，香橙派系统工程师，昇腾社区核心开发者

议题简介：随着大模型技术的快速发展，个人和企业对大模型的需求呈现爆发式增长。在云端大模型层出不穷的同时，隐私安全问题也日渐严峻。因此实现低成本的本地化AI大模型部署和应用势在必行。香橙派携手华为昇腾，推出了orangePi AI studio和orangePi AI studio Pro产品，旨在为用户提供低成本的本地化AI大模型部署能力。在本次议题中，香橙派将展示算力高达352Tops，超大的192G显存的orangePi AI studio Pro产品上极简部署AI大模型的步骤，半小时实现从0到体验本地AI聊天机器人。

【数智漫谈】

OSCHINA 视频号直播畅聊栏目【数智漫谈】，每期一个技术话题，三五位专家围坐，各抒己见，畅聊开源。给大家带来最新的行业前沿、最热门的技术话题、最有趣的开源项目、最犀利的思想交锋。如果你手上也有新点子、好项目，想要跟同行交流分享，欢迎联系我们，讲坛随时开放～

微信关注我们

原文链接：https://my.oschina.net/u/3859945/blog/18211605

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

GoFr —— 微服务开发框架

GoFr 旨在简化微服务开发，重点关注Kubernetes 部署和开箱即用的可观察性。虽然它能够构建通用应用程序，但微服务仍然是其核心。主要特点简单的 API 语法默认的 REST 标准配置管理可观察性（日志、跟踪、指标）内置身份验证中间件和自定义中间件支持 gRPC 支持支持断路器的HTTP 服务发布/订阅所有数据源的健康检查数据库迁移计划任务支持无需重启即可更改日志级别 Swagger 渲染 Abstracted File Systems WebSockets

2025-04-21

275

Intel近日宣布，其专为本地生成式AI设计的AI Playground软件正式开源，为Intel Arc GPU用户提供了一个强大的AI模型运行平台。AI Playground支持多种图像、视频生成模型以及大型语言模型（LLMs），通过优化本地计算资源，显著降低了AI应用的硬件门槛。核心功能：多模态AI模型一站式支持 AI Playground作为一款用户友好的“AI中心”，集成了丰富的生成式AI功能，涵盖图像生成、图像风格化、文本生成与聊天机器人等场景。AIbase梳理了其支持的模型与功能: 图像与视频生成：支持Stable Diffusion1.5、SDXL、Flux.1-Schnell和LTX-Video模型，可实现文本到图像、图像风格化以及文本到视频生成，生成结果在分辨率与细节上表现出色。大型语言模型：兼容Safetensor PyTorch格式的DeepSeek R1、Phi3、Qwen2、Mistral，以及GGUF格式的Llama3.1、Llama3.2，结合OpenVINO优化的TinyLlama、Mistral7B、Phi3mini和Phi3.5mini，提供高...

2025-04-21

592

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。