🔥🔥🔥 傻瓜式操作，动手实现专属于自己的“智能助手”盒子-低调大师

🔥🔥🔥 傻瓜式操作，动手实现专属于自己的“智能助手”盒子

2025-10-29 44

早晨醒来，你脑海里冒出一个想法——“我要一个不用掏手机、不用联网、就能和我说话的智能盒子。”不是云服务，不是手机 app，而是真正 独立运转。

你打开了桌上的那个小黑盒子：它有屏幕、也有麦克风、还有扬声器。你对它说：“早上好”。它回应：“早安，今天天气不错哦。”

你会不会觉得这个瞬间很酷？——因为它是你自己搭出来的。

而这个“小黑盒子”的制作特别简单。

社区中有一套简单的实现方案：一个叫 M5Stack CoreS3-SE（主控板），一个叫 Module LLM（离线语言理解模块），再加上一个开发环境叫 UIFlow 2.0。

下边来了解一下实现过程。

CoreS3 SE 主控负责感知（麦克风、屏幕、扬声器）， Module LLM 离线语言模块负责思考（NPU 推理、语言理解），通过 UIFlow 2.0 的可视化编程平台，开发者无需繁琐的配置，就能快速完成一个“离线可对话系统”的构建。

这种“去云化”的设计，不仅意味着设备能 在无网络环境下独立运行，还意味着 隐私、延迟与能耗都被重新定义—— 你的语音数据不再上传；响应几乎是即时的；设备可以在离线场景（工厂、教育、户外）中持续使用。

如果说过去的嵌入式开发像是焊电路、写寄存器，那 UIFlow 2.0 的出现则让编程变成了一种“拖拽艺术”。

M5Stack 团队在 UIFlow 2.0 中为 CoreS3 SE 与 LLM 模块提供了完整支持：

开发者可以直接在 Web IDE 中通过图形化组件或 Micropython 脚本，调用 LLM 模块的自然语言接口。

例如，只需要几行代码：

# 示例代码
from m5stack.llm import LlmModule

llm = LlmModule()
response = llm.generate("请用一句话介绍自己")
print(response)

几秒钟后，屏幕上出现一句回应——“我是运行在本地的小语言模型，很高兴认识你。”

没有 API Key，没有网络请求，没有等待延迟。

在 UIFlow 中，你还可以用“积木”方式组合交互逻辑：当按钮被按下 → 录音 → 转文字 → 发送到 LLM → 播放语音。

整个流程像拼乐高一样可视化。这让 AI 不再只属于数据中心，而开始成为 创客可玩的素材。

此外，在嵌入式环境里，AI 不追求参数量，而追求“流畅”。Module LLM 的设计思路，是将压缩过的语言模型固化在本地 NPU 上运行。它的推理速度比同等 CPU 模式快数倍，却只需极低功耗。

通过合理的 prompt 设计，它可以轻松处理日常对话、状态汇报、简单任务生成。例如：

“请提醒我下午三点去实验室。”
“帮我写一句励志的签名。”
“把这句话翻译成英文。”

在响应时间上，它几乎和传统语音助手相当（1~2 秒返回），但整个过程全程离线。

对于开发者来说，这意味着可以在 任何无网环境下运行智能语音系统：从手持终端到工业控制屏，从教育互动设备到户外语音助理。

有趣的是，这种离线 AI 设备并不需要你“懂深度学习”。

CoreS3 SE 已内置麦克风、扬声器、触摸屏；UIFlow 提供 TTS（语音合成）、ASR（语音识别）等接口。你只需要写逻辑、设计交互，就能让盒子具备完整的“听 → 想 → 说”能力。

比如：

听：按键或唤醒词触发录音；
想：ASR 转文字后交给 LLM 模块处理；
说：生成的文本通过 TTS 播出。

更进一步，你可以将对话记录保存到 SD 卡、做上下文滑动窗口、甚至在不同任务之间切换人格。

这不再是“玩具”，而是一个真正可以定制的、私有化的语言 智能体 。

11 月 1 日-2 日，北京，线下，GOTC 2025【AI 驱动造物创新论坛】上， M5Stack 团队将更具体地对前边我们讲到的实现过程进行解析与手把手实操，参与者将现场体验：

如何在本地运行集成化 LLM 推理模块
通过可视化编程构建 AI 应用
了解离线 AI 的技术路径与能效优化

💡 提示：需自备笔记本电脑。

适合人群

创客 / 教育工作者 / 科技创业者
AI 硬件与具身智能方向开发者
开源项目发起人与硬件生态合作者
对 AI 社交、情感计算、智能造物充满好奇的探索者

访问 GOTC 官方报名通道报名参会： https://www.oschina.net/event/8598047

全球开源技术峰会 GOTC 2025，为期 2 天的开源技术与行业盛会，将通过行业展览、主题发言、圆桌讨论等形式来诠释此次大会主题 ——“万源共振，智构未来”。会议聚焦 Agentic AI、大模型时代的 “开源”、AI + 软件工程、软件基础设施智能化、AI Coding、具身智能等热门话题，探讨开源未来，助力开源发展。

https://gotc.oschina.net

微信关注我们

原文链接：https://www.oschina.net/news/380204

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

AI 使用让我们高估认知能力

根据阿尔托大学的研究，使用人工智能（AI）工具可能使我们对自己的认知能力产生误判。普遍情况下，人们倾向于自我评估为 “略好于平均水平”，这种现象在认知测试表现较差的人群中尤为明显，被称为 “达克效应”(Dunning-Kruger Effect)。也就是说，能力较差的人往往高估自己的能力，而能力较强的人却更容易低估自己。然而，阿尔托大学的这项新研究表明，当涉及到大型语言模型（如 ChatGPT）时，这种效应并不成立。研究发现，无论使用者的 AI 素养如何，大家在使用 AI 时普遍高估了自己的表现。尤其是那些认为自己更具 AI 素养的用户，反而更容易产生过度自信的倾向。研究人员表示，这一发现令人意外，因为通常人们期望具备 AI 素养的人在与 AI 互动时，不仅能表现得更好，还能更准确地判断自己的表现。但事实正好相反。研究指出，虽然使用 ChatGPT 的用户在任务上表现得更好，但他们普遍对自己的表现感到过于自信。此外，研究还强调了 AI 素养的重要性，指出当前的 AI 工具并未有效促进用户的元认知能力（即对自己思维过程的认识），这可能导致用户在获取信息时的 “智力下降” 现象。因此...

2025-10-29

67

近日，国务院办公厅印发《关于健全“高效办成一件事”重点事项常态化推进机制的意见》。《意见》围绕加强重点事项清单管理、推动重点事项常态化实施、拓展“高效办成一件事”应用领域、强化组织实施提出了4个方面的重点任务，并要求到2027年底前，实现总体清单内重点事项全面落地实施，推动“高效办成一件事”从“能办”向“好办、易办”转变。基于国家政策指引，作为开源鸿蒙生态的重要共建者，国开鸿正式发布基于开源鸿蒙的政务一体化解决方案。该方案的核心突破在于依托其独创的PDBox（外设万能盒）能力，通过统一架构与标准化接口设计，实现了“一次开发，多发行版兼容；一套接口，多品类外设接入”，有效解决了开源鸿蒙与华为鸿蒙操作系统的全面适配问题，以及多品牌、多协议设备的互联挑战。方案内置国密安全芯片并采用硬件级隔离机制，在提供高效即插即用体验的同时，确保端到端的安全可控。该方案还将分布式技术深度融入政务服务场景，显著降低了开发与运维成本，助力开源鸿蒙生态打通落地“最后一公里”，推动行业从“碎片化兼容”迈入“一体化生态”新阶段，为万物互联的智能化转型夯实基础，标志着智慧政务正式从“功能集成”走向“设备融合”。一、...

2025-10-29

41

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。