清华大学近日开源了全球首个多智能体生成式学习 AI 技术框架:OpenMAIC。
![]()
据介绍,OpenMAIC(Open Multi-Agent Interactive Classroom)是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
![]()
项目结构
OpenMAIC/
├── app/ # Next.js App Router
│ ├── api/ # 服务端 API 路由(约 18 个端点)
│ │ ├── generate/ # 场景生成流水线(大纲、内容、图片、TTS…)
│ │ ├── generate-classroom/ # 异步课堂生成提交与轮询
│ │ ├── chat/ # 多智能体讨论(SSE 流式传输)
│ │ ├── pbl/ # 项目制学习端点
│ │ └── ... # quiz-grade, parse-pdf, web-search, transcription 等
│ ├── classroom/[id]/ # 课堂回放页面
│ └── page.tsx # 首页(生成输入)
│
├── lib/ # 核心业务逻辑
│ ├── generation/ # 两阶段课堂生成流水线
│ ├── orchestration/ # LangGraph 多智能体编排(导演图)
│ ├── playback/ # 回放状态机(idle → playing → live)
│ ├── action/ # 动作执行引擎(语音、白板、特效)
│ ├── ai/ # LLM 服务商抽象层
│ ├── api/ # Stage API 门面(幻灯片/画布/场景操作)
│ ├── store/ # Zustand 状态管理
│ ├── types/ # 集中式 TypeScript 类型定义
│ ├── audio/ # TTS & ASR 服务商
│ ├── media/ # 图片 & 视频生成服务商
│ ├── export/ # PPTX & HTML 导出
│ ├── hooks/ # React 自定义 Hooks(55+)
│ ├── i18n/ # 国际化(zh-CN, en-US)
│ └── ... # prosemirror, storage, pdf, web-search, utils
│
├── components/ # React UI 组件
│ ├── slide-renderer/ # 基于 Canvas 的幻灯片编辑器和渲染器
│ │ ├── Editor/Canvas/ # 交互式编辑画布
│ │ └── components/element/ # 元素渲染器(文本、图片、形状、表格、图表…)
│ ├── scene-renderers/ # 测验、交互、PBL 场景渲染器
│ ├── generation/ # 课堂生成工具栏和进度
│ ├── chat/ # 聊天区域和会话管理
│ ├── settings/ # 设置面板(服务商、TTS、ASR、媒体…)
│ ├── whiteboard/ # 基于 SVG 的白板绘图
│ ├── agent/ # 智能体头像、配置、信息栏
│ ├── ui/ # 基础 UI 组件(shadcn/ui + Radix)
│ └── ... # audio, roundtable, stage, ai-elements
│
├── packages/ # 工作区子包
│ ├── pptxgenjs/ # 定制化 PowerPoint 生成
│ └── mathml2omml/ # MathML → Office Math 转换
│
├── skills/ # OpenClaw / ClawHub skills
│ └── openmaic/ # OpenMAIC 引导式 SOP skill
│ ├── SKILL.md # 轻量路由层 + 确认规则
│ └── references/ # 按需加载的 SOP 分段
│
├── configs/ # 共享常量(形状、字体、快捷键、主题…)
└── public/ # 静态资源(logo、头像)
核心架构
- 生成流水线(
lib/generation/) — 两阶段:大纲生成 → 场景内容生成
- 多智能体编排(
lib/orchestration/) — 基于 LangGraph 的状态机,管理智能体轮次和讨论
- 回放引擎(
lib/playback/) — 驱动课堂回放和实时互动的状态机
- 动作引擎(
lib/action/) — 执行 28+ 种动作类型(语音、白板绘图/文字/形状/图表、聚光灯、激光笔…)
GitHub 链接:https://github.com/THU-MAIC/OpenMAIC