Cloudflare 推出实时语音 AI 平台:Realtime Agents
Cloudflare 宣布推出实时语音 AI 平台(Cloudflare Realtime Agents),正式进军低延迟对话式 AI 领域。该平台依托 Cloudflare 全球 330 多个节点的边缘网络,为开发者提供构建语音交互应用的完整解决方案。
新平台的核心组件包括 Realtime Agents(语音 AI 管道编排运行时)、WebRTC 音频传输支持、Workers AI 的 WebSocket 实时推理 以及 Deepgram 的语音识别/合成模型。通过这些功能,开发者可快速搭建自然流畅的语音代理应用。
下面的示例代码展示了如何创建一个继承自 RealtimeAgent
的 JavaScript 类,以进行以下操作:
-
创建 WebRTC 会话
-
管道编排(如:Deepgram STT → 自定义文本处理 Handler → ElevenLabs TTS)
-
支持会议参与者加入/离开的事件处理
这让开发者几乎不需管理底层基础设施,就可快速构建个性化语音代理应用。
export class MyAgent extends RealtimeAgent<Env> {
constructor(ctx: DurableObjectState, env: Env) {
super(ctx, env);
}
async init(agentId: string ,meetingId: string, authToken: string, workerUrl: string, accountId: string, apiToken: string) {
// Construct your text processor for generating responses to text
const textHandler = new MyTextHandler(this.env);
// Construct a Meeting object to join the RTK meeting
const transport = new RealtimeKitTransport(meetingId, authToken, [
{
media_kind: 'audio',
stream_kind: 'microphone',
},
]);
const { meeting } = transport;
// Construct a pipeline to take in meeting audio, transcribe it using
// Deepgram, and pass our generated responses through ElevenLabs to
// be spoken in the meeting
await this.initPipeline(
[transport, new DeepgramSTT(this.env.DEEPGRAM_API_KEY), textHandler, new ElevenLabsTTS(this.env.ELEVENLABS_API_KEY), transport],
agentId,
workerUrl,
accountId,
apiToken,
);
// The RTK meeting object is accessible to us, so we can register handlers
// on various events like participant joins/leaves, chat, etc.
// This is optional
meeting.participants.joined.on('participantJoined', (participant) => {
textHandler.speak(`Participant Joined ${participant.name}`);
});
meeting.participants.joined.on('participantLeft', (participant) => {
textHandler.speak(`Participant Left ${participant.name}`);
});
// Make sure to actually join the meeting after registering all handlers
await meeting.rtkMeeting.join();
}
async deinit() {
// Add any other cleanup logic required
await this.deinitPipeline();
}
}
Cloudflare 指出,要让语音交互达到“自然对话”的体验,总延迟需低于 800 毫秒,而其分布式边缘架构正好能满足这一苛刻要求。平台同时兼容多种 AI 模型和第三方服务,支持高度可组合的语音处理管道。
目前,Cloudflare Realtime Agents 已开放 Beta 公测,开发者可免费试用并基于该平台开发新一代实时语音 AI 应用。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Cloudflare 扛下了峰值达 11.5 Tbps 的超大流量 DDoS 攻击
Cloudflare 宣布其自动化防御系统在过去几周里成功拦截了数百次超大规模 DDoS 攻击,其中最大一次攻击的峰值达到 11.5 Tbps(51 亿数据包/秒)。 据介绍,此次攻击类型为 UDP Flood(UDP 泛洪)攻击,这一峰值刷新了 Cloudflare 自己在 2025 年 5 月创下的 7.3 Tbps 纪录。 UDP 洪水是一种拒绝服务攻击,攻击者将大量用户数据报协议 (UDP) 数据包发送到目标服务器,旨在让该设备的处理和响应能力无力承担。由于 UDP 洪水攻击,保护目标服务器的防火墙也可能不堪重负,导致对正常流量拒绝服务。 Cloudflare 表示将在即将发布的技术报告中提供更详细的攻击与防御分析。
-
下一篇
质量安全管控如何实现事前预防?
大家好,我是陈哥。 我前几天看了FortiGuard Labs发布的《2025年全球威胁趋势报告》,里面写道:全球范围内利用系统漏洞发起的攻击已累计超970亿次。其中,亚太地区占比达到42%,依旧是全球网络安全风险最高的区域。 过去,代码安全防护总要等到开发快收尾时才介入。那时候开发周期长,这种模式还行得通。但现在项目的迭代速度大大加快,完成周期短到以周甚至天来计算,传统模式早就跟不上趟了。 在这样的背景下,“安全左移”的理念慢慢兴起。而这一理念的落地,离不开对代码质量安全管控逻辑的重新梳理。 质量安全管控的核心目标,在于通过系统性措施规避风险,而非单纯应对已发生的问题。实现事前预防,需要从流程优化、技术应用等多维度构建防控体系,形成全链条的风险拦截机制。 一、明确的编码规范 在我之前写过的文章《老板:你来弄个团队代码提交规范》中详细写了禅道的编码规范、测试规范以及提交规范。 如果大家感兴趣的话,可以直接去看,这里就不赘述了。 一旦这些规范形成落地的文档,就能从根上减少因为习惯不一样带来的质量安全问题。更重要的是,规范一明确,新人上手也能少走不少弯路,团队协作效率也上来。在遇到问题需要...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8编译安装MySQL8.0.19
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- MySQL8.0.19开启GTID主从同步CentOS8
- Dcoker安装(在线仓库),最新的服务器搭配容器使用
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- MySQL数据库在高并发下的优化方案
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果