首页 文章 精选 留言 我的

文章列表

共 182748 篇
通义万相预告新模型 Wan2.2-S2V

通义万相预告新模型 Wan2.2-S2V

通义万相团队深夜发布预告推文,称即将推出新模型 Wan2.2-S2V,该模型将具备生成带音频视频的能力。 通义万相Wan2.2是一款开源视频生成模型,它率先在视频生成扩散模型中引入 MoE 架构,有效解决视频生成处理 Token 过长导致的计算资源消耗大问题。Wan2.2 还首创了「电影美学控制系统」,光影、色彩、构图、微表情等能力媲美专业电影水平。例如,用...

理解 SOLID 原则:编写更简洁的 JavaScript 代码

理解 SOLID 原则:编写更简洁的 JavaScript 代码

编写简洁、可维护的代码是构建可扩展应用的关键。由罗伯特·C·马丁(Bob 大叔)提出的 SOLID 原则,是五条核心设计准则,能帮助开发者更好地组织代码、减少漏洞,并降低后续修改的难度。 本文将逐一拆解每条原则,用简单的 JavaScript 示例演示,并解释其重要性。 🧱 SOLID 分别代表什么? SOLID 是五条面向对象设计原则的首字母缩写: S ...

WebRTC 入门指南:实时通信完全解析

WebRTC 入门指南:实时通信完全解析

🚀 简介 WebRTC(Web 实时通信)是一项强大的技术,支持浏览器和移动应用实时交换音视频与数据——无需中间服务器中转。它是现代视频通话、屏幕共享工具及实时协作平台的核心底层技术。 本文将完整覆盖 WebRTC 技术流程:从获取用户媒体到建立安全的点对点(P2P)连接,并提供基于 TypeScript 风格的 JavaScript 实战示例。 🎥 捕...

阿里开源 Vivid-VR:AI 视频修复神器

阿里开源 Vivid-VR:AI 视频修复神器

阿里云推出了一款名为 Vivid-VR 的开源生成式视频修复工具,基于先进的文本到视频(T2V)基础模型,结合ControlNet技术,确保视频生成过程中的内容一致性。 该工具能够有效修复真实视频或AIGC(AI生成内容)视频中的质量问题,消除闪烁、抖动等常见缺陷,为内容创作者提供了一个高效的素材补救方案。无论是对低质量视频的修复,还是对生成视频的优化,Vi...

微软开源文本转语音模型 VibeVoice,支持最多 4 位说话人同时发声

微软开源文本转语音模型 VibeVoice,支持最多 4 位说话人同时发声

微软正式开源了其最新的文本转语音(TTS)模型VibeVoice-1.5B,该模型主打 “超长、多人、高压缩”,单次即可生成长达 90 分钟的连续语音,并支持最多 4 位说话人同时发声。 VibeVoice-1.5B 的核心创新在于其双 Tokenizer 设计。模型分为两个独立但协同工作的模块。 1. 声学 Tokenizer:负责保留声音特征并实现高压缩...

播放器视频后处理实践

播放器视频后处理实践

1. 前言 在播放器架构不断演进的今天,视频后处理技术正在成为提升用户体验的关键环节。相比传统的解码即播,现代播放器越来越多地引入后处理链路,通过增强画质、渲染氛围等手段,为用户提供更具沉浸感的视听体验。 本系列文章将系统介绍我们在播放器视频后处理模块中的技术方案与工程实现,涵盖从效果设计、算法选型,到性能优化和跨平台兼容的全链路细节。第一期内容聚焦在两类核...

英伟达发布 Jetson AGX Thor 开发者套件: 基于 Blackwell 架构、专为物理 AI 和机器人打造

英伟达发布 Jetson AGX Thor 开发者套件: 基于 Blackwell 架构、专为物理 AI 和机器人打造

英伟达宣布NVIDIA Jetson AGX Thor™开发者套件和量产级模组现已发售。这是一款功能强大的新一代机器人计算机,旨在为制造、物流、交通、医疗、农业和零售等行业的数百万台机器人提供算力支持。 Jetson Thor 基于 NVIDIA Jetson™ 软件平台,专为物理 AI 和人形机器人打造,支持所有主流 AI 框架与生成式 AI 模型。同时,...

亚马逊 AGI 实验室掌门人首度回应

亚马逊 AGI 实验室掌门人首度回应

去年,当亚马逊以一种前所未有的方式招揽AI初创公司Adept的创始团队时,整个行业都为之震动。这种被称为"反向人才收购"的全新交易模式,让大型科技公司无需完全收购初创企业,而是通过挖走核心团队并获得技术授权来达到目的。 这场交易的核心人物David Luan,从Adept联合创始人兼CEO摇身一变,成为了亚马逊全新AGI实验室的掌舵人。如今,面对外界的质疑声...

LazyLLM教程 | 第6讲:检索更准:RAG召回效果优化的底层逻辑与技巧

LazyLLM教程 | 第6讲:检索更准:RAG召回效果优化的底层逻辑与技巧

从前面的课程中我们知道了 RAG(Retrieval-Augmented Generation)系统是一种结合检索和生成两个核心组件实现基于外部知识源回答用户查询的智能系统,可以在一定程度上克服大模型幻觉问题在特定领域问答任务上给出与上下文相关的答案。RAG 的基本思想是先通过检索模块从大量文档中找到与用户问题相关的上下文,然后将这些信息提供给生成模型,以生...

谷歌 NotebookLM 升级:支持 80 种语言的视频与音频概述

谷歌 NotebookLM 升级:支持 80 种语言的视频与音频概述

谷歌宣布其 AI 研究助手 NotebookLM 迎来重大更新,其 “Video Overviews(视频概述)” 功能现已支持 80 种语言(包括简体中文),并同步升级了 Audio Overviews(音频概述)。Video Overviews 最初于 7 月推出,此次更新后,全球用户可用本地语言生成笔记本内容的视频摘要。 此次升级的核心亮点如下: 视频...

微软分享有关开源 Windows 11 UI 的新细节

微软分享有关开源 Windows 11 UI 的新细节

本月初, 微软公布了有关开源Windows 11 用户界面框架 WinUI 的细节。开源 WinUI 一直是开发者们的长期呼声,但实现起来并非轻而易举。由于 WinUI 在操作系统的专有层面“根深蒂固”,开源该框架需要谨慎且深思熟虑的方法。在首次发布几周后, 微软准备分享更多关于 WinUI OSS 项目的信息。 微软希望分四个阶段完成这项任务。第一阶段主要...

华为鸿蒙 HarmonyOS 5 终端设备数突破 1200 万

华为鸿蒙 HarmonyOS 5 终端设备数突破 1200 万

鸿蒙生态发展再获新进展。8月25日,在智界及问界秋季新品发布会上,华为技术有限公司(以下简称“华为”)常务董事、终端BG董事长余承东宣布搭载HarmonyOS 5(以下简称“鸿蒙5”)的终端设备数量突破1200万台。 而这距离今年7月30日,余承东透露鸿蒙5终端数量突破千万台,仅不足一个月,再次创造了“鸿蒙速度”。 自鸿蒙5系统发布以来,其终端设备数量呈现指...

字节跳动内测全新 3D 模型生成工具 “3D Model Generator”

字节跳动内测全新 3D 模型生成工具 “3D Model Generator”

《读佳》消息称,字节的豆包内部正在研发测试名为“3D Model Generator”的3D模型生成工具。该工具致力于可控大规模生成模型,为创建高质量3D资产提供有力支持,尤其在游戏中的3D建模领域。该工具或不久后对外开放使用。 从测试页面可以看出,“3D Model Generator”支持两种生成方式,一种是基于图像生成,选取本地图像文件,点击“生成”,...

bboss v7.5.0 重磅发布,新增 OSS 文件采集功能,优化 httpproxy 重试机制

bboss v7.5.0 重磅发布,新增 OSS 文件采集功能,优化 httpproxy 重试机制

bboss v7.5.0 重磅发布,新增OSS文件采集功能,优化httpproxy重试机制,优化持久层连接参数设置,改进jdk17兼容性。 v7.5.0 功能改进 工作流调度机制完善:一次性执行流程支持异步执行模式 工作流改进:通用函数节点提供抽象函数基础类BaseJobFlowNodeFunction,供具体函数继承使用,默认提供了节点初始化方法的实现 工...

华为将发布自研 AI SSD

华为将发布自研 AI SSD

华为将于8月27日发布新品AI SSD,目标直指AI存储器市场。传统HBM存在容量限制,而华为或将通过技术创新提供大容量SSD。 另据中国基金报记者报道,在当前的AI存储器领域,HBM(高带宽内存)占据重要地位。HBM是一种通过3D堆叠和超宽接口,实现极高数据传输带宽的先进内存技术,通常直接封装在GPU(图形处理器)卡中。 问题在于,相比于之前的内存技术,H...

xAI 起诉苹果和 OpenAI,指控阻碍 AI 竞争

xAI 起诉苹果和 OpenAI,指控阻碍 AI 竞争

埃隆・马斯克(Elon Musk)创立的人工智能公司 xAI 于周一在美国德克萨斯州联邦法院对苹果公司及 ChatGPT 的开发商 OpenAI 提起诉讼。xAI 指控这两家公司非法合谋,阻碍了人工智能领域的竞争,损害了其他创新公司的发展机会。 在诉讼中,xAI 声称,苹果与 OpenAI 通过达成排他性协议,封锁了市场,使得像 xAI 和其开发的应用 X ...

xsha v0.4.0 版本发布 | AI 驱动的项目开发平台

xsha v0.4.0 版本发布 | AI 驱动的项目开发平台

本次更新内容如下: 为任务对话添加模型选择功能 在任务对话列表中添加了调度标签和执行时间 为聊天对话添加图像支持 为聊天对话添加 PDF 支持 重构后端日志系统 修复了由于容器执行输入日志每行超过 64KB 导致的任务对话状态异常问题 优化任务对话重试机制 - 在新机制下,只有最新的失败或取消的任务对话可以重试 🚀 XSha - Cursor Backgr...

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Apache Tomcat

Apache Tomcat

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。