首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/358516

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

字节跳动开源 4D 视频生成框架 EX-4D

字节跳动旗下PICO-MR团队正式开源了 EX-4D,一款突破性的4D视频生成框架;能够从单一视角(单目)视频生成高质量、多视角的4D视频序列(3D空间+时间维度)。 传统视频生成技术在多视角生成方面面临两大挑战:一是需要昂贵的多视角相机和数据集进行训练;二是难以处理遮挡区域,导致生成的视频在极端视角下出现物体穿帮或细节失真。EX-4D通过创新的深度密闭网格(DW-Mesh)表示和轻量级适配架构,成功解决了这些问题。 DW-Mesh是EX-4D的核心技术,它通过构建全密闭网格结构,记录场景中的可见和隐形面片,无需多视角监督即可统一处理复杂场景拓扑。结合预训练深度预测模型,EX-4D将单帧像素投影到3D空间,形成网格顶点,并根据几何关系精准标记遮挡区域。这种方法确保了生成视频在极端视角(如±90°)下仍能保持物理一致性和细节完整性。 此外,EX-4D引入了两种模拟mask生成策略——渲染 mask 和跟踪mask,通过模拟视角移动和帧间一致性,破解了多视角训练数据的稀缺难题。这些策略使EX-4D仅凭单目视频即可“脑补”全视角数据,极大降低了数据采集成本。 性能测试结果表明,EX-4D在 ...

富士康推出首款 AI 推理大模型 “FoxBrain”,商标申请已提交

近日,鸿海精密工业股份有限公司(也就是大家熟悉的富士康)在国家知识产权局商标局提交了 “FoxBrain” 商标注册申请。 这款 AI 推理大模型不仅是富士康的首次尝试,更是台湾省首个该类型的 AI 模型。根据公开资料显示,该商标的国际分类为科学仪器,目前正处于 “等待实质审查” 的状态。 “FoxBrain” 是鸿海研究院重磅推出的 AI 推理大模型,涵盖数据分析、数学推理、代码生成等多个功能。富士康声称,FoxBrain 的初始版本基于 Meta 的 Llama3.1模型进行开发,使用了120块英伟达 H100GPU 进行了为期一个月的训练。这一模型特别针对繁体中文进行了优化,尽管其性能相较于其他模型,如 DeepSeek,可能稍显不足。 值得一提的是,富士康并非台湾省唯一在 AI 领域发力的公司。早前,联发科也推出了 Llama-Breeze2系列 AI 模型,这些模型虽然定位为 “轻量级”,但同样主打繁体中文处理能力。

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。

用户登录
用户注册