OpenAI 发布文本生成视频模型 Sora-低调大师

OpenAI 发布文本生成视频模型 Sora

2024-02-16 499

OpenAI 今天凌晨发布了其首个视频生成模型 Sora。

https://openai.com/sora

Sora 可根据文本描述生成长达 60 秒的视频，其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。

目前，Sora已对网络安全的红队成员开放，以评估其可能存在的风险或潜在伤害。同时，OpenAI 也邀请了视觉艺术家、设计师和电影制作人使用 Sora，收集他们的反馈，以使模型更好地服务于创意行业。

OpenAI 在技术报告介绍道，他们将 Sora 视频生成模型视作世界模拟器。具体来说就是通过跨越不同持续时间、宽高比和分辨率的视频和图像，从而生成最高可达一分钟的高清视频。

https://openai.com/research/video-generation-models-as-world-simulators

Sora 使用了一种特殊的深度学习模型（即 Transformer）来处理视频和图像数据。这种处理方式首先将视频和图像编码成潜在代码，然后将这些代码分解成包含时间和空间信息的小块（即时空补丁），最后利用 Transformer 模型在这些补丁上进行操作。

这样的处理方法能够有效地捕捉和生成视频和图像数据中的复杂时空动态，为生成高质量的视频和图像提供了一种强大的方法。

微信关注我们

原文链接：https://www.oschina.net/news/278821/openai-text-to-video-sora

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

与 F5 产生分歧，核心 Nginx 开发者创建新分支 Freenginx

作为 Nginx Web 服务器的长期核心开发人员之一，Maxim Dounin宣布创建该项目的一个新分支，名为 Freenginx。 Maxim Dounin 决定分叉 Nginx 是因为与 F5 发生了分歧，F5 于 2019 年收购了 Nginx 公司。Dounin 在宣布 Freenginx时解释道：大家可能都知道，F5于2022年关闭了莫斯科办事处，从那时起我就不再为F5工作了。不过，我们已经达成协议，我将继续作为志愿者参与nginx开发。近两年来，我一直致力于改进nginx，免费为大家提供更好的服务。不幸的是，F5 的一些新的非技术管理层最近认为，他们要更了解如何运行开源项目。特别是，他们决定干涉nginx多年来使用的安全策略，无视策略和开发人员的立场。这是可以理解的：他们拥有该项目，并且可以用它做任何事情，包括以营销为目的，无视开发者的立场和社区。尽管如此，这还是违背了我们的协议。更重要的是，我再也无法控制F5内部对nginx的修改，也不再将nginx视为一个为公众利益而开发和维护的免费开源项目。因此，从今天起，我将不再参与由 F5 负责的 nginx 开发。取而...

2024-02-16

441

在推出号称最强大的 Gemini Ultra 模型一周后，谷歌今天发布了拥有最长上下文窗口的下一代大模型Gemini 1.5—— 最高支持100 万 token 的上下文长度。 https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024 谷歌首席科学家 Jeff Dean 表示，Gemini 1.5 的上下文理解能力可支持百万级 token 的多模态输入，让用户能够使用该模型与数十万字的超长文档、拥有数百个文件的数十万行代码库、一部完整的电影等进行交互。 Gemini 1.5 介绍性能提升：Gemini 1.5在多个维度上展现出显著的性能提升，特别是在处理长上下文信息的能力上实现了重大突破，可以连续处理高达100万个标记（tokens），拥有迄今为止所有大型基础模型中最长的上下文窗口。高效架构：Gemini 1.5采用了新的Mixture-of-Experts（MoE）架构，使模型更高效地进行训练和服务，同时在维持类似于1.0 Ultra模型的质量的同时，减少了计算需求。长...

2024-02-16

582

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。