GPT-4o 重磅发布,第一时间用户测评,OpenAI 也存在夸张宣传?

5月14日凌晨,OpenAI在万众期待的「春季新品发布会」上搬出了新一代旗舰生成模型GPT-4o、桌面App,并展示了一系列新能力。直播中提到GPT-4o会免费提供给用户,小编早上第一时间登录了自己的账号,然而并没有看到。猜测这个模型还在灰度中,于是氪金化身AI测评博主,对OpenAI官方宣传的GPT-4o模型进行实!际!考!察!

首先,OpenAI官方博客中提到GPT-4o,相比现有模型,在视觉和音频理解方面尤其出色。

小编观看了OpenAI demo演示视频,OpenAI工作人员与GPT-4o像朋友一样进行视频对话互动,狠狠心动!跃跃欲试!

但是 ! ! !很遗憾地告诉大家,目前视频交互功能还没对普通用户开放,我们只能通过上传图片和文件来和ChatGPT交互。

另外,官方展示的实时语音翻译功能也引起了吃瓜群众的关注,OpenAI回应手机可以拿来当翻译机来回翻译将近20个常用语言。

小编进行了尝试,发现实时语音翻译也还无法实现.....和ChatGPT语音交互后,还是有几秒的等待时间。

OpenAI在官方博客中也表示“我们计划在接下来几周内,通过API将GPT-4o的新音频和视频功能提供给一小部分可以相信的合作伙伴。”除了这些大家比较期待但还没办法体验的功能,官方博文中还Po出了一系列的文生图和图像、语音、视频识别的能力展示,接下来小编将就这些能力展!开!测!评!我们复制了官方博客中Input作为prompt进行生成,将我们自身生成的结果和官方提供的生成图形成对比,供大家参考~

漫画分镜:机器人的写作瓶颈

这个效果展示一方面能体现GPT-4o强大的图片生成能力,包括对图片上文案生成的改进,还能在生成多个图片时能够保持人物的一致性。但效果……

第一张图可以看到自测生成图中文字还是有错字,字迹显示模糊的现象

第二张图中,机器人的手有了明显的变化,没有保持一致,纸张也有了变化

第三张图,基本过关,但纸上的文字已经和前2张图完全不一样了……

漫画分镜:邮差Sally的故事

很好!GPT-4o生成了一张日漫风格的邮差美女,比官方Po出的图片还要好看

等等,怎么画风变了,日漫怎么变木偶了,而且视角也不太对

第三张又换了一个风格,虽说单个的图和文对应得还挺好,但连起来很难讲述一个连贯的故事……

漫画头像

接下来这个功能是小编最喜欢的,也是GPT-4o表现最好的。上传一张照片,为你设计漫画头像,背景也可以自定义。

这是原图,OpenAI的技术小哥Alex Nichol

这是GPT-4o生成的漫画头像,虽说自测没有官方生成的写实,但也还原了基本特征。

艺术字体

效果很赞,甚至比官方出图还赞!

但是字母怎么越来越少了

3D效果图

美观度够了,但logo改成这个样子还能用吗?

创意排版

手写体是挺优美的,但文本准确度还是有点差……

人物情绪识别

小编上传了一张情绪丰富的人物照片,GPT-4o非常准确地识别了出来,还编了故事一段故事。

会议录音识别

小编上传了一段多人的会议录音,问它这段录音中有几个人,GPT-4o通过音轨的分析来给出了一个答案,就有些离谱……

从整体的实际体验来看,目前普通用户能用到的GPT-4o并没有宣传中的那么好用,这次的发布更像是一次仓促的PR行为,没有看到太多的诚意。小编并不怀疑OpenAI发布的视频像明天的主角Google一样有剪辑视频的嫌疑,但显然视频中OpenAI员工手机里用的GPT-4o和我现在用的不太一样,至于啥时候能内外同源,只能期待了。

欢迎关注

“可信 AI 进展 “ 公众号致力于最新可信人工智能技术的传播和开源技术的培育,覆盖大规模图学习,因果推理,知识图谱,大模型等技术领域,欢迎扫码关注,解锁更多 AI 资讯~

优秀的个人博客,低调大师

微信关注我们

原文链接:https://my.oschina.net/u/7032067/blog/11121442

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

相关文章

发表评论

资源下载

更多资源
优质分享Android(本站安卓app)

优质分享Android(本站安卓app)

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Oracle Database,又名Oracle RDBMS

Oracle Database,又名Oracle RDBMS

Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat7、8、9(Java Web服务器)

Apache Tomcat7、8、9(Java Web服务器)

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Sublime Text 一个代码编辑器

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。