您现在的位置是:首页 > 文章详情

Google Gemini 2.0 Flash 新增「原生图像生成」功能

日期:2025-03-14点击:39

Google 发文宣布,Google Gemini 2.0 Flash 引入了「原生图像生成」功能。

据官方介绍,Gemini 2.0 Flash 结合多模态输入、增强版推理以及自然语言理解来进行图像生成。

Gemini 2.0 Flash 支持文字理解并生成图像,并能够理解上下文保持角色和图像场景的一致性;同时 Gemini 2.0 Flash 还支持自然语言对话的理解,以及利用现实世界的内容和增强版推理来生成图像,Google 官方指出,这对绘制食谱等精准类的内容将会有很大帮助。

值得关注的是,Gemini 2.0 Flash 能够对长文本进行精准绘制。从官方发布的样张显示,Gemini 2.0 Flash 能够准确生成出正确的文字内容,减少生成出扭曲的「抽象」字体。

但据网友实测,目前 Gemini 2.0 Flash 对于过长的提示词文本依然没有能力处理好。Gemini 团队的研究员 Kaushik Shivakumar 也现身回复上述情况称,未来团队将会改进,目前如果需要输入较长的提示词,建议先让模型以文本形式思考,从而更好地生成图像

Google 已将上述功能提供给 Google AI Studio 的开发者,开发者可以通过 Gemini API 进行体验测试。

原文链接:https://www.oschina.net/news/338720/gemini-2-0-flash-native-image-generation
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章