谷歌文本转图像模型 Imagen 4 已在 Gemini API 正式推出
谷歌宣布其最先进的文本转图像模型 Imagen 4 现已在 Gemini API 和 Google AI Studio 中正式推出。据称文本转图像生成质量取得了重大进步,与之前的模型相比,文本渲染性能有了显著的提升。
此外还推出了 Imagen 4 Fast,这是专为提升速度而打造的新模型,与功能强大的 Imagen 4 和 Imagen 4 Ultra 同属一个系列。完整的 Imagen 4 系列可为您提供满足创意需求的完美工具,让您能够在质量、速度和成本之间取得平衡。
-
[新] - Imagen 4 Fast:此模型非常适合快速图像生成和大容量任务,不仅具有超快的处理速度,而且价格实惠,生成一张图像仅需 0.02 美元。
-
Imagen 4:我们的旗舰模型可以成为各种高质量图像生成任务的首选,在文本渲染等领域的性能提升效果十分显著。
-
Imagen 4 Ultra:如果您的创意构想需要以最高水准呈现细节并严格遵守您输入的提示词,Imagen 4 Ultra 能够提供高度一致的结果。
使用效果
景观/自然图像:黎明时分,壮丽的山脉景色映入眼帘,近处是一片清澈见底的湖泊,湖面倒映着白雪皑皑的山峰。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
夸克发布健康大模型技术报告
夸克正式发布健康大模型技术报告《QuarkMed Technical Report》,首次公开了“主任医师级”能力的技术实现细节。 此前,夸克健康大模型成功通过了中国12门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。在与通用模型对比中,夸克健康大模型呈现出“难度越高、领先优势越明显”的性能曲线,尤其是在复杂医学推理任务中实现突破。本次技术报告系统披露了这一突破背后的关键路径与技术亮点。 面对医疗模型需要高质量、高专业度训练数据的问题,夸克健康大模型在模型训练不同阶段,使用了三类核心医疗数据:医学资料、医学知识和医疗记录,数据总量高达约1万亿Token。这些专业数据能有效弥补预训练语料库的不足,有助于提高模型的准确性与推理能力。 为提升模型正确性、安全性以及复杂推理能力,夸克健康大模型引入两个强化学习(RL)阶段。第一阶段通过大规模医学强化学习,提升大模型在复杂场景中的推理能力。第二阶段通过设计奖励模型,从诚实性、有用性、内容合规性三个角度评估模型输出质量、调整模型行为,使其符合人类偏好和价值观。 技术报告同时还公布了多个性能测试结果。在MedQA等多个国际权威数据集测...
- 下一篇
宇树科技被起诉,案由为侵害发明专利权纠纷
天眼查APP显示,宇树科技近日新增1条开庭公告,原告为杭州露韦美日化有限公司,案由为侵害发明专利权纠纷。该案件将于8月26日在杭州市中级人民法院开庭审理。 杭州露韦美日化有限公司成立于2005年6月,法定代表人为周建军,注册资本55万人民币,经营范围包括食品互联网销售、农副产品销售、日用百货销售等,由周建军、徐燕共同持股。 知识产权信息显示,该公司已在2016年申请了“一种电子狗”专利,2018年获得授权;2023年申请了“一种会议同声智能系统”专利,目前正在实质审查阶段。
相关文章
文章评论
共有0条评论来说两句吧...