您现在的位置是:首页 > 文章详情

首个图文混合创作大模型“书生·浦语灵笔”开源

日期:2023-10-10点击:99

上海人工智能实验室(上海 AI 实验室)宣布推出首个图文混合创作大模型书生·浦语灵笔(InternLM-XComposer,简称“浦语灵笔”),依托强大的多模态性能,解锁“一键生成”图文混合文章的创作能力,为大模型落地应用提供更多可能。

目前,浦语灵笔已开源其中的智能创作和对话(InternLM-XComposer-7B)及多任务预训练(InternLM-XComposer-VL-7B)版本,并提供免费商用。

此前,上海AI实验室曾陆续开源了书生·浦语大语言模型的7B(InterLM-7B)及20B(InternLM-20B)版本。基于书生·浦语大语言模型(InternLM),浦语灵笔接受视觉和语言模态输入,不仅在图文对话方面表现优秀,更具备图文并茂文章的“一键生成”能力。

浦语灵笔能够进行流利的中英文图文对话,准确理解图像内容;并解锁了图文并茂文章创作的全新能力。除自动配图能力外,浦语灵笔还提供了配图推荐和更换功能,根据用户实际需求定制图文内容。

目前,浦语灵笔已支持科普文稿、营销广告、新闻稿件、影视评论、生活指南等类型文章的图文并茂生成,并将逐渐开放更多能力。

浦语灵笔为图文文章创作设计了“三步走”的算法流程:

  • 理解用户指令,创作符合主题要求的长文章。
  • 智能分析文章,模型自动规划插图的理想位置,并生成所需图像的内容要求。
  • 多层次智能筛选,利用多模态大模型的图像理解能力,从图库中锁定最完美的图片。

研究人员采用5个主流的多模态大模型评测对InternLM-XComposer-VL-7B的能力进行了详细测试。

原文链接:https://www.oschina.net/news/261135
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章