阿里发布生图模型 Wan2.7-Image-低调大师

阿里发布生图模型 Wan2.7-Image

2026-04-02 94

阿里巴巴宣布推出图像生成与编辑统一模型 Wan2.7-Image，针对当前AI生图中的审美疲劳、色彩失控等痛点带来了更具“活人感”的人物生成、精准的色彩控制以及超长文本渲染能力。

基于更大规模数据及尺寸训练而成的 Wan2.7-Image-pro 也同步上线，生成图像的构图更加稳定，语义理解更强更精准。公告称，为了让AI生成的人物告别同质化，Wan2.7-Image 进一步强化了虚拟形象捏脸功能。

通过对骨相、眼眸及五官细微处的全方位定制，模型支持在提示词中灵活更换脸型（如圆脸、方脸、长方脸）与眼部特征（如丹凤眼、深邃眼窝）。这让AI不再只是生成一张“标准脸”，而是能根据创意需求，塑造出极具辨识度、富有生命力的面孔。

Wan2.7-Image 全新支持“调色盘”功能，用户可以一键提取参考图的色彩分布比例。以及致力于突破文本渲染瓶颈，支持最高3K token的长文字输入。无论是复杂的表格、精准的公式，还是需要铺满整页A4纸的文字内容，Wan2.7-Image都能实现印刷级的清晰度，支持中、英等12种语言。

在“可操控性”方面，Wan2.7-Image 生支持交互式编辑模块。通过简单的框选指令，用户可以在指定区域实现元素的添加、对齐或移动。同时，模型具备更强的主体一致性（最高支持9张参考图），在生成分镜脚本、电商套图等系列化内容时，能够有效保持角色与风格的统一，降低创作中的“随机性”。

Wan2.7-Image还具备强大的组图生成能力，可生成多达12张，用于批量制作同风格系列图、PPT配图、分镜脚本、电商模特套图及多视角建筑图。

在底层架构上，Wan2.7-Image 采用了领先的生成与理解统一架构，通过共享隐性空间内实现语义映射，让文字紧挨着画面，模型不需费力去猜文字对应的画面；并在训练流程中引入多模态指令（比如文字+图片），使得模型实现了从单纯“像素拟合”到“底层语义认知”的飞跃。

此外，针对长尾场景，团队构建了包含布局、光影、角度等多维度的精细标注体系，确保模型在复杂指令下依然保持极高的生成稳健度。

微信关注我们

原文链接：https://www.oschina.net/news/416768

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

智谱发布 GLM-5V-Turbo

智谱宣布正式发布 GLM-5V-Turbo，面向视觉编程打造的多模态 Coding 基座模型。公告称，GLM-5V-Turbo从预训练阶段深度融合视觉与文本能力，让编程不再局限于纯文本输入。模型能看懂设计稿、截图、网页界面，并据此生成完整可运行的代码，真正做到看得懂画面、写得出代码。核心要点如下：原生多模态Coding基座：原生理解图片、视频、设计稿、文档版面等多模态输入，并支持画框、截图、读网页等多模态工具调用，上下文窗口扩展至200k，将Agent的感知-行动链路从纯文本延伸到视觉交互。兼顾视觉与编程能力：在多模态Coding、Tool Use、GUI Agent等核心基准上取得领先表现。通过多任务协同RL等技术手段，确保纯文本场景下的编程、推理、工具调用等能力不退化。深度适配Claude Code与龙虾场景：与Claude Code、OpenClaw/AutoClaw等Agent深度协同，支持“看懂环境→规划动作→执行任务”的完整闭环，并提供全套官方Skills，开箱即用。 GLM-5V-Turbo 在模型架构、训练方法、数据构造、工具链四个层面进行了系统性升级：原生...

2026-04-02

91

阿里巴巴宣布新一代大语言模型 Qwen3.6-Plus 正式发布。较之上一代模型，整体性能提升明显，尤其是编程Coding能力、智能体Agent能力和工具调用能力都实现了全面跃升，同时深度适配主流Agent框架。公告称，在SWE-bench系列真实编程任务测试、考察终端编程的Terminal-Bench2、长程编程任务NL2Repo，以及Claw-Eval、QwenClawBench等真实世界Agent能力评测中，Qwen3.6-Plus显著超越一众模型，成为中国编程能力最强的模型。在前端网页开发、仓库级复杂任务等实测场景中，千问 3.6 可自主拆解任务、规划路径、测试修改直至任务完成。Qwen3.6-Plus 不仅能实现高质量代码修复，而且擅长复杂的终端操作与自动化任务执行，取得了多个高难度的长程规划任务中的最优成绩。基于原生多模态数据训练，千问3.6发展出更敏锐的理解感知能力和更强大的多模态推理能力。同时，Qwen3.6-Plus面向真实任务持续迭代优化，具备更强的指令遵循、文本和物体识别能力，在实际场景中表现更稳健。 Qwen3.6-Plus 模型可基于界面截图、设计稿或自...

2026-04-02

92

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。