国内最强生图模型Wan2.7-Image来了
分类:AI资讯 浏览量:13
具备文生图、图生组图、图像指令编辑和交互式编辑等全链路能力
Wan2.7-Image 具备文生图、图生组图、图像指令编辑和交互式编辑等全链路能力。在人类偏好盲测中,"文生图"能力超过 GPT-Image1.5 和国内主流模型,在文本渲染、照片级成像和世界知识指标上,接近 Nano Banana Pro。

告别千篇一律的"AI脸"
为告别千篇一律的"AI脸",Wan2.7-Image 强化了虚拟形象捏脸功能,支持从骨相、眼眸到五官细微处的全方位定制,比如更换提示词中的脸型(鹅蛋脸、圆脸)。
艺术家和设计师需精准控制颜色,商业海报对配色还有严格要求,但 AI 生图往往是"色彩盲盒"。Wan2.7-Image 全新支持"调色盘"功能,用户可通过 Hex Code,一键提取或输入参考图的各种颜色和占比。
超长文字渲染
超长文字渲染是 AI 生图的痛点,容易文字模糊、内容错乱甚至直接漏写。凭借长上下文文本编码(Long Context Text Encoder)解析超长序列,Wan2.7-Image 对超长文字、表格和复杂公式的渲染可达印刷级,支持 12 种语言,最高 3K tokens 的超长文字输入。
组图生成与交互式编辑
Wan2.7-Image 还具备强大的组图生成能力,可生成多达 12 张,用于批量制作同风格系列图、PPT 配图、分镜脚本、电商模特套图及多视角建筑图。
原生支持交互式编辑模块,用户可通过精准框,在指定区域添加、对齐、移动元素或 logo,实现像素级意图对齐。

技术突破
Wan2.7-Image 更强的理解能力源于模型架构与训练过程中的技术突破:
- 训练数据: 超规模的异构数据底座涵盖全域品类的视觉素材
- 模型架构: 采用领先的生成与理解统一模型架构,共享隐空间来实现语义映射
- 多维精细标注: 根据图像的布局、文字、光影、拍摄角度和用途等构建多维精细标注体系
应用场景
Wan2.7-Image 的强大功能可应用于多个行业:
- 短剧与影视: 千人一面的捏脸系统与分镜生成能力
- 自媒体与内容创作者: 多风格封面、OOTD 穿搭
- 电商: 单张模特图裂变生成特写图、不同场景的卖点图
- 教育与科研: 论文配图、信息图表、儿童绘本
即日起,用户可在 通义万相 网站和阿里云百炼体验 Wan2.7-Image。
来源:量子位