Somake

Wan

使用 Wan 2.6,轻松将文本和图片变成视频。支持精准口型同步、多角色对话和创建您的专属虚拟人!

示例
0/2000
设置
分辨率
宽高比
时长
多重拍摄

什么是 Wan

Wan 是由阿里巴巴集团通义实验室开发的开源 AI 视频生成模型系列。Wan 系列是阿里巴巴在多模态 AI 领域的旗舰产品,能够将文本提示、图片和参考视频转化为高质量且动作真实、画面一致的视频内容。

当前版本:Wan 2.6(2025年12月)

Wan 2.6 —— 最新更新

最近更新时间:2025年12月

Wan 2.6 在 2.5 版本发布后不久上线,重点提升了多模态融合和创意控制能力。本次更新针对之前版本的关键局限进行了优化,并新增了更适合复杂内容制作的新功能。

Wan 2.6 主要提升:

  • 原生音频生成升级:音质较 Wan 2.5 明显提升,发音更自然,但在语音真实感上仍略逊于 Veo 3 和 Sora 2 等高端竞品

  • 时长扩展:支持最长 15 秒的 1080P 视频片段,可拼接多个片段生成更长内容

  • 角色参考系统:可上传最多三个视频角色参考,保证不同时代视频生成的一致性 (注意:此功能暂未在 Somake 平台开放)

  • 个人虚拟人创建:录制多角度人脸和语音样本,生成属于自己的专属 AI 形象 (注意:此功能暂未在 Somake 平台开放)

  • 多角色对话:清晰呈现多角色交流,无语音重叠困扰

  • 场景与服饰控制:通过提示词即可改变角色服饰和环境场景

  • 流畅动作表现:视频输出具备逼真的镜头效果,如缩放和虚化,动作丝滑自然

当前需注意的局限:

  • 角色形象和声音有时与参考素材不完全一致——人脸和声音偶尔有差异

  • 多角色复杂动作场景(如打斗)易出现画面瑕疵和变形

  • 二次元风格视频生成效果较写实风格为弱

  • 部分功能偶有不稳定,包括输出语种偶尔出现混乱

  • 有时会出现意外或超现实元素,这是当前文本生成视频 AI 的共性挑战

版本历史与参数

版本主要能力最长时长最高分辨率音频支持
Wan 2.1文本转视频、图片转视频、画面文字生成5 秒720P不支持
Wan 2.2效率提升、集成 VACE、开源5 秒720P不支持
Wan 2.5音画同步、动作增强10 秒1080P基础
Wan 2.6多镜头叙事、角色参考、自定义虚拟人15 秒1080P原生音画表现增强

应用场景

适合营销与小型企业

  • 快速社交广告:需要一个能吸引眼球的 10 秒 Instagram 短视频?只要输入 “一只新款运动鞋飞溅水花镜头,画面有电影感,节奏感强”,几分钟就能获得专业级的广告片。

  • 产品可视化:随心创作任何场景下的产品展示视频。例如 “我们的新款咖啡杯摆放在温馨、细雨中的巴黎咖啡馆桌上,蒸汽袅袅升起”。

适合教育工作者与学生

  • 历史场景可视化:老师可以快速生成片段:“一队罗马士兵在森林中行军,低角度拍摄”,让课堂变得更生动有趣。

  • 科学原理讲解:学生可用视频辅助说明复杂知识,比如:“一段穿越植物细胞的动画,展示线粒体如何工作”。

适合艺术创作者与独立影像人

  • 快速剧本分镜:将剧本中的场景即时可视化,提前测试氛围和画面构图,节省时间与制作成本。

  • 独特视觉特效 (VFX):生成极具梦幻感或超现实抽象的背景视觉,这些画面在现实中难以拍摄。

Wan 2.6 高级提示词技巧

多镜头叙事提示词模板

一个电影感的【类型】场景。

镜头1:【远景/中景/特写】,描述场景、角色及动作。

镜头2:镜头角度,描述转场及新内容。

镜头3:镜头角度,描述结尾或高潮瞬间。

画面风格:【写实/电影感/美术风】。光线:【自然/戏剧/柔光】。

角色参考最佳实践

  • 角色参考视频选择正面清晰光线画面

  • 创建个人虚拟人时推荐录制多角度素材视频

  • 角色参考建议最多上传 3 个,保证一致性最佳

  • 匹配语音时请上传无杂音的清晰音频样本

  • 人脸和声音复现会有细微差异,建议多次生成比对

场景复杂度建议

  • 表现优秀:对白场景、访谈镜头、单角色突出、简单互动、多角色对话

  • 谨慎使用:多角色动作、打斗编排、快速运动场面

  • 尽量避免或有瑕疵:复杂动漫风、群体动态大场面

提示词自动丰富

当你的输入较简单或希望画面更丰富时,可开启提示词扩充,系统会自动添加描述细节,优化画面内容、风格和整体效果。

常见问题排查

问题:语音听起来生硬或不自然 → 解决方法:这是 Wan 2.6 当前的限制。如果对语音还原要求较高,建议视频生成后单独录制或合成音频。

问题:出现意外角色或超现实画面 → 解决方法:文本生成视频常有 AI 瑕疵,可简化提示词、减少角色或元素数量后再次生成。使用前请仔细检查输出结果。

问题:动作场景容易变形或失真 → 解决方法:多角色复杂动作是已知弱项。建议将动态场景分解为简单镜头,每段聚焦 1-2 个角色,避免编排复杂的打斗。

问题:动漫风格画面效果较差 → 解决方法:Wan 2.6 在二次元画面生成方面较弱。开发动漫内容可尝试其他模型,或优先使用写实类提示词。

问题:输出内容语种出错 → 解决方法:偶有语言不一致情况,请在提示词明确指定目标语种,如有误请重新生成。

为什么选 Somake 打造你的 AI 视频内容?

1

无需技术基础

界面操作极为简单,人人都能快速生成专业视觉内容——只需描述你想要的效果,几秒钟即可生成。

2

一站式创意平台

图片和视频生成全程在同一平台搞定,从创意到成品,工作流程顺畅高效。

3

商业版权无忧

付费用户享有创作内容的完整商业使用权,用于广告、推广、客户项目都毫无压力。

常见问题