万相 Wan 2.7 图生视频模型,支持多模态输入(文本/图像/音频/视频),可完成首帧生视频、首尾帧生视频、视频续写三大任务。支持720P和1080P分辨率,时长2~15秒,按秒计费。输出默认包含音频。
这是一个异步API,只会返回异步任务的 task_id。您应该使用该 task_id 请求 查询任务结果 API 来检索生成结果。
请求头
Bearer 身份验证格式: Bearer {{API 密钥}}。
请求体
随机数种子,用于提升生成结果的可复现性。取值范围[0, 2147483647]。取值范围:[0, 2147483647]
文本提示词,用于描述生成视频中期望包含的元素和视觉特点。支持中英文,最多5000个字符。长度限制:0 - 5000
生成视频时长,单位为秒,按秒计费。取值范围[2, 15]的整数。取值范围:[2, 15]
首帧图像URL。格式支持JPEG、JPG、PNG(不支持透明通道)、BMP、WEBP。分辨率宽高范围[240, 8000]像素,宽高比1:8~8:1,文件大小不超过20MB。与first_clip_url二选一,至少提供一个。
输出视频分辨率档位,影响费用。视频宽高比与输入素材保持一致。可选值:720P, 1080P
是否开启prompt智能改写。开启后使用大模型对输入prompt进行智能改写,对较短的prompt生成效果提升明显,但会增加耗时。
首段视频片段URL,用于视频续写。模型将基于该视频内容进行续写生成。格式支持mp4、mov,时长210秒,分辨率宽高范围[240, 4096]像素,宽高比1:88:1,文件大小不超过100MB。与image_url二选一。
尾帧图像URL。与首帧配合可生成首尾帧视频。格式限制与首帧相同。
反向提示词,用于描述不希望在视频画面中看到的内容。支持中英文,最多500个字符。长度限制:0 - 500
驱动音频URL。传入后模型将以该音频为驱动源生成视频(如口型同步、动作卡点等)。未传入时模型将自动生成匹配的背景音乐或音效。格式支持wav、mp3,时长2~30秒,文件大小不超过15MB。