万相 Wan 2.7 文生视频模型,基于文本提示词生成流畅视频。支持音频驱动或自动配音,支持720P和1080P分辨率,时长2~15秒,按秒计费。输出默认包含音频。
这是一个异步API,只会返回异步任务的 task_id。您应该使用该 task_id 请求 查询任务结果 API 来检索生成结果。
请求头
Bearer 身份验证格式: Bearer {{API 密钥}}。
请求体
随机数种子,用于提升生成结果的可复现性。取值范围[0, 2147483647]。取值范围:[0, 2147483647]
输出视频分辨率(宽高),影响费用。720P档位:1280720(16:9)、7201280(9:16)、960960(1:1)、1088832(4:3)、8321088(3:4)。1080P档位:19201080(16:9)、10801920(9:16)、14401440(1:1)、16321248(4:3)、1248*1632(3:4)。可选值:1280*720, 720*1280, 960*960, 1088*832, 832*1088, 1920*1080, 1080*1920, 1440*1440, 1632*1248, 1248*1632
文本提示词,用于描述生成视频中期望包含的元素和视觉特点。支持中英文,最多1500个字符,超过部分自动截断。长度限制:0 - 1500
生成视频时长,单位为秒,按秒计费。取值范围[2, 15]的整数。取值范围:[2, 15]
音频文件URL,模型将使用该音频驱动视频生成(如口型同步、动作卡点等)。未传入时模型自动生成匹配的背景音乐或音效。格式支持wav、mp3,时长3~30秒,文件不超过15MB。若音频超过视频时长则截取,不足则超出部分无声。
是否开启prompt智能改写。开启后使用大模型对输入prompt进行智能改写,对较短的prompt生成效果提升明显,但会增加耗时。
反向提示词,用于描述不希望在视频画面中出现的内容。支持中英文,最多500个字符。长度限制:0 - 500