Wanxiang Wan 2.7 de imagen a video
Vídeo
Wanxiang Wan 2.7 de imagen a video
POST
Wanxiang Wan 2.7 de imagen a video
Modelo de imagen a video Wanxiang Wan 2.7, compatible con entradas multimodales (texto/imagen/audio/video), capaz de realizar tres tareas principales: generación de video a partir del primer fotograma, generación de video a partir del primer y último fotograma, y continuación de video. Admite resoluciones 720P y 1080P, duraciones de 2 a 15 segundos, con facturación por segundo. La salida incluye audio de forma predeterminada.
Encabezados de solicitud
Valores enumerados:
application/jsonFormato de autenticación Bearer: Bearer {{API Key}}.
Cuerpo de la solicitud
Semilla de número aleatorio, utilizada para mejorar la reproducibilidad de los resultados generados. Rango de valores [0, 2147483647].Rango de valores: [0, 2147483647]
Prompt de texto, utilizado para describir los elementos y las características visuales que se espera incluir en el video generado. Admite chino e inglés, hasta 5000 caracteres.Límite de longitud: 0 - 5000
Duración del video generado, en segundos, con facturación por segundo. Entero en el rango [2, 15].Rango de valores: [2, 15]
URL de la imagen del primer fotograma. Formatos compatibles: JPEG, JPG, PNG (no admite canal transparente), BMP, WEBP. El rango de ancho y alto de la resolución es de [240, 8000] píxeles, relación de aspecto de 1:8 a 8:1, tamaño de archivo no superior a 20 MB. Debe elegirse entre este parámetro y first_clip_url; se debe proporcionar al menos uno.
Indica si se agrega una marca de agua; la marca de agua se ubica en la esquina inferior derecha del video.
Nivel de resolución del video de salida, afecta el costo. La relación de aspecto del video se mantiene coherente con el material de entrada.Valores opcionales:
720P, 1080PIndica si se habilita la reescritura inteligente del prompt. Al habilitarla, se utiliza un modelo grande para reescribir inteligentemente el prompt de entrada; mejora notablemente el resultado de generación para prompts más cortos, pero aumenta el tiempo de procesamiento.
URL del primer fragmento de video, utilizada para la continuación de video. El modelo generará la continuación basándose en el contenido de este video. Formatos compatibles: mp4, mov; duración de 2 a 10 segundos; rango de ancho y alto de la resolución [240, 4096] píxeles; relación de aspecto de 1:8 a 8:1; tamaño de archivo no superior a 100 MB. Debe elegirse entre este parámetro e image_url.
URL de la imagen del último fotograma. En combinación con el primer fotograma, permite generar un video a partir del primer y último fotograma. Las restricciones de formato son las mismas que para el primer fotograma.
Prompt negativo, utilizado para describir el contenido que no se desea ver en las imágenes del video. Admite chino e inglés, hasta 500 caracteres.Límite de longitud: 0 - 500
URL del audio de conducción. Al proporcionarla, el modelo generará el video usando este audio como fuente de conducción (por ejemplo, sincronización labial, acciones sincronizadas con puntos del audio, etc.). Si no se proporciona, el modelo generará automáticamente música de fondo o efectos de sonido compatibles. Formatos compatibles: wav, mp3; duración de 2 a 30 segundos; tamaño de archivo no superior a 15 MB.
Información de respuesta
Use task_id para solicitar la API de consulta del resultado de la tarea y recuperar la salida generada.