ElevenLabs texto a voz Turbo v2
Audio
ElevenLabs texto a voz Turbo v2
POST
ElevenLabs texto a voz Turbo v2
Convierte texto en voz usando la voz que elija y devuelve el audio.
Encabezados de solicitud
Valores enumerados:
application/jsonFormato de autenticación Bearer: Bearer {{clave de API}}.
Cuerpo de la solicitud
Si se especifica, el sistema intentará muestrear de forma determinista. Las solicitudes repetidas con la misma seed y los mismos parámetros deberían devolver el mismo resultado, pero no se garantiza un determinismo completo.Rango de valores: [0, 4294967295]
El texto que se convertirá en voz.
El ID de voz que se utilizará.
El texto posterior al texto de la solicitud actual. Se utiliza para mejorar la coherencia de la voz al concatenar varias generaciones.
Código de idioma (ISO 639-1) utilizado para el modelo y la normalización del texto. Si el modelo no admite este código de idioma, se devolverá un error.
Formato de salida del audio generado. El formato es codec_sample_rate_bitrate. La tasa de bits de 192 kbps para MP3 requiere una cuenta Creator o superior; la frecuencia de muestreo de 44,1 kHz para PCM requiere una cuenta Pro o superior.Valores opcionales:
mp3_22050_32, mp3_24000_48, mp3_44100_32, mp3_44100_64, mp3_44100_96, mp3_44100_128, mp3_44100_192, pcm_8000, pcm_16000, pcm_22050, pcm_24000, pcm_32000, pcm_44100, pcm_48000, ulaw_8000, alaw_8000, opus_48000_32, opus_48000_64, opus_48000_96, opus_48000_128, opus_48000_192El texto anterior al texto de la solicitud actual. Se utiliza para mejorar la coherencia de la voz al concatenar varias generaciones.
Si es true, usa la versión IVC de la voz en lugar de la versión PVC. Esta es una solución temporal para la mayor latencia de la versión PVC.
Lista de request_id de muestras posteriores. Se utiliza para mantener la coherencia de la voz al volver a generar muestras. Puede pasar hasta 3 request_id.Longitud del array: 0 - 3
Lista de request_id de muestras generadas antes de la generación actual. Puede utilizarse para mejorar la coherencia de la voz. Puede pasar hasta 3 request_id.Longitud del array: 0 - 3
Controla la normalización del texto. ‘auto’ permite que el sistema decida, ‘on’ siempre normaliza y ‘off’ la omite.Valores opcionales:
auto, on, offControla la normalización lingüística del texto para determinados idiomas admitidos con el fin de lograr una pronunciación más natural. Advertencia: puede aumentar considerablemente la latencia. Actualmente solo se admite japonés.
Lista de localizadores de diccionarios de pronunciación (id, version_id) que deben aplicarse al texto. Se aplican en orden. Cada solicitud puede tener hasta 3 localizadores.Longitud del array: 0 - 3
Información de respuesta
Archivo de audio generado Formato:binary