Voice Cloning API | Clonación rápida de audio MiniMax

Clonación rápida de audio MiniMax

curl --request POST \
  --url https://api.highwayapi.ai/v3/minimax-voice-cloning \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "audio_url": "<string>",
  "text": "<string>",
  "model": "<string>",
  "accuracy": 123,
  "need_noise_reduction": true,
  "need_volume_normalization": true
}
'

import requests

url = "https://api.highwayapi.ai/v3/minimax-voice-cloning"

payload = {
    "audio_url": "<string>",
    "text": "<string>",
    "model": "<string>",
    "accuracy": 123,
    "need_noise_reduction": True,
    "need_volume_normalization": True
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': '<content-type>', Authorization: '<authorization>'},
  body: JSON.stringify({
    audio_url: '<string>',
    text: '<string>',
    model: '<string>',
    accuracy: 123,
    need_noise_reduction: true,
    need_volume_normalization: true
  })
};

fetch('https://api.highwayapi.ai/v3/minimax-voice-cloning', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.highwayapi.ai/v3/minimax-voice-cloning",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'audio_url' => '<string>',
    'text' => '<string>',
    'model' => '<string>',
    'accuracy' => 123,
    'need_noise_reduction' => true,
    'need_volume_normalization' => true
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: <authorization>",
    "Content-Type: <content-type>"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.highwayapi.ai/v3/minimax-voice-cloning"

	payload := strings.NewReader("{\n  \"audio_url\": \"<string>\",\n  \"text\": \"<string>\",\n  \"model\": \"<string>\",\n  \"accuracy\": 123,\n  \"need_noise_reduction\": true,\n  \"need_volume_normalization\": true\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "<content-type>")
	req.Header.Add("Authorization", "<authorization>")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.highwayapi.ai/v3/minimax-voice-cloning")
  .header("Content-Type", "<content-type>")
  .header("Authorization", "<authorization>")
  .body("{\n  \"audio_url\": \"<string>\",\n  \"text\": \"<string>\",\n  \"model\": \"<string>\",\n  \"accuracy\": 123,\n  \"need_noise_reduction\": true,\n  \"need_volume_normalization\": true\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.highwayapi.ai/v3/minimax-voice-cloning")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = '<content-type>'
request["Authorization"] = '<authorization>'
request.body = "{\n  \"audio_url\": \"<string>\",\n  \"text\": \"<string>\",\n  \"model\": \"<string>\",\n  \"accuracy\": 123,\n  \"need_noise_reduction\": true,\n  \"need_volume_normalization\": true\n}"

response = http.request(request)
puts response.read_body

{
  "demo_audio_url": "<string>",
  "voice_id": "<string>"
}

POST

minimax-voice-cloning

Clonación rápida de audio MiniMax

curl --request POST \
  --url https://api.highwayapi.ai/v3/minimax-voice-cloning \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "audio_url": "<string>",
  "text": "<string>",
  "model": "<string>",
  "accuracy": 123,
  "need_noise_reduction": true,
  "need_volume_normalization": true
}
'

import requests

url = "https://api.highwayapi.ai/v3/minimax-voice-cloning"

payload = {
    "audio_url": "<string>",
    "text": "<string>",
    "model": "<string>",
    "accuracy": 123,
    "need_noise_reduction": True,
    "need_volume_normalization": True
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': '<content-type>', Authorization: '<authorization>'},
  body: JSON.stringify({
    audio_url: '<string>',
    text: '<string>',
    model: '<string>',
    accuracy: 123,
    need_noise_reduction: true,
    need_volume_normalization: true
  })
};

fetch('https://api.highwayapi.ai/v3/minimax-voice-cloning', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.highwayapi.ai/v3/minimax-voice-cloning",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'audio_url' => '<string>',
    'text' => '<string>',
    'model' => '<string>',
    'accuracy' => 123,
    'need_noise_reduction' => true,
    'need_volume_normalization' => true
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: <authorization>",
    "Content-Type: <content-type>"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.highwayapi.ai/v3/minimax-voice-cloning"

	payload := strings.NewReader("{\n  \"audio_url\": \"<string>\",\n  \"text\": \"<string>\",\n  \"model\": \"<string>\",\n  \"accuracy\": 123,\n  \"need_noise_reduction\": true,\n  \"need_volume_normalization\": true\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "<content-type>")
	req.Header.Add("Authorization", "<authorization>")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.highwayapi.ai/v3/minimax-voice-cloning")
  .header("Content-Type", "<content-type>")
  .header("Authorization", "<authorization>")
  .body("{\n  \"audio_url\": \"<string>\",\n  \"text\": \"<string>\",\n  \"model\": \"<string>\",\n  \"accuracy\": 123,\n  \"need_noise_reduction\": true,\n  \"need_volume_normalization\": true\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.highwayapi.ai/v3/minimax-voice-cloning")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = '<content-type>'
request["Authorization"] = '<authorization>'
request.body = "{\n  \"audio_url\": \"<string>\",\n  \"text\": \"<string>\",\n  \"model\": \"<string>\",\n  \"accuracy\": 123,\n  \"need_noise_reduction\": true,\n  \"need_volume_normalization\": true\n}"

response = http.request(request)
puts response.read_body

{
  "demo_audio_url": "<string>",
  "voice_id": "<string>"
}

Esta interfaz admite la clonación de voces de uno o dos canales, y permite clonar rápidamente una voz con el mismo timbre a partir de un archivo de audio especificado. La voz clonada rápidamente generada por esta interfaz es temporal. Si desea conservar permanentemente una voz clonada, invoque dicha voz en cualquier interfaz de síntesis de voz T2A dentro de las 168 horas (7 días) siguientes (sin incluir la acción de prueba dentro de esta interfaz); de lo contrario, la voz será eliminada. Escenarios aplicables de esta interfaz: clonación de IP, clonación de timbre de voz y otros escenarios relacionados que requieran clonar rápidamente una voz determinada. Notas:

El formato del archivo de audio cargado debe ser: mp3, m4a o wav;
La duración del archivo de audio cargado debe ser como mínimo de 10 segundos y como máximo de 5 minutos;
El tamaño del archivo de audio cargado no debe superar los 20mb.

Encabezados de solicitud

string

requerido

Valores enumerados: application/json

string

requerido

Formato de autenticación Bearer: Bearer {{API Key}}.

Cuerpo de la solicitud

string

requerido

URL del archivo de audio cuya voz se desea clonar. Admite formatos mp3, m4a y wav.

Parámetro de clonación de voz. Proporcionar este parámetro ayudará a mejorar la similitud y la estabilidad del timbre en la síntesis de voz.Si utiliza este parámetro, debe cargar al mismo tiempo un breve audio de ejemplo (duración inferior a 8s) y el texto correspondiente al audio. El audio admite formatos mp3, m4a y wav.

Mostrar properties

number

requerido

Parámetro de prompt de audio: URL del audio de ejemplo, cuya duración debe ser inferior a 8s.

string

requerido

Parámetro de prompt de audio: introduzca el texto correspondiente al audio de ejemplo. Debe asegurarse de que coincida con el contenido del audio y de que la oración termine con un signo de puntuación.

string

Parámetro de prueba de la clonación. El modelo utilizará la voz clonada para leer este contenido de texto y devolverá el resultado de la síntesis de audio en forma de enlace, para que pueda comprobar el efecto de la clonación. Límite de 2000 caracteres. Nota: la prueba se cobrará normalmente como síntesis de voz según el número de caracteres, con la misma tarifa que las interfaces T2A.

string

Parámetro de prueba de la clonación. Especifica el modelo de voz que se utilizará para la prueba; este campo es obligatorio cuando se envía el campo “text”.
Opciones: speech-2.8-hd, speech-2.8-turbo

float

Parámetro de clonación de audio. Rango de valores [0,1]. Al enviar este campo, se establecerá el umbral de precisión de la verificación de texto; si no se envía, el valor predeterminado de este campo es 0.7.

bool

Parámetro de clonación de audio. Indica si se habilita la reducción de ruido. Si no se envía, el valor predeterminado es false.

bool

Parámetro de clonación de audio. Indica si se habilita la normalización de volumen. Si no se envía, el valor predeterminado es false.

Información de respuesta

string

Si en el cuerpo de la solicitud se han enviado el texto de prueba text y el modelo de prueba model, este parámetro devolverá el audio de prueba en forma de enlace.

string

voice_id generado

Síntesis de voz síncrona MiniMax Speech 2.8 HD

ElevenLabs voz a texto V1

Conceptos básicos de API

Modelos de lenguaje

Imágenes

Vídeo

Audio

Clonación rápida de audio MiniMax

Encabezados de solicitud

Cuerpo de la solicitud

Información de respuesta

​Encabezados de solicitud

​Cuerpo de la solicitud

​Información de respuesta

Encabezados de solicitud

Cuerpo de la solicitud

Información de respuesta