Voice Cloning API | Clonage audio rapide MiniMax

Clonage audio rapide MiniMax

curl --request POST \
  --url https://api.highwayapi.ai/v3/minimax-voice-cloning \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "audio_url": "<string>",
  "text": "<string>",
  "model": "<string>",
  "accuracy": 123,
  "need_noise_reduction": true,
  "need_volume_normalization": true
}
'

import requests

url = "https://api.highwayapi.ai/v3/minimax-voice-cloning"

payload = {
    "audio_url": "<string>",
    "text": "<string>",
    "model": "<string>",
    "accuracy": 123,
    "need_noise_reduction": True,
    "need_volume_normalization": True
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': '<content-type>', Authorization: '<authorization>'},
  body: JSON.stringify({
    audio_url: '<string>',
    text: '<string>',
    model: '<string>',
    accuracy: 123,
    need_noise_reduction: true,
    need_volume_normalization: true
  })
};

fetch('https://api.highwayapi.ai/v3/minimax-voice-cloning', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.highwayapi.ai/v3/minimax-voice-cloning",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'audio_url' => '<string>',
    'text' => '<string>',
    'model' => '<string>',
    'accuracy' => 123,
    'need_noise_reduction' => true,
    'need_volume_normalization' => true
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: <authorization>",
    "Content-Type: <content-type>"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.highwayapi.ai/v3/minimax-voice-cloning"

	payload := strings.NewReader("{\n  \"audio_url\": \"<string>\",\n  \"text\": \"<string>\",\n  \"model\": \"<string>\",\n  \"accuracy\": 123,\n  \"need_noise_reduction\": true,\n  \"need_volume_normalization\": true\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "<content-type>")
	req.Header.Add("Authorization", "<authorization>")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.highwayapi.ai/v3/minimax-voice-cloning")
  .header("Content-Type", "<content-type>")
  .header("Authorization", "<authorization>")
  .body("{\n  \"audio_url\": \"<string>\",\n  \"text\": \"<string>\",\n  \"model\": \"<string>\",\n  \"accuracy\": 123,\n  \"need_noise_reduction\": true,\n  \"need_volume_normalization\": true\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.highwayapi.ai/v3/minimax-voice-cloning")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = '<content-type>'
request["Authorization"] = '<authorization>'
request.body = "{\n  \"audio_url\": \"<string>\",\n  \"text\": \"<string>\",\n  \"model\": \"<string>\",\n  \"accuracy\": 123,\n  \"need_noise_reduction\": true,\n  \"need_volume_normalization\": true\n}"

response = http.request(request)
puts response.read_body

{
  "demo_audio_url": "<string>",
  "voice_id": "<string>"
}

POST

minimax-voice-cloning

Clonage audio rapide MiniMax

curl --request POST \
  --url https://api.highwayapi.ai/v3/minimax-voice-cloning \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "audio_url": "<string>",
  "text": "<string>",
  "model": "<string>",
  "accuracy": 123,
  "need_noise_reduction": true,
  "need_volume_normalization": true
}
'

import requests

url = "https://api.highwayapi.ai/v3/minimax-voice-cloning"

payload = {
    "audio_url": "<string>",
    "text": "<string>",
    "model": "<string>",
    "accuracy": 123,
    "need_noise_reduction": True,
    "need_volume_normalization": True
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': '<content-type>', Authorization: '<authorization>'},
  body: JSON.stringify({
    audio_url: '<string>',
    text: '<string>',
    model: '<string>',
    accuracy: 123,
    need_noise_reduction: true,
    need_volume_normalization: true
  })
};

fetch('https://api.highwayapi.ai/v3/minimax-voice-cloning', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.highwayapi.ai/v3/minimax-voice-cloning",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'audio_url' => '<string>',
    'text' => '<string>',
    'model' => '<string>',
    'accuracy' => 123,
    'need_noise_reduction' => true,
    'need_volume_normalization' => true
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: <authorization>",
    "Content-Type: <content-type>"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.highwayapi.ai/v3/minimax-voice-cloning"

	payload := strings.NewReader("{\n  \"audio_url\": \"<string>\",\n  \"text\": \"<string>\",\n  \"model\": \"<string>\",\n  \"accuracy\": 123,\n  \"need_noise_reduction\": true,\n  \"need_volume_normalization\": true\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "<content-type>")
	req.Header.Add("Authorization", "<authorization>")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.highwayapi.ai/v3/minimax-voice-cloning")
  .header("Content-Type", "<content-type>")
  .header("Authorization", "<authorization>")
  .body("{\n  \"audio_url\": \"<string>\",\n  \"text\": \"<string>\",\n  \"model\": \"<string>\",\n  \"accuracy\": 123,\n  \"need_noise_reduction\": true,\n  \"need_volume_normalization\": true\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.highwayapi.ai/v3/minimax-voice-cloning")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = '<content-type>'
request["Authorization"] = '<authorization>'
request.body = "{\n  \"audio_url\": \"<string>\",\n  \"text\": \"<string>\",\n  \"model\": \"<string>\",\n  \"accuracy\": 123,\n  \"need_noise_reduction\": true,\n  \"need_volume_normalization\": true\n}"

response = http.request(request)
puts response.read_body

{
  "demo_audio_url": "<string>",
  "voice_id": "<string>"
}

Cette interface prend en charge le clonage vocal en mono et en stéréo, et permet de reproduire rapidement une voix au timbre identique à partir d’un fichier audio spécifié. Le timbre vocal cloné rapidement généré par cette interface est temporaire. Si vous souhaitez conserver définitivement un timbre vocal cloné, veuillez l’appeler dans n’importe quelle interface de synthèse vocale T2A dans un délai de 168 heures (7 jours) (hors comportement d’écoute de démonstration dans cette interface) ; sinon, ce timbre vocal sera supprimé. Scénarios d’utilisation de cette interface : clonage d’IP, clonage de timbre vocal et autres scénarios nécessitant de reproduire rapidement un timbre vocal donné. Remarques :

Le format du fichier audio téléversé doit être : mp3, m4a ou wav ;
La durée du fichier audio téléversé doit être d’au moins 10 secondes et ne doit pas dépasser 5 minutes ;
La taille du fichier audio téléversé ne doit pas dépasser 20 Mo.

En-têtes de requête

string

requis

Valeur d’énumération : application/json

string

requis

Format d’authentification Bearer : Bearer {{API Key}}.

Corps de la requête

string

requis

URL du fichier audio dont le timbre vocal doit être cloné. Formats pris en charge : mp3, m4a, wav.

Paramètres de clonage du timbre vocal. Fournir ce paramètre contribuera à améliorer la similarité et la stabilité du timbre vocal lors de la synthèse vocale.Si vous utilisez ce paramètre, vous devez téléverser simultanément un court exemple audio (durée inférieure à 8 s) ainsi que le texte correspondant à cet audio. Les formats audio pris en charge sont mp3, m4a et wav.

Afficher properties

number

requis

Paramètre de prompt audio : URL de l’exemple audio, dont la durée doit être inférieure à 8 s.

string

requis

Paramètre de prompt audio : renseignez le texte correspondant à l’exemple audio. Assurez-vous qu’il corresponde au contenu audio et que la phrase se termine par un signe de ponctuation.

string

Paramètre d’écoute de démonstration du clonage. Le modèle utilisera le timbre vocal cloné pour lire le contenu textuel de ce paragraphe, puis renverra le résultat de synthèse audio sous forme de lien afin de permettre l’écoute de l’effet de clonage. Limité à 2000 caractères. Remarque : l’écoute de démonstration sera facturée normalement comme synthèse vocale en fonction du nombre de caractères, avec la même tarification que les différentes interfaces T2A.

string

Paramètre d’écoute de démonstration du clonage. Spécifie le modèle vocal utilisé pour l’écoute de démonstration ; ce champ est obligatoire lorsque le champ “text” est transmis.
Options disponibles : speech-2.8-hd, speech-2.8-turbo

float

Paramètre de clonage audio. Plage de valeurs : [0,1]. Si ce champ est fourni, il définira le seuil de précision de la vérification du texte. S’il n’est pas fourni, sa valeur par défaut est 0.7.

bool

Paramètre de clonage audio. Indique s’il faut activer la réduction du bruit. Par défaut, la valeur est false si le champ n’est pas fourni.

bool

Paramètre de clonage audio. Indique s’il faut activer la normalisation du volume. Par défaut, la valeur est false si le champ n’est pas fourni.

Informations de réponse

string

Si le texte d’écoute de démonstration text ainsi que le modèle d’écoute de démonstration model sont transmis dans le corps de la requête, ce paramètre renverra l’audio de démonstration sous forme de lien.

string

voice_id généré

Synthèse vocale synchrone MiniMax Speech 2.8 HD

ElevenLabs Speech-to-Text V1

Bases de l'API

Grands modèles de langage

Images

Vidéo

Audio

Clonage audio rapide MiniMax

En-têtes de requête

Corps de la requête

Informations de réponse

​En-têtes de requête

​Corps de la requête

​Informations de réponse

En-têtes de requête

Corps de la requête

Informations de réponse