Synthèse vocale asynchrone MiniMax Speech 2.8 HD

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "text_file_id": 123,
  "voice_modify": {
    "pitch": 123,
    "timbre": 123,
    "intensity": 123,
    "sound_effects": "<string>"
  },
  "audio_setting": {
    "format": "<string>",
    "bitrate": 123,
    "channel": 123,
    "audio_sample_rate": 123
  },
  "voice_setting": {
    "vol": 123,
    "pitch": 123,
    "speed": 123,
    "emotion": "<string>",
    "voice_id": "<string>",
    "english_normalization": true
  },
  "aigc_watermark": true,
  "language_boost": "<string>",
  "continuous_sound": true,
  "pronunciation_dict": {
    "tone": [
      "<string>"
    ]
  }
}
'

import requests

url = "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd"

payload = {
    "text": "<string>",
    "text_file_id": 123,
    "voice_modify": {
        "pitch": 123,
        "timbre": 123,
        "intensity": 123,
        "sound_effects": "<string>"
    },
    "audio_setting": {
        "format": "<string>",
        "bitrate": 123,
        "channel": 123,
        "audio_sample_rate": 123
    },
    "voice_setting": {
        "vol": 123,
        "pitch": 123,
        "speed": 123,
        "emotion": "<string>",
        "voice_id": "<string>",
        "english_normalization": True
    },
    "aigc_watermark": True,
    "language_boost": "<string>",
    "continuous_sound": True,
    "pronunciation_dict": { "tone": ["<string>"] }
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': '<content-type>', Authorization: '<authorization>'},
  body: JSON.stringify({
    text: '<string>',
    text_file_id: 123,
    voice_modify: {pitch: 123, timbre: 123, intensity: 123, sound_effects: '<string>'},
    audio_setting: {format: '<string>', bitrate: 123, channel: 123, audio_sample_rate: 123},
    voice_setting: {
      vol: 123,
      pitch: 123,
      speed: 123,
      emotion: '<string>',
      voice_id: '<string>',
      english_normalization: true
    },
    aigc_watermark: true,
    language_boost: '<string>',
    continuous_sound: true,
    pronunciation_dict: {tone: ['<string>']}
  })
};

fetch('https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'text' => '<string>',
    'text_file_id' => 123,
    'voice_modify' => [
        'pitch' => 123,
        'timbre' => 123,
        'intensity' => 123,
        'sound_effects' => '<string>'
    ],
    'audio_setting' => [
        'format' => '<string>',
        'bitrate' => 123,
        'channel' => 123,
        'audio_sample_rate' => 123
    ],
    'voice_setting' => [
        'vol' => 123,
        'pitch' => 123,
        'speed' => 123,
        'emotion' => '<string>',
        'voice_id' => '<string>',
        'english_normalization' => true
    ],
    'aigc_watermark' => true,
    'language_boost' => '<string>',
    'continuous_sound' => true,
    'pronunciation_dict' => [
        'tone' => [
                '<string>'
        ]
    ]
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: <authorization>",
    "Content-Type: <content-type>"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd"

	payload := strings.NewReader("{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "<content-type>")
	req.Header.Add("Authorization", "<authorization>")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd")
  .header("Content-Type", "<content-type>")
  .header("Authorization", "<authorization>")
  .body("{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = '<content-type>'
request["Authorization"] = '<authorization>'
request.body = "{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}"

response = http.request(request)
puts response.read_body

{
  "file_id": 123,
  "task_id": "<string>",
  "base_resp": {
    "status_msg": "<string>",
    "status_code": 123
  },
  "task_token": "<string>",
  "usage_characters": 123
}

POST

async

minimax-speech-2.8-hd

Synthèse vocale asynchrone MiniMax Speech 2.8 HD

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "text_file_id": 123,
  "voice_modify": {
    "pitch": 123,
    "timbre": 123,
    "intensity": 123,
    "sound_effects": "<string>"
  },
  "audio_setting": {
    "format": "<string>",
    "bitrate": 123,
    "channel": 123,
    "audio_sample_rate": 123
  },
  "voice_setting": {
    "vol": 123,
    "pitch": 123,
    "speed": 123,
    "emotion": "<string>",
    "voice_id": "<string>",
    "english_normalization": true
  },
  "aigc_watermark": true,
  "language_boost": "<string>",
  "continuous_sound": true,
  "pronunciation_dict": {
    "tone": [
      "<string>"
    ]
  }
}
'

import requests

url = "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd"

payload = {
    "text": "<string>",
    "text_file_id": 123,
    "voice_modify": {
        "pitch": 123,
        "timbre": 123,
        "intensity": 123,
        "sound_effects": "<string>"
    },
    "audio_setting": {
        "format": "<string>",
        "bitrate": 123,
        "channel": 123,
        "audio_sample_rate": 123
    },
    "voice_setting": {
        "vol": 123,
        "pitch": 123,
        "speed": 123,
        "emotion": "<string>",
        "voice_id": "<string>",
        "english_normalization": True
    },
    "aigc_watermark": True,
    "language_boost": "<string>",
    "continuous_sound": True,
    "pronunciation_dict": { "tone": ["<string>"] }
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': '<content-type>', Authorization: '<authorization>'},
  body: JSON.stringify({
    text: '<string>',
    text_file_id: 123,
    voice_modify: {pitch: 123, timbre: 123, intensity: 123, sound_effects: '<string>'},
    audio_setting: {format: '<string>', bitrate: 123, channel: 123, audio_sample_rate: 123},
    voice_setting: {
      vol: 123,
      pitch: 123,
      speed: 123,
      emotion: '<string>',
      voice_id: '<string>',
      english_normalization: true
    },
    aigc_watermark: true,
    language_boost: '<string>',
    continuous_sound: true,
    pronunciation_dict: {tone: ['<string>']}
  })
};

fetch('https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'text' => '<string>',
    'text_file_id' => 123,
    'voice_modify' => [
        'pitch' => 123,
        'timbre' => 123,
        'intensity' => 123,
        'sound_effects' => '<string>'
    ],
    'audio_setting' => [
        'format' => '<string>',
        'bitrate' => 123,
        'channel' => 123,
        'audio_sample_rate' => 123
    ],
    'voice_setting' => [
        'vol' => 123,
        'pitch' => 123,
        'speed' => 123,
        'emotion' => '<string>',
        'voice_id' => '<string>',
        'english_normalization' => true
    ],
    'aigc_watermark' => true,
    'language_boost' => '<string>',
    'continuous_sound' => true,
    'pronunciation_dict' => [
        'tone' => [
                '<string>'
        ]
    ]
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: <authorization>",
    "Content-Type: <content-type>"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd"

	payload := strings.NewReader("{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "<content-type>")
	req.Header.Add("Authorization", "<authorization>")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd")
  .header("Content-Type", "<content-type>")
  .header("Authorization", "<authorization>")
  .body("{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = '<content-type>'
request["Authorization"] = '<authorization>'
request.body = "{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}"

response = http.request(request)
puts response.read_body

{
  "file_id": 123,
  "task_id": "<string>",
  "base_resp": {
    "status_msg": "<string>",
    "status_code": 123
  },
  "task_token": "<string>",
  "usage_characters": 123
}

Utilisez cette interface pour créer une tâche de synthèse vocale asynchrone. Les entrées texte ou fichier sont prises en charge, avec une limite de longueur de 50 000 caractères pour le texte et de 100 000 caractères pour les fichiers.

Il s’agit d’une API asynchrone qui renvoie uniquement le task_id de la tâche asynchrone. Vous devez utiliser ce task_id pour appeler l’API de consultation du résultat de tâche afin de récupérer le résultat généré.

En-têtes de requête

string

requis

Valeur d’énumération : application/json

string

requis

Format d’authentification Bearer : Bearer {{API Key}}.

Corps de la requête

string

Texte de l’audio à synthétiser, limité à 50 000 caractères maximum. L’un des deux champs text ou text_file_id est obligatoire.

• Balises d’interjections : uniquement lorsque le modèle sélectionné est speech-2.8-hd ou speech-2.8-turbo, il est possible d’insérer des balises d’interjections dans le texte. Interjections prises en charge : (laughs) (rire), (chuckle) (petit rire), (coughs) (toux), (clear-throat) (raclement de gorge), (groans) (gémissement), (breath) (respiration normale), (pant) (halètement), (inhale) (inspiration), (exhale) (expiration), (gasps) (aspiration brusque), (sniffs) (reniflement), (sighs) (soupir), (snorts) (souffle par le nez), (burps) (rot), (lip-smacking) (bruit de lèvres), (humming) (fredonnement), (hissing) (sifflement), (emm) (euh), (whistles) (sifflement), (sneezes) (éternuement), (crying) (sanglot), (applause) (applaudissements)

integer

id du fichier texte de l’audio à synthétiser ; la longueur d’un fichier unique doit être inférieure à 100 000 caractères. Formats de fichier pris en charge : txt, zip. L’un des deux champs text ou text_file_id est obligatoire ; le format est automatiquement vérifié après transmission.
• Fichier txt : limite de longueur <100000 caractères. Prend en charge l’utilisation de <#x#> pour marquer une pause personnalisée. x correspond à la durée de la pause (en secondes), dans la plage [0.01, 99.99], avec au maximum deux décimales. Notez que la pause doit être placée entre deux segments de texte pouvant être prononcés vocalement ; il n’est pas possible d’utiliser plusieurs marqueurs de pause consécutifs.
• Fichier zip :
• L’archive compressée doit contenir des fichiers txt ou json au même format.
• Format du fichier json : les trois champs [title, content, extra] sont pris en charge et représentent respectivement le titre, le corps du texte et les informations supplémentaires. Si les trois champs existent, 3 groupes de résultats sont générés, soit 9 fichiers au total, tous stockés dans un même dossier. Si un champ n’existe pas ou si son contenu est vide, le résultat correspondant à ce champ ne sera pas généré.

object

Masquer properties

integer

Ajustement de la hauteur (grave/clair), plage [-100, 100] ; plus la valeur est proche de -100, plus la voix est grave ; plus elle est proche de 100, plus la voix est claire.Plage de valeurs : [-100, 100]

integer

Ajustement du timbre (magnétique/cristallin), plage [-100, 100] ; plus la valeur est proche de -100, plus la voix est épaisse ; plus elle est proche de 100, plus la voix est cristalline.Plage de valeurs : [-100, 100]

integer

Ajustement de l’intensité (puissance/douceur), plage [-100, 100] ; plus la valeur est proche de -100, plus la voix est ferme ; plus elle est proche de 100, plus la voix est douce.Plage de valeurs : [-100, 100]

string

Paramètre d’effet sonore ; une seule option peut être sélectionnée à la fois. Valeurs possibles :

spacious_echo (écho spacieux)
auditorium_echo (diffusion en auditorium)
lofi_telephone (distorsion téléphonique)
robotic (voix électronique)

Valeurs possibles : spacious_echo, auditorium_echo, lofi_telephone, robotic

object

Masquer properties

string

défaut:"mp3"

Format de l’audio généré. Plage possible [mp3, pcm, flac], valeur par défaut : mp3Valeurs possibles : mp3, pcm, flac

integer

défaut:128000

Débit binaire de l’audio généré. Plage possible [32000, 64000, 128000, 256000], valeur par défaut : 128000. Ce paramètre ne s’applique qu’à l’audio au format mp3.

integer

défaut:2

Nombre de canaux de l’audio généré. Plage possible : [1, 2], où 1 correspond au mono et 2 au stéréo ; la valeur par défaut est 1.

integer

défaut:32000

Taux d’échantillonnage de l’audio généré. Plage possible [8000, 16000, 22050, 24000, 32000, 44100], valeur par défaut : 32000

object

requis

Masquer properties

number

défaut:1

Volume de l’audio synthétisé ; plus la valeur est élevée, plus le volume est élevé. Plage de valeurs (0, 10], valeur par défaut : 1.0Plage de valeurs : [0, 10]

integer

défaut:0

Intonation de l’audio synthétisé, plage de valeurs [-12, 12], valeur par défaut : 0, où 0 correspond à une sortie avec le timbre d’origine.Plage de valeurs : [-12, 12]

number

défaut:1

Vitesse de parole de l’audio synthétisé ; plus la valeur est élevée, plus la vitesse est rapide. Plage de valeurs [0.5, 2], valeur par défaut : 1.0Plage de valeurs : [0.5, 2]

string

Contrôle l’émotion de la voix synthétisée. Plage de paramètres : [“happy”, “sad”, “angry”, “fearful”, “disgusted”, “surprised”, “calm”, “fluent”, “whisper”], correspondant respectivement à 8 émotions : joie, tristesse, colère, peur, dégoût, surprise, neutralité, expressivité, chuchotement
• Le modèle associe automatiquement l’émotion appropriée en fonction du texte d’entrée ; il n’est généralement pas nécessaire de la spécifier manuellement.
• Ce paramètre ne s’applique qu’aux modèles speech-2.6-hd, speech-2.6-turbo, speech-01-hd, speech-01-turbo.
• Les options fluent, whisper ne s’appliquent qu’aux modèles speech-2.6-turbo, speech-2.6-hd.Valeurs possibles : happy, sad, angry, fearful, disgusted, surprised, calm, fluent, whisper

string

requis

Identifiant du timbre de l’audio synthétisé. Si vous devez définir un timbre mixte, veuillez définir le paramètre timber_weights et laisser ce paramètre vide. Trois types de timbres sont pris en charge : timbres système, timbres répliqués et timbres générés à partir de texte. Voici quelques-uns des derniers timbres système (ID) ; vous pouvez consulter l’ensemble des timbres officiellement pris en charge.
• Chinois :
• moss_audio_ce44fc67-7ce3-11f0-8de5-96e35d26fb85
• moss_audio_aaa1346a-7ce7-11f0-8e61-2e6e3c7ee85d
• Chinese (Mandarin)_Lyrical_Voice
• Chinese (Mandarin)_HK_Flight_Attendant
• Anglais :
• English_Graceful_Lady
• English_Insightful_Speaker
• English_radiant_girl
• English_Persuasive_Man
• moss_audio_6dc281eb-713c-11f0-a447-9613c873494c
• moss_audio_570551b1-735c-11f0-b236-0adeeecad052
• moss_audio_ad5baf92-735f-11f0-8263-fe5a2fe98ec8
• English_Lucky_Robot
• Japonais :
• Japanese_Whisper_Belle
• moss_audio_24875c4a-7be4-11f0-9359-4e72c55db738
• moss_audio_7f4ee608-78ea-11f0-bb73-1e2a4cfcd245
• moss_audio_c1a6a3ac-7be6-11f0-8e8e-36b92fbb4f95

boolean

défaut:false

Prend en charge la normalisation du texte anglais ; une fois activée, elle peut améliorer les performances dans les scénarios de lecture de nombres, mais augmente légèrement la latence. Valeur par défaut : false

boolean

défaut:false

Contrôle l’ajout d’un marqueur rythmique audio à la fin de l’audio synthétisé. Valeur par défaut : False. Ce paramètre ne s’applique qu’à la synthèse non streaming.

string

Indique s’il faut renforcer la capacité de reconnaissance des langues minoritaires et dialectes spécifiés. La valeur par défaut est null ; vous pouvez définir auto pour laisser le modèle décider automatiquement.Valeurs possibles : Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, auto

boolean

défaut:false

Activez ce paramètre pour rendre les jonctions entre propositions plus naturelles ; seuls les modèles speech-2.8-hd et speech-2.8-turbo sont pris en charge.

object

Masquer properties

string[]

Définit les règles de remplacement de phonétique ou de prononciation correspondant aux caractères ou symboles nécessitant une annotation spéciale. Dans un texte chinois, les tons sont indiqués par des chiffres : le premier ton est 1, le deuxième ton est 2, le troisième ton est 3, le quatrième ton est 4, et le ton neutre est 5. Exemples : [“燕少飞/(yan4)(shao3)(fei1)”, “omg/oh my god”]

Informations de réponse

integer

ID du fichier audio correspondant renvoyé après la création réussie de la tâche.

• Une fois la tâche terminée, il est possible de consulter le résultat via file_id. Ce champ n’est pas renvoyé en cas d’erreur de requête.Remarque : l’URL de téléchargement renvoyée est valide pendant 9 heures (32400 secondes) à partir de sa génération. Une fois expirée, le fichier deviendra invalide et les informations générées seront perdues ; veuillez prêter attention à l’heure des informations de téléchargement.

string

Utilisez task_id pour appeler l’API de consultation du résultat de tâche afin de récupérer la sortie générée.

object

Masquer properties

string

requis

Détails de l’état

integer

requis

Code d’état

• 0 : normal
• 1002 : limitation de débit
• 1004 : échec de l’authentification
• 1039 : limitation TPM déclenchée
• 1042 : caractères illégaux supérieurs à 10 %
• 2013 : erreur de paramètre

string

Informations de clé utilisées pour finaliser la tâche actuelle

integer

Nombre de caractères facturés

Synthèse vocale synchrone MiniMax Speech 2.8 Turbo

Synthèse vocale synchrone MiniMax Speech 2.8 HD

Bases de l'API

Grands modèles de langage

Images

Vidéo

Audio

Synthèse vocale asynchrone MiniMax Speech 2.8 HD

En-têtes de requête

Corps de la requête

Informations de réponse

​En-têtes de requête

​Corps de la requête

​Informations de réponse

En-têtes de requête

Corps de la requête

Informations de réponse