Síntese de voz assíncrona MiniMax Speech 2.8 HD

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "text_file_id": 123,
  "voice_modify": {
    "pitch": 123,
    "timbre": 123,
    "intensity": 123,
    "sound_effects": "<string>"
  },
  "audio_setting": {
    "format": "<string>",
    "bitrate": 123,
    "channel": 123,
    "audio_sample_rate": 123
  },
  "voice_setting": {
    "vol": 123,
    "pitch": 123,
    "speed": 123,
    "emotion": "<string>",
    "voice_id": "<string>",
    "english_normalization": true
  },
  "aigc_watermark": true,
  "language_boost": "<string>",
  "continuous_sound": true,
  "pronunciation_dict": {
    "tone": [
      "<string>"
    ]
  }
}
'

import requests

url = "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd"

payload = {
    "text": "<string>",
    "text_file_id": 123,
    "voice_modify": {
        "pitch": 123,
        "timbre": 123,
        "intensity": 123,
        "sound_effects": "<string>"
    },
    "audio_setting": {
        "format": "<string>",
        "bitrate": 123,
        "channel": 123,
        "audio_sample_rate": 123
    },
    "voice_setting": {
        "vol": 123,
        "pitch": 123,
        "speed": 123,
        "emotion": "<string>",
        "voice_id": "<string>",
        "english_normalization": True
    },
    "aigc_watermark": True,
    "language_boost": "<string>",
    "continuous_sound": True,
    "pronunciation_dict": { "tone": ["<string>"] }
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': '<content-type>', Authorization: '<authorization>'},
  body: JSON.stringify({
    text: '<string>',
    text_file_id: 123,
    voice_modify: {pitch: 123, timbre: 123, intensity: 123, sound_effects: '<string>'},
    audio_setting: {format: '<string>', bitrate: 123, channel: 123, audio_sample_rate: 123},
    voice_setting: {
      vol: 123,
      pitch: 123,
      speed: 123,
      emotion: '<string>',
      voice_id: '<string>',
      english_normalization: true
    },
    aigc_watermark: true,
    language_boost: '<string>',
    continuous_sound: true,
    pronunciation_dict: {tone: ['<string>']}
  })
};

fetch('https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'text' => '<string>',
    'text_file_id' => 123,
    'voice_modify' => [
        'pitch' => 123,
        'timbre' => 123,
        'intensity' => 123,
        'sound_effects' => '<string>'
    ],
    'audio_setting' => [
        'format' => '<string>',
        'bitrate' => 123,
        'channel' => 123,
        'audio_sample_rate' => 123
    ],
    'voice_setting' => [
        'vol' => 123,
        'pitch' => 123,
        'speed' => 123,
        'emotion' => '<string>',
        'voice_id' => '<string>',
        'english_normalization' => true
    ],
    'aigc_watermark' => true,
    'language_boost' => '<string>',
    'continuous_sound' => true,
    'pronunciation_dict' => [
        'tone' => [
                '<string>'
        ]
    ]
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: <authorization>",
    "Content-Type: <content-type>"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd"

	payload := strings.NewReader("{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "<content-type>")
	req.Header.Add("Authorization", "<authorization>")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd")
  .header("Content-Type", "<content-type>")
  .header("Authorization", "<authorization>")
  .body("{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = '<content-type>'
request["Authorization"] = '<authorization>'
request.body = "{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}"

response = http.request(request)
puts response.read_body

{
  "file_id": 123,
  "task_id": "<string>",
  "base_resp": {
    "status_msg": "<string>",
    "status_code": 123
  },
  "task_token": "<string>",
  "usage_characters": 123
}

POST

async

minimax-speech-2.8-hd

Síntese de voz assíncrona MiniMax Speech 2.8 HD

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "text_file_id": 123,
  "voice_modify": {
    "pitch": 123,
    "timbre": 123,
    "intensity": 123,
    "sound_effects": "<string>"
  },
  "audio_setting": {
    "format": "<string>",
    "bitrate": 123,
    "channel": 123,
    "audio_sample_rate": 123
  },
  "voice_setting": {
    "vol": 123,
    "pitch": 123,
    "speed": 123,
    "emotion": "<string>",
    "voice_id": "<string>",
    "english_normalization": true
  },
  "aigc_watermark": true,
  "language_boost": "<string>",
  "continuous_sound": true,
  "pronunciation_dict": {
    "tone": [
      "<string>"
    ]
  }
}
'

import requests

url = "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd"

payload = {
    "text": "<string>",
    "text_file_id": 123,
    "voice_modify": {
        "pitch": 123,
        "timbre": 123,
        "intensity": 123,
        "sound_effects": "<string>"
    },
    "audio_setting": {
        "format": "<string>",
        "bitrate": 123,
        "channel": 123,
        "audio_sample_rate": 123
    },
    "voice_setting": {
        "vol": 123,
        "pitch": 123,
        "speed": 123,
        "emotion": "<string>",
        "voice_id": "<string>",
        "english_normalization": True
    },
    "aigc_watermark": True,
    "language_boost": "<string>",
    "continuous_sound": True,
    "pronunciation_dict": { "tone": ["<string>"] }
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': '<content-type>', Authorization: '<authorization>'},
  body: JSON.stringify({
    text: '<string>',
    text_file_id: 123,
    voice_modify: {pitch: 123, timbre: 123, intensity: 123, sound_effects: '<string>'},
    audio_setting: {format: '<string>', bitrate: 123, channel: 123, audio_sample_rate: 123},
    voice_setting: {
      vol: 123,
      pitch: 123,
      speed: 123,
      emotion: '<string>',
      voice_id: '<string>',
      english_normalization: true
    },
    aigc_watermark: true,
    language_boost: '<string>',
    continuous_sound: true,
    pronunciation_dict: {tone: ['<string>']}
  })
};

fetch('https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'text' => '<string>',
    'text_file_id' => 123,
    'voice_modify' => [
        'pitch' => 123,
        'timbre' => 123,
        'intensity' => 123,
        'sound_effects' => '<string>'
    ],
    'audio_setting' => [
        'format' => '<string>',
        'bitrate' => 123,
        'channel' => 123,
        'audio_sample_rate' => 123
    ],
    'voice_setting' => [
        'vol' => 123,
        'pitch' => 123,
        'speed' => 123,
        'emotion' => '<string>',
        'voice_id' => '<string>',
        'english_normalization' => true
    ],
    'aigc_watermark' => true,
    'language_boost' => '<string>',
    'continuous_sound' => true,
    'pronunciation_dict' => [
        'tone' => [
                '<string>'
        ]
    ]
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: <authorization>",
    "Content-Type: <content-type>"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd"

	payload := strings.NewReader("{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "<content-type>")
	req.Header.Add("Authorization", "<authorization>")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd")
  .header("Content-Type", "<content-type>")
  .header("Authorization", "<authorization>")
  .body("{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.highwayapi.ai/v3/async/minimax-speech-2.8-hd")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = '<content-type>'
request["Authorization"] = '<authorization>'
request.body = "{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}"

response = http.request(request)
puts response.read_body

{
  "file_id": 123,
  "task_id": "<string>",
  "base_resp": {
    "status_msg": "<string>",
    "status_code": 123
  },
  "task_token": "<string>",
  "usage_characters": 123
}

Use esta API para criar tarefas assíncronas de síntese de voz. Suporta entrada por texto ou arquivo; o limite máximo é de 50 mil caracteres para texto e 100 mil caracteres para arquivos.

Esta é uma API assíncrona e retornará apenas o task_id da tarefa assíncrona. Você deve usar esse task_id para solicitar a API de consulta de resultado da tarefa para recuperar o resultado gerado.

Cabeçalhos da solicitação

string

obrigatório

Valores enumerados: application/json

string

obrigatório

Formato de autenticação Bearer: Bearer {{API Key}}.

Corpo da solicitação

string

Texto do áudio a ser sintetizado, com limite máximo de 50 mil caracteres. Obrigatório escolher um entre text e text_file_id

• Tags de interjeição: somente quando o modelo selecionado for speech-2.8-hd ou speech-2.8-turbo, há suporte para inserir tags de interjeição no texto. Interjeições suportadas: (laughs) (risada), (chuckle) (risadinha), (coughs) (tosse), (clear-throat) (limpar a garganta), (groans) (gemido), (breath) (respiração normal), (pant) (ofegar), (inhale) (inspirar), (exhale) (expirar), (gasps) (gasp), (sniffs) (fungar), (sighs) (suspiro), (snorts) (bufar), (burps) (arroto), (lip-smacking) (estalo de lábios), (humming) (cantarolar), (hissing) (sibilo), (emm) (hum), (whistles) (assobio), (sneezes) (espirro), (crying) (soluço), (applause) (aplausos)

integer

id do arquivo de texto do áudio a ser sintetizado. O limite de comprimento de um único arquivo é inferior a 100 mil caracteres. Formatos de arquivo suportados: txt, zip. Obrigatório escolher um entre text e text_file_id; após o envio, o formato será validado automaticamente.
• Arquivo txt: limite de comprimento <100000 caracteres. Suporta o uso de <#x#> para marcar pausas personalizadas. x é a duração da pausa (unidade: segundos), no intervalo [0.01, 99.99], com no máximo duas casas decimais. Observe que a pausa deve ser definida entre dois trechos de texto que possam ser pronunciados por voz; não é permitido usar várias marcações de pausa consecutivamente
• Arquivo zip:
• O pacote compactado deve conter arquivos txt ou json no mesmo formato.
• Formato do arquivo json: suporta três campos, [title, content, extra], que indicam, respectivamente, título, corpo do texto e informações adicionais. Se os três campos existirem, serão gerados 3 conjuntos de resultados, totalizando 9 arquivos, armazenados juntos em uma única pasta. Se algum campo não existir ou seu conteúdo estiver vazio, o resultado correspondente a esse campo não será gerado

object

Ocultar propriedades

integer

Ajuste de altura tonal (grave/brilhante), intervalo [-100, 100]. Quanto mais próximo de -100, mais grave será a voz; quanto mais próximo de 100, mais brilhante será a vozIntervalo de valores: [-100, 100]

integer

Ajuste de timbre (magnético/cristalino), intervalo [-100, 100]. Quanto mais próximo de -100, mais encorpada será a voz; quanto mais próximo de 100, mais cristalina será a vozIntervalo de valores: [-100, 100]

integer

Ajuste de intensidade (sensação de força/suavidade), intervalo [-100, 100]. Quanto mais próximo de -100, mais firme será a voz; quanto mais próximo de 100, mais suave será a vozIntervalo de valores: [-100, 100]

string

Configuração de efeito sonoro; apenas uma opção pode ser selecionada por vez. Valores opcionais:

spacious_echo (eco em espaço amplo)
auditorium_echo (transmissão em auditório)
lofi_telephone (distorção de telefone)
robotic (voz eletrônica)

Valores opcionais: spacious_echo, auditorium_echo, lofi_telephone, robotic

object

Ocultar propriedades

string

padrão:"mp3"

Formato do áudio gerado. Intervalo opcional [mp3, pcm, flac], valor padrão mp3Valores opcionais: mp3, pcm, flac

integer

padrão:128000

Bitrate do áudio gerado. Intervalo opcional [32000, 64000, 128000, 256000], valor padrão 128000. Este parâmetro é válido apenas para áudio no formato mp3

integer

padrão:2

Número de canais do áudio gerado. Intervalo opcional: [1, 2], em que 1 é mono e 2 é estéreo; o valor padrão é 1

integer

padrão:32000

Taxa de amostragem do áudio gerado. Intervalo opcional [8000, 16000, 22050, 24000, 32000, 44100], padrão 32000

object

obrigatório

Ocultar propriedades

number

padrão:1

Volume do áudio sintetizado. Quanto maior o valor, maior o volume. Intervalo de valores (0, 10], valor padrão 1.0Intervalo de valores: [0, 10]

integer

padrão:0

Tom do áudio sintetizado, intervalo de valores [-12, 12], valor padrão 0, em que 0 representa a saída no timbre originalIntervalo de valores: [-12, 12]

number

padrão:1

Velocidade de fala do áudio sintetizado. Quanto maior o valor, mais rápida a fala. Intervalo de valores [0.5, 2], valor padrão 1.0Intervalo de valores: [0.5, 2]

string

Controla a emoção da voz sintetizada. O intervalo de parâmetros é [“happy”, “sad”, “angry”, “fearful”, “disgusted”, “surprised”, “calm”, “fluent”, “whisper”], correspondendo respectivamente a 8 emoções: feliz, triste, com raiva, com medo, com nojo, surpreso, neutro, vívido, sussurrado
• O modelo corresponderá automaticamente a emoção adequada com base no texto de entrada; geralmente não é necessário especificá-la manualmente
• Este parâmetro é válido apenas para os modelos speech-2.6-hd, speech-2.6-turbo, speech-01-hd, speech-01-turbo
• As opções fluent, whisper são válidas apenas para os modelos speech-2.6-turbo, speech-2.6-hdValores opcionais: happy, sad, angry, fearful, disgusted, surprised, calm, fluent, whisper

string

obrigatório

ID do timbre do áudio sintetizado. Se precisar configurar timbres mistos, defina o parâmetro timber_weights e deixe este parâmetro vazio. Suporta três tipos: timbres do sistema, timbres clonados e timbres gerados a partir de texto. A seguir estão alguns dos timbres do sistema (ID) mais recentes; você pode consultar todos os timbres suportados oficialmente
• Chinês:
• moss_audio_ce44fc67-7ce3-11f0-8de5-96e35d26fb85
• moss_audio_aaa1346a-7ce7-11f0-8e61-2e6e3c7ee85d
• Chinese (Mandarin)_Lyrical_Voice
• Chinese (Mandarin)_HK_Flight_Attendant
• Inglês:
• English_Graceful_Lady
• English_Insightful_Speaker
• English_radiant_girl
• English_Persuasive_Man
• moss_audio_6dc281eb-713c-11f0-a447-9613c873494c
• moss_audio_570551b1-735c-11f0-b236-0adeeecad052
• moss_audio_ad5baf92-735f-11f0-8263-fe5a2fe98ec8
• English_Lucky_Robot
• Japonês:
• Japanese_Whisper_Belle
• moss_audio_24875c4a-7be4-11f0-9359-4e72c55db738
• moss_audio_7f4ee608-78ea-11f0-bb73-1e2a4cfcd245
• moss_audio_c1a6a3ac-7be6-11f0-8e8e-36b92fbb4f95

boolean

padrão:false

Suporta normalização de texto em inglês. Quando ativado, pode melhorar o desempenho em cenários de leitura de números, mas aumenta ligeiramente a latência. O padrão é false

boolean

padrão:false

Controla a adição de uma marcação rítmica de áudio ao final do áudio sintetizado. O valor padrão é False. Este parâmetro é válido apenas para síntese não streaming

string

Indica se deve aprimorar a capacidade de reconhecimento de idiomas minoritários e dialetos especificados. O valor padrão é null; pode ser definido como auto para permitir que o modelo decida autonomamente.Valores opcionais: Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, auto

boolean

padrão:false

Ative este parâmetro para tornar a transição entre subfrases mais natural. Suportado apenas pelos modelos speech-2.8-hd e speech-2.8-turbo

object

Ocultar propriedades

string[]

Define regras de anotação fonética ou substituição de pronúncia correspondentes a textos ou símbolos que exigem marcação especial. Em textos em chinês, os tons são representados por números: primeiro tom como 1, segundo tom como 2, terceiro tom como 3, quarto tom como 4, tom neutro como 5 Exemplo: [“燕少飞/(yan4)(shao3)(fei1)”, “omg/oh my god”]

Informações de resposta

integer

ID do arquivo de áudio correspondente retornado após a criação bem-sucedida da tarefa.

• Depois que a tarefa for concluída, é possível consultar pelo file_id. Quando ocorrer um erro na solicitação, este campo não será retornadoObservação: a URL de download retornada é válida por 9 horas (32400 segundos) a partir da geração. Após expirar, o arquivo ficará inválido e as informações geradas serão perdidas; preste atenção ao prazo das informações de download

string

Use o task_id para solicitar a API de consulta de resultado da tarefa para recuperar a saída gerada.

object

Ocultar propriedades

string

obrigatório

Detalhes do status

integer

obrigatório

Código de status

• 0: normal
• 1002: limite de taxa
• 1004: falha na autenticação
• 1039: limite de taxa TPM acionado
• 1042: caracteres ilegais acima de 10%
• 2013: erro de parâmetro

string

Informações da chave usadas para concluir a tarefa atual

integer

Número de caracteres faturáveis

MiniMax Speech 2.8 Turbo Síntese de voz síncrona

Síntese de voz síncrona MiniMax Speech 2.8 HD

Noções básicas da API

Modelos de linguagem

Imagens

Vídeo

Áudio

Síntese de voz assíncrona MiniMax Speech 2.8 HD

Cabeçalhos da solicitação

Corpo da solicitação

Informações de resposta

​Cabeçalhos da solicitação

​Corpo da solicitação

​Informações de resposta

Cabeçalhos da solicitação

Corpo da solicitação

Informações de resposta