MiniMax Speech 2.8 Turbo Síntese de fala assíncrona

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/minimax-speech-2.8-turbo \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "text_file_id": 123,
  "voice_modify": {
    "pitch": 123,
    "timbre": 123,
    "intensity": 123,
    "sound_effects": "<string>"
  },
  "audio_setting": {
    "format": "<string>",
    "bitrate": 123,
    "channel": 123,
    "audio_sample_rate": 123
  },
  "voice_setting": {
    "vol": 123,
    "pitch": 123,
    "speed": 123,
    "emotion": "<string>",
    "voice_id": "<string>",
    "english_normalization": true
  },
  "aigc_watermark": true,
  "language_boost": "<string>",
  "continuous_sound": true,
  "pronunciation_dict": {
    "tone": [
      "<string>"
    ]
  }
}
'

import requests

url = "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-turbo"

payload = {
    "text": "<string>",
    "text_file_id": 123,
    "voice_modify": {
        "pitch": 123,
        "timbre": 123,
        "intensity": 123,
        "sound_effects": "<string>"
    },
    "audio_setting": {
        "format": "<string>",
        "bitrate": 123,
        "channel": 123,
        "audio_sample_rate": 123
    },
    "voice_setting": {
        "vol": 123,
        "pitch": 123,
        "speed": 123,
        "emotion": "<string>",
        "voice_id": "<string>",
        "english_normalization": True
    },
    "aigc_watermark": True,
    "language_boost": "<string>",
    "continuous_sound": True,
    "pronunciation_dict": { "tone": ["<string>"] }
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': '<content-type>', Authorization: '<authorization>'},
  body: JSON.stringify({
    text: '<string>',
    text_file_id: 123,
    voice_modify: {pitch: 123, timbre: 123, intensity: 123, sound_effects: '<string>'},
    audio_setting: {format: '<string>', bitrate: 123, channel: 123, audio_sample_rate: 123},
    voice_setting: {
      vol: 123,
      pitch: 123,
      speed: 123,
      emotion: '<string>',
      voice_id: '<string>',
      english_normalization: true
    },
    aigc_watermark: true,
    language_boost: '<string>',
    continuous_sound: true,
    pronunciation_dict: {tone: ['<string>']}
  })
};

fetch('https://api.highwayapi.ai/v3/async/minimax-speech-2.8-turbo', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-turbo",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'text' => '<string>',
    'text_file_id' => 123,
    'voice_modify' => [
        'pitch' => 123,
        'timbre' => 123,
        'intensity' => 123,
        'sound_effects' => '<string>'
    ],
    'audio_setting' => [
        'format' => '<string>',
        'bitrate' => 123,
        'channel' => 123,
        'audio_sample_rate' => 123
    ],
    'voice_setting' => [
        'vol' => 123,
        'pitch' => 123,
        'speed' => 123,
        'emotion' => '<string>',
        'voice_id' => '<string>',
        'english_normalization' => true
    ],
    'aigc_watermark' => true,
    'language_boost' => '<string>',
    'continuous_sound' => true,
    'pronunciation_dict' => [
        'tone' => [
                '<string>'
        ]
    ]
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: <authorization>",
    "Content-Type: <content-type>"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-turbo"

	payload := strings.NewReader("{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "<content-type>")
	req.Header.Add("Authorization", "<authorization>")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.highwayapi.ai/v3/async/minimax-speech-2.8-turbo")
  .header("Content-Type", "<content-type>")
  .header("Authorization", "<authorization>")
  .body("{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.highwayapi.ai/v3/async/minimax-speech-2.8-turbo")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = '<content-type>'
request["Authorization"] = '<authorization>'
request.body = "{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}"

response = http.request(request)
puts response.read_body

{
  "file_id": 123,
  "task_id": "<string>",
  "base_resp": {
    "status_msg": "<string>",
    "status_code": 123
  },
  "task_token": "<string>",
  "usage_characters": 123
}

POST

async

minimax-speech-2.8-turbo

MiniMax Speech 2.8 Turbo Síntese de fala assíncrona

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/minimax-speech-2.8-turbo \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "text_file_id": 123,
  "voice_modify": {
    "pitch": 123,
    "timbre": 123,
    "intensity": 123,
    "sound_effects": "<string>"
  },
  "audio_setting": {
    "format": "<string>",
    "bitrate": 123,
    "channel": 123,
    "audio_sample_rate": 123
  },
  "voice_setting": {
    "vol": 123,
    "pitch": 123,
    "speed": 123,
    "emotion": "<string>",
    "voice_id": "<string>",
    "english_normalization": true
  },
  "aigc_watermark": true,
  "language_boost": "<string>",
  "continuous_sound": true,
  "pronunciation_dict": {
    "tone": [
      "<string>"
    ]
  }
}
'

import requests

url = "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-turbo"

payload = {
    "text": "<string>",
    "text_file_id": 123,
    "voice_modify": {
        "pitch": 123,
        "timbre": 123,
        "intensity": 123,
        "sound_effects": "<string>"
    },
    "audio_setting": {
        "format": "<string>",
        "bitrate": 123,
        "channel": 123,
        "audio_sample_rate": 123
    },
    "voice_setting": {
        "vol": 123,
        "pitch": 123,
        "speed": 123,
        "emotion": "<string>",
        "voice_id": "<string>",
        "english_normalization": True
    },
    "aigc_watermark": True,
    "language_boost": "<string>",
    "continuous_sound": True,
    "pronunciation_dict": { "tone": ["<string>"] }
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': '<content-type>', Authorization: '<authorization>'},
  body: JSON.stringify({
    text: '<string>',
    text_file_id: 123,
    voice_modify: {pitch: 123, timbre: 123, intensity: 123, sound_effects: '<string>'},
    audio_setting: {format: '<string>', bitrate: 123, channel: 123, audio_sample_rate: 123},
    voice_setting: {
      vol: 123,
      pitch: 123,
      speed: 123,
      emotion: '<string>',
      voice_id: '<string>',
      english_normalization: true
    },
    aigc_watermark: true,
    language_boost: '<string>',
    continuous_sound: true,
    pronunciation_dict: {tone: ['<string>']}
  })
};

fetch('https://api.highwayapi.ai/v3/async/minimax-speech-2.8-turbo', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-turbo",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'text' => '<string>',
    'text_file_id' => 123,
    'voice_modify' => [
        'pitch' => 123,
        'timbre' => 123,
        'intensity' => 123,
        'sound_effects' => '<string>'
    ],
    'audio_setting' => [
        'format' => '<string>',
        'bitrate' => 123,
        'channel' => 123,
        'audio_sample_rate' => 123
    ],
    'voice_setting' => [
        'vol' => 123,
        'pitch' => 123,
        'speed' => 123,
        'emotion' => '<string>',
        'voice_id' => '<string>',
        'english_normalization' => true
    ],
    'aigc_watermark' => true,
    'language_boost' => '<string>',
    'continuous_sound' => true,
    'pronunciation_dict' => [
        'tone' => [
                '<string>'
        ]
    ]
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: <authorization>",
    "Content-Type: <content-type>"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.highwayapi.ai/v3/async/minimax-speech-2.8-turbo"

	payload := strings.NewReader("{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "<content-type>")
	req.Header.Add("Authorization", "<authorization>")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.highwayapi.ai/v3/async/minimax-speech-2.8-turbo")
  .header("Content-Type", "<content-type>")
  .header("Authorization", "<authorization>")
  .body("{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.highwayapi.ai/v3/async/minimax-speech-2.8-turbo")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = '<content-type>'
request["Authorization"] = '<authorization>'
request.body = "{\n  \"text\": \"<string>\",\n  \"text_file_id\": 123,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"audio_sample_rate\": 123\n  },\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"english_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}"

response = http.request(request)
puts response.read_body

{
  "file_id": 123,
  "task_id": "<string>",
  "base_resp": {
    "status_msg": "<string>",
    "status_code": 123
  },
  "task_token": "<string>",
  "usage_characters": 123
}

Use esta interface para criar uma tarefa assíncrona de síntese de fala. Oferece suporte a entrada por texto ou arquivo; o texto tem limite máximo de 50 mil caracteres, e arquivos têm limite máximo de 100 mil caracteres.

Esta é uma API assíncrona e retornará apenas o task_id da tarefa assíncrona. Você deve usar esse task_id para solicitar a API de consulta do resultado da tarefa e recuperar o resultado gerado.

Cabeçalhos da requisição

string

obrigatório

Valores enumerados: application/json

string

obrigatório

Formato de autenticação Bearer: Bearer {{API Key}}.

Corpo da requisição

string

Texto do áudio a ser sintetizado, com limite máximo de 50 mil caracteres. Obrigatório escolher um entre este campo e text_file_id

• Tags de interjeições: somente quando o modelo selecionado for speech-2.8-hd ou speech-2.8-turbo, é possível inserir tags de interjeição no texto. Interjeições compatíveis: (laughs) (risada), (chuckle) (risinho), (coughs) (tosse), (clear-throat) (limpar a garganta), (groans) (gemido), (breath) (respiração normal), (pant) (ofegar), (inhale) (inspirar), (exhale) (expirar), (gasps) (inspiração súbita), (sniffs) (fungar), (sighs) (suspiro), (snorts) (bufada pelo nariz), (burps) (arroto), (lip-smacking) (estalar os lábios), (humming) (cantarolar), (hissing) (chiado), (emm) (hum), (whistles) (assobio), (sneezes) (espirro), (crying) (soluço/choro), (applause) (aplausos)

integer

id do arquivo de texto do áudio a ser sintetizado; o tamanho de um único arquivo deve ser menor que 100 mil caracteres. Formatos de arquivo compatíveis: txt, zip. Obrigatório escolher um entre este campo e text; após o envio, o formato será validado automaticamente.
• Arquivo txt: limite de tamanho <100.000 caracteres. Suporta o uso de <#x#> para marcar pausas personalizadas. x é a duração da pausa (unidade: segundos), no intervalo [0.01,99.99], com no máximo duas casas decimais. Observe que a pausa deve ser definida entre dois trechos de texto que possam ser pronunciados, e várias marcações de pausa não podem ser usadas consecutivamente
• Arquivo zip:
• O pacote compactado deve conter arquivos txt ou json no mesmo formato.
• Formato do arquivo json: oferece suporte aos três campos [title, content, extra], que representam, respectivamente, título, corpo do texto e informações adicionais. Se os três campos existirem, serão gerados 3 grupos de resultados, totalizando 9 arquivos, armazenados em uma única pasta. Se algum campo não existir ou seu conteúdo estiver vazio, o resultado correspondente a esse campo não será gerado

object

Ocultar properties

integer

Ajuste de altura (grave/brilhante), intervalo [-100, 100]. Quanto mais próximo de -100, mais grave a voz; quanto mais próximo de 100, mais brilhante a vozIntervalo de valores: [-100, 100]

integer

Ajuste de timbre (encorpado/cristalino), intervalo [-100, 100]. Quanto mais próximo de -100, mais encorpada a voz; quanto mais próximo de 100, mais cristalina a vozIntervalo de valores: [-100, 100]

integer

Ajuste de intensidade (força/suavidade), intervalo [-100, 100]. Quanto mais próximo de -100, mais firme a voz; quanto mais próximo de 100, mais suave a vozIntervalo de valores: [-100, 100]

string

Configuração de efeito sonoro; apenas uma opção pode ser selecionada por vez. Valores opcionais:

spacious_echo (eco em espaço amplo)
auditorium_echo (transmissão de auditório)
lofi_telephone (distorção de telefone)
robotic (voz eletrônica)

Valores opcionais: spacious_echo, auditorium_echo, lofi_telephone, robotic

object

Ocultar properties

string

padrão:"mp3"

Formato do áudio gerado. Intervalo de opções [mp3, pcm, flac], valor padrão mp3Valores opcionais: mp3, pcm, flac

integer

padrão:128000

Taxa de bits do áudio gerado. Intervalo de opções [32000, 64000, 128000, 256000], valor padrão 128000. Este parâmetro só tem efeito para áudio no formato mp3

integer

padrão:2

Número de canais do áudio gerado. Intervalo de opções: [1, 2], em que 1 é mono e 2 é estéreo; o valor padrão é 1

integer

padrão:32000

Taxa de amostragem do áudio gerado. Intervalo de opções [8000, 16000, 22050, 24000, 32000, 44100], valor padrão 32000

object

obrigatório

Ocultar properties

number

padrão:1

Volume do áudio sintetizado; quanto maior o valor, maior o volume. Intervalo de valores (0, 10], valor padrão 1.0Intervalo de valores: [0, 10]

integer

padrão:0

Entonação do áudio sintetizado, intervalo de valores [-12, 12], valor padrão 0, em que 0 é a saída no timbre originalIntervalo de valores: [-12, 12]

number

padrão:1

Velocidade de fala do áudio sintetizado; quanto maior o valor, mais rápida a fala. Intervalo de valores [0.5, 2], valor padrão 1.0Intervalo de valores: [0.5, 2]

string

Controla a emoção da fala sintetizada. O intervalo de parâmetros é [“happy”, “sad”, “angry”, “fearful”, “disgusted”, “surprised”, “calm”, “fluent”, “whisper”], correspondendo respectivamente a 8 emoções: felicidade, tristeza, raiva, medo, nojo, surpresa, neutralidade, expressividade, sussurro
• O modelo corresponderá automaticamente a emoção adequada de acordo com o texto de entrada; em geral, não é necessário especificar manualmente
• Este parâmetro só tem efeito nos modelos speech-2.6-hd, speech-2.6-turbo, speech-01-hd, speech-01-turbo
• As opções fluent, whisper só têm efeito nos modelos speech-2.6-turbo, speech-2.6-hdValores opcionais: happy, sad, angry, fearful, disgusted, surprised, calm, fluent, whisper

string

obrigatório

ID do timbre do áudio sintetizado. Se precisar configurar timbres mistos, defina o parâmetro timber_weights e deixe este parâmetro vazio. Suporta três tipos de timbre: timbres do sistema, timbres clonados e timbres gerados a partir de texto. A seguir estão alguns dos timbres de sistema mais recentes (ID); consulte todos os timbres oficialmente compatíveis
• Chinês:
• moss_audio_ce44fc67-7ce3-11f0-8de5-96e35d26fb85
• moss_audio_aaa1346a-7ce7-11f0-8e61-2e6e3c7ee85d
• Chinese (Mandarin)_Lyrical_Voice
• Chinese (Mandarin)_HK_Flight_Attendant
• Inglês:
• English_Graceful_Lady
• English_Insightful_Speaker
• English_radiant_girl
• English_Persuasive_Man
• moss_audio_6dc281eb-713c-11f0-a447-9613c873494c
• moss_audio_570551b1-735c-11f0-b236-0adeeecad052
• moss_audio_ad5baf92-735f-11f0-8263-fe5a2fe98ec8
• English_Lucky_Robot
• Japonês:
• Japanese_Whisper_Belle
• moss_audio_24875c4a-7be4-11f0-9359-4e72c55db738
• moss_audio_7f4ee608-78ea-11f0-bb73-1e2a4cfcd245
• moss_audio_c1a6a3ac-7be6-11f0-8e8e-36b92fbb4f95

boolean

padrão:false

Oferece suporte à normalização de textos em inglês. Quando ativado, pode melhorar o desempenho em cenários de leitura de números, mas aumentará ligeiramente a latência. Padrão false

boolean

padrão:false

Controla a adição de uma marcação rítmica de áudio ao final do áudio sintetizado; o valor padrão é False. Este parâmetro só tem efeito na síntese não streaming

string

Indica se a capacidade de reconhecimento de determinados idiomas minoritários e dialetos deve ser aprimorada. O valor padrão é null; pode ser definido como auto para permitir que o modelo decida autonomamente.Valores opcionais: Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, auto

boolean

padrão:false

Ative este parâmetro para tornar a conexão entre subfrases mais natural; compatível apenas com os modelos speech-2.8-hd e speech-2.8-turbo

object

Ocultar properties

string[]

Define regras de anotação fonética ou substituição de pronúncia correspondentes a textos ou símbolos que precisam de marcação especial. Em textos em chinês, os tons são representados por números: primeiro tom como 1, segundo tom como 2, terceiro tom como 3, quarto tom como 4, tom neutro como 5 Exemplo: [“燕少飞/(yan4)(shao3)(fei1)”, “omg/oh my god”]

Informações da resposta

integer

ID do arquivo de áudio correspondente retornado após a criação bem-sucedida da tarefa.

• Após a conclusão da tarefa, ele pode ser consultado por meio de file_id. Quando ocorrer erro na requisição, este campo não será retornadoObservação: a URL de download retornada é válida por 9 horas (32400 segundos) a partir da geração. Após expirar, o arquivo ficará inválido e as informações geradas serão perdidas; observe o prazo para baixar as informações

string

Use o task_id para solicitar a API de consulta do resultado da tarefa e recuperar a saída gerada.

object

Ocultar properties

string

obrigatório

Detalhes do status

integer

obrigatório

Código de status

• 0: Normal
• 1002: Limitação de taxa
• 1004: Falha de autenticação
• 1039: Limitação de taxa TPM acionada
• 1042: Caracteres inválidos acima de 10%
• 2013: Erro de parâmetro

string

Informações da chave usadas para concluir a tarefa atual

integer

Número de caracteres faturáveis

Síntese de voz assíncrona MiniMax Speech-2.6-turbo

MiniMax Speech 2.8 Turbo Síntese de voz síncrona

Noções básicas da API

Modelos de linguagem

Imagens

Vídeo

Áudio

MiniMax Speech 2.8 Turbo Síntese de fala assíncrona

Cabeçalhos da requisição

Corpo da requisição

Informações da resposta

​Cabeçalhos da requisição

​Corpo da requisição

​Informações da resposta

Cabeçalhos da requisição

Corpo da requisição

Informações da resposta