Pular para o conteúdo principal
POST
/
v3
/
minimax-speech-2.8-turbo
MiniMax Speech 2.8 Turbo Síntese de voz síncrona
curl --request POST \
  --url https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "stream": true,
  "voice_modify": {
    "pitch": 123,
    "timbre": 123,
    "intensity": 123,
    "sound_effects": "<string>"
  },
  "audio_setting": {
    "format": "<string>",
    "bitrate": 123,
    "channel": 123,
    "force_cbr": true,
    "sample_rate": 123
  },
  "output_format": "<string>",
  "voice_setting": {
    "vol": 123,
    "pitch": 123,
    "speed": 123,
    "emotion": "<string>",
    "voice_id": "<string>",
    "latex_read": true,
    "text_normalization": true
  },
  "aigc_watermark": true,
  "language_boost": "<string>",
  "stream_options": {
    "exclude_aggregated_audio": true
  },
  "timber_weights": [
    {
      "weight": 123,
      "voice_id": "<string>"
    }
  ],
  "subtitle_enable": true,
  "continuous_sound": true,
  "pronunciation_dict": {
    "tone": [
      {}
    ]
  }
}
'
{
  "data": {},
  "trace_id": "<string>",
  "base_resp": {},
  "extra_info": {}
}
Converte texto em voz, com suporte a várias vozes, controle de emoção, ajuste de velocidade de fala e outros recursos. O comprimento do texto deve ser inferior a 10000 caracteres. Se o comprimento do texto for maior que 3000 caracteres, recomenda-se usar saída em streaming.

Cabeçalhos da requisição

Content-Type
string
obrigatório
Valores enumerados: application/json
Authorization
string
obrigatório
Formato de autenticação Bearer: Bearer {{API Key}}.

Corpo da requisição

text
string
obrigatório
Texto a ser sintetizado em voz. O comprimento deve ser inferior a 10000 caracteres. Se o comprimento do texto for maior que 3000 caracteres, recomenda-se usar saída em streaming. Suporta troca de parágrafos (quebras de linha), controle de pausas (marcador &lt;#x#&gt;) e tags de interjeição/expressão (como (laughs), (coughs) etc.; compatível apenas com speech-2.8-hd/turbo)
stream
boolean
padrão:false
Controla se a saída será em streaming. O padrão é false, ou seja, streaming desativado
voice_modify
object
audio_setting
object
output_format
string
padrão:"hex"
Parâmetro que controla o formato do resultado de saída. Valores disponíveis: url, hex; o padrão é hex. Este parâmetro só é efetivo em cenários sem streaming; cenários com streaming só oferecem retorno no formato hex. A url retornada é válida por 24 horasValores disponíveis: url, hex
voice_setting
object
aigc_watermark
boolean
padrão:false
Controla a adição de uma marcação rítmica de áudio ao final do áudio sintetizado. O valor padrão é false. Este parâmetro só é efetivo para síntese sem streaming
language_boost
string
Define se a capacidade de reconhecimento de idiomas menos comuns e dialetos especificados será aprimorada. O valor padrão é null; pode ser definido como auto para permitir que o modelo faça a avaliação automaticamenteValores disponíveis: Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, auto
stream_options
object
timber_weights
array
Configuração de voz misturada, com suporte a mistura de até 4 vozes
subtitle_enable
boolean
padrão:false
Controla se o serviço de legendas será ativado. O valor padrão é false. Este parâmetro é válido apenas em cenários de saída sem streaming e apenas para os modelos speech-2.6-hd, speech-2.6-turbo, speech-02-turbo, speech-02-hd, speech-01-turbo, speech-01-hd
continuous_sound
boolean
padrão:false
Ative este parâmetro para tornar a transição entre subfrases mais natural. Compatível apenas com os modelos speech-2.8-hd e speech-2.8-turbo
pronunciation_dict
object

Informações da resposta

data
object
Objeto de dados de síntese retornado; pode ser null, portanto é necessário verificar se não está vazio
trace_id
string
id desta sessão, usado para ajudar a localizar problemas durante consultas/feedback
base_resp
object
Código de status e detalhes desta requisição
extra_info
object
Informações adicionais do áudio