MiniMax Speech 2.8 Turbo Síntese de voz síncrona
Áudio
MiniMax Speech 2.8 Turbo Síntese de voz síncrona
POST
MiniMax Speech 2.8 Turbo Síntese de voz síncrona
Converte texto em voz, com suporte a várias vozes, controle de emoção, ajuste de velocidade de fala e outros recursos. O comprimento do texto deve ser inferior a 10000 caracteres. Se o comprimento do texto for maior que 3000 caracteres, recomenda-se usar saída em streaming.
Cabeçalhos da requisição
Valores enumerados:
application/jsonFormato de autenticação Bearer: Bearer {{API Key}}.
Corpo da requisição
Texto a ser sintetizado em voz. O comprimento deve ser inferior a 10000 caracteres. Se o comprimento do texto for maior que 3000 caracteres, recomenda-se usar saída em streaming. Suporta troca de parágrafos (quebras de linha), controle de pausas (marcador
<#x#>) e tags de interjeição/expressão (como (laughs), (coughs) etc.; compatível apenas com speech-2.8-hd/turbo)Controla se a saída será em streaming. O padrão é false, ou seja, streaming desativado
Parâmetro que controla o formato do resultado de saída. Valores disponíveis: url, hex; o padrão é hex. Este parâmetro só é efetivo em cenários sem streaming; cenários com streaming só oferecem retorno no formato hex. A url retornada é válida por 24 horasValores disponíveis:
url, hexControla a adição de uma marcação rítmica de áudio ao final do áudio sintetizado. O valor padrão é false. Este parâmetro só é efetivo para síntese sem streaming
Define se a capacidade de reconhecimento de idiomas menos comuns e dialetos especificados será aprimorada. O valor padrão é null; pode ser definido como auto para permitir que o modelo faça a avaliação automaticamenteValores disponíveis:
Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, autoConfiguração de voz misturada, com suporte a mistura de até 4 vozes
Controla se o serviço de legendas será ativado. O valor padrão é false. Este parâmetro é válido apenas em cenários de saída sem streaming e apenas para os modelos speech-2.6-hd, speech-2.6-turbo, speech-02-turbo, speech-02-hd, speech-01-turbo, speech-01-hd
Ative este parâmetro para tornar a transição entre subfrases mais natural. Compatível apenas com os modelos speech-2.8-hd e speech-2.8-turbo
Informações da resposta
Objeto de dados de síntese retornado; pode ser null, portanto é necessário verificar se não está vazio
id desta sessão, usado para ajudar a localizar problemas durante consultas/feedback
Código de status e detalhes desta requisição
Informações adicionais do áudio