Síntese de voz síncrona MiniMax Speech 2.8 HD
Áudio
Síntese de voz síncrona MiniMax Speech 2.8 HD
POST
Síntese de voz síncrona MiniMax Speech 2.8 HD
Converta texto em fala, com suporte a várias vozes, controle de emoção, ajuste de velocidade de fala e outros recursos. O limite de comprimento do texto é inferior a 10000 caracteres; se o texto tiver mais de 3000 caracteres, recomenda-se usar saída em streaming.
Cabeçalhos da requisição
Valores enumerados:
application/jsonFormato de autenticação Bearer: Bearer {{API Key}}.
Corpo da requisição
O texto a ser sintetizado em fala. O limite de comprimento é inferior a 10000 caracteres; se o texto tiver mais de 3000 caracteres, recomenda-se usar saída em streaming. Oferece suporte a troca de parágrafos (quebras de linha), controle de pausas (marcador
<#x#>) e tags de interjeições (como (laughs), (coughs), etc.; compatível apenas com speech-2.8-hd/turbo)Controla se a saída será em streaming. O padrão é false, ou seja, streaming desativado
Parâmetro que controla o formato do resultado de saída. Os valores disponíveis são url e hex; o valor padrão é hex. Este parâmetro só tem efeito em cenários não streaming; em cenários de streaming, apenas o retorno em formato hex é compatível. A url retornada é válida por 24 horasValores disponíveis:
url, hexControla a adição de um identificador de ritmo de áudio ao final do áudio sintetizado. O valor padrão é false. Este parâmetro só tem efeito para síntese não streaming
Define se a capacidade de reconhecimento para idiomas minoritários e dialetos especificados será aprimorada. O valor padrão é null; pode ser definido como auto para permitir que o modelo julgue automaticamenteValores disponíveis:
Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, autoConfiguração de voz mista, com suporte a no máximo 4 vozes misturadas
Controla se o serviço de legendas será ativado, padrão false. Este parâmetro só é válido em cenários de saída não streaming e apenas para os modelos speech-2.6-hd, speech-2.6-turbo, speech-02-turbo, speech-02-hd, speech-01-turbo, speech-01-hd
Ative este parâmetro para tornar a transição entre orações mais natural. Compatível apenas com os modelos speech-2.8-hd e speech-2.8-turbo
Informações da resposta
Objeto de dados sintetizados retornado; pode ser null, portanto é necessário verificar se não está vazio
id desta sessão, usado para ajudar a localizar problemas em consultas/feedback
Código de status e detalhes desta requisição
Informações adicionais do áudio