Síntese de voz assíncrona MiniMax Speech 2.8 HD
Áudio
Síntese de voz assíncrona MiniMax Speech 2.8 HD
POST
Síntese de voz assíncrona MiniMax Speech 2.8 HD
Use esta API para criar tarefas assíncronas de síntese de voz. Suporta entrada por texto ou arquivo; o limite máximo é de 50 mil caracteres para texto e 100 mil caracteres para arquivos.
Cabeçalhos da solicitação
Valores enumerados:
application/jsonFormato de autenticação Bearer: Bearer {{API Key}}.
Corpo da solicitação
Texto do áudio a ser sintetizado, com limite máximo de 50 mil caracteres. Obrigatório escolher um entre
• Tags de interjeição: somente quando o modelo selecionado for
text e text_file_id• Tags de interjeição: somente quando o modelo selecionado for
speech-2.8-hd ou speech-2.8-turbo, há suporte para inserir tags de interjeição no texto. Interjeições suportadas: (laughs) (risada), (chuckle) (risadinha), (coughs) (tosse), (clear-throat) (limpar a garganta), (groans) (gemido), (breath) (respiração normal), (pant) (ofegar), (inhale) (inspirar), (exhale) (expirar), (gasps) (gasp), (sniffs) (fungar), (sighs) (suspiro), (snorts) (bufar), (burps) (arroto), (lip-smacking) (estalo de lábios), (humming) (cantarolar), (hissing) (sibilo), (emm) (hum), (whistles) (assobio), (sneezes) (espirro), (crying) (soluço), (applause) (aplausos)id do arquivo de texto do áudio a ser sintetizado. O limite de comprimento de um único arquivo é inferior a 100 mil caracteres. Formatos de arquivo suportados: txt, zip. Obrigatório escolher um entre
• Arquivo txt: limite de comprimento <100000 caracteres. Suporta o uso de
• Arquivo zip:
• O pacote compactado deve conter arquivos txt ou json no mesmo formato.
• Formato do arquivo json: suporta três campos, [
text e text_file_id; após o envio, o formato será validado automaticamente.• Arquivo txt: limite de comprimento <100000 caracteres. Suporta o uso de
<#x#> para marcar pausas personalizadas. x é a duração da pausa (unidade: segundos), no intervalo [0.01, 99.99], com no máximo duas casas decimais. Observe que a pausa deve ser definida entre dois trechos de texto que possam ser pronunciados por voz; não é permitido usar várias marcações de pausa consecutivamente• Arquivo zip:
• O pacote compactado deve conter arquivos txt ou json no mesmo formato.
• Formato do arquivo json: suporta três campos, [
title, content, extra], que indicam, respectivamente, título, corpo do texto e informações adicionais. Se os três campos existirem, serão gerados 3 conjuntos de resultados, totalizando 9 arquivos, armazenados juntos em uma única pasta. Se algum campo não existir ou seu conteúdo estiver vazio, o resultado correspondente a esse campo não será geradoControla a adição de uma marcação rítmica de áudio ao final do áudio sintetizado. O valor padrão é False. Este parâmetro é válido apenas para síntese não streaming
Indica se deve aprimorar a capacidade de reconhecimento de idiomas minoritários e dialetos especificados. O valor padrão é
null; pode ser definido como auto para permitir que o modelo decida autonomamente.Valores opcionais: Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, autoAtive este parâmetro para tornar a transição entre subfrases mais natural. Suportado apenas pelos modelos
speech-2.8-hd e speech-2.8-turboInformações de resposta
ID do arquivo de áudio correspondente retornado após a criação bem-sucedida da tarefa.
• Depois que a tarefa for concluída, é possível consultar pelo file_id. Quando ocorrer um erro na solicitação, este campo não será retornadoObservação: a URL de download retornada é válida por 9 horas (32400 segundos) a partir da geração. Após expirar, o arquivo ficará inválido e as informações geradas serão perdidas; preste atenção ao prazo das informações de download
• Depois que a tarefa for concluída, é possível consultar pelo file_id. Quando ocorrer um erro na solicitação, este campo não será retornadoObservação: a URL de download retornada é válida por 9 horas (32400 segundos) a partir da geração. Após expirar, o arquivo ficará inválido e as informações geradas serão perdidas; preste atenção ao prazo das informações de download
Use o task_id para solicitar a API de consulta de resultado da tarefa para recuperar a saída gerada.
Informações da chave usadas para concluir a tarefa atual
Número de caracteres faturáveis