ElevenLabs Texto para fala Flash V2

curl --request POST \
  --url https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "text": "<string>",
  "stream": true,
  "voice_id": "<string>",
  "next_text": "<string>",
  "language_code": "<string>",
  "output_format": "<string>",
  "previous_text": "<string>",
  "use_pvc_as_ivc": true,
  "voice_settings": {
    "speed": 123,
    "style": 123,
    "stability": 123,
    "similarity_boost": 123,
    "use_speaker_boost": true
  },
  "next_request_ids": [
    "<string>"
  ],
  "previous_request_ids": [
    "<string>"
  ],
  "apply_text_normalization": "<string>",
  "apply_language_text_normalization": true,
  "pronunciation_dictionary_locators": [
    {
      "version_id": "<string>",
      "pronunciation_dictionary_id": "<string>"
    }
  ]
}
'

import requests

url = "https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2"

payload = {
    "seed": 123,
    "text": "<string>",
    "stream": True,
    "voice_id": "<string>",
    "next_text": "<string>",
    "language_code": "<string>",
    "output_format": "<string>",
    "previous_text": "<string>",
    "use_pvc_as_ivc": True,
    "voice_settings": {
        "speed": 123,
        "style": 123,
        "stability": 123,
        "similarity_boost": 123,
        "use_speaker_boost": True
    },
    "next_request_ids": ["<string>"],
    "previous_request_ids": ["<string>"],
    "apply_text_normalization": "<string>",
    "apply_language_text_normalization": True,
    "pronunciation_dictionary_locators": [
        {
            "version_id": "<string>",
            "pronunciation_dictionary_id": "<string>"
        }
    ]
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': '<content-type>', Authorization: '<authorization>'},
  body: JSON.stringify({
    seed: 123,
    text: '<string>',
    stream: true,
    voice_id: '<string>',
    next_text: '<string>',
    language_code: '<string>',
    output_format: '<string>',
    previous_text: '<string>',
    use_pvc_as_ivc: true,
    voice_settings: {
      speed: 123,
      style: 123,
      stability: 123,
      similarity_boost: 123,
      use_speaker_boost: true
    },
    next_request_ids: ['<string>'],
    previous_request_ids: ['<string>'],
    apply_text_normalization: '<string>',
    apply_language_text_normalization: true,
    pronunciation_dictionary_locators: [{version_id: '<string>', pronunciation_dictionary_id: '<string>'}]
  })
};

fetch('https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'seed' => 123,
    'text' => '<string>',
    'stream' => true,
    'voice_id' => '<string>',
    'next_text' => '<string>',
    'language_code' => '<string>',
    'output_format' => '<string>',
    'previous_text' => '<string>',
    'use_pvc_as_ivc' => true,
    'voice_settings' => [
        'speed' => 123,
        'style' => 123,
        'stability' => 123,
        'similarity_boost' => 123,
        'use_speaker_boost' => true
    ],
    'next_request_ids' => [
        '<string>'
    ],
    'previous_request_ids' => [
        '<string>'
    ],
    'apply_text_normalization' => '<string>',
    'apply_language_text_normalization' => true,
    'pronunciation_dictionary_locators' => [
        [
                'version_id' => '<string>',
                'pronunciation_dictionary_id' => '<string>'
        ]
    ]
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: <authorization>",
    "Content-Type: <content-type>"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2"

	payload := strings.NewReader("{\n  \"seed\": 123,\n  \"text\": \"<string>\",\n  \"stream\": true,\n  \"voice_id\": \"<string>\",\n  \"next_text\": \"<string>\",\n  \"language_code\": \"<string>\",\n  \"output_format\": \"<string>\",\n  \"previous_text\": \"<string>\",\n  \"use_pvc_as_ivc\": true,\n  \"voice_settings\": {\n    \"speed\": 123,\n    \"style\": 123,\n    \"stability\": 123,\n    \"similarity_boost\": 123,\n    \"use_speaker_boost\": true\n  },\n  \"next_request_ids\": [\n    \"<string>\"\n  ],\n  \"previous_request_ids\": [\n    \"<string>\"\n  ],\n  \"apply_text_normalization\": \"<string>\",\n  \"apply_language_text_normalization\": true,\n  \"pronunciation_dictionary_locators\": [\n    {\n      \"version_id\": \"<string>\",\n      \"pronunciation_dictionary_id\": \"<string>\"\n    }\n  ]\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "<content-type>")
	req.Header.Add("Authorization", "<authorization>")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2")
  .header("Content-Type", "<content-type>")
  .header("Authorization", "<authorization>")
  .body("{\n  \"seed\": 123,\n  \"text\": \"<string>\",\n  \"stream\": true,\n  \"voice_id\": \"<string>\",\n  \"next_text\": \"<string>\",\n  \"language_code\": \"<string>\",\n  \"output_format\": \"<string>\",\n  \"previous_text\": \"<string>\",\n  \"use_pvc_as_ivc\": true,\n  \"voice_settings\": {\n    \"speed\": 123,\n    \"style\": 123,\n    \"stability\": 123,\n    \"similarity_boost\": 123,\n    \"use_speaker_boost\": true\n  },\n  \"next_request_ids\": [\n    \"<string>\"\n  ],\n  \"previous_request_ids\": [\n    \"<string>\"\n  ],\n  \"apply_text_normalization\": \"<string>\",\n  \"apply_language_text_normalization\": true,\n  \"pronunciation_dictionary_locators\": [\n    {\n      \"version_id\": \"<string>\",\n      \"pronunciation_dictionary_id\": \"<string>\"\n    }\n  ]\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = '<content-type>'
request["Authorization"] = '<authorization>'
request.body = "{\n  \"seed\": 123,\n  \"text\": \"<string>\",\n  \"stream\": true,\n  \"voice_id\": \"<string>\",\n  \"next_text\": \"<string>\",\n  \"language_code\": \"<string>\",\n  \"output_format\": \"<string>\",\n  \"previous_text\": \"<string>\",\n  \"use_pvc_as_ivc\": true,\n  \"voice_settings\": {\n    \"speed\": 123,\n    \"style\": 123,\n    \"stability\": 123,\n    \"similarity_boost\": 123,\n    \"use_speaker_boost\": true\n  },\n  \"next_request_ids\": [\n    \"<string>\"\n  ],\n  \"previous_request_ids\": [\n    \"<string>\"\n  ],\n  \"apply_text_normalization\": \"<string>\",\n  \"apply_language_text_normalization\": true,\n  \"pronunciation_dictionary_locators\": [\n    {\n      \"version_id\": \"<string>\",\n      \"pronunciation_dictionary_id\": \"<string>\"\n    }\n  ]\n}"

response = http.request(request)
puts response.read_body

POST

elevenlabs-tts-flash-v2

ElevenLabs Texto para fala Flash V2

curl --request POST \
  --url https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "text": "<string>",
  "stream": true,
  "voice_id": "<string>",
  "next_text": "<string>",
  "language_code": "<string>",
  "output_format": "<string>",
  "previous_text": "<string>",
  "use_pvc_as_ivc": true,
  "voice_settings": {
    "speed": 123,
    "style": 123,
    "stability": 123,
    "similarity_boost": 123,
    "use_speaker_boost": true
  },
  "next_request_ids": [
    "<string>"
  ],
  "previous_request_ids": [
    "<string>"
  ],
  "apply_text_normalization": "<string>",
  "apply_language_text_normalization": true,
  "pronunciation_dictionary_locators": [
    {
      "version_id": "<string>",
      "pronunciation_dictionary_id": "<string>"
    }
  ]
}
'

import requests

url = "https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2"

payload = {
    "seed": 123,
    "text": "<string>",
    "stream": True,
    "voice_id": "<string>",
    "next_text": "<string>",
    "language_code": "<string>",
    "output_format": "<string>",
    "previous_text": "<string>",
    "use_pvc_as_ivc": True,
    "voice_settings": {
        "speed": 123,
        "style": 123,
        "stability": 123,
        "similarity_boost": 123,
        "use_speaker_boost": True
    },
    "next_request_ids": ["<string>"],
    "previous_request_ids": ["<string>"],
    "apply_text_normalization": "<string>",
    "apply_language_text_normalization": True,
    "pronunciation_dictionary_locators": [
        {
            "version_id": "<string>",
            "pronunciation_dictionary_id": "<string>"
        }
    ]
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': '<content-type>', Authorization: '<authorization>'},
  body: JSON.stringify({
    seed: 123,
    text: '<string>',
    stream: true,
    voice_id: '<string>',
    next_text: '<string>',
    language_code: '<string>',
    output_format: '<string>',
    previous_text: '<string>',
    use_pvc_as_ivc: true,
    voice_settings: {
      speed: 123,
      style: 123,
      stability: 123,
      similarity_boost: 123,
      use_speaker_boost: true
    },
    next_request_ids: ['<string>'],
    previous_request_ids: ['<string>'],
    apply_text_normalization: '<string>',
    apply_language_text_normalization: true,
    pronunciation_dictionary_locators: [{version_id: '<string>', pronunciation_dictionary_id: '<string>'}]
  })
};

fetch('https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'seed' => 123,
    'text' => '<string>',
    'stream' => true,
    'voice_id' => '<string>',
    'next_text' => '<string>',
    'language_code' => '<string>',
    'output_format' => '<string>',
    'previous_text' => '<string>',
    'use_pvc_as_ivc' => true,
    'voice_settings' => [
        'speed' => 123,
        'style' => 123,
        'stability' => 123,
        'similarity_boost' => 123,
        'use_speaker_boost' => true
    ],
    'next_request_ids' => [
        '<string>'
    ],
    'previous_request_ids' => [
        '<string>'
    ],
    'apply_text_normalization' => '<string>',
    'apply_language_text_normalization' => true,
    'pronunciation_dictionary_locators' => [
        [
                'version_id' => '<string>',
                'pronunciation_dictionary_id' => '<string>'
        ]
    ]
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: <authorization>",
    "Content-Type: <content-type>"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2"

	payload := strings.NewReader("{\n  \"seed\": 123,\n  \"text\": \"<string>\",\n  \"stream\": true,\n  \"voice_id\": \"<string>\",\n  \"next_text\": \"<string>\",\n  \"language_code\": \"<string>\",\n  \"output_format\": \"<string>\",\n  \"previous_text\": \"<string>\",\n  \"use_pvc_as_ivc\": true,\n  \"voice_settings\": {\n    \"speed\": 123,\n    \"style\": 123,\n    \"stability\": 123,\n    \"similarity_boost\": 123,\n    \"use_speaker_boost\": true\n  },\n  \"next_request_ids\": [\n    \"<string>\"\n  ],\n  \"previous_request_ids\": [\n    \"<string>\"\n  ],\n  \"apply_text_normalization\": \"<string>\",\n  \"apply_language_text_normalization\": true,\n  \"pronunciation_dictionary_locators\": [\n    {\n      \"version_id\": \"<string>\",\n      \"pronunciation_dictionary_id\": \"<string>\"\n    }\n  ]\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "<content-type>")
	req.Header.Add("Authorization", "<authorization>")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2")
  .header("Content-Type", "<content-type>")
  .header("Authorization", "<authorization>")
  .body("{\n  \"seed\": 123,\n  \"text\": \"<string>\",\n  \"stream\": true,\n  \"voice_id\": \"<string>\",\n  \"next_text\": \"<string>\",\n  \"language_code\": \"<string>\",\n  \"output_format\": \"<string>\",\n  \"previous_text\": \"<string>\",\n  \"use_pvc_as_ivc\": true,\n  \"voice_settings\": {\n    \"speed\": 123,\n    \"style\": 123,\n    \"stability\": 123,\n    \"similarity_boost\": 123,\n    \"use_speaker_boost\": true\n  },\n  \"next_request_ids\": [\n    \"<string>\"\n  ],\n  \"previous_request_ids\": [\n    \"<string>\"\n  ],\n  \"apply_text_normalization\": \"<string>\",\n  \"apply_language_text_normalization\": true,\n  \"pronunciation_dictionary_locators\": [\n    {\n      \"version_id\": \"<string>\",\n      \"pronunciation_dictionary_id\": \"<string>\"\n    }\n  ]\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = '<content-type>'
request["Authorization"] = '<authorization>'
request.body = "{\n  \"seed\": 123,\n  \"text\": \"<string>\",\n  \"stream\": true,\n  \"voice_id\": \"<string>\",\n  \"next_text\": \"<string>\",\n  \"language_code\": \"<string>\",\n  \"output_format\": \"<string>\",\n  \"previous_text\": \"<string>\",\n  \"use_pvc_as_ivc\": true,\n  \"voice_settings\": {\n    \"speed\": 123,\n    \"style\": 123,\n    \"stability\": 123,\n    \"similarity_boost\": 123,\n    \"use_speaker_boost\": true\n  },\n  \"next_request_ids\": [\n    \"<string>\"\n  ],\n  \"previous_request_ids\": [\n    \"<string>\"\n  ],\n  \"apply_text_normalization\": \"<string>\",\n  \"apply_language_text_normalization\": true,\n  \"pronunciation_dictionary_locators\": [\n    {\n      \"version_id\": \"<string>\",\n      \"pronunciation_dictionary_id\": \"<string>\"\n    }\n  ]\n}"

response = http.request(request)
puts response.read_body

Converta texto em fala usando a voz de sua escolha e retorne o áudio.

Cabeçalhos da solicitação

string

obrigatório

Valores enumerados: application/json

string

obrigatório

Formato de autenticação Bearer: Bearer {{API Key}}.

Corpo da solicitação

integer

Se especificado, o sistema tentará amostrar de forma determinística. Solicitações repetidas com o mesmo seed e os mesmos parâmetros devem retornar o mesmo resultado, mas a determinismo total não é garantido.Intervalo de valores: [0, 4294967295]

string

obrigatório

O texto a ser convertido em fala.

boolean

Se deve ativar o modo Stream

string

obrigatório

O ID da voz a ser usada.

string

O texto após o texto da solicitação atual. Usado para melhorar a continuidade da fala ao concatenar várias gerações.

string

O código de idioma (ISO 639-1) usado para o modelo e a normalização de texto. Se o modelo não oferecer suporte a esse código de idioma, um erro será retornado.

string

padrão:"mp3_44100_128"

O formato de saída do áudio gerado. O formato é codec_sample_rate_bitrate. A taxa de bits de 192kbps para MP3 exige uma conta Creator ou superior, e a taxa de amostragem de 44,1kHz para PCM exige uma conta Pro ou superior.Valores opcionais: mp3_22050_32, mp3_24000_48, mp3_44100_32, mp3_44100_64, mp3_44100_96, mp3_44100_128, mp3_44100_192, pcm_8000, pcm_16000, pcm_22050, pcm_24000, pcm_32000, pcm_44100, pcm_48000, ulaw_8000, alaw_8000, opus_48000_32, opus_48000_64, opus_48000_96, opus_48000_128, opus_48000_192

string

O texto antes do texto da solicitação atual. Usado para melhorar a continuidade da fala ao concatenar várias gerações.

boolean

padrão:false

Se for true, use a versão IVC da voz em vez da versão PVC. Esta é uma solução temporária para a maior latência da versão PVC.

object

Ocultar properties

number

padrão:1

Ajusta a velocidade da fala. 1.0 é a velocidade padrão; valores menores que 1.0 desaceleram a fala, e valores maiores que 1.0 aceleram a fala.

number

padrão:0

Determina o grau de exagero do estilo da voz. Tenta amplificar o estilo do falante original. Quando definido como um valor diferente de 0, consome mais recursos computacionais e pode aumentar a latência.

number

Determina a estabilidade da geração de fala e a aleatoriedade entre cada geração. Valores mais baixos proporcionam uma gama emocional mais ampla, enquanto valores mais altos podem resultar em uma fala monótona.

number

Determina o quanto a IA tenta se aproximar da voz original ao replicá-la.

boolean

padrão:true

Aumenta a semelhança com o falante original. Requer uma carga computacional um pouco maior e aumentará a latência.

string[]

Lista de request_id das amostras subsequentes. Usada para manter a continuidade da fala ao gerar novamente amostras. É possível enviar no máximo 3 request_id.Comprimento do array: 0 - 3

string[]

Lista de request_id das amostras geradas antes da geração atual. Pode ser usada para melhorar a continuidade da fala. É possível enviar no máximo 3 request_id.Comprimento do array: 0 - 3

string

padrão:"auto"

Controla a normalização de texto. ‘auto’ é decidido pelo sistema, ‘on’ sempre normaliza, e ‘off’ ignora a normalização.Valores opcionais: auto, on, off

boolean

padrão:false

Controla a normalização de texto específica do idioma para alguns idiomas compatíveis, a fim de obter uma pronúncia mais natural. Aviso: pode aumentar significativamente a latência. Atualmente, apenas japonês é compatível.

object[]

Lista de localizadores de dicionário de pronúncia (id, version_id) que devem ser aplicados ao texto. Aplicados em ordem. Cada solicitação pode ter no máximo 3 localizadores.Comprimento do array: 0 - 3

Ocultar properties

string

O ID da versão do dicionário de pronúncia. Se não for especificado, a versão mais recente será usada.

string

obrigatório

O ID do dicionário de pronúncia.

Informações da resposta

Arquivo de áudio gerado Formato: binary

ElevenLabs Conversão de fala em texto V2

ElevenLabs Texto para Fala Flash V2.5

Noções básicas da API

Modelos de linguagem

Imagens

Vídeo

Áudio

ElevenLabs Texto para fala Flash V2

Cabeçalhos da solicitação

Corpo da solicitação

Informações da resposta

​Cabeçalhos da solicitação

​Corpo da solicitação

​Informações da resposta

Cabeçalhos da solicitação

Corpo da solicitação

Informações da resposta