MiniMax Speech 2.8 Turbo synchrone Sprachsynthese

curl --request POST \
  --url https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "stream": true,
  "voice_modify": {
    "pitch": 123,
    "timbre": 123,
    "intensity": 123,
    "sound_effects": "<string>"
  },
  "audio_setting": {
    "format": "<string>",
    "bitrate": 123,
    "channel": 123,
    "force_cbr": true,
    "sample_rate": 123
  },
  "output_format": "<string>",
  "voice_setting": {
    "vol": 123,
    "pitch": 123,
    "speed": 123,
    "emotion": "<string>",
    "voice_id": "<string>",
    "latex_read": true,
    "text_normalization": true
  },
  "aigc_watermark": true,
  "language_boost": "<string>",
  "stream_options": {
    "exclude_aggregated_audio": true
  },
  "timber_weights": [
    {
      "weight": 123,
      "voice_id": "<string>"
    }
  ],
  "subtitle_enable": true,
  "continuous_sound": true,
  "pronunciation_dict": {
    "tone": [
      "<string>"
    ]
  }
}
'

import requests

url = "https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo"

payload = {
    "text": "<string>",
    "stream": True,
    "voice_modify": {
        "pitch": 123,
        "timbre": 123,
        "intensity": 123,
        "sound_effects": "<string>"
    },
    "audio_setting": {
        "format": "<string>",
        "bitrate": 123,
        "channel": 123,
        "force_cbr": True,
        "sample_rate": 123
    },
    "output_format": "<string>",
    "voice_setting": {
        "vol": 123,
        "pitch": 123,
        "speed": 123,
        "emotion": "<string>",
        "voice_id": "<string>",
        "latex_read": True,
        "text_normalization": True
    },
    "aigc_watermark": True,
    "language_boost": "<string>",
    "stream_options": { "exclude_aggregated_audio": True },
    "timber_weights": [
        {
            "weight": 123,
            "voice_id": "<string>"
        }
    ],
    "subtitle_enable": True,
    "continuous_sound": True,
    "pronunciation_dict": { "tone": ["<string>"] }
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': '<content-type>', Authorization: '<authorization>'},
  body: JSON.stringify({
    text: '<string>',
    stream: true,
    voice_modify: {pitch: 123, timbre: 123, intensity: 123, sound_effects: '<string>'},
    audio_setting: {
      format: '<string>',
      bitrate: 123,
      channel: 123,
      force_cbr: true,
      sample_rate: 123
    },
    output_format: '<string>',
    voice_setting: {
      vol: 123,
      pitch: 123,
      speed: 123,
      emotion: '<string>',
      voice_id: '<string>',
      latex_read: true,
      text_normalization: true
    },
    aigc_watermark: true,
    language_boost: '<string>',
    stream_options: {exclude_aggregated_audio: true},
    timber_weights: [{weight: 123, voice_id: '<string>'}],
    subtitle_enable: true,
    continuous_sound: true,
    pronunciation_dict: {tone: ['<string>']}
  })
};

fetch('https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'text' => '<string>',
    'stream' => true,
    'voice_modify' => [
        'pitch' => 123,
        'timbre' => 123,
        'intensity' => 123,
        'sound_effects' => '<string>'
    ],
    'audio_setting' => [
        'format' => '<string>',
        'bitrate' => 123,
        'channel' => 123,
        'force_cbr' => true,
        'sample_rate' => 123
    ],
    'output_format' => '<string>',
    'voice_setting' => [
        'vol' => 123,
        'pitch' => 123,
        'speed' => 123,
        'emotion' => '<string>',
        'voice_id' => '<string>',
        'latex_read' => true,
        'text_normalization' => true
    ],
    'aigc_watermark' => true,
    'language_boost' => '<string>',
    'stream_options' => [
        'exclude_aggregated_audio' => true
    ],
    'timber_weights' => [
        [
                'weight' => 123,
                'voice_id' => '<string>'
        ]
    ],
    'subtitle_enable' => true,
    'continuous_sound' => true,
    'pronunciation_dict' => [
        'tone' => [
                '<string>'
        ]
    ]
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: <authorization>",
    "Content-Type: <content-type>"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo"

	payload := strings.NewReader("{\n  \"text\": \"<string>\",\n  \"stream\": true,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"force_cbr\": true,\n    \"sample_rate\": 123\n  },\n  \"output_format\": \"<string>\",\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"latex_read\": true,\n    \"text_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"stream_options\": {\n    \"exclude_aggregated_audio\": true\n  },\n  \"timber_weights\": [\n    {\n      \"weight\": 123,\n      \"voice_id\": \"<string>\"\n    }\n  ],\n  \"subtitle_enable\": true,\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "<content-type>")
	req.Header.Add("Authorization", "<authorization>")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo")
  .header("Content-Type", "<content-type>")
  .header("Authorization", "<authorization>")
  .body("{\n  \"text\": \"<string>\",\n  \"stream\": true,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"force_cbr\": true,\n    \"sample_rate\": 123\n  },\n  \"output_format\": \"<string>\",\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"latex_read\": true,\n    \"text_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"stream_options\": {\n    \"exclude_aggregated_audio\": true\n  },\n  \"timber_weights\": [\n    {\n      \"weight\": 123,\n      \"voice_id\": \"<string>\"\n    }\n  ],\n  \"subtitle_enable\": true,\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = '<content-type>'
request["Authorization"] = '<authorization>'
request.body = "{\n  \"text\": \"<string>\",\n  \"stream\": true,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"force_cbr\": true,\n    \"sample_rate\": 123\n  },\n  \"output_format\": \"<string>\",\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"latex_read\": true,\n    \"text_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"stream_options\": {\n    \"exclude_aggregated_audio\": true\n  },\n  \"timber_weights\": [\n    {\n      \"weight\": 123,\n      \"voice_id\": \"<string>\"\n    }\n  ],\n  \"subtitle_enable\": true,\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}"

response = http.request(request)
puts response.read_body

{
  "data": {},
  "trace_id": "<string>",
  "base_resp": {},
  "extra_info": {}
}

POST

minimax-speech-2.8-turbo

MiniMax Speech 2.8 Turbo synchrone Sprachsynthese

curl --request POST \
  --url https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "stream": true,
  "voice_modify": {
    "pitch": 123,
    "timbre": 123,
    "intensity": 123,
    "sound_effects": "<string>"
  },
  "audio_setting": {
    "format": "<string>",
    "bitrate": 123,
    "channel": 123,
    "force_cbr": true,
    "sample_rate": 123
  },
  "output_format": "<string>",
  "voice_setting": {
    "vol": 123,
    "pitch": 123,
    "speed": 123,
    "emotion": "<string>",
    "voice_id": "<string>",
    "latex_read": true,
    "text_normalization": true
  },
  "aigc_watermark": true,
  "language_boost": "<string>",
  "stream_options": {
    "exclude_aggregated_audio": true
  },
  "timber_weights": [
    {
      "weight": 123,
      "voice_id": "<string>"
    }
  ],
  "subtitle_enable": true,
  "continuous_sound": true,
  "pronunciation_dict": {
    "tone": [
      "<string>"
    ]
  }
}
'

import requests

url = "https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo"

payload = {
    "text": "<string>",
    "stream": True,
    "voice_modify": {
        "pitch": 123,
        "timbre": 123,
        "intensity": 123,
        "sound_effects": "<string>"
    },
    "audio_setting": {
        "format": "<string>",
        "bitrate": 123,
        "channel": 123,
        "force_cbr": True,
        "sample_rate": 123
    },
    "output_format": "<string>",
    "voice_setting": {
        "vol": 123,
        "pitch": 123,
        "speed": 123,
        "emotion": "<string>",
        "voice_id": "<string>",
        "latex_read": True,
        "text_normalization": True
    },
    "aigc_watermark": True,
    "language_boost": "<string>",
    "stream_options": { "exclude_aggregated_audio": True },
    "timber_weights": [
        {
            "weight": 123,
            "voice_id": "<string>"
        }
    ],
    "subtitle_enable": True,
    "continuous_sound": True,
    "pronunciation_dict": { "tone": ["<string>"] }
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {'Content-Type': '<content-type>', Authorization: '<authorization>'},
  body: JSON.stringify({
    text: '<string>',
    stream: true,
    voice_modify: {pitch: 123, timbre: 123, intensity: 123, sound_effects: '<string>'},
    audio_setting: {
      format: '<string>',
      bitrate: 123,
      channel: 123,
      force_cbr: true,
      sample_rate: 123
    },
    output_format: '<string>',
    voice_setting: {
      vol: 123,
      pitch: 123,
      speed: 123,
      emotion: '<string>',
      voice_id: '<string>',
      latex_read: true,
      text_normalization: true
    },
    aigc_watermark: true,
    language_boost: '<string>',
    stream_options: {exclude_aggregated_audio: true},
    timber_weights: [{weight: 123, voice_id: '<string>'}],
    subtitle_enable: true,
    continuous_sound: true,
    pronunciation_dict: {tone: ['<string>']}
  })
};

fetch('https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'text' => '<string>',
    'stream' => true,
    'voice_modify' => [
        'pitch' => 123,
        'timbre' => 123,
        'intensity' => 123,
        'sound_effects' => '<string>'
    ],
    'audio_setting' => [
        'format' => '<string>',
        'bitrate' => 123,
        'channel' => 123,
        'force_cbr' => true,
        'sample_rate' => 123
    ],
    'output_format' => '<string>',
    'voice_setting' => [
        'vol' => 123,
        'pitch' => 123,
        'speed' => 123,
        'emotion' => '<string>',
        'voice_id' => '<string>',
        'latex_read' => true,
        'text_normalization' => true
    ],
    'aigc_watermark' => true,
    'language_boost' => '<string>',
    'stream_options' => [
        'exclude_aggregated_audio' => true
    ],
    'timber_weights' => [
        [
                'weight' => 123,
                'voice_id' => '<string>'
        ]
    ],
    'subtitle_enable' => true,
    'continuous_sound' => true,
    'pronunciation_dict' => [
        'tone' => [
                '<string>'
        ]
    ]
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: <authorization>",
    "Content-Type: <content-type>"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo"

	payload := strings.NewReader("{\n  \"text\": \"<string>\",\n  \"stream\": true,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"force_cbr\": true,\n    \"sample_rate\": 123\n  },\n  \"output_format\": \"<string>\",\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"latex_read\": true,\n    \"text_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"stream_options\": {\n    \"exclude_aggregated_audio\": true\n  },\n  \"timber_weights\": [\n    {\n      \"weight\": 123,\n      \"voice_id\": \"<string>\"\n    }\n  ],\n  \"subtitle_enable\": true,\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Content-Type", "<content-type>")
	req.Header.Add("Authorization", "<authorization>")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo")
  .header("Content-Type", "<content-type>")
  .header("Authorization", "<authorization>")
  .body("{\n  \"text\": \"<string>\",\n  \"stream\": true,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"force_cbr\": true,\n    \"sample_rate\": 123\n  },\n  \"output_format\": \"<string>\",\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"latex_read\": true,\n    \"text_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"stream_options\": {\n    \"exclude_aggregated_audio\": true\n  },\n  \"timber_weights\": [\n    {\n      \"weight\": 123,\n      \"voice_id\": \"<string>\"\n    }\n  ],\n  \"subtitle_enable\": true,\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Content-Type"] = '<content-type>'
request["Authorization"] = '<authorization>'
request.body = "{\n  \"text\": \"<string>\",\n  \"stream\": true,\n  \"voice_modify\": {\n    \"pitch\": 123,\n    \"timbre\": 123,\n    \"intensity\": 123,\n    \"sound_effects\": \"<string>\"\n  },\n  \"audio_setting\": {\n    \"format\": \"<string>\",\n    \"bitrate\": 123,\n    \"channel\": 123,\n    \"force_cbr\": true,\n    \"sample_rate\": 123\n  },\n  \"output_format\": \"<string>\",\n  \"voice_setting\": {\n    \"vol\": 123,\n    \"pitch\": 123,\n    \"speed\": 123,\n    \"emotion\": \"<string>\",\n    \"voice_id\": \"<string>\",\n    \"latex_read\": true,\n    \"text_normalization\": true\n  },\n  \"aigc_watermark\": true,\n  \"language_boost\": \"<string>\",\n  \"stream_options\": {\n    \"exclude_aggregated_audio\": true\n  },\n  \"timber_weights\": [\n    {\n      \"weight\": 123,\n      \"voice_id\": \"<string>\"\n    }\n  ],\n  \"subtitle_enable\": true,\n  \"continuous_sound\": true,\n  \"pronunciation_dict\": {\n    \"tone\": [\n      \"<string>\"\n    ]\n  }\n}"

response = http.request(request)
puts response.read_body

{
  "data": {},
  "trace_id": "<string>",
  "base_resp": {},
  "extra_info": {}
}

Konvertiert Text in Sprache und unterstützt mehrere Stimmen, Emotionssteuerung, Anpassung der Sprechgeschwindigkeit und weitere Funktionen. Die Textlänge muss unter 10000 Zeichen liegen. Wenn die Textlänge mehr als 3000 Zeichen beträgt, wird die Verwendung einer Streaming-Ausgabe empfohlen.

Anfrageheader

string

erforderlich

Enumerationswert: application/json

string

erforderlich

Bearer-Authentifizierungsformat: Bearer {{API-Schlüssel}}.

Anfragetext

string

erforderlich

Der Text, für den Sprache synthetisiert werden soll. Die Längenbegrenzung liegt unter 10000 Zeichen. Wenn die Textlänge mehr als 3000 Zeichen beträgt, wird die Verwendung einer Streaming-Ausgabe empfohlen. Unterstützt Absatzwechsel (Zeilenumbrüche), Pausensteuerung (<#x#>-Markierung) und Füllwort-Tags (z. B. (laughs), (coughs) usw.; nur von speech-2.8-hd/turbo unterstützt).

boolean

Standard:false

Steuert, ob die Ausgabe per Streaming erfolgt. Standardmäßig false, d. h. Streaming ist nicht aktiviert.

object

Ausblenden properties

integer

Anpassung der Tonhöhe (tief/hell), Bereich [-100, 100]. Je näher der Wert an -100 liegt, desto tiefer klingt die Stimme; je näher an 100, desto heller klingt die Stimme.Wertebereich: [-100, 100]

integer

Anpassung der Klangfarbe (resonant/klar), Bereich [-100, 100]. Je näher der Wert an -100 liegt, desto voller klingt die Stimme; je näher der Wert an 100 liegt, desto klarer klingt die Stimme.Wertebereich: [-100, 100]

integer

Anpassung der Intensität (kraftvoll/sanft), Bereich [-100, 100]. Je näher der Wert an -100 liegt, desto kräftiger klingt die Stimme; je näher an 100, desto sanfter klingt die Stimme.Wertebereich: [-100, 100]

string

Einstellung für Soundeffekte; pro Anfrage kann nur ein Effekt ausgewählt werden. Mögliche Werte: spacious_echo (weiter Hall), auditorium_echo (Auditorium-Ansage), lofi_telephone (Telefonverzerrung), robotic (elektronischer Sound)Mögliche Werte: spacious_echo, auditorium_echo, lofi_telephone, robotic

object

Ausblenden properties

string

Standard:"mp3"

Format der generierten Audiodatei; wav wird nur bei Nicht-Streaming-Ausgabe unterstützt.Mögliche Werte: mp3, pcm, flac, wav

integer

Standard:128000

Bitrate der generierten Audiodatei. Möglicher Bereich: [32000, 64000, 128000, 256000], Standardwert ist 128000. Dieser Parameter wirkt sich nur auf Audio im mp3-Format aus.Mögliche Werte: 32000, 64000, 128000, 256000

integer

Standard:1

Anzahl der Kanäle der generierten Audiodatei. Möglicher Bereich: [1, 2], wobei 1 Mono und 2 Stereo bedeutet. Standardwert ist 1.Mögliche Werte: 1, 2

boolean

Standard:false

Steuerung der konstanten Bitrate (CBR) für Audio; mögliche Werte sind false und true. Wenn dieser Parameter auf true gesetzt ist, wird die Audiocodierung mit konstanter Bitrate durchgeführt. Hinweis: Dieser Parameter ist nur wirksam, wenn Audio auf Streaming-Ausgabe gesetzt ist und das Audioformat mp3 ist.

integer

Standard:32000

Abtastrate der generierten Audiodatei. Möglicher Bereich: [8000, 16000, 22050, 24000, 32000, 44100], Standardwert ist 32000.Mögliche Werte: 8000, 16000, 22050, 24000, 32000, 44100

string

Standard:"hex"

Parameter zur Steuerung der Form des Ausgabeergebnisses. Mögliche Werte sind url und hex, Standardwert ist hex. Dieser Parameter ist nur in Nicht-Streaming-Szenarien wirksam; Streaming-Szenarien unterstützen nur die Rückgabe im hex-Format. Die zurückgegebene url ist 24 Stunden lang gültig.Mögliche Werte: url, hex

object

Ausblenden properties

number

Standard:1

Lautstärke des synthetisierten Audios. Je größer der Wert, desto höher die Lautstärke. Wertebereich (0, 10], Standardwert ist 1.0.Wertebereich: [0, 10]

integer

Standard:0

Intonation des synthetisierten Audios. Wertebereich [-12, 12], Standardwert ist 0; 0 bedeutet Ausgabe mit der ursprünglichen Stimme.Wertebereich: [-12, 12]

number

Standard:1

Sprechgeschwindigkeit des synthetisierten Audios. Je größer der Wert, desto schneller die Sprechgeschwindigkeit. Wertebereich [0.5, 2], Standardwert ist 1.0.Wertebereich: [0.5, 2]

string

Steuert die Emotion der synthetisierten Sprache. Die Parameterwerte entsprechen 8 Emotionen: fröhlich (happy), traurig (sad), wütend (angry), ängstlich (fearful), angewidert (disgusted), überrascht (surprised), neutral (calm), lebendig (fluent), Flüstern (whisper). Das Modell passt die passende Emotion automatisch anhand des Eingabetextes an; in der Regel ist keine manuelle Angabe erforderlich.Mögliche Werte: happy, sad, angry, fearful, disgusted, surprised, calm, fluent, whisper

string

erforderlich

Stimm-ID des synthetisierten Audios. Wenn eine gemischte Stimme festgelegt werden soll, setzen Sie bitte den Parameter timber_weights und lassen Sie diesen Parameter leer. Unterstützt drei Typen: Systemstimmen, geklonte Stimmen und Text-zu-Stimme-Stimmen.

boolean

Standard:false

Steuert, ob LaTeX-Formeln vorgelesen werden. Standardwert ist false. Es wird nur Chinesisch unterstützt; nach Aktivierung dieses Parameters wird der Parameter language_boost auf Chinese gesetzt.

boolean

Standard:false

Gibt an, ob die Textnormalisierung für Chinesisch und Englisch aktiviert werden soll. Nach der Aktivierung kann die Leistung in Szenarien mit Zahlenlesung verbessert werden, erhöht jedoch die Latenz leicht. Standardwert ist false.

boolean

Standard:false

Steuert, ob am Ende des synthetisierten Audios eine Audio-Rhythmuskennung hinzugefügt wird. Standardwert ist false. Dieser Parameter ist nur für Nicht-Streaming-Synthese wirksam.

string

Gibt an, ob die Erkennungsfähigkeit für angegebene kleinere Sprachen und Dialekte verbessert werden soll. Standardwert ist null; kann auf auto gesetzt werden, damit das Modell selbstständig entscheidet.Mögliche Werte: Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, auto

object

Ausblenden properties

boolean

Standard:false

Legt fest, ob der letzte Chunk die zusammengefügten Sprachdaten im hex-Format enthalten soll. Standardwert ist false, d. h. der letzte Chunk enthält die vollständig zusammengefügten Sprachdaten im hex-Format.

object[]

Einstellung für gemischte Stimmen; unterstützt die Mischung von bis zu 4 Stimmen.

Ausblenden properties

integer

erforderlich

Gewichtung der einzelnen Stimmen im synthetisierten Audio; muss zusammen mit voice_id ausgefüllt werden. Möglicher Wertebereich: [1, 100]. Unterstützt die Mischung von bis zu 4 Stimmen. Je höher der Anteil einer einzelnen Stimme, desto ähnlicher ist die synthetisierte Stimme dieser Stimme.Wertebereich: [1, 100]

string

erforderlich

Stimm-ID des synthetisierten Audios; muss zusammen mit dem Parameter weight ausgefüllt werden. Unterstützt drei Typen: Systemstimmen, geklonte Stimmen und Text-zu-Stimme-Stimmen.

boolean

Standard:false

Steuert, ob der Untertiteldienst aktiviert wird. Standardwert ist false. Dieser Parameter ist nur in Nicht-Streaming-Ausgabeszenarien gültig und nur für die Modelle speech-2.6-hd, speech-2.6-turbo, speech-01-turbo, speech-01-hd wirksam.

boolean

Standard:false

Aktivieren Sie diesen Parameter, damit Übergänge zwischen Teilsätzen natürlicher klingen. Wird nur von den Modellen speech-2.8-hd und speech-2.8-turbo unterstützt.

object

Ausblenden properties

string[]

Definiert Aussprache- oder Lautersetzungsregeln für besonders zu markierende Zeichen oder Symbole. In chinesischem Text werden Töne durch Zahlen dargestellt: erster Ton = 1, zweiter Ton = 2, dritter Ton = 3, vierter Ton = 4, neutraler Ton = 5. Beispiel: [“燕少飞/(yan4)(shao3)(fei1)”, “omg/oh my god”]

Antwortinformationen

object

Zurückgegebenes Synthesedatenobjekt. Kann null sein; daher ist eine Nicht-null-Prüfung erforderlich.

string

ID dieser Sitzung, die bei Anfragen/Feedback hilft, das Problem zu lokalisieren.

object

Statuscode und Details dieser Anfrage.

object

Zusätzliche Informationen zum Audio.

MiniMax Speech 2.8 Turbo asynchrone Sprachsynthese

Zurück

MiniMax Speech 2.8 HD – Asynchrone Sprachsynthese

Weiter

API-Grundlagen

Große Sprachmodelle

Bilder

Video

Audio

MiniMax Speech 2.8 Turbo synchrone Sprachsynthese

Anfrageheader

Anfragetext

Antwortinformationen

​Anfrageheader

​Anfragetext

​Antwortinformationen

Anfrageheader

Anfragetext

Antwortinformationen