
MiniMax présente fièrement T2A-01-HD, une avancée révolutionnaire dans la technologie Text-to-Audio (T2A) et les capacités de clonage vocal. Ce modèle révolutionnaire établit de nouvelles normes de l'industrie en offrant une polyvalence inégalée en matière de synthèse vocale, de profondeur émotionnelle et de prise en charge multilingue. Que vous ayez besoin de clonage vocal pour des applications professionnelles, des projets créatifs ou une communication multilingue, T2A-01-HD offre des résultats haute fidélité et naturels.
Principales caractéristiques de T2A-01-HD
Multi-Voix : synthèse et clonage vocaux avancés
T2A-01-HD peut générer une voix synthétique de haute qualité à partir de seulement 10 secondes d'entrée audio. Il capture les caractéristiques vocales, les schémas de parole et les nuances émotionnelles, ce qui le rend idéal pour les applications allant du service client automatisé à la narration générée par l'IA.
Les principales capacités incluent :
- 300+ Voix pré-intégrées : couvrant plusieurs langues, accents, genres et âges.
- Clonage vocal personnalisé : clonez des voix uniques avec une grande précision.
- Contrôle avancé : modifiez la hauteur, la vitesse et l'expression pour une sortie personnalisée.
- Effets professionnels : ajoutez de l'acoustique de pièce, des filtres téléphoniques et d'autres améliorations.

Multi-Émotion : intelligence émotionnelle alimentée par l'IA
Contrairement aux modèles TTS traditionnels, T2A-01-HD peut identifier et reproduire les nuances émotionnelles dans la parole. Les utilisateurs peuvent laisser le système détecter automatiquement les émotions ou les spécifier pour une sortie plus expressive, garantissant ainsi une expérience véritablement humaine.
Multi-Langue : clonage vocal authentique dans plus de 17 langues
T2A-01-HD prend en charge le clonage vocal dans plusieurs langues, notamment :
- Anglais (US, UK, Australie, Inde)
- Mandarin, cantonais, japonais, coréen, vietnamien, indonésien
- Français, allemand, espagnol, italien, néerlandais, russe, ukrainien
- Portugais (brésilien), turc, arabe
Avec une fidélité supérieure à celle des modèles précédents, T2A-01-HD permet une communication transparente dans toutes les langues tout en préservant les accents naturels.
Comment cloner une voix avec l'API de MiniMax
MiniMax fournit une API simple mais puissante pour permettre un clonage vocal rapide. Vous trouverez ci-dessous un guide étape par étape sur la façon d'utiliser l'API T2A-01-HD pour le clonage vocal.
Clonage vocal rapide
Pour créer une voix clonée, vous devez d'abord télécharger un fichier audio. Ce fichier doit être au format MP3
, M4A
ou WAV
, d'une durée de 10 secondes
à 5 minutes
et d'une taille inférieure à 20 Mo
.
Flux de fonctionnement
- Téléchargez un fichier audio : utilisez l'interface de téléchargement de fichiers pour soumettre votre fichier audio et récupérer un
file_id
. - Clonez la voix : appelez l'API Voice Clone avec le
file_id
et attribuez unvoice_id
personnalisé. - Utilisez la voix clonée : utilisez le
voice_id
dans l'API T2A v2 pour générer une sortie de synthèse vocale.
Téléchargement d'un fichier audio
Pour commencer, téléchargez un fichier audio à l'aide de l'API de téléchargement de fichiers. Cette étape est essentielle pour obtenir un file_id
, qui est requis pour cloner la voix.
Point de terminaison :https://api.minimaxi.chat/v1/files/upload
Paramètres requis :
Authorization
: votre clé APIContent-Type
:multipart/form-data
purpose
:voice_clone
file
: le fichier audio (MP3, M4A, WAV)
Exemple de requête API (Python) :
import json
import requests
group_id = 'your_group_id' # Remplacez par votre ID de groupe
api_key = 'your_api_key' # Remplacez par votre clé API
# Télécharger le fichier audio
url = f'https://api.minimaxi.chat/v1/files/upload?GroupId={group_id}'
headers = {'Authorization': f'Bearer {api_key}'}
data = {'purpose': 'voice_clone'}
files = {'file': open('audio.mp3', 'rb')}
response = requests.post(url, headers=headers, data=data, files=files)
file_id = response.json().get("file").get("file_id")
print("File ID:", file_id)
Clonez la voix
Une fois le fichier téléchargé, utilisez le file_id
pour créer une voix clonée avec un voice_id
personnalisé.
Point de terminaison :https://api.minimaxi.chat/v1/voice_clone
Paramètres requis :
file_id
: l'ID du fichier téléchargévoice_id
: ID personnalisé défini par l'utilisateur (doit comporter au moins 8 caractères, contenir des lettres et des chiffres et commencer par une lettre)
Paramètres facultatifs :
noise_reduction
: indicateur booléen pour activer la réduction du bruit (par défaut :false
)text
: un court extrait de texte (300 caractères maximum) pour prévisualiser la voix clonéemodel
: le modèle de synthèse vocale utilisé pour la prévisualisation (speech-01-turbo
)accuracy
: seuil de validation du texte (par défaut :0.7
)need_volume_normalization
: indicateur booléen pour la normalisation du volume (par défaut :false
)
Exemple de requête API :
url = f"https://api.minimaxi.chat/v1/voice_clone?GroupId={group_id}"
payload = json.dumps({
"file_id": file_id,
"voice_id": "CustomVoice123"
})
headers = {
'Authorization': f'Bearer {api_key}',
'Content-Type': 'application/json'
}
response = requests.post(url, headers=headers, data=payload)
print("Voice Clone Response:", response.text)
Exemple de réponse
${file_id}
{"input_sensitive":false,"input_sensitive_type":0,"base_resp":{"status_code":0,"status_msg":"success"}}
Utilisez la voix clonée
La voix clonée peut être utilisée dans l'API T2A v2 de MiniMax pour la synthèse vocale. Pour conserver la voix en permanence, utilisez-la au moins une fois dans les 7 jours ; sinon, elle sera automatiquement supprimée.
Paramètres de réponse de l'API de clonage vocal
Après avoir envoyé la requête, l'API renverra une réponse indiquant la réussite ou l'échec du processus de clonage. Une réponse réussie ressemble à ceci :
Exemple de requête
curl --location 'https://api.minimaxi.chat/v1/voice_clone?GroupId=${group_id}' \
--header 'authority: api.minimaxi.chat' \
--header 'authorization: Bearer ${api_key}' \
--header 'content-type: application/json' \
--data '{
"file_id":your file id,
"voice_id":"your voice id"
}'
Exemple de réponse
{
"input_sensitive": false,
"input_sensitive_type": 0,
"base_resp": {
"status_code": 0,
"status_msg": "success"
}
}

Utilisation d'Apidog pour un clonage vocal rapide
Apidog simplifie les tests et la visualisation des requêtes et des réponses impliquées dans le processus de clonage vocal. Vous trouverez ci-dessous un guide sur la façon dont vous pouvez utiliser Apidog en conjonction avec l'API MiniMaxi.
1. Téléchargement d'un fichier audio dans Apidog
Pour démarrer le processus de clonage vocal, la première étape consiste à télécharger un fichier audio. Apidog fournit une interface facile pour remplir les paramètres sans réellement exécuter la requête.
- Ouvrez Apidog et démarrez une nouvelle requête.
- Définissez l'en-tête Authorization avec votre clé API.
- Ajoutez le paramètre
purpose
avec la valeurvoice_clone
. - Sélectionnez le fichier audio (MP3, M4A, WAV) à partir de votre stockage local.

Exemple Apidog :
- Méthode : POST
- URL :
https://api.minimaxi.chat/v1/files/upload
- Authorization : votre clé API
- Données de formulaire :
purpose
:voice_clone
file
: sélectionnez votre fichier audio (par exemple,audio.mp3
)
Une fois que vous avez rempli les paramètres, Apidog affichera une fausse réponse avec le file_id
, qui est requis pour l'étape suivante.

2. Clonage de la voix avec Apidog
Après avoir téléchargé le fichier audio et obtenu le file_id
, vous pouvez maintenant procéder au clonage de la voix.
- Ouvrez l'API Voice Clone dans Apidog.
- Définissez l'en-tête Authorization avec votre clé API.
- Saisissez le
file_id
que vous avez reçu de l'étape de téléchargement. - Fournissez un
voice_id
personnalisé (par exemple,test1234
) pour la voix clonée. - En option, configurez des paramètres supplémentaires comme la réduction du bruit ou la normalisation du volume.
Exemple Apidog :
- Méthode : POST
- URL :
https://api.minimaxi.chat/v1/voice_clone
- Authorization : votre clé API
- Corps :
file_id
: l'ID de votre fichier téléchargévoice_id
: un ID de voix personnalisé (par exemple,test1234
)
3. Exemple de réponse API dans Apidog
Une fois les paramètres de la requête remplis, Apidog affichera la réponse attendue. Voici un exemple de ce à quoi une réponse réussie pourrait ressembler :
{
"input_sensitive": false,
"input_sensitive_type": 0,
"base_resp": {
"status_code": 0,
"status_msg": "success"
}
}
4. Avantages de l'utilisation d'Apidog
- Tests sans code : vous n'avez pas besoin d'exécuter la requête réelle. Il suffit de remplir les paramètres et Apidog simulera la réponse de l'API.
- Interface conviviale : l'interface simple d'Apidog vous permet de tester différents paramètres et de suivre facilement les réponses.
- Débogage simplifié : si une erreur se produit, la réponse inclura des codes d'erreur et des messages utiles pour vous guider dans le dépannage.
En utilisant Apidog, vous pouvez visualiser la structure de la requête et de la réponse rapidement sans avoir besoin d'exécuter les appels d'API réels, ce qui en fait un outil pratique pour tester les fonctionnalités de clonage vocal MiniMaxi.
Codes d'erreur
Si une erreur se produit pendant la requête, la réponse inclura un base_resp.status_code
et un base_resp.status_msg
pour le dépannage.
Code d'erreur | Signification |
---|---|
1000 | Erreur inconnue |
1001 | Délai d'attente dépassé |
1002 | Restriction RPM du déclencheur |
1004 | Échec de l'authentification |
1039 | Restriction TPM du déclencheur |
1042 | Caractères illégaux dépassant le maximum (plus de 10 % de l'entrée) |
2013 | Format d'entrée non valide |
Découvrez l'avenir de la technologie vocale
T2A-01-HD de MiniMax change la donne en matière de synthèse vocale basée sur l'IA, offrant une combinaison inégalée de précision, de profondeur émotionnelle et de prise en charge multilingue. Que vous ayez besoin de clonage vocal pour le divertissement, l'accessibilité ou les applications professionnelles, T2A-01-HD offre des performances inégalées.
Essayez-le gratuitement dès maintenant
- Playground : Explorez les voix générées par l'IA

- Plateforme API : Intégrez le clonage vocal de MiniMax
Démarrage rapide pour les développeurs
Apprenez à effectuer votre première requête API à l'aide de l'ID de groupe et de la clé API. Lors de l'appel de l'API, vous aurez besoin à la fois de l'ID de groupe et de la clé API. L'ID de groupe est l'identifiant unique de votre compte, lié aux privilèges de votre compte. Il est associé à vos recharges, à votre facturation et à votre utilisation du débit. La clé API est essentielle pour accéder en toute sécurité à l'API. Assurez-vous de la stocker dans un endroit sûr, tel qu'un fichier texte crypté sur votre ordinateur, pour empêcher tout accès non autorisé. Suivez ces étapes pour les obtenir :
1. Obtenez l'ID de groupe :
- Accédez à l'onglet Compte et sélectionnez Votre profil dans le menu de gauche.
- Recherchez le champ ID de groupe dans les informations de base. Il s'agit d'un numéro à 19 chiffres. Vous pouvez utiliser l'icône de copie pour copier l'ID de groupe.

2. Générez une clé API :
- Dans le menu de gauche, cliquez sur Clés API, puis sélectionnez Créer une nouvelle clé secrète.

- Saisissez un nom pour la clé dans le champ prévu, puis cliquez sur Créer.

- Une boîte de dialogue apparaîtra. Avant de cliquer sur Confirmer, utilisez l'icône de copie pour enregistrer en toute sécurité la clé API, car elle ne sera plus affichée.

Avec T2A-01-HD, l'avenir de la synthèse vocale alimentée par l'IA est arrivé. Commencez à créer des voix réalistes dès aujourd'hui !