Comment cloner une voix en utilisant l'API T2A-01-HD de MiniMax

Clonage vocal rapide de MiniMaxi API : simple et efficace pour la synthèse vocale.

Louis Dupont

Louis Dupont

5 June 2025

Comment cloner une voix en utilisant l'API T2A-01-HD de MiniMax

MiniMax présente fièrement T2A-01-HD, une avancée révolutionnaire dans la technologie Text-to-Audio (T2A) et les capacités de clonage vocal. Ce modèle révolutionnaire établit de nouvelles normes de l'industrie en offrant une polyvalence inégalée en matière de synthèse vocale, de profondeur émotionnelle et de prise en charge multilingue. Que vous ayez besoin de clonage vocal pour des applications professionnelles, des projets créatifs ou une communication multilingue, T2A-01-HD offre des résultats haute fidélité et naturels.

Principales caractéristiques de T2A-01-HD

Multi-Voix : synthèse et clonage vocaux avancés

T2A-01-HD peut générer une voix synthétique de haute qualité à partir de seulement 10 secondes d'entrée audio. Il capture les caractéristiques vocales, les schémas de parole et les nuances émotionnelles, ce qui le rend idéal pour les applications allant du service client automatisé à la narration générée par l'IA.

Les principales capacités incluent :

Multi-Émotion : intelligence émotionnelle alimentée par l'IA

Contrairement aux modèles TTS traditionnels, T2A-01-HD peut identifier et reproduire les nuances émotionnelles dans la parole. Les utilisateurs peuvent laisser le système détecter automatiquement les émotions ou les spécifier pour une sortie plus expressive, garantissant ainsi une expérience véritablement humaine.

Multi-Langue : clonage vocal authentique dans plus de 17 langues

T2A-01-HD prend en charge le clonage vocal dans plusieurs langues, notamment :

Avec une fidélité supérieure à celle des modèles précédents, T2A-01-HD permet une communication transparente dans toutes les langues tout en préservant les accents naturels.

Comment cloner une voix avec l'API de MiniMax

MiniMax fournit une API simple mais puissante pour permettre un clonage vocal rapide. Vous trouverez ci-dessous un guide étape par étape sur la façon d'utiliser l'API T2A-01-HD pour le clonage vocal.

Clonage vocal rapide

Pour créer une voix clonée, vous devez d'abord télécharger un fichier audio. Ce fichier doit être au format MP3, M4A ou WAV, d'une durée de 10 secondes à 5 minutes et d'une taille inférieure à 20 Mo.

Flux de fonctionnement

  1. Téléchargez un fichier audio : utilisez l'interface de téléchargement de fichiers pour soumettre votre fichier audio et récupérer un file_id.
  2. Clonez la voix : appelez l'API Voice Clone avec le file_id et attribuez un voice_id personnalisé.
  3. Utilisez la voix clonée : utilisez le voice_id dans l'API T2A v2 pour générer une sortie de synthèse vocale.

Téléchargement d'un fichier audio

Pour commencer, téléchargez un fichier audio à l'aide de l'API de téléchargement de fichiers. Cette étape est essentielle pour obtenir un file_id, qui est requis pour cloner la voix.

Point de terminaison :
https://api.minimaxi.chat/v1/files/upload

Paramètres requis :

Exemple de requête API (Python) :

import json
import requests

group_id = 'your_group_id'  # Remplacez par votre ID de groupe
api_key = 'your_api_key'  # Remplacez par votre clé API

# Télécharger le fichier audio
url = f'https://api.minimaxi.chat/v1/files/upload?GroupId={group_id}'
headers = {'Authorization': f'Bearer {api_key}'}
data = {'purpose': 'voice_clone'}
files = {'file': open('audio.mp3', 'rb')}

response = requests.post(url, headers=headers, data=data, files=files)
file_id = response.json().get("file").get("file_id")
print("File ID:", file_id)

Clonez la voix

Une fois le fichier téléchargé, utilisez le file_id pour créer une voix clonée avec un voice_id personnalisé.

Point de terminaison :
https://api.minimaxi.chat/v1/voice_clone

Paramètres requis :

Paramètres facultatifs :

Exemple de requête API :

url = f"https://api.minimaxi.chat/v1/voice_clone?GroupId={group_id}"
payload = json.dumps({
  "file_id": file_id,
  "voice_id": "CustomVoice123"
})
headers = {
  'Authorization': f'Bearer {api_key}',
  'Content-Type': 'application/json'
}

response = requests.post(url, headers=headers, data=payload)
print("Voice Clone Response:", response.text)

Exemple de réponse

${file_id}    
{"input_sensitive":false,"input_sensitive_type":0,"base_resp":{"status_code":0,"status_msg":"success"}}    

Utilisez la voix clonée

La voix clonée peut être utilisée dans l'API T2A v2 de MiniMax pour la synthèse vocale. Pour conserver la voix en permanence, utilisez-la au moins une fois dans les 7 jours ; sinon, elle sera automatiquement supprimée.

Paramètres de réponse de l'API de clonage vocal

Après avoir envoyé la requête, l'API renverra une réponse indiquant la réussite ou l'échec du processus de clonage. Une réponse réussie ressemble à ceci :

Exemple de requête

curl --location 'https://api.minimaxi.chat/v1/voice_clone?GroupId=${group_id}' \
--header 'authority: api.minimaxi.chat' \
--header 'authorization: Bearer ${api_key}' \
--header 'content-type: application/json' \
--data '{
    "file_id":your file id,
    "voice_id":"your voice id"
}'

Exemple de réponse

{
    "input_sensitive": false,
    "input_sensitive_type": 0,
    "base_resp": {
        "status_code": 0,
        "status_msg": "success"
    }
}
Utilisation d'Apidog pour un clonage vocal rapide

Utilisation d'Apidog pour un clonage vocal rapide

Apidog simplifie les tests et la visualisation des requêtes et des réponses impliquées dans le processus de clonage vocal. Vous trouverez ci-dessous un guide sur la façon dont vous pouvez utiliser Apidog en conjonction avec l'API MiniMaxi.

1. Téléchargement d'un fichier audio dans Apidog

Pour démarrer le processus de clonage vocal, la première étape consiste à télécharger un fichier audio. Apidog fournit une interface facile pour remplir les paramètres sans réellement exécuter la requête.

Exemple Apidog :

Une fois que vous avez rempli les paramètres, Apidog affichera une fausse réponse avec le file_id, qui est requis pour l'étape suivante.

2. Clonage de la voix avec Apidog

Après avoir téléchargé le fichier audio et obtenu le file_id, vous pouvez maintenant procéder au clonage de la voix.

Exemple Apidog :


3. Exemple de réponse API dans Apidog

Une fois les paramètres de la requête remplis, Apidog affichera la réponse attendue. Voici un exemple de ce à quoi une réponse réussie pourrait ressembler :

{
    "input_sensitive": false,
    "input_sensitive_type": 0,
    "base_resp": {
        "status_code": 0,
        "status_msg": "success"
    }
}

4. Avantages de l'utilisation d'Apidog

En utilisant Apidog, vous pouvez visualiser la structure de la requête et de la réponse rapidement sans avoir besoin d'exécuter les appels d'API réels, ce qui en fait un outil pratique pour tester les fonctionnalités de clonage vocal MiniMaxi.


Codes d'erreur

Si une erreur se produit pendant la requête, la réponse inclura un base_resp.status_code et un base_resp.status_msg pour le dépannage.

Code d'erreur Signification
1000 Erreur inconnue
1001 Délai d'attente dépassé
1002 Restriction RPM du déclencheur
1004 Échec de l'authentification
1039 Restriction TPM du déclencheur
1042 Caractères illégaux dépassant le maximum (plus de 10 % de l'entrée)
2013 Format d'entrée non valide

Découvrez l'avenir de la technologie vocale

T2A-01-HD de MiniMax change la donne en matière de synthèse vocale basée sur l'IA, offrant une combinaison inégalée de précision, de profondeur émotionnelle et de prise en charge multilingue. Que vous ayez besoin de clonage vocal pour le divertissement, l'accessibilité ou les applications professionnelles, T2A-01-HD offre des performances inégalées.

Essayez-le gratuitement dès maintenant

Démarrage rapide pour les développeurs

Apprenez à effectuer votre première requête API à l'aide de l'ID de groupe et de la clé API. Lors de l'appel de l'API, vous aurez besoin à la fois de l'ID de groupe et de la clé API. L'ID de groupe est l'identifiant unique de votre compte, lié aux privilèges de votre compte. Il est associé à vos recharges, à votre facturation et à votre utilisation du débit. La clé API est essentielle pour accéder en toute sécurité à l'API. Assurez-vous de la stocker dans un endroit sûr, tel qu'un fichier texte crypté sur votre ordinateur, pour empêcher tout accès non autorisé. Suivez ces étapes pour les obtenir :

1. Obtenez l'ID de groupe :

2. Générez une clé API :

Avec T2A-01-HD, l'avenir de la synthèse vocale alimentée par l'IA est arrivé. Commencez à créer des voix réalistes dès aujourd'hui !

button

Explore more

Fathom-R1-14B : Modèle de raisonnement IA avancé d'Inde

Fathom-R1-14B : Modèle de raisonnement IA avancé d'Inde

L'IA en expansion rapide. Fathom-R1-14B (14,8 milliards de paramètres) excelle en raisonnement mathématique et général, conçu par Fractal AI Research.

5 June 2025

Mistral Code : L'assistant de codage le plus personnalisable basé sur l'IA pour les entreprises

Mistral Code : L'assistant de codage le plus personnalisable basé sur l'IA pour les entreprises

Découvrez Mistral Code, l'IA d'aide au code la plus personnalisable pour les entreprises.

5 June 2025

Comment Claude Code transforme le codage de l'IA en 2025

Comment Claude Code transforme le codage de l'IA en 2025

Découvrez Claude Code en 2025 : codage IA révolutionné. Fonctionnalités, démo, et pourquoi il gagne du terrain après Windsurf d'Anthropic. Indispensable !

5 June 2025

Pratiquez le Design-first d'API dans Apidog

Découvrez une manière plus simple de créer et utiliser des API