Comment cloner une voix en utilisant l'API T2A-01-HD de MiniMax

MiniMax présente fièrement T2A-01-HD, une avancée révolutionnaire dans la technologie Text-to-Audio (T2A) et les capacités de clonage vocal. Ce modèle révolutionnaire établit de nouvelles normes de l'industrie en offrant une polyvalence inégalée en matière de synthèse vocale, de profondeur émotionnelle et de prise en charge multilingue. Que vous ayez besoin de clonage vocal pour des applications professionnelles, des projets créatifs ou une communication multilingue, T2A-01-HD offre des résultats haute fidélité et naturels.

Principales caractéristiques de T2A-01-HD

Multi-Voix : synthèse et clonage vocaux avancés

T2A-01-HD peut générer une voix synthétique de haute qualité à partir de seulement 10 secondes d'entrée audio. Il capture les caractéristiques vocales, les schémas de parole et les nuances émotionnelles, ce qui le rend idéal pour les applications allant du service client automatisé à la narration générée par l'IA.

Les principales capacités incluent :

300+ Voix pré-intégrées : couvrant plusieurs langues, accents, genres et âges.
Clonage vocal personnalisé : clonez des voix uniques avec une grande précision.
Contrôle avancé : modifiez la hauteur, la vitesse et l'expression pour une sortie personnalisée.
Effets professionnels : ajoutez de l'acoustique de pièce, des filtres téléphoniques et d'autres améliorations.

Multi-Émotion : intelligence émotionnelle alimentée par l'IA

Contrairement aux modèles TTS traditionnels, T2A-01-HD peut identifier et reproduire les nuances émotionnelles dans la parole. Les utilisateurs peuvent laisser le système détecter automatiquement les émotions ou les spécifier pour une sortie plus expressive, garantissant ainsi une expérience véritablement humaine.

Multi-Langue : clonage vocal authentique dans plus de 17 langues

T2A-01-HD prend en charge le clonage vocal dans plusieurs langues, notamment :

Anglais (US, UK, Australie, Inde)
Mandarin, cantonais, japonais, coréen, vietnamien, indonésien
Français, allemand, espagnol, italien, néerlandais, russe, ukrainien
Portugais (brésilien), turc, arabe

Avec une fidélité supérieure à celle des modèles précédents, T2A-01-HD permet une communication transparente dans toutes les langues tout en préservant les accents naturels.

Comment cloner une voix avec l'API de MiniMax

MiniMax fournit une API simple mais puissante pour permettre un clonage vocal rapide. Vous trouverez ci-dessous un guide étape par étape sur la façon d'utiliser l'API T2A-01-HD pour le clonage vocal.

Clonage vocal rapide

Pour créer une voix clonée, vous devez d'abord télécharger un fichier audio. Ce fichier doit être au format MP3, M4A ou WAV, d'une durée de 10 secondes à 5 minutes et d'une taille inférieure à 20 Mo.

Flux de fonctionnement

Téléchargez un fichier audio : utilisez l'interface de téléchargement de fichiers pour soumettre votre fichier audio et récupérer un file_id.
Clonez la voix : appelez l'API Voice Clone avec le file_id et attribuez un voice_id personnalisé.
Utilisez la voix clonée : utilisez le voice_id dans l'API T2A v2 pour générer une sortie de synthèse vocale.

Téléchargement d'un fichier audio

Pour commencer, téléchargez un fichier audio à l'aide de l'API de téléchargement de fichiers. Cette étape est essentielle pour obtenir un file_id, qui est requis pour cloner la voix.

Point de terminaison :
https://api.minimaxi.chat/v1/files/upload

Paramètres requis :

Authorization : votre clé API
Content-Type : multipart/form-data
purpose : voice_clone
file : le fichier audio (MP3, M4A, WAV)

Exemple de requête API (Python) :

import json
import requests

group_id = 'your_group_id'  # Remplacez par votre ID de groupe
api_key = 'your_api_key'  # Remplacez par votre clé API

# Télécharger le fichier audio
url = f'https://api.minimaxi.chat/v1/files/upload?GroupId={group_id}'
headers = {'Authorization': f'Bearer {api_key}'}
data = {'purpose': 'voice_clone'}
files = {'file': open('audio.mp3', 'rb')}

response = requests.post(url, headers=headers, data=data, files=files)
file_id = response.json().get("file").get("file_id")
print("File ID:", file_id)

Clonez la voix

Une fois le fichier téléchargé, utilisez le file_id pour créer une voix clonée avec un voice_id personnalisé.

Point de terminaison :
https://api.minimaxi.chat/v1/voice_clone

Paramètres requis :

file_id : l'ID du fichier téléchargé
voice_id : ID personnalisé défini par l'utilisateur (doit comporter au moins 8 caractères, contenir des lettres et des chiffres et commencer par une lettre)

Paramètres facultatifs :

noise_reduction : indicateur booléen pour activer la réduction du bruit (par défaut : false)
text : un court extrait de texte (300 caractères maximum) pour prévisualiser la voix clonée
model : le modèle de synthèse vocale utilisé pour la prévisualisation (speech-01-turbo)
accuracy : seuil de validation du texte (par défaut : 0.7)
need_volume_normalization : indicateur booléen pour la normalisation du volume (par défaut : false)

Exemple de requête API :

url = f"https://api.minimaxi.chat/v1/voice_clone?GroupId={group_id}"
payload = json.dumps({
  "file_id": file_id,
  "voice_id": "CustomVoice123"
})
headers = {
  'Authorization': f'Bearer {api_key}',
  'Content-Type': 'application/json'
}

response = requests.post(url, headers=headers, data=payload)
print("Voice Clone Response:", response.text)

Exemple de réponse

${file_id}    
{"input_sensitive":false,"input_sensitive_type":0,"base_resp":{"status_code":0,"status_msg":"success"}}

Utilisez la voix clonée

La voix clonée peut être utilisée dans l'API T2A v2 de MiniMax pour la synthèse vocale. Pour conserver la voix en permanence, utilisez-la au moins une fois dans les 7 jours ; sinon, elle sera automatiquement supprimée.

Paramètres de réponse de l'API de clonage vocal

Après avoir envoyé la requête, l'API renverra une réponse indiquant la réussite ou l'échec du processus de clonage. Une réponse réussie ressemble à ceci :

Exemple de requête

curl --location 'https://api.minimaxi.chat/v1/voice_clone?GroupId=${group_id}' \
--header 'authority: api.minimaxi.chat' \
--header 'authorization: Bearer ${api_key}' \
--header 'content-type: application/json' \
--data '{
    "file_id":your file id,
    "voice_id":"your voice id"
}'

Exemple de réponse

{
    "input_sensitive": false,
    "input_sensitive_type": 0,
    "base_resp": {
        "status_code": 0,
        "status_msg": "success"
    }
}

Utilisation d'Apidog pour un clonage vocal rapide

Apidog simplifie les tests et la visualisation des requêtes et des réponses impliquées dans le processus de clonage vocal. Vous trouverez ci-dessous un guide sur la façon dont vous pouvez utiliser Apidog en conjonction avec l'API MiniMaxi.

1. Téléchargement d'un fichier audio dans Apidog

Pour démarrer le processus de clonage vocal, la première étape consiste à télécharger un fichier audio. Apidog fournit une interface facile pour remplir les paramètres sans réellement exécuter la requête.

Ouvrez Apidog et démarrez une nouvelle requête.
Définissez l'en-tête Authorization avec votre clé API.
Ajoutez le paramètre purpose avec la valeur voice_clone.
Sélectionnez le fichier audio (MP3, M4A, WAV) à partir de votre stockage local.

Exemple Apidog :

Méthode : POST
URL : https://api.minimaxi.chat/v1/files/upload
Authorization : votre clé API
Données de formulaire :
purpose : voice_clone
file : sélectionnez votre fichier audio (par exemple, audio.mp3)

Une fois que vous avez rempli les paramètres, Apidog affichera une fausse réponse avec le file_id, qui est requis pour l'étape suivante.

2. Clonage de la voix avec Apidog

Après avoir téléchargé le fichier audio et obtenu le file_id, vous pouvez maintenant procéder au clonage de la voix.

Ouvrez l'API Voice Clone dans Apidog.
Définissez l'en-tête Authorization avec votre clé API.
Saisissez le file_id que vous avez reçu de l'étape de téléchargement.
Fournissez un voice_id personnalisé (par exemple, test1234) pour la voix clonée.
En option, configurez des paramètres supplémentaires comme la réduction du bruit ou la normalisation du volume.

Exemple Apidog :

Méthode : POST
URL : https://api.minimaxi.chat/v1/voice_clone
Authorization : votre clé API
Corps :
file_id : l'ID de votre fichier téléchargé
voice_id : un ID de voix personnalisé (par exemple, test1234)

3. Exemple de réponse API dans Apidog

Une fois les paramètres de la requête remplis, Apidog affichera la réponse attendue. Voici un exemple de ce à quoi une réponse réussie pourrait ressembler :

{
    "input_sensitive": false,
    "input_sensitive_type": 0,
    "base_resp": {
        "status_code": 0,
        "status_msg": "success"
    }
}

4. Avantages de l'utilisation d'Apidog

Tests sans code : vous n'avez pas besoin d'exécuter la requête réelle. Il suffit de remplir les paramètres et Apidog simulera la réponse de l'API.
Interface conviviale : l'interface simple d'Apidog vous permet de tester différents paramètres et de suivre facilement les réponses.
Débogage simplifié : si une erreur se produit, la réponse inclura des codes d'erreur et des messages utiles pour vous guider dans le dépannage.

En utilisant Apidog, vous pouvez visualiser la structure de la requête et de la réponse rapidement sans avoir besoin d'exécuter les appels d'API réels, ce qui en fait un outil pratique pour tester les fonctionnalités de clonage vocal MiniMaxi.

Codes d'erreur

Si une erreur se produit pendant la requête, la réponse inclura un base_resp.status_code et un base_resp.status_msg pour le dépannage.

Code d'erreur	Signification
1000	Erreur inconnue
1001	Délai d'attente dépassé
1002	Restriction RPM du déclencheur
1004	Échec de l'authentification
1039	Restriction TPM du déclencheur
1042	Caractères illégaux dépassant le maximum (plus de 10 % de l'entrée)
2013	Format d'entrée non valide

Découvrez l'avenir de la technologie vocale

T2A-01-HD de MiniMax change la donne en matière de synthèse vocale basée sur l'IA, offrant une combinaison inégalée de précision, de profondeur émotionnelle et de prise en charge multilingue. Que vous ayez besoin de clonage vocal pour le divertissement, l'accessibilité ou les applications professionnelles, T2A-01-HD offre des performances inégalées.

Essayez-le gratuitement dès maintenant

Playground : Explorez les voix générées par l'IA

Plateforme API : Intégrez le clonage vocal de MiniMax

Démarrage rapide pour les développeurs

Apprenez à effectuer votre première requête API à l'aide de l'ID de groupe et de la clé API. Lors de l'appel de l'API, vous aurez besoin à la fois de l'ID de groupe et de la clé API. L'ID de groupe est l'identifiant unique de votre compte, lié aux privilèges de votre compte. Il est associé à vos recharges, à votre facturation et à votre utilisation du débit. La clé API est essentielle pour accéder en toute sécurité à l'API. Assurez-vous de la stocker dans un endroit sûr, tel qu'un fichier texte crypté sur votre ordinateur, pour empêcher tout accès non autorisé. Suivez ces étapes pour les obtenir :

1. Obtenez l'ID de groupe :

Accédez à l'onglet Compte et sélectionnez Votre profil dans le menu de gauche.
Recherchez le champ ID de groupe dans les informations de base. Il s'agit d'un numéro à 19 chiffres. Vous pouvez utiliser l'icône de copie pour copier l'ID de groupe.

2. Générez une clé API :

Dans le menu de gauche, cliquez sur Clés API, puis sélectionnez Créer une nouvelle clé secrète.

Saisissez un nom pour la clé dans le champ prévu, puis cliquez sur Créer.

Une boîte de dialogue apparaîtra. Avant de cliquer sur Confirmer, utilisez l'icône de copie pour enregistrer en toute sécurité la clé API, car elle ne sera plus affichée.

Avec T2A-01-HD, l'avenir de la synthèse vocale alimentée par l'IA est arrivé. Commencez à créer des voix réalistes dès aujourd'hui !

button