
MiniMax se enorgullece de presentar T2A-01-HD, un avance innovador en la tecnología de Texto a Audio (T2A) y las capacidades de clonación de voz. Este modelo revolucionario establece nuevos estándares en la industria al ofrecer una versatilidad sin igual en la síntesis de voz, la profundidad emocional y el soporte multilingüe. Ya sea que necesite clonación de voz para aplicaciones comerciales, proyectos creativos o comunicación multilingüe, T2A-01-HD ofrece resultados de alta fidelidad y sonido natural.
Características clave de T2A-01-HD
Multi-Voz: Síntesis y clonación de voz avanzadas
T2A-01-HD puede generar una voz sintética de alta calidad a partir de solo 10 segundos de entrada de audio. Captura las características de la voz, los patrones de habla y los matices emocionales, lo que lo hace ideal para aplicaciones que van desde el servicio al cliente automatizado hasta la narración generada por IA.
Las capacidades clave incluyen:
- Más de 300 voces preconstruidas: Cubriendo múltiples idiomas, acentos, géneros y edades.
- Clonación de voz personalizada: Clone voces únicas con alta precisión.
- Control avanzado: Modifique el tono, la velocidad y la expresión para una salida personalizada.
- Efectos profesionales: Agregue acústica de sala, filtros telefónicos y otras mejoras.

Multi-Emoción: Inteligencia emocional impulsada por IA
A diferencia de los modelos TTS tradicionales, T2A-01-HD puede identificar y replicar matices emocionales en el habla. Los usuarios pueden dejar que el sistema detecte las emociones automáticamente o especificarlas para una salida más expresiva, lo que garantiza una experiencia verdaderamente humana.
Multi-Idioma: Clonación de voz auténtica en más de 17 idiomas
T2A-01-HD admite la clonación de voz en varios idiomas, incluidos:
- Inglés (EE. UU., Reino Unido, Australia, India)
- Mandarín, cantonés, japonés, coreano, vietnamita, indonesio
- Francés, alemán, español, italiano, holandés, ruso, ucraniano
- Portugués (brasileño), turco, árabe
Con una fidelidad superior en comparación con los modelos anteriores, T2A-01-HD permite una comunicación fluida entre idiomas al tiempo que conserva los acentos naturales.
Cómo clonar una voz con la API de MiniMax
MiniMax proporciona una API simple pero potente para permitir la clonación rápida de voz. A continuación, se muestra una guía paso a paso sobre cómo usar la API T2A-01-HD para la clonación de voz.
Clonación rápida de voz
Para crear una voz clonada, primero debe cargar un archivo de audio. Este archivo debe estar en formato MP3
, M4A
o WAV
, con una duración de 10 segundos
a 5 minutos
y un tamaño inferior a 20MB
.
Flujo de operación
- Cargue un archivo de audio: Use la interfaz de carga de archivos para enviar su archivo de audio y recuperar un
file_id
. - Clone la voz: Llame a la API de clonación de voz con el
file_id
y asigne unvoice_id
personalizado. - Use la voz clonada: Utilice el
voice_id
dentro de la API T2A v2 para generar una salida de síntesis de voz.
Carga de un archivo de audio
Para comenzar, cargue un archivo de audio utilizando la API de carga de archivos. Este paso es esencial para obtener un file_id
, que es necesario para clonar la voz.
Endpoint:https://api.minimaxi.chat/v1/files/upload
Parámetros requeridos:
Authorization
: Su clave APIContent-Type
:multipart/form-data
purpose
:voice_clone
file
: El archivo de audio (MP3, M4A, WAV)
Ejemplo de solicitud de API (Python):
import json
import requests
group_id = 'your_group_id' # Replace with your group ID
api_key = 'your_api_key' # Replace with your API key
# Upload audio file
url = f'https://api.minimaxi.chat/v1/files/upload?GroupId={group_id}'
headers = {'Authorization': f'Bearer {api_key}'}
data = {'purpose': 'voice_clone'}
files = {'file': open('audio.mp3', 'rb')}
response = requests.post(url, headers=headers, data=data, files=files)
file_id = response.json().get("file").get("file_id")
print("File ID:", file_id)
Clone la voz
Una vez que se carga el archivo, use el file_id
para crear una voz clonada con un voice_id
personalizado.
Endpoint:https://api.minimaxi.chat/v1/voice_clone
Parámetros requeridos:
file_id
: El ID del archivo cargadovoice_id
: ID personalizado definido por el usuario (debe tener al menos 8 caracteres, contener letras y números, y comenzar con una letra)
Parámetros opcionales:
noise_reduction
: Indicador booleano para habilitar la reducción de ruido (predeterminado:false
)text
: Un breve fragmento de texto (máximo 300 caracteres) para obtener una vista previa de la voz clonadamodel
: El modelo de texto a voz utilizado para la vista previa (speech-01-turbo
)accuracy
: Umbral de validación de texto (predeterminado:0.7
)need_volume_normalization
: Indicador booleano para la normalización del volumen (predeterminado:false
)
Ejemplo de solicitud de API:
url = f"https://api.minimaxi.chat/v1/voice_clone?GroupId={group_id}"
payload = json.dumps({
"file_id": file_id,
"voice_id": "CustomVoice123"
})
headers = {
'Authorization': f'Bearer {api_key}',
'Content-Type': 'application/json'
}
response = requests.post(url, headers=headers, data=payload)
print("Voice Clone Response:", response.text)
Ejemplo de respuesta
${file_id}
{"input_sensitive":false,"input_sensitive_type":0,"base_resp":{"status_code":0,"status_msg":"success"}}
Use la voz clonada
La voz clonada se puede usar dentro de la API T2A v2 de MiniMax para la síntesis de voz. Para conservar la voz de forma permanente, utilícela al menos una vez en 7 días; de lo contrario, se eliminará automáticamente.
Parámetros de respuesta de la API de clonación de voz
Después de enviar la solicitud, la API devolverá una respuesta que indica el éxito o el fracaso del proceso de clonación. Una respuesta exitosa se ve así:
Ejemplo de solicitud
curl --location 'https://api.minimaxi.chat/v1/voice_clone?GroupId=${group_id}' \
--header 'authority: api.minimaxi.chat' \
--header 'authorization: Bearer ${api_key}' \
--header 'content-type: application/json' \
--data '{
"file_id":your file id,
"voice_id":"your voice id"
}'
Ejemplo de respuesta
{
"input_sensitive": false,
"input_sensitive_type": 0,
"base_resp": {
"status_code": 0,
"status_msg": "success"
}
}

Uso de Apidog para la clonación rápida de voz
Apidog simplifica las pruebas y la visualización de las solicitudes y respuestas involucradas en el proceso de clonación de voz. A continuación, se muestra una guía sobre cómo puede usar Apidog junto con la API de MiniMaxi.
1. Carga de un archivo de audio en Apidog
Para iniciar el proceso de clonación de voz, el primer paso es cargar un archivo de audio. Apidog proporciona una interfaz fácil para completar los parámetros sin ejecutar realmente la solicitud.
- Abra Apidog e inicie una nueva solicitud.
- Establezca el encabezado Authorization con su clave API.
- Agregue el parámetro
purpose
con el valorvoice_clone
. - Seleccione el archivo de audio (MP3, M4A, WAV) de su almacenamiento local.

Ejemplo de Apidog:
- Método: POST
- URL:
https://api.minimaxi.chat/v1/files/upload
- Authorization: Su clave API
- Datos del formulario:
purpose
:voice_clone
file
: Seleccione su archivo de audio (por ejemplo,audio.mp3
)
Una vez que complete los parámetros, Apidog mostrará una respuesta simulada con el file_id
, que se requiere para el siguiente paso.

2. Clonación de la voz con Apidog
Después de cargar el archivo de audio y obtener el file_id
, ahora puede proceder a clonar la voz.
- Abra la API de clonación de voz en Apidog.
- Establezca el encabezado Authorization con su clave API.
- Ingrese el
file_id
que recibió del paso de carga. - Proporcione un
voice_id
personalizado (por ejemplo,test1234
) para la voz clonada. - Opcionalmente, configure parámetros adicionales como la reducción de ruido o la normalización del volumen.
Ejemplo de Apidog:
- Método: POST
- URL:
https://api.minimaxi.chat/v1/voice_clone
- Authorization: Su clave API
- Cuerpo:
file_id
: El ID de su archivo cargadovoice_id
: Un ID de voz personalizado (por ejemplo,test1234
)
3. Ejemplo de respuesta de la API en Apidog
Una vez que se completan los parámetros de la solicitud, Apidog mostrará la respuesta esperada. Aquí hay un ejemplo de cómo podría ser una respuesta exitosa:
{
"input_sensitive": false,
"input_sensitive_type": 0,
"base_resp": {
"status_code": 0,
"status_msg": "success"
}
}
4. Beneficios de usar Apidog
- Pruebas sin código: No necesita ejecutar la solicitud real. Simplemente complete los parámetros y Apidog simulará la respuesta de la API.
- Interfaz fácil de usar: La interfaz simple de Apidog le permite probar diferentes parámetros y rastrear fácilmente las respuestas.
- Depuración simplificada: Si ocurre un error, la respuesta incluirá códigos de error y mensajes útiles para guiarlo en la resolución de problemas.
Al usar Apidog, puede visualizar la estructura de la solicitud y la respuesta rápidamente sin necesidad de ejecutar las llamadas API reales, lo que la convierte en una herramienta conveniente para probar las funciones de clonación de voz de MiniMaxi.
Códigos de error
Si ocurre un error durante la solicitud, la respuesta incluirá un base_resp.status_code
y base_resp.status_msg
para la resolución de problemas.
Código de error | Significado |
---|---|
1000 | Error desconocido |
1001 | Tiempo de espera agotado |
1002 | Activar la restricción RPM |
1004 | Fallo de autenticación |
1039 | Activar la restricción TPM |
1042 | Los caracteres ilegales excedieron el máximo (más del 10% de la entrada) |
2013 | Formato de entrada no válido |
Experimente el futuro de la tecnología de voz
T2A-01-HD de MiniMax es un cambio de juego en la síntesis de voz impulsada por IA, que ofrece una combinación incomparable de precisión, profundidad emocional y soporte multilingüe. Ya sea que necesite clonación de voz para entretenimiento, accesibilidad o aplicaciones comerciales, T2A-01-HD ofrece un rendimiento inigualable.
Pruébelo ahora gratis
- Playground: Explore voces generadas por IA

- Plataforma API: Integre la clonación de voz de MiniMax
Inicio rápido para desarrolladores
Aprenda cómo realizar su primera solicitud API utilizando el ID de grupo y la clave API. Al llamar a la API, necesitará tanto el GroupID como la clave API. GroupID es el identificador único de su cuenta, vinculado a los privilegios de su cuenta. Está asociado con sus recargas, facturación y uso de rendimiento. La clave API es esencial para acceder de forma segura a la API. Asegúrese de almacenarla en un lugar seguro, como un archivo de texto cifrado en su computadora, para evitar el acceso no autorizado. Siga estos pasos para obtenerlos:
1. Obtenga el GroupID:
- Vaya a la pestaña Cuenta y seleccione Su perfil en el menú de la izquierda.
- Ubique el campo GroupID en la información básica. Este es un número de 19 dígitos. Puede usar el icono de copia para copiar el GroupID.

2. Genere una clave API:
- En el menú de la izquierda, haga clic en Claves API, luego seleccione Crear nueva clave secreta.

- Ingrese un nombre para la clave en el campo provisto, luego haga clic en Crear.

- Aparecerá un cuadro de diálogo. Antes de hacer clic en Confirmar, use el icono de copia para guardar de forma segura la clave API, ya que no se volverá a mostrar.

Con T2A-01-HD, el futuro de la síntesis de voz impulsada por IA está aquí. ¡Comience a crear voces realistas hoy mismo!