Cómo clonar una voz usando la API T2A-01-HD de MiniMax

La clonación rápida de voz de MiniMaxi API replica voces fácil y eficazmente para diversas apps. Sube audio, clona la voz y úsala para síntesis de voz.

Daniel Costa

Daniel Costa

15 April 2025

Cómo clonar una voz usando la API T2A-01-HD de MiniMax

MiniMax se enorgullece de presentar T2A-01-HD, un avance innovador en la tecnología de Texto a Audio (T2A) y las capacidades de clonación de voz. Este modelo revolucionario establece nuevos estándares en la industria al ofrecer una versatilidad sin igual en la síntesis de voz, la profundidad emocional y el soporte multilingüe. Ya sea que necesite clonación de voz para aplicaciones comerciales, proyectos creativos o comunicación multilingüe, T2A-01-HD ofrece resultados de alta fidelidad y sonido natural.

Características clave de T2A-01-HD

Multi-Voz: Síntesis y clonación de voz avanzadas

T2A-01-HD puede generar una voz sintética de alta calidad a partir de solo 10 segundos de entrada de audio. Captura las características de la voz, los patrones de habla y los matices emocionales, lo que lo hace ideal para aplicaciones que van desde el servicio al cliente automatizado hasta la narración generada por IA.

Las capacidades clave incluyen:

Multi-Emoción: Inteligencia emocional impulsada por IA

A diferencia de los modelos TTS tradicionales, T2A-01-HD puede identificar y replicar matices emocionales en el habla. Los usuarios pueden dejar que el sistema detecte las emociones automáticamente o especificarlas para una salida más expresiva, lo que garantiza una experiencia verdaderamente humana.

Multi-Idioma: Clonación de voz auténtica en más de 17 idiomas

T2A-01-HD admite la clonación de voz en varios idiomas, incluidos:

Con una fidelidad superior en comparación con los modelos anteriores, T2A-01-HD permite una comunicación fluida entre idiomas al tiempo que conserva los acentos naturales.

Cómo clonar una voz con la API de MiniMax

MiniMax proporciona una API simple pero potente para permitir la clonación rápida de voz. A continuación, se muestra una guía paso a paso sobre cómo usar la API T2A-01-HD para la clonación de voz.

Clonación rápida de voz

Para crear una voz clonada, primero debe cargar un archivo de audio. Este archivo debe estar en formato MP3, M4A o WAV, con una duración de 10 segundos a 5 minutos y un tamaño inferior a 20MB.

Flujo de operación

  1. Cargue un archivo de audio: Use la interfaz de carga de archivos para enviar su archivo de audio y recuperar un file_id.
  2. Clone la voz: Llame a la API de clonación de voz con el file_id y asigne un voice_id personalizado.
  3. Use la voz clonada: Utilice el voice_id dentro de la API T2A v2 para generar una salida de síntesis de voz.

Carga de un archivo de audio

Para comenzar, cargue un archivo de audio utilizando la API de carga de archivos. Este paso es esencial para obtener un file_id, que es necesario para clonar la voz.

Endpoint:
https://api.minimaxi.chat/v1/files/upload

Parámetros requeridos:

Ejemplo de solicitud de API (Python):

import json
import requests

group_id = 'your_group_id'  # Replace with your group ID
api_key = 'your_api_key'  # Replace with your API key

# Upload audio file
url = f'https://api.minimaxi.chat/v1/files/upload?GroupId={group_id}'
headers = {'Authorization': f'Bearer {api_key}'}
data = {'purpose': 'voice_clone'}
files = {'file': open('audio.mp3', 'rb')}

response = requests.post(url, headers=headers, data=data, files=files)
file_id = response.json().get("file").get("file_id")
print("File ID:", file_id)

Clone la voz

Una vez que se carga el archivo, use el file_id para crear una voz clonada con un voice_id personalizado.

Endpoint:
https://api.minimaxi.chat/v1/voice_clone

Parámetros requeridos:

Parámetros opcionales:

Ejemplo de solicitud de API:

url = f"https://api.minimaxi.chat/v1/voice_clone?GroupId={group_id}"
payload = json.dumps({
  "file_id": file_id,
  "voice_id": "CustomVoice123"
})
headers = {
  'Authorization': f'Bearer {api_key}',
  'Content-Type': 'application/json'
}

response = requests.post(url, headers=headers, data=payload)
print("Voice Clone Response:", response.text)

Ejemplo de respuesta

${file_id}    
{"input_sensitive":false,"input_sensitive_type":0,"base_resp":{"status_code":0,"status_msg":"success"}}    

Use la voz clonada

La voz clonada se puede usar dentro de la API T2A v2 de MiniMax para la síntesis de voz. Para conservar la voz de forma permanente, utilícela al menos una vez en 7 días; de lo contrario, se eliminará automáticamente.

Parámetros de respuesta de la API de clonación de voz

Después de enviar la solicitud, la API devolverá una respuesta que indica el éxito o el fracaso del proceso de clonación. Una respuesta exitosa se ve así:

Ejemplo de solicitud

curl --location 'https://api.minimaxi.chat/v1/voice_clone?GroupId=${group_id}' \
--header 'authority: api.minimaxi.chat' \
--header 'authorization: Bearer ${api_key}' \
--header 'content-type: application/json' \
--data '{
    "file_id":your file id,
    "voice_id":"your voice id"
}'

Ejemplo de respuesta

{
    "input_sensitive": false,
    "input_sensitive_type": 0,
    "base_resp": {
        "status_code": 0,
        "status_msg": "success"
    }
}
Uso de Apidog para la clonación rápida de voz

Uso de Apidog para la clonación rápida de voz

Apidog simplifica las pruebas y la visualización de las solicitudes y respuestas involucradas en el proceso de clonación de voz. A continuación, se muestra una guía sobre cómo puede usar Apidog junto con la API de MiniMaxi.

1. Carga de un archivo de audio en Apidog

Para iniciar el proceso de clonación de voz, el primer paso es cargar un archivo de audio. Apidog proporciona una interfaz fácil para completar los parámetros sin ejecutar realmente la solicitud.

Ejemplo de Apidog:

Una vez que complete los parámetros, Apidog mostrará una respuesta simulada con el file_id, que se requiere para el siguiente paso.

2. Clonación de la voz con Apidog

Después de cargar el archivo de audio y obtener el file_id, ahora puede proceder a clonar la voz.

Ejemplo de Apidog:


3. Ejemplo de respuesta de la API en Apidog

Una vez que se completan los parámetros de la solicitud, Apidog mostrará la respuesta esperada. Aquí hay un ejemplo de cómo podría ser una respuesta exitosa:

{
    "input_sensitive": false,
    "input_sensitive_type": 0,
    "base_resp": {
        "status_code": 0,
        "status_msg": "success"
    }
}

4. Beneficios de usar Apidog

Al usar Apidog, puede visualizar la estructura de la solicitud y la respuesta rápidamente sin necesidad de ejecutar las llamadas API reales, lo que la convierte en una herramienta conveniente para probar las funciones de clonación de voz de MiniMaxi.


Códigos de error

Si ocurre un error durante la solicitud, la respuesta incluirá un base_resp.status_code y base_resp.status_msg para la resolución de problemas.

Código de error Significado
1000 Error desconocido
1001 Tiempo de espera agotado
1002 Activar la restricción RPM
1004 Fallo de autenticación
1039 Activar la restricción TPM
1042 Los caracteres ilegales excedieron el máximo (más del 10% de la entrada)
2013 Formato de entrada no válido

Experimente el futuro de la tecnología de voz

T2A-01-HD de MiniMax es un cambio de juego en la síntesis de voz impulsada por IA, que ofrece una combinación incomparable de precisión, profundidad emocional y soporte multilingüe. Ya sea que necesite clonación de voz para entretenimiento, accesibilidad o aplicaciones comerciales, T2A-01-HD ofrece un rendimiento inigualable.

Pruébelo ahora gratis

Inicio rápido para desarrolladores

Aprenda cómo realizar su primera solicitud API utilizando el ID de grupo y la clave API. Al llamar a la API, necesitará tanto el GroupID como la clave API. GroupID es el identificador único de su cuenta, vinculado a los privilegios de su cuenta. Está asociado con sus recargas, facturación y uso de rendimiento. La clave API es esencial para acceder de forma segura a la API. Asegúrese de almacenarla en un lugar seguro, como un archivo de texto cifrado en su computadora, para evitar el acceso no autorizado. Siga estos pasos para obtenerlos:

1. Obtenga el GroupID:

2. Genere una clave API:

Con T2A-01-HD, el futuro de la síntesis de voz impulsada por IA está aquí. ¡Comience a crear voces realistas hoy mismo!

button

Explore more

Cómo usar Ollama: Guía Completa para Principiantes sobre LLMs Locales con Ollama

Cómo usar Ollama: Guía Completa para Principiantes sobre LLMs Locales con Ollama

El panorama de la inteligencia artificial evoluciona constantemente, y los Grandes Modelos de Lenguaje (LLM) se vuelven cada vez más potentes y accesibles. Aunque muchos interactúan con estos modelos a través de servicios basados en la nube, existe un movimiento creciente enfocado en ejecutarlos directamente en computadoras personales. Aquí es donde entra Ollama. Ollama es una herramienta potente pero fácil de usar, diseñada para simplificar drásticamente el complejo proceso de descargar, config

28 April 2025

¿Dónde Descargar Swagger UI en Español Gratis?

¿Dónde Descargar Swagger UI en Español Gratis?

¿Necesitas Swagger UI en español? Este artículo explica por qué no existe una descarga oficial gratuita y cómo habilitar la traducción. Explora las características de Swagger y por qué Apidog es la alternativa superior para diseño, pruebas y documentación API integrados.

23 April 2025

¿Dónde Descargar Postman en Español Gratis?

¿Dónde Descargar Postman en Español Gratis?

¿Puedes descargar Postman en español gratis? Aunque Postman carece de soporte nativo en español, existen soluciones. Explóralas y descubre Apidog, una potente alternativa unificada a Postman diseñada para optimizar todo tu flujo de trabajo de API, sin importar el idioma.

22 April 2025

Practica el diseño de API en Apidog

Descubre una forma más fácil de construir y usar APIs