Apidog

Plataforma de desarrollo de API colaborativa todo en uno

Diseño de API

Documentación de API

Depuración de API

Simulación de API

Prueba automatizada de API

Cómo clonar una voz usando la API T2A-01-HD de MiniMax

La clonación rápida de voz de MiniMaxi API replica voces fácil y eficazmente para diversas apps. Sube audio, clona la voz y úsala para síntesis de voz.

Daniel Costa

Daniel Costa

Updated on April 15, 2025

MiniMax se enorgullece de presentar T2A-01-HD, un avance innovador en la tecnología de Texto a Audio (T2A) y las capacidades de clonación de voz. Este modelo revolucionario establece nuevos estándares en la industria al ofrecer una versatilidad sin igual en la síntesis de voz, la profundidad emocional y el soporte multilingüe. Ya sea que necesite clonación de voz para aplicaciones comerciales, proyectos creativos o comunicación multilingüe, T2A-01-HD ofrece resultados de alta fidelidad y sonido natural.

Características clave de T2A-01-HD

Multi-Voz: Síntesis y clonación de voz avanzadas

T2A-01-HD puede generar una voz sintética de alta calidad a partir de solo 10 segundos de entrada de audio. Captura las características de la voz, los patrones de habla y los matices emocionales, lo que lo hace ideal para aplicaciones que van desde el servicio al cliente automatizado hasta la narración generada por IA.

Las capacidades clave incluyen:

  • Más de 300 voces preconstruidas: Cubriendo múltiples idiomas, acentos, géneros y edades.
  • Clonación de voz personalizada: Clone voces únicas con alta precisión.
  • Control avanzado: Modifique el tono, la velocidad y la expresión para una salida personalizada.
  • Efectos profesionales: Agregue acústica de sala, filtros telefónicos y otras mejoras.

Multi-Emoción: Inteligencia emocional impulsada por IA

A diferencia de los modelos TTS tradicionales, T2A-01-HD puede identificar y replicar matices emocionales en el habla. Los usuarios pueden dejar que el sistema detecte las emociones automáticamente o especificarlas para una salida más expresiva, lo que garantiza una experiencia verdaderamente humana.

Multi-Idioma: Clonación de voz auténtica en más de 17 idiomas

T2A-01-HD admite la clonación de voz en varios idiomas, incluidos:

  • Inglés (EE. UU., Reino Unido, Australia, India)
  • Mandarín, cantonés, japonés, coreano, vietnamita, indonesio
  • Francés, alemán, español, italiano, holandés, ruso, ucraniano
  • Portugués (brasileño), turco, árabe

Con una fidelidad superior en comparación con los modelos anteriores, T2A-01-HD permite una comunicación fluida entre idiomas al tiempo que conserva los acentos naturales.

Cómo clonar una voz con la API de MiniMax

MiniMax proporciona una API simple pero potente para permitir la clonación rápida de voz. A continuación, se muestra una guía paso a paso sobre cómo usar la API T2A-01-HD para la clonación de voz.

Clonación rápida de voz

Para crear una voz clonada, primero debe cargar un archivo de audio. Este archivo debe estar en formato MP3, M4A o WAV, con una duración de 10 segundos a 5 minutos y un tamaño inferior a 20MB.

Flujo de operación

  1. Cargue un archivo de audio: Use la interfaz de carga de archivos para enviar su archivo de audio y recuperar un file_id.
  2. Clone la voz: Llame a la API de clonación de voz con el file_id y asigne un voice_id personalizado.
  3. Use la voz clonada: Utilice el voice_id dentro de la API T2A v2 para generar una salida de síntesis de voz.

Carga de un archivo de audio

Para comenzar, cargue un archivo de audio utilizando la API de carga de archivos. Este paso es esencial para obtener un file_id, que es necesario para clonar la voz.

Endpoint:
https://api.minimaxi.chat/v1/files/upload

Parámetros requeridos:

  • Authorization: Su clave API
  • Content-Type: multipart/form-data
  • purpose: voice_clone
  • file: El archivo de audio (MP3, M4A, WAV)

Ejemplo de solicitud de API (Python):

import json
import requests

group_id = 'your_group_id'  # Replace with your group ID
api_key = 'your_api_key'  # Replace with your API key

# Upload audio file
url = f'https://api.minimaxi.chat/v1/files/upload?GroupId={group_id}'
headers = {'Authorization': f'Bearer {api_key}'}
data = {'purpose': 'voice_clone'}
files = {'file': open('audio.mp3', 'rb')}

response = requests.post(url, headers=headers, data=data, files=files)
file_id = response.json().get("file").get("file_id")
print("File ID:", file_id)

Clone la voz

Una vez que se carga el archivo, use el file_id para crear una voz clonada con un voice_id personalizado.

Endpoint:
https://api.minimaxi.chat/v1/voice_clone

Parámetros requeridos:

  • file_id: El ID del archivo cargado
  • voice_id: ID personalizado definido por el usuario (debe tener al menos 8 caracteres, contener letras y números, y comenzar con una letra)

Parámetros opcionales:

  • noise_reduction: Indicador booleano para habilitar la reducción de ruido (predeterminado: false)
  • text: Un breve fragmento de texto (máximo 300 caracteres) para obtener una vista previa de la voz clonada
  • model: El modelo de texto a voz utilizado para la vista previa (speech-01-turbo)
  • accuracy: Umbral de validación de texto (predeterminado: 0.7)
  • need_volume_normalization: Indicador booleano para la normalización del volumen (predeterminado: false)

Ejemplo de solicitud de API:

url = f"https://api.minimaxi.chat/v1/voice_clone?GroupId={group_id}"
payload = json.dumps({
  "file_id": file_id,
  "voice_id": "CustomVoice123"
})
headers = {
  'Authorization': f'Bearer {api_key}',
  'Content-Type': 'application/json'
}

response = requests.post(url, headers=headers, data=payload)
print("Voice Clone Response:", response.text)

Ejemplo de respuesta

${file_id}    
{"input_sensitive":false,"input_sensitive_type":0,"base_resp":{"status_code":0,"status_msg":"success"}}    

Use la voz clonada

La voz clonada se puede usar dentro de la API T2A v2 de MiniMax para la síntesis de voz. Para conservar la voz de forma permanente, utilícela al menos una vez en 7 días; de lo contrario, se eliminará automáticamente.

Parámetros de respuesta de la API de clonación de voz

Después de enviar la solicitud, la API devolverá una respuesta que indica el éxito o el fracaso del proceso de clonación. Una respuesta exitosa se ve así:

Ejemplo de solicitud

curl --location 'https://api.minimaxi.chat/v1/voice_clone?GroupId=${group_id}' \
--header 'authority: api.minimaxi.chat' \
--header 'authorization: Bearer ${api_key}' \
--header 'content-type: application/json' \
--data '{
    "file_id":your file id,
    "voice_id":"your voice id"
}'

Ejemplo de respuesta

{
    "input_sensitive": false,
    "input_sensitive_type": 0,
    "base_resp": {
        "status_code": 0,
        "status_msg": "success"
    }
}
Uso de Apidog para la clonación rápida de voz

Uso de Apidog para la clonación rápida de voz

Apidog simplifica las pruebas y la visualización de las solicitudes y respuestas involucradas en el proceso de clonación de voz. A continuación, se muestra una guía sobre cómo puede usar Apidog junto con la API de MiniMaxi.

1. Carga de un archivo de audio en Apidog

Para iniciar el proceso de clonación de voz, el primer paso es cargar un archivo de audio. Apidog proporciona una interfaz fácil para completar los parámetros sin ejecutar realmente la solicitud.

  • Abra Apidog e inicie una nueva solicitud.
  • Establezca el encabezado Authorization con su clave API.
  • Agregue el parámetro purpose con el valor voice_clone.
  • Seleccione el archivo de audio (MP3, M4A, WAV) de su almacenamiento local.

Ejemplo de Apidog:

  • Método: POST
  • URL: https://api.minimaxi.chat/v1/files/upload
  • Authorization: Su clave API
  • Datos del formulario:
  • purpose: voice_clone
  • file: Seleccione su archivo de audio (por ejemplo, audio.mp3)

Una vez que complete los parámetros, Apidog mostrará una respuesta simulada con el file_id, que se requiere para el siguiente paso.

2. Clonación de la voz con Apidog

Después de cargar el archivo de audio y obtener el file_id, ahora puede proceder a clonar la voz.

  • Abra la API de clonación de voz en Apidog.
  • Establezca el encabezado Authorization con su clave API.
  • Ingrese el file_id que recibió del paso de carga.
  • Proporcione un voice_id personalizado (por ejemplo, test1234) para la voz clonada.
  • Opcionalmente, configure parámetros adicionales como la reducción de ruido o la normalización del volumen.

Ejemplo de Apidog:

  • Método: POST
  • URL: https://api.minimaxi.chat/v1/voice_clone
  • Authorization: Su clave API
  • Cuerpo:
  • file_id: El ID de su archivo cargado
  • voice_id: Un ID de voz personalizado (por ejemplo, test1234)

3. Ejemplo de respuesta de la API en Apidog

Una vez que se completan los parámetros de la solicitud, Apidog mostrará la respuesta esperada. Aquí hay un ejemplo de cómo podría ser una respuesta exitosa:

{
    "input_sensitive": false,
    "input_sensitive_type": 0,
    "base_resp": {
        "status_code": 0,
        "status_msg": "success"
    }
}

4. Beneficios de usar Apidog

  • Pruebas sin código: No necesita ejecutar la solicitud real. Simplemente complete los parámetros y Apidog simulará la respuesta de la API.
  • Interfaz fácil de usar: La interfaz simple de Apidog le permite probar diferentes parámetros y rastrear fácilmente las respuestas.
  • Depuración simplificada: Si ocurre un error, la respuesta incluirá códigos de error y mensajes útiles para guiarlo en la resolución de problemas.

Al usar Apidog, puede visualizar la estructura de la solicitud y la respuesta rápidamente sin necesidad de ejecutar las llamadas API reales, lo que la convierte en una herramienta conveniente para probar las funciones de clonación de voz de MiniMaxi.


Códigos de error

Si ocurre un error durante la solicitud, la respuesta incluirá un base_resp.status_code y base_resp.status_msg para la resolución de problemas.

Código de error Significado
1000 Error desconocido
1001 Tiempo de espera agotado
1002 Activar la restricción RPM
1004 Fallo de autenticación
1039 Activar la restricción TPM
1042 Los caracteres ilegales excedieron el máximo (más del 10% de la entrada)
2013 Formato de entrada no válido

Experimente el futuro de la tecnología de voz

T2A-01-HD de MiniMax es un cambio de juego en la síntesis de voz impulsada por IA, que ofrece una combinación incomparable de precisión, profundidad emocional y soporte multilingüe. Ya sea que necesite clonación de voz para entretenimiento, accesibilidad o aplicaciones comerciales, T2A-01-HD ofrece un rendimiento inigualable.

Pruébelo ahora gratis

Inicio rápido para desarrolladores

Aprenda cómo realizar su primera solicitud API utilizando el ID de grupo y la clave API. Al llamar a la API, necesitará tanto el GroupID como la clave API. GroupID es el identificador único de su cuenta, vinculado a los privilegios de su cuenta. Está asociado con sus recargas, facturación y uso de rendimiento. La clave API es esencial para acceder de forma segura a la API. Asegúrese de almacenarla en un lugar seguro, como un archivo de texto cifrado en su computadora, para evitar el acceso no autorizado. Siga estos pasos para obtenerlos:

1. Obtenga el GroupID:

  • Vaya a la pestaña Cuenta y seleccione Su perfil en el menú de la izquierda.
  • Ubique el campo GroupID en la información básica. Este es un número de 19 dígitos. Puede usar el icono de copia para copiar el GroupID.

2. Genere una clave API:

  • En el menú de la izquierda, haga clic en Claves API, luego seleccione Crear nueva clave secreta.
  • Ingrese un nombre para la clave en el campo provisto, luego haga clic en Crear.
  • Aparecerá un cuadro de diálogo. Antes de hacer clic en Confirmar, use el icono de copia para guardar de forma segura la clave API, ya que no se volverá a mostrar.

Con T2A-01-HD, el futuro de la síntesis de voz impulsada por IA está aquí. ¡Comience a crear voces realistas hoy mismo!

button
¿Dónde Descargar Swagger UI en Español Gratis?Punto de vista

¿Dónde Descargar Swagger UI en Español Gratis?

¿Necesitas Swagger UI en español? Este artículo explica por qué no existe una descarga oficial gratuita y cómo habilitar la traducción. Explora las características de Swagger y por qué Apidog es la alternativa superior para diseño, pruebas y documentación API integrados.

Oliver Kingsley

April 23, 2025

¿Dónde Descargar Postman en Español Gratis?Punto de vista

¿Dónde Descargar Postman en Español Gratis?

¿Puedes descargar Postman en español gratis? Aunque Postman carece de soporte nativo en español, existen soluciones. Explóralas y descubre Apidog, una potente alternativa unificada a Postman diseñada para optimizar todo tu flujo de trabajo de API, sin importar el idioma.

Oliver Kingsley

April 22, 2025

Cómo usar GPT-4.1 con CursorPunto de vista

Cómo usar GPT-4.1 con Cursor

Esta guía explica el rendimiento de GPT-4.1, precios y dos métodos para integrarlo en Cursor.

Daniel Costa

April 15, 2025