วิธีการโคลนเสียงโดยใช้ MiniMax's T2A-01-HD API

คุณสมบัติโคลนเสียง MiniMaxi API รวดเร็ว ใช้งานง่าย สร้างเสียงเหมือนจริงจากไฟล์เสียง เพื่อสังเคราะห์เสียงพูด

อาชว์

อาชว์

4 June 2025

วิธีการโคลนเสียงโดยใช้ MiniMax's T2A-01-HD API

```html

MiniMax ภูมิใจนำเสนอ T2A-01-HD ซึ่งเป็นความก้าวหน้าครั้งสำคัญในเทคโนโลยี Text-to-Audio (T2A) และความสามารถในการโคลนเสียง โมเดลปฏิวัติวงการนี้สร้างมาตรฐานใหม่ในอุตสาหกรรมด้วยการนำเสนอความสามารถรอบด้านที่เหนือชั้นในการสังเคราะห์เสียง ความลึกซึ้งทางอารมณ์ และการรองรับหลายภาษา ไม่ว่าคุณจะต้องการโคลนเสียงสำหรับแอปพลิเคชันทางธุรกิจ โครงการสร้างสรรค์ หรือการสื่อสารหลายภาษา T2A-01-HD มอบผลลัพธ์ที่มีความเที่ยงตรงสูงและฟังดูเป็นธรรมชาติ

คุณสมบัติหลักของ T2A-01-HD

Multi-Voice: การสังเคราะห์และโคลนเสียงขั้นสูง

T2A-01-HD สามารถสร้างเสียงสังเคราะห์คุณภาพสูงได้จากอินพุตเสียงเพียง 10 วินาที มันจะจับลักษณะเสียง รูปแบบการพูด และความแตกต่างทางอารมณ์ ทำให้เหมาะสำหรับแอปพลิเคชันต่างๆ ตั้งแต่การบริการลูกค้าอัตโนมัติไปจนถึงการบรรยายที่สร้างโดย AI

ความสามารถหลัก ได้แก่:

Multi-Emotion: ปัญญาทางอารมณ์ที่ขับเคลื่อนด้วย AI

แตกต่างจากโมเดล TTS ทั่วไป T2A-01-HD สามารถระบุและจำลองความแตกต่างทางอารมณ์ในการพูดได้ ผู้ใช้สามารถให้ระบบตรวจจับอารมณ์โดยอัตโนมัติ หรือระบุอารมณ์เหล่านั้นเพื่อผลลัพธ์ที่แสดงออกมากขึ้น เพื่อให้มั่นใจถึงประสบการณ์ที่เหมือนมนุษย์อย่างแท้จริง

Multi-Language: การโคลนเสียงที่แท้จริงใน 17+ ภาษา

T2A-01-HD รองรับการโคลนเสียงในหลายภาษา ได้แก่:

ด้วยความเที่ยงตรงที่เหนือกว่าเมื่อเทียบกับรุ่นก่อนหน้า T2A-01-HD ช่วยให้การสื่อสารเป็นไปอย่างราบรื่นในหลายภาษา ในขณะที่ยังคงรักษาสำเนียงที่เป็นธรรมชาติไว้

วิธีโคลนเสียงด้วย API ของ MiniMax

MiniMax มอบ API ที่เรียบง่ายแต่ทรงพลังเพื่อเปิดใช้งานการโคลนเสียงอย่างรวดเร็ว ด้านล่างนี้คือคำแนะนำทีละขั้นตอนเกี่ยวกับวิธีใช้ T2A-01-HD API สำหรับการโคลนเสียง

การโคลนเสียงอย่างรวดเร็ว

ในการสร้างเสียงที่โคลน คุณต้องอัปโหลดไฟล์เสียงก่อน ไฟล์นี้ควรอยู่ในรูปแบบ MP3, M4A หรือ WAV โดยมีระยะเวลา 10 วินาที ถึง 5 นาที และมีขนาดต่ำกว่า 20MB

ขั้นตอนการดำเนินการ

  1. อัปโหลดไฟล์เสียง: ใช้ส่วนต่อประสานการอัปโหลดไฟล์เพื่อส่งไฟล์เสียงของคุณและดึง file_id
  2. โคลนเสียง: เรียก Voice Clone API ด้วย file_id และกำหนด voice_id ที่กำหนดเอง
  3. ใช้เสียงที่โคลน: ใช้ voice_id ภายใน T2A v2 API เพื่อสร้างเอาต์พุตการสังเคราะห์คำพูด

การอัปโหลดไฟล์เสียง

ในการเริ่มต้น ให้อัปโหลดไฟล์เสียงโดยใช้ File Upload API ขั้นตอนนี้จำเป็นสำหรับการรับ file_id ซึ่งจำเป็นสำหรับการโคลนเสียง

Endpoint:
https://api.minimaxi.chat/v1/files/upload

พารามิเตอร์ที่จำเป็น:

ตัวอย่างคำขอ API (Python):

import json
import requests

group_id = 'your_group_id'  # แทนที่ด้วย ID กลุ่มของคุณ
api_key = 'your_api_key'  # แทนที่ด้วย API key ของคุณ

# อัปโหลดไฟล์เสียง
url = f'https://api.minimaxi.chat/v1/files/upload?GroupId={group_id}'
headers = {'Authorization': f'Bearer {api_key}'}
data = {'purpose': 'voice_clone'}
files = {'file': open('audio.mp3', 'rb')}

response = requests.post(url, headers=headers, data=data, files=files)
file_id = response.json().get("file").get("file_id")
print("File ID:", file_id)

โคลนเสียง

เมื่ออัปโหลดไฟล์แล้ว ให้ใช้ file_id เพื่อสร้างเสียงที่โคลนด้วย voice_id ที่กำหนดเอง

Endpoint:
https://api.minimaxi.chat/v1/voice_clone

พารามิเตอร์ที่จำเป็น:

พารามิเตอร์เสริม:

ตัวอย่างคำขอ API:

url = f"https://api.minimaxi.chat/v1/voice_clone?GroupId={group_id}"
payload = json.dumps({
  "file_id": file_id,
  "voice_id": "CustomVoice123"
})
headers = {
  'Authorization': f'Bearer {api_key}',
  'Content-Type': 'application/json'
}

response = requests.post(url, headers=headers, data=payload)
print("Voice Clone Response:", response.text)

ตัวอย่างการตอบสนอง

${file_id}    
{"input_sensitive":false,"input_sensitive_type":0,"base_resp":{"status_code":0,"status_msg":"success"}}    

ใช้เสียงที่โคลน

เสียงที่โคลนสามารถใช้ภายใน MiniMax’s T2A v2 API สำหรับการสังเคราะห์คำพูด ในการเก็บรักษาเสียงอย่างถาวร ให้ใช้เสียงนั้นอย่างน้อยหนึ่งครั้งภายใน 7 วัน มิฉะนั้น เสียงนั้นจะถูกลบโดยอัตโนมัติ

พารามิเตอร์การตอบสนอง API การโคลนเสียง

หลังจากส่งคำขอ API จะส่งคืนการตอบสนองที่ระบุความสำเร็จหรือความล้มเหลวของกระบวนการโคลน การตอบสนองที่สำเร็จมีลักษณะดังนี้:

ตัวอย่างคำขอ

curl --location 'https://api.minimaxi.chat/v1/voice_clone?GroupId=${group_id}' \
--header 'authority: api.minimaxi.chat' \
--header 'authorization: Bearer ${api_key}' \
--header 'content-type: application/json' \
--data '{
    "file_id":your file id,
    "voice_id":"your voice id"
}'

ตัวอย่างการตอบสนอง

{
    "input_sensitive": false,
    "input_sensitive_type": 0,
    "base_resp": {
        "status_code": 0,
        "status_msg": "success"
    }
}
การใช้ Apidog เพื่อการโคลนเสียงที่รวดเร็ว

การใช้ Apidog เพื่อการโคลนเสียงที่รวดเร็ว

Apidog ช่วยลดความซับซ้อนในการทดสอบและการแสดงภาพคำขอและการตอบสนองที่เกี่ยวข้องกับกระบวนการโคลนเสียง ด้านล่างนี้คือคำแนะนำเกี่ยวกับวิธีที่คุณสามารถใช้ Apidog ร่วมกับ MiniMaxi API

1. การอัปโหลดไฟล์เสียงใน Apidog

ในการเริ่มต้นกระบวนการโคลนเสียง ขั้นตอนแรกคือการอัปโหลดไฟล์เสียง Apidog มีส่วนต่อประสานที่ง่ายต่อการกรอกพารามิเตอร์โดยไม่ต้องเรียกใช้คำขอจริง

ตัวอย่าง Apidog:

เมื่อคุณกรอกพารามิเตอร์แล้ว Apidog จะแสดงการตอบสนองจำลองด้วย file_id ซึ่งจำเป็นสำหรับขั้นตอนถัดไป

2. การโคลนเสียงด้วย Apidog

หลังจากอัปโหลดไฟล์เสียงและรับ file_id แล้ว ตอนนี้คุณสามารถดำเนินการโคลนเสียงได้

ตัวอย่าง Apidog:


3. ตัวอย่างการตอบสนอง API ใน Apidog

เมื่อกรอกพารามิเตอร์คำขอแล้ว Apidog จะแสดงการตอบสนองที่คาดไว้ นี่คือตัวอย่างลักษณะของการตอบสนองที่ประสบความสำเร็จ:

{
    "input_sensitive": false,
    "input_sensitive_type": 0,
    "base_resp": {
        "status_code": 0,
        "status_msg": "success"
    }
}

4. ประโยชน์ของการใช้ Apidog

ด้วยการใช้ Apidog คุณสามารถแสดงภาพโครงสร้างคำขอและการตอบสนองได้อย่างรวดเร็วโดยไม่จำเป็นต้องดำเนินการเรียก API จริง ทำให้เป็นเครื่องมือที่สะดวกสำหรับการทดสอบคุณสมบัติการโคลนเสียงของ MiniMaxi


รหัสข้อผิดพลาด

หากเกิดข้อผิดพลาดระหว่างคำขอ การตอบสนองจะรวมถึง base_resp.status_code และ base_resp.status_msg สำหรับการแก้ไขปัญหา

รหัสข้อผิดพลาด ความหมาย
1000 ข้อผิดพลาดที่ไม่รู้จัก
1001 หมดเวลา
1002 ทริกเกอร์ข้อจำกัด RPM
1004 การตรวจสอบสิทธิ์ล้มเหลว
1039 ทริกเกอร์ข้อจำกัด TPM
1042 อักขระที่ไม่ถูกต้องเกินขีดจำกัดสูงสุด (มากกว่า 10% ของอินพุต)
2013 รูปแบบอินพุตไม่ถูกต้อง

สัมผัสอนาคตของเทคโนโลยีเสียง

T2A-01-HD ของ MiniMax เป็นตัวเปลี่ยนเกมในการสังเคราะห์เสียงที่ขับเคลื่อนด้วย AI โดยนำเสนอการผสมผสานที่เหนือชั้นของความแม่นยำ ความลึกซึ้งทางอารมณ์ และการรองรับหลายภาษา ไม่ว่าคุณจะต้องการโคลนเสียงเพื่อความบันเทิง การเข้าถึง หรือแอปพลิเคชันทางธุรกิจ T2A-01-HD มอบประสิทธิภาพที่ไม่มีใครเทียบได้

ลองเลยตอนนี้ฟรี

Developer Quickstart

เรียนรู้วิธีสร้างคำขอ API แรกของคุณโดยใช้ Group ID และ API key เมื่อเรียกใช้ API คุณจะต้องมีทั้ง GroupID และ API keyGroupID เป็นตัวระบุเฉพาะสำหรับบัญชีของคุณ ซึ่งเชื่อมโยงกับสิทธิ์ของบัญชีของคุณ มันเกี่ยวข้องกับการเติมเงิน การเรียกเก็บเงิน และการใช้งานปริมาณงานของคุณAPI key เป็นสิ่งจำเป็นสำหรับการเข้าถึง API อย่างปลอดภัย ตรวจสอบให้แน่ใจว่าได้จัดเก็บไว้ในตำแหน่งที่ปลอดภัย เช่น ไฟล์ข้อความที่เข้ารหัสบนคอมพิวเตอร์ของคุณ เพื่อป้องกันการเข้าถึงโดยไม่ได้รับอนุญาตทำตามขั้นตอนเหล่านี้เพื่อรับ:

1. รับ GroupID:

2. สร้าง API Key:

ด้วย T2A-01-HD อนาคตของการสังเคราะห์เสียงที่ขับเคลื่อนด้วย AI มาถึงแล้ว เริ่มสร้างเสียงที่เหมือนจริงได้แล้ววันนี้!

button

```

Explore more

สร้างทางเลือกสำหรับ Claude Web Search แบบ Open Source (พร้อมเซิร์ฟเวอร์ Firecrawl MCP)

สร้างทางเลือกสำหรับ Claude Web Search แบบ Open Source (พร้อมเซิร์ฟเวอร์ Firecrawl MCP)

สำหรับองค์กรที่ต้องการควบคุม, ปรับแต่ง, หรือความเป็นส่วนตัวมากกว่าการค้นหาเว็บของ Claude, การสร้างทางเลือกโดยใช้ Firecrawl เป็นทางออกที่ดี มาเรียนรู้กัน!

21 March 2025

10 อันดับทางเลือกที่ดีที่สุดสำหรับการเล่นวินเซิร์ฟสำหรับนักเขียนโค้ดที่ชอบความรู้สึกในปี 2025

10 อันดับทางเลือกที่ดีที่สุดสำหรับการเล่นวินเซิร์ฟสำหรับนักเขียนโค้ดที่ชอบความรู้สึกในปี 2025

ค้นพบ 10 ทางเลือก Windsurf ปี 2025 ปรับปรุงการเขียนโค้ด เหมาะสำหรับนักพัฒนาที่ต้องการโซลูชันการเขียนโค้ดที่มีประสิทธิภาพ ปลอดภัย และหลากหลาย

20 March 2025

Figma มีเซิร์ฟเวอร์ MCP แล้ว และนี่คือวิธีใช้งาน

Figma มีเซิร์ฟเวอร์ MCP แล้ว และนี่คือวิธีใช้งาน

ค้นพบวิธีเชื่อมต่อ Figma MCP กับ AI เช่น Cursor เพื่อสร้างโค้ดอัตโนมัติ เหมาะสำหรับนักพัฒนาและนักออกแบบ

20 March 2025

ฝึกการออกแบบ API แบบ Design-first ใน Apidog

ค้นพบวิธีที่ง่ายขึ้นในการสร้างและใช้ API