xAI ได้เปิดตัว Grok 4.3 เป็นระยะ: รุ่นเบต้าเมื่อวันที่ 17 เมษายน 2026, การเข้าถึง API ในวันที่ 30 เมษายน และการเปิดใช้งานทั่วไปเต็มรูปแบบในวันที่ 6 พฤษภาคม จุดเด่นคือ: หน้าต่างบริบทขนาด 1,000,000 โทเค็น, การป้อนวิดีโอแบบเนทีฟเป็นครั้งแรกสำหรับ Grok, การให้เหตุผลตลอดเวลา, และการลดราคาลงประมาณ 40% เมื่อเทียบกับ Grok 4.20 โมเดล Grok รุ่นเก่าแปดรุ่นจะปลดระวางในวันที่ 15 พฤษภาคม ดังนั้นใครก็ตามที่ใช้ซีรีส์ grok-3 หรือ grok-4 ควรวางแผนการโยกย้ายในสัปดาห์นี้
คู่มือนี้ครอบคลุมวิธีการเรียกใช้ Grok 4.3 จากโค้ดของคุณ: รูปแบบของเอนด์พอยต์, การยืนยันตัวตน, URL พื้นฐานที่เข้ากันได้กับ OpenAI, พารามิเตอร์ความพยายามในการให้เหตุผล, การป้อนวิดีโอ, การเรียกใช้ฟังก์ชัน และการตั้งค่าการทดสอบที่ใช้งานได้ใน Apidog
สำหรับการใช้งานด้านเสียงของการเปิดตัวเดียวกัน โปรดดู วิธีการใช้ Grok Voice ฟรี สำหรับการเปรียบเทียบกับโมเดลเสียงเรือธงของ OpenAI โปรดดู Grok Voice vs GPT-Realtime
ปุ่ม
TL;DR
- Grok 4.3 เปิดตัวทั่วไป (GA) เมื่อวันที่ 6 พฤษภาคม 2026 โมเดลเก่าแปดรุ่นจะปลดระวางในวันที่ 15 พฤษภาคม 2026
- ราคา: $1.25 ต่อ 1 ล้านโทเค็นอินพุต, $2.50 ต่อ 1 ล้านโทเค็นเอาต์พุต, อินพุตที่แคชไว้ $0.20 ต่อ 1 ล้าน ลดลงประมาณ 40% เมื่อเทียบกับ Grok 4.20
- หน้าต่างบริบท 1 ล้านโทเค็น การป้อนวิดีโอแบบเนทีฟ การให้เหตุผลตลอดเวลา
- ระดับความพยายามในการให้เหตุผล:
low/medium/highค่าเริ่มต้นคือmedium - เอนด์พอยต์:
https://api.x.ai/v1/chat/completions(URL พื้นฐานที่เข้ากันได้กับ OpenAI) - ทรูพุต: ประมาณ 159 โทเค็น/วินาที สำหรับระดับมาตรฐาน
- ดัชนีความฉลาด 53 (การวิเคราะห์โดยปัญญาประดิษฐ์), จัดอยู่อันดับที่ 10 จาก 146 โมเดลทั่วโลก
- ใช้ Apidog เพื่อสร้างสคริปต์คำขอ, เก็บการกำหนดค่าการให้เหตุผลเป็นตัวแปร, และเล่นซ้ำในโหมดความเข้ากันได้ทั้ง Grok และ OpenAI
มีอะไรเปลี่ยนไปใน Grok 4.3 บ้าง
การอัปเกรดที่สำคัญ เรียงตามลำดับผลกระทบต่อทีมส่วนใหญ่:
- ลดราคาลง 40% อินพุตลดลง 37.5% เมื่อเทียบกับ Grok 4.20; เอาต์พุตลดลง 58.3% อัตราอินพุตที่แคชไว้ตอนนี้คือ $0.20/1M ซึ่งเป็นการลดราคาที่รุนแรงที่ทำให้พร้อมท์ระบบที่ยาวและเสถียรมีราคาถูกลงมาก
- บริบท 1 ล้านโทเค็น เพิ่มขึ้นจาก 256k ใน Grok 4.20 เพียงพอที่จะใส่โค้ดเบสขนาดกลาง, การประชุมผลประกอบการเต็มรูปแบบ หรือสัญญาทางกฎหมายที่สมบูรณ์ในพร้อมท์เดียว
- การป้อนวิดีโอแบบเนทีฟ เป็นครั้งแรกสำหรับ Grok ส่ง URL วิดีโอ และโมเดลจะให้เหตุผลบนเฟรมวิดีโอโดยตรง
- การให้เหตุผลตลอดเวลา Grok 4.3 มาพร้อมกับขั้นตอนการให้เหตุผลพื้นฐานในทุกคำขอ พารามิเตอร์
reasoning_effortจะปรับระดับความลึก แต่โมเดลจะไม่ให้เหตุผลน้อยกว่าlow - การปรับปรุงความสามารถของ Agent อย่างมาก +300 Elo points บน GDPval-AA เมื่อเทียบกับ Grok 4.20 การจัดส่งเครื่องมือและเวิร์กโฟลว์แบบหลายขั้นตอนทำงานได้ดีขึ้นอย่างเห็นได้ชัด
ดัชนีความฉลาดที่ 53 (การวิเคราะห์โดยปัญญาประดิษฐ์) ทำให้ Grok 4.3 สูงกว่าค่าเฉลี่ย 35 สำหรับระดับราคาเดียวกัน และอยู่ในอันดับที่สิบจาก 146 โมเดลที่ติดตาม
ข้อกำหนดเบื้องต้น
ก่อนคำขอแรก ให้เตรียมสี่สิ่งนี้:
- บัญชี xAI Console ที่
console.x.aiขั้นตอนการเข้าสู่ระบบเหมือนกับ Grok Voice - ระดับบริการที่สามารถเรียกเก็บเงินได้พร้อมคีย์ API ขอแนะนำให้ใช้คีย์ที่จำกัดขอบเขตโปรเจกต์สำหรับการใช้งานจริง (production)
- OpenAI SDK (Grok 4.3 เข้ากันได้กับ OpenAI) หรือ xAI SDK ใช้ได้ทั้งคู่
- ไคลเอนต์ API ที่สามารถเล่นคำขอซ้ำได้โดยไม่สร้างความยุ่งเหยิงในเทอร์มินัลของคุณ

ส่งออกคีย์เพียงครั้งเดียว:
export XAI_API_KEY="xai-..."
เอนด์พอยต์และการยืนยันตัวตน
Grok 4.3 ใช้งานได้บนอินเทอร์เฟซ Chat Completions ที่เข้ากันได้กับ OpenAI โดยใช้ URL พื้นฐานของ xAI
POST https://api.x.ai/v1/chat/completions
การยืนยันตัวตนใช้ bearer token เฮดเดอร์เป็นแบบมาตรฐาน:
Authorization: Bearer $XAI_API_KEY
Content-Type: application/json
ความเข้ากันได้กับ OpenAI หมายความว่าคุณสามารถใช้ OpenAI Python หรือ Node SDK และเปลี่ยน base_url ได้ นี่เป็นเส้นทางที่ง่ายที่สุดสำหรับทีมส่วนใหญ่ที่ย้ายจาก gpt-4 หรือ gpt-5
from openai import OpenAI
client = OpenAI(
api_key=os.environ["XAI_API_KEY"],
base_url="https://api.x.ai/v1",
)
response = client.chat.completions.create(
model="grok-4.3",
messages=[
{"role": "user", "content": "Summarize the trade-offs of GraphQL vs REST in three bullets."}
],
reasoning_effort="medium",
)
print(response.choices[0].message.content)
หากคุณต้องการใช้ xAI SDK รูปแบบการเรียกใช้จะเหมือนกัน การเปลี่ยนแปลงเพียงอย่างเดียวคือการ import
พารามิเตอร์คำขอ
แผนที่พารามิเตอร์ทั้งหมดสำหรับ Grok 4.3:
| พารามิเตอร์ | ชนิด | ค่า | หมายเหตุ |
|---|---|---|---|
model |
string | grok-4.3 |
จำเป็น |
messages |
array | รูปแบบข้อความของ OpenAI | จำเป็น รองรับ role: system / user / assistant |
reasoning_effort |
string | low, medium, high |
ไม่บังคับ ค่าเริ่มต้น: medium ระดับที่สูงขึ้นจะเพิ่มความหน่วงเวลาและโทเค็นเอาต์พุต |
max_tokens |
int | 1–32768 | จำกัดเอาต์พุต |
temperature |
float | 0.0–2.0 | ค่าเริ่มต้น 1.0 |
top_p |
float | 0.0–1.0 | การสุ่มตัวอย่างแบบ Nucleus |
stream |
bool | true / false | เหตุการณ์ที่ส่งจากเซิร์ฟเวอร์เมื่อเป็นจริง |
tools |
array | รูปแบบเครื่องมือของ OpenAI | การเรียกใช้ฟังก์ชัน |
tool_choice |
string / object | auto, none, หรือเครื่องมือที่ระบุ |
ความหมายตามมาตรฐาน OpenAI |
response_format |
object | { type: "json_object" } |
เอาต์พุตที่มีโครงสร้าง |
seed |
int | ใดๆ | เพื่อความสามารถในการทำซ้ำที่ temperature: 0 |
คำขอ curl ที่ใช้งานได้:
curl https://api.x.ai/v1/chat/completions \
-H "Authorization: Bearer $XAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-4.3",
"messages": [
{"role": "system", "content": "You are a senior backend engineer."},
{"role": "user", "content": "Review this query plan and flag the bottleneck."}
],
"reasoning_effort": "high"
}'
การตอบกลับมีรูปแบบมาตรฐานของ OpenAI: choices[].message.content พร้อมด้วยอ็อบเจกต์ usage ที่แยกรายละเอียดของ prompt_tokens, completion_tokens, reasoning_tokens, และ total_tokens
ความพยายามในการให้เหตุผล
สามระดับ พร้อมคำแนะนำที่ชัดเจน:
lowใช้สำหรับการจัดหมวดหมู่, สรุป, การดึงกฎ, คำถามและคำตอบง่ายๆ ความหน่วงเวลาสั้น, เอาต์พุตโดยตรงmediumค่าเริ่มต้น ใช้สำหรับการบริการลูกค้า, การเรียกใช้ฟังก์ชัน, การวิเคราะห์ข้อมูล, การใช้เครื่องมือแบบขั้นตอนเดียว ความลึกของการให้เหตุผลเพียงพอสำหรับทราฟฟิกการผลิตส่วนใหญ่highใช้สำหรับ agents หลายขั้นตอน, การตรวจสอบโค้ดแบบลูกโซ่ยาว, คณิตศาสตร์ที่ซับซ้อน และงานที่โมเดลต้องวางแผนก่อนตอบ
การให้เหตุผลตลอดเวลาหมายความว่าแม้แต่ low ก็ยังมีการคิดบางอย่าง ซึ่งเป็นปัจจัยที่ทำให้ความแม่นยำของข้อเท็จจริงเพิ่มขึ้นเมื่อเทียบกับ Grok 4.20 อย่าคาดหวังว่าจะประหยัดเงินด้วยการหลีกเลี่ยงการให้เหตุผลทั้งหมด เพราะมันถูกฝังอยู่แล้ว
การเรียกใช้ฟังก์ชัน
รูปแบบมาตรฐานของ OpenAI สามารถใช้งานได้โดยตรง ประกาศเครื่องมือ, โมเดลจะส่งอาร์เรย์ tool_calls ในข้อความผู้ช่วย, คุณดำเนินการ, และคุณตอบกลับด้วยข้อความ tool role:
tools = [{
"type": "function",
"function": {
"name": "lookup_user",
"description": "Look up a user by ID.",
"parameters": {
"type": "object",
"properties": {"user_id": {"type": "string"}},
"required": ["user_id"],
},
},
}]
response = client.chat.completions.create(
model="grok-4.3",
messages=[{"role": "user", "content": "Find user u_42 and tell me their last login."}],
tools=tools,
reasoning_effort="medium",
)
tool_calls = response.choices[0].message.tool_calls
การเพิ่มขึ้น 300 Elo บน GDPval-AA แสดงให้เห็นที่นี่ในการใช้งานจริง; Grok 4.3 เลือกเครื่องมือได้ดีขึ้น, มีการเรียกใช้ที่ซ้ำซ้อนน้อยลง, และสามารถกู้คืนจากข้อผิดพลาดของเครื่องมือได้โดยไม่ติดขัด หากคุณกำลังทดสอบโฟลว์เครื่องมือ การทดสอบเซิร์ฟเวอร์ MCP ใน Apidog ครอบคลุมการตั้งค่าการเล่นซ้ำที่เราใช้ภายในองค์กร
การป้อนวิดีโอ
Grok 4.3 เป็นโมเดล Grok รุ่นแรกที่รองรับการป้อนวิดีโอแบบเนทีฟ ส่ง URL วิดีโอภายในบล็อกเนื้อหา:
response = client.chat.completions.create(
model="grok-4.3",
messages=[{
"role": "user",
"content": [
{"type": "text", "text": "Describe what happens in this clip and flag any anomalies."},
{"type": "video_url", "video_url": {"url": "https://example.com/clip.mp4"}},
],
}],
)
โทเค็นวิดีโอจะนับรวมในมิเตอร์อินพุต คลิปที่ยาวจะใช้บริบทอย่างรวดเร็ว; ให้ลดขนาดหรือตัดแต่งก่อนส่งหากต้นทุนเป็นเรื่องสำคัญ โมเดลจะให้เหตุผลบนเฟรมวิดีโอโดยตรง คุณจึงไม่จำเป็นต้องดึงคีย์เฟรมด้วยตนเอง
บริบท 1 ล้านโทเค็น
หน้าต่างบริบท 1 ล้านโทเค็นเป็นเครื่องมือสำหรับการใช้งานจริง ไม่ใช่เพียงแค่รางวัลจากการทดสอบ รูปแบบการใช้งานทั่วไป:
- การตรวจสอบโค้ดทั้งโค้ดเบส รวม diff, ไฟล์ที่แก้ไขทั้งหมด และผลลัพธ์ lint เข้าด้วยกัน แล้วให้ Grok ตรวจสอบ
- การตอบคำถามเอกสารขนาดยาว ใส่สัญญา 200 หน้าเข้าไป แล้วถามคำถามที่เฉพาะเจาะจง
- หน่วยความจำการสนทนา เก็บการสนทนาทั้งหมดของ agent เป็นเวลาหนึ่งเดือนไว้ในบริบทเพื่อการปรับเปลี่ยนส่วนบุคคล
อินพุตที่แคชไว้ในราคา $0.20/1M ทำให้ราคานี้เข้าถึงได้ พร้อมท์ระบบขนาด 400k โทเค็นที่คุณเก็บไว้อย่างเสถียรจะใช้เงิน $0.08 ต่อการเรียกใช้แบบแคช แทนที่จะเป็น $0.50 สำหรับการเรียกใช้ใหม่
การโยกย้ายจากโมเดล Grok รุ่นเก่า
โมเดล Grok รุ่นเก่าแปดรุ่นจะปลดระวางในวันที่ 15 พฤษภาคม 2026, เวลา 12:00 น. PT หากคุณกำลังใช้งานโมเดลใดๆ เหล่านั้น ให้เปลี่ยนสตริง model เป็น grok-4.3 ก่อนถึงกำหนดเวลา การเรียกใช้งานส่วนใหญ่จะทำงานได้โดยไม่ต้องเปลี่ยนแปลงเพิ่มเติม เนื่องจากรูปแบบคำขอไม่เปลี่ยนแปลง
สองสิ่งที่คุณควรระวัง:
- ความพยายามในการให้เหตุผล โมเดลเก่าบางรุ่นไม่รองรับ
reasoning_effortGrok 4.3 ให้เหตุผลตลอดเวลา; หากโค้ดเดิมของคุณอาศัยเส้นทางที่ไม่ใช้การให้เหตุผลที่รวดเร็ว ให้ยอมรับความหน่วงเวลาที่เพิ่มขึ้น หรือคงไว้ที่low - การจัดรูปแบบเอาต์พุต Grok 4.3 มีโครงสร้างมากกว่า Grok 4.20 โดยค่าเริ่มต้น หากคุณเคยใช้ regex ในการประมวลผลหลังการทำงานอย่างมาก ให้ทดสอบใหม่ก่อนที่จะเปลี่ยน
สำหรับการเปรียบเทียบราคาเต็มของผลิตภัณฑ์ OpenAI โปรดดู ราคา GPT-5.5; สำหรับโมเดลการให้เหตุผลแบบตัวต่อตัว โปรดดู วิธีการใช้ GPT-5.5 API
การทดสอบใน Apidog
วิธีการตรวจสอบ Grok 4.3 กับกรณีการใช้งานของคุณที่เร็วที่สุด:
- สร้างสภาพแวดล้อม Apidog ด้วย
XAI_API_KEYและBASE_URL = https://api.x.ai/v1 - บันทึกคอลเล็กชันคำขอที่มีสามรูปแบบ:
low,medium,highสำหรับการให้เหตุผล ใช้พร้อมท์เดียวกัน แต่ระดับความพยายามต่างกัน - รันทั้งสามแบบ เปรียบเทียบการตอบกลับ, ความหน่วงเวลา, และจำนวน
usage.reasoning_tokensเคียงข้างกัน - เพิ่มรูปแบบที่สี่ที่ชี้ไปยัง URL พื้นฐานของ OpenAI เพื่อเปรียบเทียบ Grok 4.3 กับ GPT-5.5 บนอินพุตเดียวกัน ใช้ SDK เดียวกัน แต่โมเดลและ URL พื้นฐานต่างกัน
ดาวน์โหลด Apidog เพื่อทำการเปรียบเทียบ คอลเล็กชันสามารถย้ายได้ง่ายเมื่อคุณเปลี่ยนผู้ให้บริการ ซึ่งเป็นจุดประสงค์หลัก สำหรับกลยุทธ์การทดสอบ API ที่กว้างขึ้น โปรดดู เครื่องมือทดสอบ API สำหรับวิศวกร QA

การจำกัดอัตรา (Rate limits)
การจำกัดระดับใน xAI Console เริ่มต้นจากพื้นฐานไม่กี่พันคำขอต่อนาทีใน Tier 1 ไปจนถึงหลายแสนคำขอในระดับองค์กร (enterprise tiers) ตัวเลขที่แน่นอนอาจมีการเปลี่ยนแปลง; โปรดตรวจสอบแดชบอร์ดของคอนโซล ทรูพุต 159 โทเค็น/วินาทีที่ xAI โฆษณาเป็นความเร็วเอาต์พุตต่อสตรีม ไม่ใช่รวมทั้งหมด; คำขอพร้อมกันจะปรับขนาดเป็นเชิงเส้นภายในขีดจำกัดของระดับ
หากคุณติดขีดจำกัดอัตรา (rate limits) API จะคืนค่า 429 พร้อมเฮดเดอร์ retry-after ซึ่งสามารถจัดการได้ด้วยกลไก exponential backoff มาตรฐาน
คำถามที่พบบ่อย
Grok 4.3 เข้ากันได้กับ OpenAI ทั้งหมดหรือไม่? สำหรับ Chat Completions ใช่ ใส่ OpenAI SDK, เปลี่ยน base_url, เปลี่ยน model การเรียกใช้ฟังก์ชัน, เอาต์พุตที่มีโครงสร้าง และการสตรีมทั้งหมดทำงานเหมือนกัน
รองรับ Responses API หรือไม่? อินเทอร์เฟซของ xAI ในวันนี้คือ Chat Completions Responses API เป็นของ OpenAI เท่านั้น
ขีดจำกัดบริบทที่แท้จริงในการใช้งานจริงคือเท่าใด? 1,000,000 โทเค็น อินพุตที่ยาวมีค่าใช้จ่ายจริงแม้ในราคา $1.25/1M; ให้แคชอย่างจริงจังหากพร้อมท์ของคุณเสถียร
การให้เหตุผลตลอดเวลามีผลต่อความหน่วงเวลาอย่างไร? ความหน่วงเวลาของโทเค็นแรกจะสูงกว่าโมเดลที่ไม่ใช้การให้เหตุผลเล็กน้อย แต่ Grok 4.3 สตรีมเอาต์พุตที่ประมาณ 159 โทเค็น/วินาที ดังนั้นเวลาตอบสนองตั้งแต่ต้นจนจบจึงสามารถแข่งขันได้ การแลกเปลี่ยนนี้คุ้มค่าสำหรับงานที่ต้องการความแม่นยำสูง
ฉันสามารถใช้ Grok 4.3 ร่วมกับ Grok Voice ได้หรือไม่? ได้ ตัวแทนเสียง (grok-voice-think-fast-1.0) จะเรียก Grok 4.3 อยู่เบื้องหลังเมื่อมีการให้เหตุผล คุณยังสามารถเรียก Grok 4.3 ได้โดยตรงจากวงจรเสียงที่คุณสร้างขึ้นบนพื้นฐานของ TTS และ STT
จะเกิดอะไรขึ้นกับการเรียกใช้ Grok 3 / Grok 4 เดิมของฉันหลังจากวันที่ 15 พฤษภาคม? จะล้มเหลวด้วยรหัส 410 (โมเดลถูกปลดระวาง) กรุณาโยกย้ายก่อนถึงกำหนด
Grok 4.3 รองรับการป้อนรูปภาพหรือไม่? ใช่ นอกจากการป้อนวิดีโอใหม่แล้ว ส่ง URL รูปภาพในบล็อกเนื้อหา รูปแบบเดียวกับ OpenAI
สรุป
Grok 4.3 เป็นการเคลื่อนไหวด้านราคาและประสิทธิภาพที่ก้าวร้าวที่สุดที่ xAI ได้เปิดตัว การลดราคา 40%, บริบท 1 ล้านโทเค็น, การให้เหตุผลตลอดเวลา, และวิดีโอแบบเนทีฟ ทำให้เป็นเครื่องมือประจำวันที่สำคัญสำหรับงาน agent ส่วนใหญ่ ความเข้ากันได้กับ OpenAI หมายถึงการโยกย้ายคือการเปลี่ยน URL พื้นฐาน ไม่ใช่การเขียนใหม่ทั้งหมด
วิธีการตรวจสอบที่เร็วที่สุด: สร้างสคริปต์การให้เหตุผลสามรูปแบบใน Apidog ใส่พร้อมท์จริงของคุณ วัดความหน่วงเวลาและโทเค็นการให้เหตุผล โยกย้ายก่อนวันที่ 15 พฤษภาคม
ปุ่ม
