วิธีใช้ Grok 4.3 API

xAI ได้เปิดตัว Grok 4.3 เป็นระยะ: รุ่นเบต้าเมื่อวันที่ 17 เมษายน 2026, การเข้าถึง API ในวันที่ 30 เมษายน และการเปิดใช้งานทั่วไปเต็มรูปแบบในวันที่ 6 พฤษภาคม จุดเด่นคือ: หน้าต่างบริบทขนาด 1,000,000 โทเค็น, การป้อนวิดีโอแบบเนทีฟเป็นครั้งแรกสำหรับ Grok, การให้เหตุผลตลอดเวลา, และการลดราคาลงประมาณ 40% เมื่อเทียบกับ Grok 4.20 โมเดล Grok รุ่นเก่าแปดรุ่นจะปลดระวางในวันที่ 15 พฤษภาคม ดังนั้นใครก็ตามที่ใช้ซีรีส์ grok-3 หรือ grok-4 ควรวางแผนการโยกย้ายในสัปดาห์นี้

คู่มือนี้ครอบคลุมวิธีการเรียกใช้ Grok 4.3 จากโค้ดของคุณ: รูปแบบของเอนด์พอยต์, การยืนยันตัวตน, URL พื้นฐานที่เข้ากันได้กับ OpenAI, พารามิเตอร์ความพยายามในการให้เหตุผล, การป้อนวิดีโอ, การเรียกใช้ฟังก์ชัน และการตั้งค่าการทดสอบที่ใช้งานได้ใน Apidog

สำหรับการใช้งานด้านเสียงของการเปิดตัวเดียวกัน โปรดดู วิธีการใช้ Grok Voice ฟรี สำหรับการเปรียบเทียบกับโมเดลเสียงเรือธงของ OpenAI โปรดดู Grok Voice vs GPT-Realtime

ปุ่ม

TL;DR

Grok 4.3 เปิดตัวทั่วไป (GA) เมื่อวันที่ 6 พฤษภาคม 2026 โมเดลเก่าแปดรุ่นจะปลดระวางในวันที่ 15 พฤษภาคม 2026
ราคา: $1.25 ต่อ 1 ล้านโทเค็นอินพุต, $2.50 ต่อ 1 ล้านโทเค็นเอาต์พุต, อินพุตที่แคชไว้ $0.20 ต่อ 1 ล้าน ลดลงประมาณ 40% เมื่อเทียบกับ Grok 4.20
หน้าต่างบริบท 1 ล้านโทเค็น การป้อนวิดีโอแบบเนทีฟ การให้เหตุผลตลอดเวลา
ระดับความพยายามในการให้เหตุผล: low / medium / high ค่าเริ่มต้นคือ medium
เอนด์พอยต์: https://api.x.ai/v1/chat/completions (URL พื้นฐานที่เข้ากันได้กับ OpenAI)
ทรูพุต: ประมาณ 159 โทเค็น/วินาที สำหรับระดับมาตรฐาน
ดัชนีความฉลาด 53 (การวิเคราะห์โดยปัญญาประดิษฐ์), จัดอยู่อันดับที่ 10 จาก 146 โมเดลทั่วโลก
ใช้ Apidog เพื่อสร้างสคริปต์คำขอ, เก็บการกำหนดค่าการให้เหตุผลเป็นตัวแปร, และเล่นซ้ำในโหมดความเข้ากันได้ทั้ง Grok และ OpenAI

มีอะไรเปลี่ยนไปใน Grok 4.3 บ้าง

การอัปเกรดที่สำคัญ เรียงตามลำดับผลกระทบต่อทีมส่วนใหญ่:

ลดราคาลง 40% อินพุตลดลง 37.5% เมื่อเทียบกับ Grok 4.20; เอาต์พุตลดลง 58.3% อัตราอินพุตที่แคชไว้ตอนนี้คือ $0.20/1M ซึ่งเป็นการลดราคาที่รุนแรงที่ทำให้พร้อมท์ระบบที่ยาวและเสถียรมีราคาถูกลงมาก
บริบท 1 ล้านโทเค็น เพิ่มขึ้นจาก 256k ใน Grok 4.20 เพียงพอที่จะใส่โค้ดเบสขนาดกลาง, การประชุมผลประกอบการเต็มรูปแบบ หรือสัญญาทางกฎหมายที่สมบูรณ์ในพร้อมท์เดียว
การป้อนวิดีโอแบบเนทีฟ เป็นครั้งแรกสำหรับ Grok ส่ง URL วิดีโอ และโมเดลจะให้เหตุผลบนเฟรมวิดีโอโดยตรง
การให้เหตุผลตลอดเวลา Grok 4.3 มาพร้อมกับขั้นตอนการให้เหตุผลพื้นฐานในทุกคำขอ พารามิเตอร์ reasoning_effort จะปรับระดับความลึก แต่โมเดลจะไม่ให้เหตุผลน้อยกว่า low
การปรับปรุงความสามารถของ Agent อย่างมาก +300 Elo points บน GDPval-AA เมื่อเทียบกับ Grok 4.20 การจัดส่งเครื่องมือและเวิร์กโฟลว์แบบหลายขั้นตอนทำงานได้ดีขึ้นอย่างเห็นได้ชัด

ดัชนีความฉลาดที่ 53 (การวิเคราะห์โดยปัญญาประดิษฐ์) ทำให้ Grok 4.3 สูงกว่าค่าเฉลี่ย 35 สำหรับระดับราคาเดียวกัน และอยู่ในอันดับที่สิบจาก 146 โมเดลที่ติดตาม

ข้อกำหนดเบื้องต้น

ก่อนคำขอแรก ให้เตรียมสี่สิ่งนี้:

บัญชี xAI Console ที่ console.x.ai ขั้นตอนการเข้าสู่ระบบเหมือนกับ Grok Voice
ระดับบริการที่สามารถเรียกเก็บเงินได้พร้อมคีย์ API ขอแนะนำให้ใช้คีย์ที่จำกัดขอบเขตโปรเจกต์สำหรับการใช้งานจริง (production)
OpenAI SDK (Grok 4.3 เข้ากันได้กับ OpenAI) หรือ xAI SDK ใช้ได้ทั้งคู่
ไคลเอนต์ API ที่สามารถเล่นคำขอซ้ำได้โดยไม่สร้างความยุ่งเหยิงในเทอร์มินัลของคุณ

ส่งออกคีย์เพียงครั้งเดียว:

export XAI_API_KEY="xai-..."

เอนด์พอยต์และการยืนยันตัวตน

Grok 4.3 ใช้งานได้บนอินเทอร์เฟซ Chat Completions ที่เข้ากันได้กับ OpenAI โดยใช้ URL พื้นฐานของ xAI

POST https://api.x.ai/v1/chat/completions

การยืนยันตัวตนใช้ bearer token เฮดเดอร์เป็นแบบมาตรฐาน:

Authorization: Bearer $XAI_API_KEY
Content-Type: application/json

ความเข้ากันได้กับ OpenAI หมายความว่าคุณสามารถใช้ OpenAI Python หรือ Node SDK และเปลี่ยน base_url ได้ นี่เป็นเส้นทางที่ง่ายที่สุดสำหรับทีมส่วนใหญ่ที่ย้ายจาก gpt-4 หรือ gpt-5

from openai import OpenAI

client = OpenAI(
    api_key=os.environ["XAI_API_KEY"],
    base_url="https://api.x.ai/v1",
)

response = client.chat.completions.create(
    model="grok-4.3",
    messages=[
        {"role": "user", "content": "Summarize the trade-offs of GraphQL vs REST in three bullets."}
    ],
    reasoning_effort="medium",
)

print(response.choices[0].message.content)

หากคุณต้องการใช้ xAI SDK รูปแบบการเรียกใช้จะเหมือนกัน การเปลี่ยนแปลงเพียงอย่างเดียวคือการ import

พารามิเตอร์คำขอ

แผนที่พารามิเตอร์ทั้งหมดสำหรับ Grok 4.3:

พารามิเตอร์	ชนิด	ค่า	หมายเหตุ
`model`	string	`grok-4.3`	จำเป็น
`messages`	array	รูปแบบข้อความของ OpenAI	จำเป็น รองรับ `role: system / user / assistant`
`reasoning_effort`	string	`low`, `medium`, `high`	ไม่บังคับ ค่าเริ่มต้น: `medium` ระดับที่สูงขึ้นจะเพิ่มความหน่วงเวลาและโทเค็นเอาต์พุต
`max_tokens`	int	1–32768	จำกัดเอาต์พุต
`temperature`	float	0.0–2.0	ค่าเริ่มต้น 1.0
`top_p`	float	0.0–1.0	การสุ่มตัวอย่างแบบ Nucleus
`stream`	bool	true / false	เหตุการณ์ที่ส่งจากเซิร์ฟเวอร์เมื่อเป็นจริง
`tools`	array	รูปแบบเครื่องมือของ OpenAI	การเรียกใช้ฟังก์ชัน
`tool_choice`	string / object	`auto`, `none`, หรือเครื่องมือที่ระบุ	ความหมายตามมาตรฐาน OpenAI
`response_format`	object	`{ type: "json_object" }`	เอาต์พุตที่มีโครงสร้าง
`seed`	int	ใดๆ	เพื่อความสามารถในการทำซ้ำที่ `temperature: 0`

คำขอ curl ที่ใช้งานได้:

curl https://api.x.ai/v1/chat/completions \
  -H "Authorization: Bearer $XAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-4.3",
    "messages": [
      {"role": "system", "content": "You are a senior backend engineer."},
      {"role": "user", "content": "Review this query plan and flag the bottleneck."}
    ],
    "reasoning_effort": "high"
  }'

การตอบกลับมีรูปแบบมาตรฐานของ OpenAI: choices[].message.content พร้อมด้วยอ็อบเจกต์ usage ที่แยกรายละเอียดของ prompt_tokens, completion_tokens, reasoning_tokens, และ total_tokens

ความพยายามในการให้เหตุผล

สามระดับ พร้อมคำแนะนำที่ชัดเจน:

low ใช้สำหรับการจัดหมวดหมู่, สรุป, การดึงกฎ, คำถามและคำตอบง่ายๆ ความหน่วงเวลาสั้น, เอาต์พุตโดยตรง
medium ค่าเริ่มต้น ใช้สำหรับการบริการลูกค้า, การเรียกใช้ฟังก์ชัน, การวิเคราะห์ข้อมูล, การใช้เครื่องมือแบบขั้นตอนเดียว ความลึกของการให้เหตุผลเพียงพอสำหรับทราฟฟิกการผลิตส่วนใหญ่
high ใช้สำหรับ agents หลายขั้นตอน, การตรวจสอบโค้ดแบบลูกโซ่ยาว, คณิตศาสตร์ที่ซับซ้อน และงานที่โมเดลต้องวางแผนก่อนตอบ

การให้เหตุผลตลอดเวลาหมายความว่าแม้แต่ low ก็ยังมีการคิดบางอย่าง ซึ่งเป็นปัจจัยที่ทำให้ความแม่นยำของข้อเท็จจริงเพิ่มขึ้นเมื่อเทียบกับ Grok 4.20 อย่าคาดหวังว่าจะประหยัดเงินด้วยการหลีกเลี่ยงการให้เหตุผลทั้งหมด เพราะมันถูกฝังอยู่แล้ว

การเรียกใช้ฟังก์ชัน

รูปแบบมาตรฐานของ OpenAI สามารถใช้งานได้โดยตรง ประกาศเครื่องมือ, โมเดลจะส่งอาร์เรย์ tool_calls ในข้อความผู้ช่วย, คุณดำเนินการ, และคุณตอบกลับด้วยข้อความ tool role:

tools = [{
    "type": "function",
    "function": {
        "name": "lookup_user",
        "description": "Look up a user by ID.",
        "parameters": {
            "type": "object",
            "properties": {"user_id": {"type": "string"}},
            "required": ["user_id"],
        },
    },
}]

response = client.chat.completions.create(
    model="grok-4.3",
    messages=[{"role": "user", "content": "Find user u_42 and tell me their last login."}],
    tools=tools,
    reasoning_effort="medium",
)

tool_calls = response.choices[0].message.tool_calls

การเพิ่มขึ้น 300 Elo บน GDPval-AA แสดงให้เห็นที่นี่ในการใช้งานจริง; Grok 4.3 เลือกเครื่องมือได้ดีขึ้น, มีการเรียกใช้ที่ซ้ำซ้อนน้อยลง, และสามารถกู้คืนจากข้อผิดพลาดของเครื่องมือได้โดยไม่ติดขัด หากคุณกำลังทดสอบโฟลว์เครื่องมือ การทดสอบเซิร์ฟเวอร์ MCP ใน Apidog ครอบคลุมการตั้งค่าการเล่นซ้ำที่เราใช้ภายในองค์กร

การป้อนวิดีโอ

Grok 4.3 เป็นโมเดล Grok รุ่นแรกที่รองรับการป้อนวิดีโอแบบเนทีฟ ส่ง URL วิดีโอภายในบล็อกเนื้อหา:

response = client.chat.completions.create(
    model="grok-4.3",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "Describe what happens in this clip and flag any anomalies."},
            {"type": "video_url", "video_url": {"url": "https://example.com/clip.mp4"}},
        ],
    }],
)

โทเค็นวิดีโอจะนับรวมในมิเตอร์อินพุต คลิปที่ยาวจะใช้บริบทอย่างรวดเร็ว; ให้ลดขนาดหรือตัดแต่งก่อนส่งหากต้นทุนเป็นเรื่องสำคัญ โมเดลจะให้เหตุผลบนเฟรมวิดีโอโดยตรง คุณจึงไม่จำเป็นต้องดึงคีย์เฟรมด้วยตนเอง

บริบท 1 ล้านโทเค็น

หน้าต่างบริบท 1 ล้านโทเค็นเป็นเครื่องมือสำหรับการใช้งานจริง ไม่ใช่เพียงแค่รางวัลจากการทดสอบ รูปแบบการใช้งานทั่วไป:

การตรวจสอบโค้ดทั้งโค้ดเบส รวม diff, ไฟล์ที่แก้ไขทั้งหมด และผลลัพธ์ lint เข้าด้วยกัน แล้วให้ Grok ตรวจสอบ
การตอบคำถามเอกสารขนาดยาว ใส่สัญญา 200 หน้าเข้าไป แล้วถามคำถามที่เฉพาะเจาะจง
หน่วยความจำการสนทนา เก็บการสนทนาทั้งหมดของ agent เป็นเวลาหนึ่งเดือนไว้ในบริบทเพื่อการปรับเปลี่ยนส่วนบุคคล

อินพุตที่แคชไว้ในราคา $0.20/1M ทำให้ราคานี้เข้าถึงได้ พร้อมท์ระบบขนาด 400k โทเค็นที่คุณเก็บไว้อย่างเสถียรจะใช้เงิน $0.08 ต่อการเรียกใช้แบบแคช แทนที่จะเป็น $0.50 สำหรับการเรียกใช้ใหม่

การโยกย้ายจากโมเดล Grok รุ่นเก่า

โมเดล Grok รุ่นเก่าแปดรุ่นจะปลดระวางในวันที่ 15 พฤษภาคม 2026, เวลา 12:00 น. PT หากคุณกำลังใช้งานโมเดลใดๆ เหล่านั้น ให้เปลี่ยนสตริง model เป็น grok-4.3 ก่อนถึงกำหนดเวลา การเรียกใช้งานส่วนใหญ่จะทำงานได้โดยไม่ต้องเปลี่ยนแปลงเพิ่มเติม เนื่องจากรูปแบบคำขอไม่เปลี่ยนแปลง

สองสิ่งที่คุณควรระวัง:

ความพยายามในการให้เหตุผล โมเดลเก่าบางรุ่นไม่รองรับ reasoning_effort Grok 4.3 ให้เหตุผลตลอดเวลา; หากโค้ดเดิมของคุณอาศัยเส้นทางที่ไม่ใช้การให้เหตุผลที่รวดเร็ว ให้ยอมรับความหน่วงเวลาที่เพิ่มขึ้น หรือคงไว้ที่ low
การจัดรูปแบบเอาต์พุต Grok 4.3 มีโครงสร้างมากกว่า Grok 4.20 โดยค่าเริ่มต้น หากคุณเคยใช้ regex ในการประมวลผลหลังการทำงานอย่างมาก ให้ทดสอบใหม่ก่อนที่จะเปลี่ยน

สำหรับการเปรียบเทียบราคาเต็มของผลิตภัณฑ์ OpenAI โปรดดู ราคา GPT-5.5; สำหรับโมเดลการให้เหตุผลแบบตัวต่อตัว โปรดดู วิธีการใช้ GPT-5.5 API

การทดสอบใน Apidog

วิธีการตรวจสอบ Grok 4.3 กับกรณีการใช้งานของคุณที่เร็วที่สุด:

สร้างสภาพแวดล้อม Apidog ด้วย XAI_API_KEY และ BASE_URL = https://api.x.ai/v1
บันทึกคอลเล็กชันคำขอที่มีสามรูปแบบ: low, medium, high สำหรับการให้เหตุผล ใช้พร้อมท์เดียวกัน แต่ระดับความพยายามต่างกัน
รันทั้งสามแบบ เปรียบเทียบการตอบกลับ, ความหน่วงเวลา, และจำนวน usage.reasoning_tokens เคียงข้างกัน
เพิ่มรูปแบบที่สี่ที่ชี้ไปยัง URL พื้นฐานของ OpenAI เพื่อเปรียบเทียบ Grok 4.3 กับ GPT-5.5 บนอินพุตเดียวกัน ใช้ SDK เดียวกัน แต่โมเดลและ URL พื้นฐานต่างกัน

ดาวน์โหลด Apidog เพื่อทำการเปรียบเทียบ คอลเล็กชันสามารถย้ายได้ง่ายเมื่อคุณเปลี่ยนผู้ให้บริการ ซึ่งเป็นจุดประสงค์หลัก สำหรับกลยุทธ์การทดสอบ API ที่กว้างขึ้น โปรดดู เครื่องมือทดสอบ API สำหรับวิศวกร QA

การจำกัดอัตรา (Rate limits)

การจำกัดระดับใน xAI Console เริ่มต้นจากพื้นฐานไม่กี่พันคำขอต่อนาทีใน Tier 1 ไปจนถึงหลายแสนคำขอในระดับองค์กร (enterprise tiers) ตัวเลขที่แน่นอนอาจมีการเปลี่ยนแปลง; โปรดตรวจสอบแดชบอร์ดของคอนโซล ทรูพุต 159 โทเค็น/วินาทีที่ xAI โฆษณาเป็นความเร็วเอาต์พุตต่อสตรีม ไม่ใช่รวมทั้งหมด; คำขอพร้อมกันจะปรับขนาดเป็นเชิงเส้นภายในขีดจำกัดของระดับ

หากคุณติดขีดจำกัดอัตรา (rate limits) API จะคืนค่า 429 พร้อมเฮดเดอร์ retry-after ซึ่งสามารถจัดการได้ด้วยกลไก exponential backoff มาตรฐาน

คำถามที่พบบ่อย

Grok 4.3 เข้ากันได้กับ OpenAI ทั้งหมดหรือไม่? สำหรับ Chat Completions ใช่ ใส่ OpenAI SDK, เปลี่ยน base_url, เปลี่ยน model การเรียกใช้ฟังก์ชัน, เอาต์พุตที่มีโครงสร้าง และการสตรีมทั้งหมดทำงานเหมือนกัน

รองรับ Responses API หรือไม่? อินเทอร์เฟซของ xAI ในวันนี้คือ Chat Completions Responses API เป็นของ OpenAI เท่านั้น

ขีดจำกัดบริบทที่แท้จริงในการใช้งานจริงคือเท่าใด? 1,000,000 โทเค็น อินพุตที่ยาวมีค่าใช้จ่ายจริงแม้ในราคา $1.25/1M; ให้แคชอย่างจริงจังหากพร้อมท์ของคุณเสถียร

การให้เหตุผลตลอดเวลามีผลต่อความหน่วงเวลาอย่างไร? ความหน่วงเวลาของโทเค็นแรกจะสูงกว่าโมเดลที่ไม่ใช้การให้เหตุผลเล็กน้อย แต่ Grok 4.3 สตรีมเอาต์พุตที่ประมาณ 159 โทเค็น/วินาที ดังนั้นเวลาตอบสนองตั้งแต่ต้นจนจบจึงสามารถแข่งขันได้ การแลกเปลี่ยนนี้คุ้มค่าสำหรับงานที่ต้องการความแม่นยำสูง

ฉันสามารถใช้ Grok 4.3 ร่วมกับ Grok Voice ได้หรือไม่? ได้ ตัวแทนเสียง (grok-voice-think-fast-1.0) จะเรียก Grok 4.3 อยู่เบื้องหลังเมื่อมีการให้เหตุผล คุณยังสามารถเรียก Grok 4.3 ได้โดยตรงจากวงจรเสียงที่คุณสร้างขึ้นบนพื้นฐานของ TTS และ STT

จะเกิดอะไรขึ้นกับการเรียกใช้ Grok 3 / Grok 4 เดิมของฉันหลังจากวันที่ 15 พฤษภาคม? จะล้มเหลวด้วยรหัส 410 (โมเดลถูกปลดระวาง) กรุณาโยกย้ายก่อนถึงกำหนด

Grok 4.3 รองรับการป้อนรูปภาพหรือไม่? ใช่ นอกจากการป้อนวิดีโอใหม่แล้ว ส่ง URL รูปภาพในบล็อกเนื้อหา รูปแบบเดียวกับ OpenAI

สรุป

Grok 4.3 เป็นการเคลื่อนไหวด้านราคาและประสิทธิภาพที่ก้าวร้าวที่สุดที่ xAI ได้เปิดตัว การลดราคา 40%, บริบท 1 ล้านโทเค็น, การให้เหตุผลตลอดเวลา, และวิดีโอแบบเนทีฟ ทำให้เป็นเครื่องมือประจำวันที่สำคัญสำหรับงาน agent ส่วนใหญ่ ความเข้ากันได้กับ OpenAI หมายถึงการโยกย้ายคือการเปลี่ยน URL พื้นฐาน ไม่ใช่การเขียนใหม่ทั้งหมด

วิธีการตรวจสอบที่เร็วที่สุด: สร้างสคริปต์การให้เหตุผลสามรูปแบบใน Apidog ใส่พร้อมท์จริงของคุณ วัดความหน่วงเวลาและโทเค็นการให้เหตุผล โยกย้ายก่อนวันที่ 15 พฤษภาคม

ปุ่ม