สรุปสั้นๆ / คำตอบด่วน
GPT-5.4 คือโมเดลแนวหน้าขั้นสูงที่สุดของ OpenAI สำหรับการทำงานระดับมืออาชีพ ซึ่งเปิดตัวเมื่อวันที่ 5 มีนาคม 2026 โดยรวมความสามารถในการเขียนโค้ดชั้นนำของอุตสาหกรรมจาก GPT-5.3-Codex เข้ากับการให้เหตุผล การใช้งานคอมพิวเตอร์ และการผสานรวมเครื่องมือที่ได้รับการปรับปรุง โมเดลนี้มีอัตราการชนะ 83% ในงานความรู้ 75% ในเกณฑ์มาตรฐานการใช้งานคอมพิวเตอร์ และใช้โทเคนน้อยกว่า GPT-5.2 อย่างมีนัยสำคัญ มีให้บริการผ่าน API ในราคา 2.50 ดอลลาร์สหรัฐฯ ต่อโทเคนอินพุตล้านครั้ง และ 15 ดอลลาร์สหรัฐฯ ต่อโทเคนเอาต์พุตล้านครั้ง พร้อมเวอร์ชัน Pro (30 ดอลลาร์สหรัฐฯ / 180 ดอลลาร์สหรัฐฯ) สำหรับงานที่ซับซ้อน
บทนำ
OpenAI เพิ่งยกระดับมาตรฐานสำหรับการทำงานระดับมืออาชีพที่ขับเคลื่อนด้วย AI เมื่อวันที่ 5 มีนาคม 2026 พวกเขาได้เปิดตัว GPT-5.4 ซึ่งเป็นโมเดลที่ให้อัตราการชนะ 83% เมื่อเทียบกับผู้เชี่ยวชาญในอุตสาหกรรมในงานความรู้จริง โดยใช้โทเคนน้อยกว่ารุ่นก่อนหน้าอย่างมีนัยสำคัญ
หากคุณเคยทำงานกับโมเดล AI ที่สร้างข้อมูลที่ผิดพลาด มีปัญหาในการทำงานที่ซับซ้อน หรือใช้โทเคนจำนวนมากในงานง่ายๆ GPT-5.4 จะแก้ไขปัญหาเหล่านี้ได้โดยตรง มีโอกาสที่จะสร้างข้อผิดพลาดทางข้อเท็จจริงน้อยลง 33% และทำงานที่ต้องใช้คอมพิวเตอร์ได้เร็วกว่าโมเดลรุ่นก่อนหน้าถึง 3 เท่า
คู่มือนี้จะอธิบายว่า GPT-5.4 ทำอะไรได้บ้าง เปรียบเทียบกับเวอร์ชันก่อนหน้าอย่างไร และประสิทธิภาพที่เพิ่มขึ้นคุ้มค่ากับค่าใช้จ่ายโทเคนที่สูงขึ้นหรือไม่ คุณจะได้รับข้อมูลเกณฑ์มาตรฐานที่เฉพาะเจาะจง การเปรียบเทียบประสิทธิภาพจริง และคำแนะนำที่ชัดเจนว่า GPT-5.4 เวอร์ชันใดที่เหมาะกับกรณีการใช้งานของคุณ
สิ่งที่คุณจะได้เรียนรู้:
- การปรับปรุงประสิทธิภาพที่แน่นอนเมื่อเทียบกับ GPT-5.2 และ GPT-5.3-Codex
- คะแนนเกณฑ์มาตรฐานในการเขียนโค้ด การใช้งานคอมพิวเตอร์ และงานความรู้
- ความสามารถใหม่ในการใช้งานคอมพิวเตอร์และการมองเห็นพร้อมตัวอย่างจริง
- รายละเอียดราคาและเวลาที่ควรใช้ Pro เทียบกับ Standard
- ข้อควรพิจารณาในการผสานรวมสำหรับนักพัฒนา API
GPT-5.4 คืออะไร?
GPT-5.4 เป็นโมเดลทั่วไปรุ่นแรกของ OpenAI ที่มีความสามารถในการใช้งานคอมพิวเตอร์แบบเนทีฟ โดยผสานรวมความเป็นเลิศในการเขียนโค้ดของ GPT-5.3-Codex เข้ากับการให้เหตุผล การรับรู้ภาพ และการผสานรวมเครื่องมือที่ได้รับการปรับปรุงในโมเดลแนวหน้าเดียว

โมเดลนี้มุ่งเป้าไปที่สถานการณ์การทำงานระดับมืออาชีพหลักสามประการ:
งานความรู้ (Knowledge work) - การสร้างสเปรดชีต งานนำเสนอ เอกสาร และการวิเคราะห์ใน 44 อาชีพ GPT-5.4 เทียบเท่าหรือเหนือกว่าผู้เชี่ยวชาญในอุตสาหกรรมในการเปรียบเทียบ 83% บน GDPval เพิ่มขึ้นจาก 70.9% สำหรับ GPT-5.2
การใช้งานคอมพิวเตอร์และเอเจนต์ (Computer use and agents) - การใช้งานคอมพิวเตอร์ผ่านคำสั่งเมาส์/คีย์บอร์ด การทำงานอัตโนมัติของเบราว์เซอร์ และขั้นตอนการทำงานหลายขั้นตอนในแอปพลิเคชันต่างๆ บรรลุอัตราความสำเร็จ 75% บน OSWorld-Verified ซึ่งเหนือกว่าประสิทธิภาพของมนุษย์ที่ 72.4%
การเขียนโค้ดและการพัฒนา (Coding and development) - การเขียน ดีบัก และทำซ้ำโค้ดด้วยประสิทธิภาพที่ล้ำสมัยบน SWE-Bench Pro (57.7%) พร้อมรองรับหน้าต่างบริบท (context window) สูงสุด 1M โทเคนสำหรับฐานโค้ดที่ซับซ้อน
GPT-5.4 มีสองเวอร์ชัน:
- GPT-5.4 - โมเดลมาตรฐานสำหรับงานมืออาชีพส่วนใหญ่
- GPT-5.4 Pro - ประสิทธิภาพสูงสุดสำหรับงานการให้เหตุผลที่ซับซ้อน (30 ดอลลาร์สหรัฐฯ ต่อโทเคนอินพุตล้านครั้ง, 180 ดอลลาร์สหรัฐฯ ต่อโทเคนเอาต์พุตล้านครั้ง)
การปรับปรุงที่สำคัญเหนือ GPT-5.2
GPT-5.4 ไม่ใช่การอัปเดตแบบเพิ่มขึ้น OpenAI ได้เพิ่มประสิทธิภาพอย่างมากในสี่ด้านที่สำคัญ
1. ความถูกต้องของข้อเท็จจริงและการลดการสร้างข้อมูลที่ผิดพลาด
การกล่าวอ้างที่ผิดพลาดลดลง 33% ในระดับข้อกล่าวอ้างแต่ละข้อ การตอบสนองทั้งหมดมีข้อผิดพลาดโดยรวมน้อยลง 18% ซึ่งเป็นสิ่งสำคัญเมื่อคุณสร้างเอกสารทางกฎหมาย โมเดลทางการเงิน หรือเอกสารทางเทคนิคที่ข้อเท็จจริงที่ผิดพลาดเพียงอย่างเดียวอาจทำให้โครงการล้มเหลวได้
2. ประสิทธิภาพของโทเคน
GPT-5.4 ใช้โทเคนน้อยลงอย่างมีนัยสำคัญในการแก้ปัญหาเมื่อเทียบกับ GPT-5.2 ในขั้นตอนการทำงานที่ต้องใช้เครื่องมือจำนวนมากด้วยเกณฑ์มาตรฐาน MCP Atlas การใช้โทเคนลดลง 47% ในขณะที่ยังคงความถูกต้อง สำหรับผู้ใช้ API ที่มีปริมาณมาก ประสิทธิภาพที่เพิ่มขึ้นนี้จะช่วยชดเชยราคาต่อโทเคนที่สูงขึ้น
3. ความสามารถในการใช้งานคอมพิวเตอร์
โมเดลก่อนหน้าจำเป็นต้องใช้โมเดลเฉพาะทางแยกต่างหากสำหรับการใช้งานคอมพิวเตอร์ GPT-5.4 จัดการสิ่งนี้ได้แบบเนทีฟ:
- ออกคำสั่งเมาส์และคีย์บอร์ดจากภาพหน้าจอ
- ทำงานอัตโนมัติของเบราว์เซอร์ผ่าน Playwright
- นำทางสภาพแวดล้อมเดสก์ท็อปผ่านการโต้ตอบตามพิกัด
- รองรับนโยบายความปลอดภัยที่กำหนดเองและข้อกำหนดการยืนยัน
4. การค้นหาและผสานรวมเครื่องมือ
การค้นหาเครื่องมือช่วยขจัดความจำเป็นในการโหลดคำจำกัดความเครื่องมือหลายพันรายการในทุกคำขอ โมเดลจะค้นหาคำจำกัดความเครื่องมือตามความต้องการ ลดค่าใช้จ่ายโทเคนล่วงหน้า และช่วยให้ทำงานร่วมกับระบบนิเวศที่มีเครื่องมือหลายหมื่นรายการได้
บนเกณฑ์มาตรฐาน Toolathlon, GPT-5.4 บรรลุความแม่นยำ 54.6% เทียบกับ 45.7% สำหรับ GPT-5.2 โดยใช้ผลลัพธ์จากเครื่องมือน้อยลง (ตัวแทนของความหน่วง)
เกณฑ์มาตรฐานประสิทธิภาพของ GPT-5.4
ข้อมูลเกณฑ์มาตรฐานแสดงให้เห็นว่า GPT-5.4 excels ได้ดีในด้านใด และโมเดลรุ่นก่อนหน้ายังคงแข่งขันได้ในด้านใด
งานความรู้ (GDPval)
โมเดล | อัตราการชนะเทียบกับผู้เชี่ยวชาญ |
|---|---|
GPT-5.4 | 83.0% |
GPT-5.4 Pro | 82.0% |
GPT-5.2 Pro | 74.1% |
GPT-5.2 | 70.9% |
GDPval ทดสอบงานความรู้ที่ระบุไว้อย่างดีใน 44 อาชีพจาก 9 อุตสาหกรรมชั้นนำที่ก่อให้เกิด GDP ของสหรัฐอเมริกา งานรวมถึงการนำเสนอการขาย สเปรดชีตบัญชี ตารางเวลาการดูแลฉุกเฉิน แผนภาพการผลิต และวิดีโอสั้นๆ
การสร้างสเปรดชีตและเอกสาร
ในงานจำลองการลงทุนภายในของธนาคาร:
- GPT-5.4: คะแนนเฉลี่ย 87.3%
- GPT-5.2: คะแนนเฉลี่ย 68.4%
สำหรับการประเมินงานนำเสนอ ผู้ประเมินที่เป็นมนุษย์ชอบผลลัพธ์ของ GPT-5.4 68% ของเวลา เนื่องจากมีความสวยงามที่แข็งแกร่งกว่า ความหลากหลายทางภาพที่มากกว่า และการใช้การสร้างภาพที่มีประสิทธิภาพมากขึ้น
ประสิทธิภาพการเขียนโค้ด (SWE-Bench Pro)
โมเดล | ความแม่นยำ | ความหน่วงโดยประมาณ |
|---|---|---|
GPT-5.4 | 57.7% | ~1000s |
GPT-5.3-Codex | 56.8% | ~1200s |
GPT-5.2 | 55.6% | ~1500s |

GPT-5.4 เทียบเท่าหรือเหนือกว่า GPT-5.3-Codex บน SWE-Bench Pro ในขณะที่ให้ความหน่วงต่ำกว่าในความพยายามในการให้เหตุผล โหมด /fast ใน Codex ให้ความเร็วโทเคนที่เร็วกว่าสูงสุด 1.5 เท่าด้วย GPT-5.4
การใช้งานคอมพิวเตอร์ (OSWorld-Verified)
OSWorld-Verified วัดความสำเร็จในการนำทางสภาพแวดล้อมเดสก์ท็อปผ่านภาพหน้าจอและการกระทำของคีย์บอร์ด/เมาส์:
- GPT-5.4: 75.0%
- GPT-5.3-Codex: 74.0% (ด้วยพารามิเตอร์ API ที่รักษาความละเอียดภาพต้นฉบับ)
- GPT-5.2: 47.3%
- ประสิทธิภาพของมนุษย์: 72.4%
เกณฑ์มาตรฐานนี้ทดสอบขั้นตอนการทำงานเดสก์ท็อปจริง: การจัดการอีเมลและปฏิทิน การป้อนข้อมูลจำนวนมาก การดำเนินการไฟล์ และงานข้ามแอปพลิเคชัน
การท่องเว็บ (BrowseComp)
BrowseComp ทดสอบการวิจัยเว็บแบบต่อเนื่องเพื่อค้นหาข้อมูลที่หายาก:
- GPT-5.4 Pro: 89.3%
- GPT-5.4: 82.7%
- GPT-5.2 Pro: 77.9%
- GPT-5.2: 65.8%
การปรับปรุง 17% โดยรวมจาก GPT-5.2 สะท้อนถึงการสังเคราะห์ข้อมูลจากหลายแหล่งที่ดีขึ้น และกลยุทธ์การค้นหาที่คงที่มากขึ้น
ความเข้าใจภาพ
MMMU Pro (ไม่มีเครื่องมือ) - ทดสอบความเข้าใจและการให้เหตุผลทางภาพ:
- GPT-5.4: 81.2%
- GPT-5.2: 79.5%
OmniDocBench - ความแม่นยำในการวิเคราะห์เอกสาร (ค่าผิดพลาดต่ำกว่า = ดีกว่า):
- GPT-5.4: ระยะทางแก้ไขที่ปรับให้เป็นมาตรฐาน 0.109
- GPT-5.2: ระยะทางแก้ไขที่ปรับให้เป็นมาตรฐาน 0.140
ความสามารถในการใช้งานคอมพิวเตอร์และการมองเห็น
ความสามารถในการใช้งานคอมพิวเตอร์ของ GPT-5.4 คุ้มค่าแก่การตรวจสอบอย่างละเอียด นี่คือโมเดลทั่วไปรุ่นแรกของ OpenAI ที่สามารถใช้งานคอมพิวเตอร์ได้แบบเนทีฟ
การทำงานของคอมพิวเตอร์ใช้งานอย่างไร
โมเดลจะตีความภาพหน้าจอของอินเทอร์เฟซเบราว์เซอร์หรือเดสก์ท็อป และตอบสนองด้วย:
- การคลิกตามพิกัดบนองค์ประกอบ UI
- การป้อนข้อมูลด้วยแป้นพิมพ์สำหรับการป้อนข้อความ
- คำสั่ง Playwright สำหรับการทำงานอัตโนมัติของเบราว์เซอร์
- การเคลื่อนไหวของเมาส์และการลาก
นักพัฒนาสามารถกำหนดค่าพฤติกรรมผ่านข้อความระบบ โดยปรับนโยบายความปลอดภัยและข้อกำหนดการยืนยันตามระดับความเสี่ยงที่ยอมรับได้
ตัวอย่างการใช้งานคอมพิวเตอร์ในโลกจริง
Mainstay ได้ทดสอบ GPT-5.4 กับพอร์ทัล HOA และภาษีทรัพย์สินประมาณ 30,000 แห่ง:
- GPT-5.4: ความสำเร็จในการพยายามครั้งแรก 95% ความสำเร็จ 100% ภายในสามครั้ง
- โมเดล CUA รุ่นก่อนหน้า: อัตราความสำเร็จ 73-79%
- การเสร็จสิ้นเซสชัน: เร็วกว่า 3 เท่าด้วย GPT-5.4
- การใช้โทเคน: ใช้โทเคนน้อยลง 70% ต่อเซสชัน
โมเดลนำทางอินเทอร์เฟซพอร์ทัล ดึงข้อมูลจากเค้าโครง UI ที่หลากหลาย จัดการขั้นตอนการยืนยันตัวตน และจัดการกรณีพิเศษ เช่น captchas หรือแบบฟอร์มหลายขั้นตอน
การรับรู้ภาพที่ได้รับการปรับปรุง
GPT-5.4 แนะนำระดับรายละเอียดอินพุตภาพต้นฉบับที่รองรับ:
- พิกเซลรวมสูงสุด 10.24M
- มิติสูงสุด 6000 พิกเซล
- การรับรู้ความเที่ยงตรงสูงสำหรับภาพที่มีความหนาแน่นและมีความละเอียดสูง
ระดับรายละเอียดสูงรองรับพิกเซลรวมสูงสุด 2.56M หรือมิติสูงสุด 2048 พิกเซล การทดสอบผู้ใช้ API ในช่วงแรกแสดงให้เห็นถึงการปรับปรุงที่แข็งแกร่งในความสามารถในการระบุตำแหน่ง ความเข้าใจภาพ และความแม่นยำในการคลิกด้วยการตั้งค่ารายละเอียดต้นฉบับหรือสูง
การปรับปรุงการแยกวิเคราะห์เอกสาร
การรับรู้ภาพที่ดีขึ้นส่งผลต่อการจัดการเอกสาร GPT-5.4 แยกวิเคราะห์:
- ไฟล์ PDF หลายหน้าพร้อมตารางและรูปภาพ
- เอกสารที่สแกนด้วยเค้าโครงที่หลากหลาย
- ภาพหน้าจอที่มีข้อความและองค์ประกอบ UI
- แผนภาพและกราฟทางเทคนิค
การปรับปรุง 22% บน OmniDocBench (อัตราข้อผิดพลาด 0.140 เป็น 0.109) สะท้อนถึงความสามารถนี้
คุณสมบัติการเขียนโค้ดและการพัฒนา
GPT-5.4 สืบทอดความเป็นเลิศในการเขียนโค้ดของ GPT-5.3-Codex ในขณะที่เพิ่มการใช้งานคอมพิวเตอร์สำหรับขั้นตอนการพัฒนาแบบบูรณาการ
การพัฒนาส่วนหน้า (Frontend)
การประเมินภายในพบว่า GPT-5.4 มีความเป็นเลิศในงานส่วนหน้าที่ซับซ้อนด้วยผลลัพธ์ที่สวยงามและใช้งานได้จริงมากกว่าโมเดลรุ่นก่อนหน้า ทักษะ Playwright Interactive ที่เป็นแบบทดลองใน Codex แสดงให้เห็นถึงสิ่งนี้:
ตัวอย่าง: การจำลองสวนสนุก พรอมต์เดียวสร้างการจำลองสวนสนุกแบบไอโซเมตริกด้วย:
- การวางเส้นทางตามไทล์
- การสร้างเครื่องเล่นและทิวทัศน์
- การค้นหาเส้นทางของแขกและการเข้าคิว
- เมตริกสวนสนุก (เงิน, แขก, ความสุข, ความสะอาด)
- การทดสอบการเล่นในเบราว์เซอร์ผ่านการทำงานอัตโนมัติของ Playwright
- การสร้างภาพสำหรับสินทรัพย์ไอโซเมตริก
โมเดลสร้างเกม จากนั้นใช้ Playwright เพื่อทำงานอัตโนมัติในการทดสอบการเล่น ตรวจสอบตำแหน่ง การนำทาง ปฏิกิริยาของแขก และความเสถียรของ UI ในหลายรอบ
โหมดเร็วสำหรับนักพัฒนา
GPT-5.4 ใน Codex รองรับโหมด /fast ที่ให้ความเร็วโทเคนเร็วกว่าสูงสุด 1.5 เท่า นักพัฒนา API สามารถเข้าถึงความเร็วที่เทียบเท่ากันผ่านการประมวลผลตามลำดับความสำคัญ สิ่งนี้ยังคงความฉลาดเท่าเดิมในขณะที่ลดเวลาการทำซ้ำระหว่างการดีบักและการพัฒนา
การรองรับหน้าต่างบริบท (Context Window)
GPT-5.4 Codex มีการรองรับหน้าต่างบริบท 1M โทเคนแบบทดลอง กำหนดค่าผ่าน:
- พารามิเตอร์
model_context_window - พารามิเตอร์
model_auto_compact_token_limit
คำขอที่เกินบริบทมาตรฐาน 272K จะถูกนับรวมในขีดจำกัดการใช้งานในอัตรา 2 เท่าของอัตราปกติ สิ่งนี้ช่วยให้สามารถวิเคราะห์ฐานโค้ดทั้งหมด ชุดเอกสารขนาดใหญ่ หรือโครงการหลายไฟล์ในคำขอเดียว
Apidog สำหรับเอกสาร API:เอกสาร API

การผสานรวมและการค้นหาเครื่องมือ
การค้นหาเครื่องมือแสดงถึงการเปลี่ยนแปลงพื้นฐานในวิธีที่โมเดลโต้ตอบกับเครื่องมือภายนอกและเซิร์ฟเวอร์ MCP
การค้นหาเครื่องมือทำงานอย่างไร
แนวทางก่อนหน้า: คำจำกัดความเครื่องมือทั้งหมดถูกโหลดเข้าสู่ทุกคำขอตั้งแต่ต้น สำหรับระบบที่มีเครื่องมือจำนวนมาก สิ่งนี้จะเพิ่มโทเคนหลายพันถึงหลายหมื่นรายการ ทำให้เพิ่มค่าใช้จ่ายและชะลอการตอบสนอง
แนวทางการค้นหาเครื่องมือ: โมเดลได้รับรายการเครื่องมือที่มีอยู่แบบเบาบาง เมื่อจำเป็น มันจะค้นหาคำจำกัดความเครื่องมือเฉพาะและเพิ่มไปยังการสนทนาในขณะนั้น
ตัวอย่างการประหยัดโทเคน
เกณฑ์มาตรฐาน MCP Atlas ของ Scale ได้ทดสอบ 250 งานพร้อมเปิดใช้งานเซิร์ฟเวอร์ MCP ทั้งหมด 36 ตัว:

รายละเอียดโทเคนโดยไม่มีการค้นหาเครื่องมือ:
- โทเคนอินพุตล่วงหน้า 65,320 (คำจำกัดความเครื่องมือ)
- โทเคนเพิ่มเติมจากผลลัพธ์เครื่องมือ
- โทเคนเอาต์พุต
การค้นหาเครื่องมือช่วยขจัดค่าใช้จ่ายล่วงหน้าในขณะที่ยังคงประสิทธิภาพของแคช
ประสิทธิภาพของ MCP Atlas
บนเกณฑ์มาตรฐาน MCP Atlas (250 งาน, 36 เซิร์ฟเวอร์ MCP):
- GPT-5.4: ความแม่นยำ 67.2%
- GPT-5.2: ความแม่นยำ 60.6%
โมเดลทำงานร่วมกับระบบนิเวศเครื่องมือที่ใหญ่ขึ้นโดยไม่ลดทอนความแม่นยำหรือทำให้หน้าต่างบริบทเกินขีดจำกัด
การเรียกใช้เครื่องมือแบบ Agentic
เกณฑ์มาตรฐาน Toolathlon ทดสอบขั้นตอนการทำงานของเครื่องมือหลายขั้นตอน (การอ่านอีเมล การแยกไฟล์แนบ การอัปโหลดไฟล์ การให้คะแนน การบันทึกผลลัพธ์):

ผลลัพธ์ของเครื่องมือ (การรอการตอบสนองจากเครื่องมือ) สะท้อนความหน่วงได้ดีกว่าจำนวนการเรียกใช้เครื่องมือ เนื่องจากรวบรวมประโยชน์ของการทำงานแบบขนาน GPT-5.4 ทำงานเสร็จในรอบที่น้อยกว่า
GPT-5.4 เทียบกับ GPT-5.3-Codex เทียบกับ GPT-5.2
การเลือกระหว่างโมเดลขึ้นอยู่กับความต้องการเฉพาะของคุณ
เมื่อใดที่ควรใช้ GPT-5.4
- ต้องมีการใช้งานคอมพิวเตอร์ - การทำงานของคอมพิวเตอร์แบบเนทีฟ, การทำงานอัตโนมัติของเบราว์เซอร์
- งานความรู้ - สเปรดชีต งานนำเสนอ เอกสาร
- ขั้นตอนการทำงานที่ใช้เครื่องมือจำนวนมาก - เซิร์ฟเวอร์ MCP, API ภายนอก, การทำงานอัตโนมัติหลายขั้นตอน
- คำนึงถึงต้นทุนในวงกว้าง - ประสิทธิภาพของโทเคนช่วยลดต้นทุนรวมแม้ราคาต่อโทเคนจะสูงขึ้น
- ต้องการบริบทที่ยาวนาน - สูงสุด 1M โทเคนสำหรับฐานโค้ดที่ซับซ้อน
เมื่อใดที่ GPT-5.3-Codex ยังคงแข่งขันได้
- งานเขียนโค้ดล้วนๆ - ประสิทธิภาพ SWE-Bench Pro คล้ายกัน (56.8% เทียบกับ 57.7%)
- ขั้นตอนการทำงานของ Codex ที่มีอยู่แล้ว - การผสานรวมที่มีอยู่แล้วอาจไม่จำเป็นต้องใช้คอมพิวเตอร์
- การเพิ่มประสิทธิภาพต้นทุน - หากราคา GPT-5.3-Codex ยังคงต่ำกว่า
เมื่อใดที่ GPT-5.2 เพียงพอ
- คำถามง่ายๆ - Q&A พื้นฐาน, การสรุป, การสร้างเนื้อหาตรงไปตรงมา
- ข้อจำกัดด้านงบประมาณ - ต้นทุนต่อโทเคนต่ำกว่า (1.75 ดอลลาร์สหรัฐฯ / 14 ดอลลาร์สหรัฐฯ เทียบกับ 2.50 ดอลลาร์สหรัฐฯ / 15 ดอลลาร์สหรัฐฯ)
- ขั้นตอนการทำงานที่ไม่ใช่แบบ agentic - คำขอครั้งเดียวโดยไม่มีการใช้เครื่องมือ
การเปรียบเทียบราคา
โมเดล | ราคาอินพุต | อินพุตที่แคชแล้ว | ราคาเอาต์พุต |
|---|---|---|---|
GPT-5.2 | $1.75/M | $0.175/M | $14/M |
GPT-5.4 | $2.50/M | $0.25/M | $15/M |
GPT-5.2 Pro | $21/M | - | $168/M |
GPT-5.4 Pro | $30/M | - | $180/M |
มีราคา Batch และ Flex ในอัตรา 50% ของอัตรามาตรฐาน การประมวลผลแบบลำดับความสำคัญในอัตรา 200% ของอัตรามาตรฐาน
ตัวเลือกการวางจำหน่ายและการเข้าถึง
GPT-5.4 เริ่มเปิดตัวอย่างค่อยเป็นค่อยไปตั้งแต่วันที่ 5 มีนาคม 2026 ใน ChatGPT, Codex และ API
การเข้าถึง ChatGPT
GPT-5.4 Thinking มีให้สำหรับ:
- สมาชิก ChatGPT Plus
- สมาชิก ChatGPT Team
- สมาชิก ChatGPT Pro
GPT-5.4 Pro มีให้สำหรับ:
- สมาชิก ChatGPT Pro
- สมาชิก ChatGPT Enterprise
การเข้าถึงแบบเดิม: GPT-5.2 Thinking ยังคงมีให้ใช้งานเป็นเวลาสามเดือนภายใต้ส่วน Legacy Models โดยจะยกเลิกในวันที่ 5 มิถุนายน 2026
Enterprise และ Education: การเข้าถึงล่วงหน้ามีให้ผ่านการตั้งค่าผู้ดูแลระบบ
การเข้าถึง Codex
GPT-5.4 เป็นโมเดลเริ่มต้นใน Codex ด้วย:
- การรองรับหน้าต่างบริบท 1M แบบทดลอง
- ทักษะ Playwright Interactive สำหรับการทดสอบการเล่นในเบราว์เซอร์
- โหมด /fast สำหรับความเร็วโทเคน 1.5 เท่า
การเข้าถึง API
ชื่อโมเดล:
gpt-5.4- โมเดลมาตรฐานgpt-5.4-pro- โมเดล Pro สำหรับงานที่ซับซ้อน
หน้าต่างบริบท:
- มาตรฐาน: 272K โทเคน
- ขยาย: สูงสุด 1M โทเคน (ทดลอง, อัตราการใช้งาน 2 เท่า)
ราคา:
- มาตรฐาน: อินพุต 2.50 ดอลลาร์สหรัฐฯ/M, อินพุตที่แคชแล้ว 0.25 ดอลลาร์สหรัฐฯ/M, เอาต์พุต 15 ดอลลาร์สหรัฐฯ/M
- Pro: อินพุต 30 ดอลลาร์สหรัฐฯ/M, เอาต์พุต 180 ดอลลาร์สหรัฐฯ/M
- Batch/Flex: ส่วนลด 50%
- Priority: 2 เท่าของอัตรามาตรฐาน
ไทม์ไลน์การยกเลิก
GPT-5.2 Thinking จะถูกยกเลิกในวันที่ 5 มิถุนายน 2026 กรุณาย้ายขั้นตอนการทำงานก่อนวันดังกล่าวเพื่อหลีกเลี่ยงการหยุดชะงัก
บทสรุป
GPT-5.4 มอบการปรับปรุงที่วัดผลได้ในงานความรู้ การใช้งานคอมพิวเตอร์ และงานเขียนโค้ด อัตราการชนะ GDPval 83% คะแนน OSWorld-Verified 75% และความแม่นยำ SWE-Bench Pro 57.7% ทำให้เป็นมาตรฐานใหม่สำหรับขั้นตอนการทำงาน AI ระดับมืออาชีพ
สำหรับนักพัฒนาที่รวม GPT-5.4 เข้ากับแอปพลิเคชัน การมีเครื่องมือทดสอบและดีบัก API ที่แข็งแกร่งเป็นสิ่งสำคัญ Apidog ปรับปรุงกระบวนการรวมด้วยความสามารถในการออกแบบ ดีบัก ทดสอบ และจัดทำเอกสาร API แบบรวม ไม่ว่าคุณจะสร้าง AI agent ทำงานอัตโนมัติ หรือสร้างฟีเจอร์สำหรับลูกค้าที่ขับเคลื่อนโดย GPT-5.4, Apidog ช่วยให้มั่นใจว่าการรวม API ของคุณทำงานได้อย่างถูกต้องตั้งแต่วันแรก
ประเด็นสำคัญ:
- ลดการกล่าวอ้างที่ผิดพลาดลง 33% และข้อผิดพลาดในการตอบสนองน้อยลง 18%
- ลดการใช้โทเคน 47% ในขั้นตอนการทำงานที่ใช้เครื่องมือจำนวนมาก
- อัตราความสำเร็จในการใช้งานคอมพิวเตอร์ 75% เหนือกว่าเกณฑ์พื้นฐานของมนุษย์
- การทำงานของคอมพิวเตอร์แบบเนทีฟผ่านคำสั่งเมาส์/คีย์บอร์ด
- การค้นหาเครื่องมือช่วยให้ทำงานร่วมกับเครื่องมือหลายหมื่นรายการได้
- หน้าต่างบริบท 1M โทเคนสำหรับฐานโค้ดที่ซับซ้อน
- มีให้บริการในราคา 2.50 ดอลลาร์สหรัฐฯ / 15 ดอลลาร์สหรัฐฯ ต่อโทเคนล้านครั้ง (เวอร์ชันมาตรฐาน)
เมื่อใดที่ควรนำมาใช้:
- คุณต้องการการใช้งานคอมพิวเตอร์หรือการทำงานอัตโนมัติของเบราว์เซอร์
- ประสิทธิภาพของโทเคนมีความสำคัญสำหรับขั้นตอนการทำงานที่มีปริมาณมาก
- ความถูกต้องของข้อเท็จจริงเป็นสิ่งสำคัญอย่างยิ่ง (กฎหมาย การเงิน เทคนิค)
- คุณทำงานกับระบบนิเวศเครื่องมือขนาดใหญ่หรือเซิร์ฟเวอร์ MCP
- การวิเคราะห์ฐานโค้ดหรือเอกสารที่มีบริบทที่ยาวนาน
เมื่อใดที่ควรรอ:
- ขั้นตอนการทำงาน Q&A แบบง่ายๆ ไม่ได้รับประโยชน์จากความสามารถใหม่ๆ
- ข้อจำกัดด้านงบประมาณที่ให้ความสำคัญกับต้นทุนต่อโทเคนต่ำที่สุด
- ขั้นตอนการทำงานของ GPT-5.2 หรือ GPT-5.3-Codex ที่มีอยู่แล้วทำงานได้เพียงพอแล้ว
GPT-5.4 แสดงถึงโมเดลการให้เหตุผลที่มีประสิทธิภาพที่สุดของ OpenAI จนถึงปัจจุบัน การรวมกันของการลดการสร้างข้อมูลที่ผิดพลาด ประสิทธิภาพโทเคนที่ดีขึ้น และความสามารถในการใช้งานคอมพิวเตอร์แบบเนทีฟ ทำให้คุ้มค่ากับราคาต่อโทเคนที่สูงขึ้นสำหรับการใช้งานระดับมืออาชีพ
คำถามที่พบบ่อย
GPT-5.4 และ GPT-5.2 แตกต่างกันอย่างไร?
GPT-5.4 บรรลุอัตราการชนะ 83% ในงานความรู้เทียบกับ 70.9% สำหรับ GPT-5.2 ใช้โทเคนน้อยลงอย่างมีนัยสำคัญ มีความสามารถในการใช้งานคอมพิวเตอร์แบบเนทีฟ และลดข้อผิดพลาดทางข้อเท็จจริงลง 33% ราคาจะสูงขึ้น (2.50 ดอลลาร์สหรัฐฯ / 15 ดอลลาร์สหรัฐฯ เทียบกับ 1.75 ดอลลาร์สหรัฐฯ / 14 ดอลลาร์สหรัฐฯ) แต่ต้นทุนรวมอาจต่ำลงเนื่องจากประสิทธิภาพที่เพิ่มขึ้น
ค่าใช้จ่าย API ของ GPT-5.4 เท่าไหร่?
GPT-5.4 มีค่าใช้จ่าย 2.50 ดอลลาร์สหรัฐฯ ต่อโทเคนอินพุตล้านครั้ง, 0.25 ดอลลาร์สหรัฐฯ ต่อโทเคนอินพุตที่แคชแล้วล้านครั้ง, และ 15 ดอลลาร์สหรัฐฯ ต่อโทเคนเอาต์พุตล้านครั้ง GPT-5.4 Pro มีค่าใช้จ่าย 30 ดอลลาร์สหรัฐฯ/M สำหรับอินพุต และ 180 ดอลลาร์สหรัฐฯ/M สำหรับเอาต์พุต ราคา Batch และ Flex มีส่วนลด 50%
GPT-5.4 มีขีดจำกัดหน้าต่างบริบทหรือไม่?
หน้าต่างบริบทมาตรฐานคือ 272K โทเคน มีการรองรับหน้าต่างบริบท 1M โทเคนแบบทดลองใน Codex โดยการกำหนดค่าพารามิเตอร์ model_context_window และ model_auto_compact_token_limit คำขอที่เกิน 272K จะถูกนับในอัตราการใช้งาน 2 เท่า
GPT-5.4 Pro ใช้สำหรับอะไร?
GPT-5.4 Pro มุ่งเป้าไปที่ประสิทธิภาพสูงสุดในงานการให้เหตุผลที่ซับซ้อน ได้คะแนนสูงกว่าในเกณฑ์มาตรฐานเช่น BrowseComp (89.3% เทียบกับ 82.7%) และ GDPval (82.0% เทียบกับ 83.0% ของมาตรฐาน) แต่มีค่าใช้จ่ายมากกว่า 12 เท่า (30 ดอลลาร์สหรัฐฯ / 180 ดอลลาร์สหรัฐฯ เทียบกับ 2.50 ดอลลาร์สหรัฐฯ / 15 ดอลลาร์สหรัฐฯ)
GPT-5.4 เปิดตัวเมื่อใด?
GPT-5.4 เปิดตัวเมื่อวันที่ 5 มีนาคม 2026 โดยทยอยเปิดตัวใน ChatGPT, Codex และ API GPT-5.2 Thinking ยังคงมีให้ใช้งานจนถึงวันที่ 5 มิถุนายน 2026 สำหรับการย้ายข้อมูล
GPT-5.4 สามารถใช้คอมพิวเตอร์และเบราว์เซอร์ได้หรือไม่?
ใช่ GPT-5.4 เป็นโมเดลทั่วไปรุ่นแรกของ OpenAI ที่มีความสามารถในการใช้งานคอมพิวเตอร์แบบเนทีฟ โดยออกคำสั่งเมาส์/คีย์บอร์ด ทำงานอัตโนมัติของเบราว์เซอร์ผ่าน Playwright และนำทางสภาพแวดล้อมเดสก์ท็อปผ่านการตีความภาพหน้าจอ
การค้นหาเครื่องมือใน GPT-5.4 คืออะไร?
การค้นหาเครื่องมือช่วยให้โมเดลสามารถค้นหาคำจำกัดความเครื่องมือตามความต้องการแทนที่จะโหลดคำจำกัดความทั้งหมดล่วงหน้า สิ่งนี้ช่วยลดการใช้โทเคน 47% ในขั้นตอนการทำงานที่ใช้เครื่องมือจำนวนมาก และช่วยให้ทำงานร่วมกับระบบนิเวศที่มีเครื่องมือหลายหมื่นรายการได้
GPT-5.4 เปรียบเทียบกับ GPT-5.3-Codex สำหรับการเขียนโค้ดอย่างไร?
GPT-5.4 เทียบเท่าหรือเหนือกว่า GPT-5.3-Codex บน SWE-Bench Pro (57.7% เทียบกับ 56.8%) ในขณะที่ให้ความหน่วงต่ำกว่าและเพิ่มความสามารถในการใช้งานคอมพิวเตอร์ เป็นทางเลือกที่แนะนำสำหรับขั้นตอนการพัฒนาใหม่ๆ
GPT-5.4 มีให้บริการใน ChatGPT หรือไม่?
ใช่ GPT-5.4 Thinking มีให้บริการสำหรับสมาชิก Plus, Team และ Pro GPT-5.4 Pro มีให้บริการสำหรับแผน Pro และ Enterprise GPT-5.2 Thinking ยังคงมีให้บริการภายใต้ Legacy Models จนถึงวันที่ 5 มิถุนายน 2026
ข้อควรพิจารณาด้านความปลอดภัยสำหรับ GPT-5.4 คืออะไร?
GPT-5.4 ได้รับการจัดว่าเป็นความสามารถทางไซเบอร์สูงภายใต้กรอบการเตรียมความพร้อมของ OpenAI การป้องกันรวมถึงการขยายชุดความปลอดภัยทางไซเบอร์ ระบบตรวจสอบ การควบคุมการเข้าถึงที่เชื่อถือได้ และการบล็อกแบบอะซิงโครนัสสำหรับคำขอที่มีความเสี่ยงสูงขึ้นบนพื้นผิว Zero Data Retention อาจเกิดผลบวกลวง (false positives) บ้างเมื่อตัวจำแนกดีขึ้น
