ราคา Gemini 3.5 Flash: ค่าใช้จ่ายจริงเท่าไหร่

Ashley Innocent

Ashley Innocent

20 May 2026

ราคา Gemini 3.5 Flash: ค่าใช้จ่ายจริงเท่าไหร่

Apidog สำหรับองค์กร

ติดตั้งภายในองค์กร

SSO & RBAC

รองรับ SOC 2

สำรวจ Apidog Enterprise

Google ได้เปิดตัว Gemini 3.5 Flash เมื่อวันที่ 19 พฤษภาคม 2026 และคำกล่าวอ้างเรื่องราคาพาดหัวนั้นโดดเด่น: "ถูกกว่าครึ่งหนึ่งของโมเดลระดับแนวหน้าอื่นๆ" สำหรับงานเอเจนต์ นี่คือข้อความทางการตลาด คู่มือนี้จะทำการคำนวณจริง

คุณจะพบอัตราต่อโทเค็น, ขีดจำกัดระดับฟรี, ส่วนลดโหมดแบตช์, สถานการณ์ค่าใช้จ่ายในโลกจริงสำหรับปริมาณงานทั่วไป, และการเปรียบเทียบค่าใช้จ่ายแบบเคียงข้างกันระหว่าง GPT-5.5 และ Claude Opus 4.7 เมื่ออ่านจบ คุณจะทราบว่า Flash มีค่าใช้จ่ายเท่าใดในการใช้งาน และคุณสามารถประหยัดได้อย่างน้อย 50% หรือมากกว่านั้นได้ที่ไหน โดยไม่สูญเสียประสิทธิภาพมากนัก

สรุปโดยย่อ

ประเภทค่าใช้จ่าย อัตรา
อินพุตมาตรฐาน ~1.50 ดอลลาร์สหรัฐฯ / 1 ล้านโทเค็น
เอาต์พุตมาตรฐาน ~9.00 ดอลลาร์สหรัฐฯ / 1 ล้านโทเค็น
อินพุตโหมดแบตช์ ~0.75 ดอลลาร์สหรัฐฯ / 1 ล้านโทเค็น (ลด 50%)
เอาต์พุตโหมดแบตช์ ~4.50 ดอลลาร์สหรัฐฯ / 1 ล้านโทเค็น (ลด 50%)
อินพุตแบบแคช อัตราลดลง (แตกต่างกันไป)
ระดับฟรี (AI Studio) ~1,500 คำขอ/วัน, 1 ล้านโทเค็น/นาที, 15 คำขอ/นาที (RPM)
บัญชีใหม่ Vertex AI เครดิต 300 ดอลลาร์สหรัฐฯ นาน 90 วัน

อัตราปัจจุบัน ณ เดือนพฤษภาคม 2026 ตามประกาศเปิดตัวของ Google และรายการรวมของผู้รวบรวมข้อมูล โปรดตรวจสอบกับ หน้าอัตราค่าบริการอย่างเป็นทางการ ก่อนที่จะอนุมัติงบประมาณเสมอ

อัตราต่อโทเค็นของ Gemini 3.5 Flash

Flash ใช้โมเดลจ่ายตามการใช้งานที่ Gemini ทุกรุ่นใช้มาตั้งแต่ 2.5: คุณจ่ายต่อหนึ่งล้านโทเค็นอินพุตและต่อหนึ่งล้านโทเค็นเอาต์พุต แยกกัน

ระดับ อินพุต (ดอลลาร์สหรัฐฯ/1M) เอาต์พุต (ดอลลาร์สหรัฐฯ/1M)
มาตรฐาน ~1.50 ดอลลาร์สหรัฐฯ ~9.00 ดอลลาร์สหรัฐฯ
อินพุตแบบแคช มีส่วนลด ไม่มี
แบตช์ (ไม่พร้อมกัน) ~0.75 ดอลลาร์สหรัฐฯ ~4.50 ดอลลาร์สหรัฐฯ

ข้อควรทราบเชิงปฏิบัติสองประการ:

สำหรับข้อมูลพื้นฐานเกี่ยวกับวิธีการทำงานของโหมดแบตช์ของ Gemini โปรดดูที่ โหมดแบตช์ของ Gemini API มาแล้วและถูกลง 50%

ระดับฟรี: สิ่งที่คุณจะได้รับโดยไม่ต้องจ่ายเงิน

ระดับฟรีของ AI Studio มาพร้อมกับ Flash ตั้งแต่วันแรก ข้อจำกัดในการเปิดตัว:

นั่นเพียงพอสำหรับโปรเจกต์เสริมส่วนใหญ่, ต้นแบบภายใน, และระบบอัตโนมัติขนาดเล็ก หากปริมาณงานของคุณอยู่ภายใน 1,500 คำขอ/วัน คุณจะไม่ต้องจ่ายเงิน

รายละเอียดระดับฟรี:

สำหรับคู่มือการตั้งค่าฉบับเต็ม โปรดดูที่ วิธีการใช้ Gemini 3.5 Flash ฟรี และ วิธีการขอคีย์ API ของ Google Gemini ฟรี

โหมดแบตช์: ส่วนลด 50% ที่ทีมส่วนใหญ่มักพลาด

หากปริมาณงานของคุณไม่ต้องการการตอบสนองแบบเรียลไทม์ โหมดแบตช์จะช่วยลดค่าใช้จ่าย Flash ลงประมาณครึ่งหนึ่ง

วิธีการทำงาน:

  1. ส่งงานแบตช์พร้อมพรอมต์สูงสุด 50,000 รายการในครั้งเดียว
  2. Google จะประมวลผลภายใน 24 ชั่วโมง
  3. คุณจะจ่ายถูกลงประมาณ 50% ต่อโทเค็น ทั้งอินพุตและเอาต์พุต

เมื่อโหมดแบตช์เหมาะสม:

เมื่อไม่เหมาะสม:

สแต็กการผลิตส่วนใหญ่ควรรันโหมดแบตช์สำหรับงานใดก็ตามที่สามารถทนต่อความหน่วงได้ การประหยัดจะเพิ่มขึ้นอย่างรวดเร็วเมื่อขยายขนาด ดูรายละเอียดการตั้งค่าใน คู่มือโหมดแบตช์ ของเรา

อินพุตแบบแคช: อีกหนึ่งกลไก

หากพรอมต์ของคุณมีส่วนนำแบบคงที่ที่ยาวร่วมกัน (พรอมต์ระบบ, เอกสารอ้างอิงขนาดใหญ่, คำแนะนำที่ยาว) การแคชบริบทจะให้ส่วนลดสำหรับส่วนที่แคชไว้

รูปแบบ:

การประหยัดที่เกิดขึ้นจริงขึ้นอยู่กับอัตราการพบในแคช แต่สำหรับแอปพลิเคชันสไตล์ RAG ที่ส่วนข้อมูลที่ดึงกลับมาเดียวกันนั้นปรากฏซ้ำในการสอบถาม คาดว่าจะลดต้นทุนอินพุตได้ 30–60%

สถานการณ์ค่าใช้จ่ายในโลกจริง

คณิตศาสตร์โทเค็นเริ่มเป็นนามธรรมอย่างรวดเร็ว นี่คือห้าสถานการณ์ที่เป็นรูปธรรมในอัตรามาตรฐานของ Flash

สถานการณ์ที่ 1: แชทบอทสนับสนุนลูกค้า

ค่าใช้จ่ายรายวัน:

รันปริมาณงานเดียวกันผ่านโหมดแบตช์ (หากคุณทนต่อการตอบสนองแบบแบตช์ได้): ~585 ดอลลาร์สหรัฐฯ/เดือน เพิ่มการแคชบริบทสำหรับพรอมต์ระบบ: ลดเพิ่มอีก 20–30%

สถานการณ์ที่ 2: ซอฟต์แวร์ Q&A เอกสาร (SaaS)

ค่าใช้จ่ายรายวัน:

นี่คือจุดที่บริบท 1 ล้านของ Flash โดดเด่น: ไม่มีโครงสร้างพื้นฐานสำหรับการแบ่งส่วนข้อมูล เพียงแค่ส่งเอกสารทั้งฉบับ เมื่อเทียบกับ RAG ที่แบ่งส่วนข้อมูลด้วยโมเดลเรือธง คุณจะต้องจ่ายเพิ่มหลายเท่าทั้งใน API และโครงสร้างพื้นฐาน

สถานการณ์ที่ 3: เอเจนต์อัตโนมัติที่ทำงานต่อเนื่อง

ค่าใช้จ่ายต่อการทำงานหนึ่งครั้ง:

รวมรายวัน: 200 × 0.83 ดอลลาร์สหรัฐฯ = ~165 ดอลลาร์สหรัฐฯ/วัน, ~4,950 ดอลลาร์สหรัฐฯ/เดือน

เพื่อเปรียบเทียบ ปริมาณงานเดียวกันบน Opus 4.7 (~15 ดอลลาร์สหรัฐฯ/75 ดอลลาร์สหรัฐฯ ต่อ 1 ล้าน) มีค่าใช้จ่ายประมาณ 25 ดอลลาร์สหรัฐฯ/การทำงานหนึ่งครั้ง หรือ 5,000 ดอลลาร์สหรัฐฯ/วัน นั่นคือช่องว่างค่าใช้จ่ายงานเอเจนต์ที่ Google อ้างถึง

สถานการณ์ที่ 4: ไปป์ไลน์การแยกข้อมูลจากแผนภูมิ

ค่าใช้จ่ายรายวัน:

เพิ่มโหมดแบตช์และปริมาณงานเดียวกันจะทำงานด้วยค่าใช้จ่าย ~375 ดอลลาร์สหรัฐฯ/เดือน การให้เหตุผลของ CharXiv ที่ 84.2% หมายความว่าคุณภาพยังคงรักษาไว้ได้

สถานการณ์ที่ 5: การสร้างเนื้อหาปริมาณมาก

ค่าใช้จ่ายรายวัน:

ย้ายสิ่งนี้ไปที่โหมดแบตช์และบิลรายเดือนจะลดลงเหลือ ~28,000 ดอลลาร์สหรัฐฯ ในระดับนี้ คุณอาจต้องการทดสอบการส่งชิ้นส่วนงานประจำไปยังโมเดลที่ถูกกว่ามาก เช่น 3.1 Flash-Lite และสงวน Flash ไว้สำหรับการสร้างที่ยากขึ้น

ค่าใช้จ่ายเทียบกับ GPT-5.5 และ Opus 4.7

การเปรียบเทียบราคาพาดหัว:

โมเดล อินพุต (ดอลลาร์สหรัฐฯ/1M) เอาต์พุต (ดอลลาร์สหรัฐฯ/1M) เท่าตัวเมื่อเทียบกับ Flash
Gemini 3.5 Flash ~1.50 ดอลลาร์สหรัฐฯ ~9.00 ดอลลาร์สหรัฐฯ 1 เท่า (ค่าพื้นฐาน)
GPT-5.5 ~10 ดอลลาร์สหรัฐฯ ~30 ดอลลาร์สหรัฐฯ อินพุต 6.7 เท่า, เอาต์พุต 3.3 เท่า
Claude Opus 4.7 ~15 ดอลลาร์สหรัฐฯ ~75 ดอลลาร์สหรัฐฯ อินพุต 10 เท่า, เอาต์พุต 8.3 เท่า

รันสถานการณ์ที่ 1 (แชทสนับสนุนลูกค้า) ผ่านแต่ละโมเดล:

นี่คือช่องว่างค่าใช้จ่ายงานเอเจนต์ที่เป็นแก่นของข้อความทางการตลาดของ Google โมเดลเรือธงให้คุณภาพที่ดีขึ้นเล็กน้อยสำหรับงานที่ยากที่สุด; สำหรับงานประจำวัน Flash ก็เพียงพอในราคาที่ถูกกว่ามาก

สำหรับการวิเคราะห์เชิงลึกเพิ่มเติม โปรดดูที่ ราคา GPT-5.5 และ การเปรียบเทียบสามทาง ของเรา

ค่าใช้จ่ายเทียบกับ Gemini รุ่นอื่นๆ

โมเดล อินพุต (ดอลลาร์สหรัฐฯ/1M) เอาต์พุต (ดอลลาร์สหรัฐฯ/1M) เมื่อใดควรใช้
Gemini 3.1 Flash-Lite ~0.40 ดอลลาร์สหรัฐฯ ~2.00 ดอลลาร์สหรัฐฯ งานประจำที่มีปริมาณมาก
Gemini 3 Flash ~0.50 ดอลลาร์สหรัฐฯ ~3.00 ดอลลาร์สหรัฐฯ รุ่นก่อนหน้า แต่ยังคงแข็งแกร่ง
Gemini 3.1 Pro ~2.00 ดอลลาร์สหรัฐฯ ~12.00 ดอลลาร์สหรัฐฯ งานที่ต้องใช้การให้เหตุผลมาก่อน 3.5 Pro
Gemini 3.5 Flash ~1.50 ดอลลาร์สหรัฐฯ ~9.00 ดอลลาร์สหรัฐฯ ค่าเริ่มต้นใหม่สำหรับงานส่วนใหญ่
Gemini 3.5 Pro (มิถุนายน 2026) จะแจ้งให้ทราบ จะแจ้งให้ทราบ งานที่ต้องใช้การให้เหตุผลที่ซับซ้อนที่สุด

Flash มีราคาแพงกว่ารุ่นก่อนหน้าอย่าง Flash 3.x แต่ถูกกว่ารุ่น Pro ก่อนหน้าอย่างน่าเชื่อถือ สำหรับทีมส่วนใหญ่ นี่คือการแลกเปลี่ยนที่เหมาะสม: ดีกว่า Flash 3.x, ราคาถูกกว่า Pro 3.x

สำหรับ Gemini รุ่นเก่า โปรดดูที่ 3.1 Flash-Lite, ราคา API 3.0, และ 3 Flash

ราคา Vertex AI (สำหรับการผลิต)

หากคุณเรียกใช้ Flash ผ่าน Vertex AI แทนที่จะเป็น AI Studio ราคาต่อโทเค็นจะเท่ากัน ความแตกต่างคือคุณสมบัติการเรียกเก็บเงินและบัญชี:

สำหรับทีมผู้ผลิตส่วนใหญ่ เส้นทางคือ: สร้างต้นแบบบนระดับฟรีของ AI Studio, เปลี่ยนไปใช้ AI Studio แบบเสียเงินเพื่อขยายขนาด, จากนั้นย้ายไป Vertex AI เมื่อคุณต้องการการควบคุมระดับองค์กร พฤติกรรมของโมเดลเหมือนกันในทั้งสามกรณี

เคล็ดลับการเพิ่มประสิทธิภาพต้นทุน

หกพฤติกรรมที่เป็นรูปธรรมที่ช่วยลดค่าใช้จ่าย Flash ได้มากที่สุด:

  1. เรียกใช้โหมดแบตช์สำหรับทุกสิ่งที่ำไม่ต้องการการตอบสนองแบบเรียลไทม์ ลด 50% โดยไม่สูญเสียคุณภาพ
  2. แคชส่วนนำแบบคงที่ที่ยาว พรอมต์ระบบ, เอกสารอ้างอิง, คำแนะนำ, ล้วนเป็นตัวเลือกที่ดี
  3. ใช้เอาต์พุต JSON ที่มีโครงสร้าง บังคับให้โมเดลเขียนน้อยลง ทั้งเร็วขึ้นและถูกกว่าข้อความแบบอิสระ
  4. กำหนดเส้นทางตามความซับซ้อนของงาน งานง่าย ๆ ไป Flash-Lite; งานยากไป Flash; งานที่ยากมาก ๆ ไป 3.5 Pro เมื่อเปิดตัว
  5. ตรวจสอบอินพุตล่วงหน้า อย่าสิ้นเปลืองโทเค็นไปกับคำขอที่ผิดพลาด Apidog จะตรวจจับสิ่งเหล่านี้ก่อนที่จะถึง API
  6. ติดตามค่าใช้จ่ายต่อพรอมต์ เพิ่มมิดเดิลแวร์การบันทึกที่บันทึกโทเค็นอินพุต/เอาต์พุตต่อคำขอ ค่าใช้จ่ายที่เกินมักจะมาจากพรอมต์ที่ผิดปกติบางรายการ

สำหรับขั้นตอนการตรวจสอบพรอมต์ ดาวน์โหลด Apidog, สร้างสถานการณ์การทดสอบสำหรับเอนด์พอยต์ Gemini ของคุณ, และเพิ่มการยืนยันรูปแบบการตอบกลับ การใช้คำขอที่ผิดพลาดซ้ำ ๆ 200 ครั้งในการดีบักเป็นวิธีที่ทีมงานเสียโควตาระดับฟรีไปในบ่ายวันเดียว

เมื่อระดับฟรีไม่เพียงพอ

สามสัญญาณในการอัปเกรดจาก Flash แบบฟรีเป็นแบบเสียเงิน:

  1. คุณใช้งานถึง 1,500 คำขอ/วัน หลายวันติดต่อกัน การจ่ายตามการใช้งานนั้นถูกพอสมควร จนเวลาที่นักพัฒนาเสียไปกับการหลบเลี่ยงโควตาแพงกว่าการอัปเกรด
  2. คุณต้องการอัตราการส่งข้อมูลต่อนาที (RPM) ที่สูงขึ้น ระดับฟรีจำกัดที่ 15 คำขอต่อนาที; ระดับเสียเงินจะสูงกว่ามาก
  3. คุณต้องการถิ่นที่อยู่ของข้อมูลหรือบันทึกการตรวจสอบ ย้ายไป Vertex AI ในบัญชีแบบเสียเงิน

ทีมส่วนใหญ่พบว่าการใช้งาน Flash แบบเสียเงิน 50–200 ดอลลาร์สหรัฐฯ/เดือน ช่วยลดความยุ่งยากในการจัดการระดับฟรีได้มาก

ความเสี่ยงด้านราคาและสิ่งที่ต้องจับตาดู

สามสิ่งที่อาจเปลี่ยนแปลงการคำนวณ:

ตั้งค่าการแจ้งเตือนค่าใช้จ่ายตั้งแต่วันแรก ทั้ง AI Studio (ในหน้าโควตาของโปรเจกต์) และ Vertex AI (ในการเรียกเก็บเงินบน Cloud) รองรับการกำหนดงบประมาณสูงสุดต่อวัน ใช้ประโยชน์จากสิ่งเหล่านี้

สรุป

Gemini 3.5 Flash มีราคาถูกเพียงพอที่งาน AI ระดับการผลิตส่วนใหญ่ในปี 2026 ควรเริ่มต้นที่นี่ อัตรามาตรฐาน (1.50 ดอลลาร์สหรัฐฯ / 9 ดอลลาร์สหรัฐฯ ต่อ 1 ล้านโทเค็น) ต่ำกว่าตัวเลือกโมเดลระดับแนวหน้าอื่นๆ ทุกตัว โหมดแบตช์และการแคชบริบทช่วยลดต้นทุนที่แท้จริงให้ต่ำลงอีก

สำหรับงานที่ Flash ไม่เพียงพอ วิธีที่ถูกต้องคือการผสมผสานระดับ: ใช้ Flash สำหรับงานจำนวนมาก, โมเดลเรือธงอย่าง GPT-5.5 หรือ Opus 4.7 สำหรับงานที่ยากที่สุด การกำหนดเส้นทางตามความซับซ้อนของงานเป็นการเพิ่มประสิทธิภาพต้นทุนที่มีผลตอบแทนสูงสุดที่คุณสามารถทำได้

ในการนำไปปฏิบัติ:

นี่คืองานสองวันที่มักจะคืนทุนได้ภายในรอบบิลเดียว

ดาวน์โหลดแอป

ฝึกการออกแบบ API แบบ Design-first ใน Apidog

ค้นพบวิธีที่ง่ายขึ้นในการสร้างและใช้ API