วิธีใช้ GPT-OSS ฟรีด้วย Ollama

Ashley Innocent

Ashley Innocent

5 August 2025

วิธีใช้ GPT-OSS ฟรีด้วย Ollama

Apidog สำหรับองค์กร

การติดตั้งแบบ On-Premises

SSO & RBAC

รองรับมาตรฐาน SOC 2

สำรวจ Apidog Enterprise

การรันโมเดลภาษาขนาดใหญ่ (LLMs) บนเครื่องของคุณเอง ช่วยให้ผู้พัฒนาได้รับความเป็นส่วนตัว การควบคุม และประหยัดค่าใช้จ่าย โมเดลแบบ open-weight ของ OpenAI ซึ่งรวมกันเรียกว่า GPT-OSS (gpt-oss-120b และ gpt-oss-20b) นำเสนอความสามารถในการให้เหตุผลอันทรงพลังสำหรับงานต่างๆ เช่น การเขียนโค้ด เวิร์กโฟลว์แบบเอเจนท์ และการวิเคราะห์ข้อมูล ด้วย Ollama ซึ่งเป็นแพลตฟอร์มโอเพนซอร์ส คุณสามารถปรับใช้โมเดลเหล่านี้บนฮาร์ดแวร์ของคุณเองได้โดยไม่ต้องพึ่งพาคลาวด์ คู่มือทางเทคนิคนี้จะแนะนำคุณเกี่ยวกับการติดตั้ง Ollama การกำหนดค่าโมเดล GPT-OSS และการดีบักด้วย Apidog ซึ่งเป็นเครื่องมือที่ช่วยให้การทดสอบ API สำหรับ LLMs ในเครื่องง่ายขึ้น

💡
สำหรับการดีบัก API ที่ราบรื่น ดาวน์โหลด Apidog ฟรี เพื่อแสดงภาพและเพิ่มประสิทธิภาพการโต้ตอบ GPT-OSS ของคุณ
button

ทำไมต้องรัน GPT-OSS บนเครื่องด้วย Ollama?

การรัน GPT-OSS บนเครื่องโดยใช้ Ollama มอบข้อได้เปรียบที่แตกต่างกันสำหรับนักพัฒนาและนักวิจัย ประการแรก ช่วยให้มั่นใจได้ถึง ความเป็นส่วนตัวของข้อมูล เนื่องจากข้อมูลอินพุตและเอาต์พุตของคุณยังคงอยู่ในเครื่องของคุณ ประการที่สอง ช่วยลดค่าใช้จ่าย API ของคลาวด์ที่เกิดขึ้นซ้ำๆ ทำให้เหมาะสำหรับการใช้งานที่มีปริมาณมากหรือการทดลอง ประการที่สาม ความเข้ากันได้ของ Ollama กับโครงสร้าง API ของ OpenAI ช่วยให้สามารถรวมเข้ากับเครื่องมือที่มีอยู่ได้อย่างราบรื่น ในขณะที่การสนับสนุนโมเดลแบบ Quantized เช่น gpt-oss-20b (ซึ่งต้องการหน่วยความจำเพียง 16GB) ช่วยให้สามารถเข้าถึงได้บนฮาร์ดแวร์ที่ไม่สูงมาก

Ollama GPT-OSS

นอกจากนี้ Ollama ยังช่วยลดความซับซ้อนของการปรับใช้ LLM อีกด้วย โดยจะจัดการกับน้ำหนักโมเดล (model weights) การพึ่งพา (dependencies) และการกำหนดค่าผ่าน Modelfile เดียวกัน ซึ่งคล้ายกับ Docker container สำหรับ AI เมื่อจับคู่กับ Apidog ซึ่งนำเสนอการแสดงผลแบบเรียลไทม์ของการตอบสนอง AI แบบสตรีมมิ่ง คุณจะได้รับระบบนิเวศที่แข็งแกร่งสำหรับการพัฒนา AI ในเครื่อง ถัดไป เรามาสำรวจข้อกำหนดเบื้องต้นสำหรับการตั้งค่าสภาพแวดล้อมนี้กัน

ข้อกำหนดเบื้องต้นสำหรับการรัน GPT-OSS บนเครื่อง

ก่อนดำเนินการต่อ ตรวจสอบให้แน่ใจว่าระบบของคุณตรงตามข้อกำหนดต่อไปนี้:

เมื่อเตรียมสิ่งเหล่านี้พร้อมแล้ว คุณก็พร้อมที่จะติดตั้ง Ollama และปรับใช้ GPT-OSS ไปยังขั้นตอนการติดตั้งกันเลย

ขั้นตอนที่ 1: การติดตั้ง Ollama บนระบบของคุณ

การติดตั้ง Ollama นั้นตรงไปตรงมา รองรับ macOS, Linux และ Windows ทำตามขั้นตอนเหล่านี้เพื่อตั้งค่า:

ดาวน์โหลด Ollama:

curl -fsSL https://ollama.com/install.sh | sh

สคริปต์นี้จะดำเนินการดาวน์โหลดและตั้งค่าโดยอัตโนมัติ

ยืนยันการติดตั้ง:

เริ่มเซิร์ฟเวอร์ Ollama:

เมื่อติดตั้งแล้ว Ollama ก็พร้อมที่จะดาวน์โหลดและรันโมเดล GPT-OSS ไปยังการดาวน์โหลดโมเดลกันเลย

ขั้นตอนที่ 2: การดาวน์โหลดโมเดล GPT-OSS

โมเดล GPT-OSS ของ OpenAI (gpt-oss-120b และ gpt-oss-20b) มีให้ใช้งานบน Hugging Face และได้รับการปรับให้เหมาะสมสำหรับ Ollama ด้วยการ Quantization แบบ MXFP4 ซึ่งช่วยลดความต้องการหน่วยความจำ ทำตามขั้นตอนเหล่านี้เพื่อดาวน์โหลด:

เลือกโมเดล:

GPT-OSS 20B
GPT-OSS 120B

ดาวน์โหลดผ่าน Ollama:

ollama pull gpt-oss-20b

หรือ

ollama pull gpt-oss-120b

ขึ้นอยู่กับฮาร์ดแวร์ของคุณ การดาวน์โหลด (20-50GB) อาจใช้เวลา ตรวจสอบให้แน่ใจว่ามีการเชื่อมต่ออินเทอร์เน็ตที่เสถียร

ยืนยันการดาวน์โหลด:

ollama list

มองหา gpt-oss-20b:latest หรือ gpt-oss-120b:latest

เมื่อดาวน์โหลดโมเดลแล้ว คุณสามารถรันมันบนเครื่องได้เลย มาสำรวจวิธีการโต้ตอบกับ GPT-OSS กัน

ขั้นตอนที่ 3: การรันโมเดล GPT-OSS ด้วย Ollama

Ollama มีหลายวิธีในการโต้ตอบกับโมเดล GPT-OSS: อินเทอร์เฟซบรรทัดคำสั่ง (CLI), API หรืออินเทอร์เฟซแบบกราฟิก เช่น Open WebUI เรามาเริ่มต้นด้วย CLI เพื่อความเรียบง่าย

เปิดเซสชันแบบโต้ตอบ:

ollama run gpt-oss-20b

สิ่งนี้จะเปิดเซสชันแชทแบบเรียลไทม์ พิมพ์คำถามของคุณ (เช่น “เขียนฟังก์ชัน Python สำหรับการค้นหาแบบไบนารี”) แล้วกด Enter ใช้ /help สำหรับคำสั่งพิเศษ

การค้นหาแบบครั้งเดียว:

ollama run gpt-oss-20b "Explain quantum computing in simple terms"

ปรับพารามิเตอร์:

ollama run gpt-oss-20b --temperature 0.1 --top-p 1.0 "Write a factual summary of blockchain technology"

ค่า temperature ที่ต่ำกว่า (เช่น 0.1) จะให้ผลลัพธ์ที่เป็นข้อเท็จจริงและกำหนดได้ ซึ่งเหมาะสำหรับงานทางเทคนิค

ถัดไป เรามาปรับแต่งพฤติกรรมของโมเดลโดยใช้ Modelfiles สำหรับกรณีการใช้งานเฉพาะกัน

ขั้นตอนที่ 4: การปรับแต่ง GPT-OSS ด้วย Ollama Modelfiles

Modelfiles ของ Ollama ช่วยให้คุณสามารถปรับแต่งพฤติกรรม GPT-OSS ได้โดยไม่ต้องฝึกซ้ำ คุณสามารถตั้งค่า system prompts ปรับขนาด context หรือ fine-tune พารามิเตอร์ได้ นี่คือวิธีการสร้างโมเดลที่กำหนดเอง:

สร้าง Modelfile:

FROM gpt-oss-20b
SYSTEM "You are a technical assistant specializing in Python programming. Provide concise, accurate code with comments."
PARAMETER temperature 0.5
PARAMETER num_ctx 4096

สิ่งนี้จะกำหนดค่าโมเดลให้เป็นผู้ช่วยที่เน้น Python โดยมีความคิดสร้างสรรค์ปานกลางและหน้าต่าง context 4k โทเค็น

สร้างโมเดลที่กำหนดเอง:

ollama create python-gpt-oss -f Modelfile

รันโมเดลที่กำหนดเอง:

ollama run python-gpt-oss

ตอนนี้ โมเดลจะจัดลำดับความสำคัญของการตอบสนองที่เกี่ยวข้องกับ Python ด้วยพฤติกรรมที่ระบุ

การปรับแต่งนี้ช่วยเพิ่มประสิทธิภาพ GPT-OSS สำหรับโดเมนเฉพาะ เช่น การเขียนโค้ดหรือเอกสารทางเทคนิค ตอนนี้ เรามาผสานรวมโมเดลเข้ากับแอปพลิเคชันโดยใช้ Ollama API กัน

ขั้นตอนที่ 5: การผสานรวม GPT-OSS กับ Ollama API

API ของ Ollama ซึ่งทำงานบน http://localhost:11434 ช่วยให้สามารถเข้าถึง GPT-OSS แบบโปรแกรมได้ ซึ่งเหมาะสำหรับนักพัฒนาที่สร้างแอปพลิเคชันที่ขับเคลื่อนด้วย AI นี่คือวิธีการใช้งาน:

API Endpoints:

curl http://localhost:11434/api/generate -H "Content-Type: application/json" -d '{"model": "gpt-oss-20b", "prompt": "Write a Python script for a REST API"}'
curl http://localhost:11434/v1/chat/completions -H "Content-Type: application/json" -d '{"model": "gpt-oss-20b", "messages": [{"role": "user", "content": "Explain neural networks"}]}'

ความเข้ากันได้กับ OpenAI:

from openai import OpenAI
client = OpenAI(base_url="http://localhost:11434/v1", api_key="ollama")
response = client.chat.completions.create(
    model="gpt-oss-20b",
    messages=[{"role": "user", "content": "What is machine learning?"}]
)
print(response.choices[0].message.content)

การผสานรวม API นี้ช่วยให้ GPT-OSS สามารถขับเคลื่อนแชทบอท ตัวสร้างโค้ด หรือเครื่องมือวิเคราะห์ข้อมูลได้ อย่างไรก็ตาม การดีบักการตอบสนองแบบสตรีมมิ่งอาจเป็นเรื่องที่ท้าทาย มาดูกันว่า Apidog ทำให้สิ่งนี้ง่ายขึ้นได้อย่างไร

ขั้นตอนที่ 6: การดีบัก GPT-OSS ด้วย Apidog

Apidog เป็นเครื่องมือทดสอบ API อันทรงพลังที่แสดงภาพการตอบสนองแบบสตรีมมิ่งจาก Ollama endpoints ทำให้ง่ายต่อการดีบักเอาต์พุต GPT-OSS นี่คือวิธีการใช้งาน:

ติดตั้ง Apidog:

กำหนดค่า Ollama API ใน Apidog:

{
  "model": "gpt-oss-20b",
  "prompt": "Generate a Python function for sorting",
  "stream": true
}

แสดงภาพการตอบสนอง:

การทดสอบเปรียบเทียบ:

การแสดงภาพของ Apidog เปลี่ยนการดีบักจากงานที่น่าเบื่อให้เป็นกระบวนการที่ชัดเจนและนำไปปฏิบัติได้ ซึ่งช่วยเพิ่มประสิทธิภาพเวิร์กโฟลว์การพัฒนาของคุณ ตอนนี้ เรามาแก้ไขปัญหาทั่วไปที่คุณอาจพบกัน

ขั้นตอนที่ 7: การแก้ไขปัญหาทั่วไป

การรัน GPT-OSS บนเครื่องอาจนำเสนอความท้าทาย นี่คือวิธีแก้ไขปัญหาที่พบบ่อย:

ข้อผิดพลาดหน่วยความจำ GPU:

โมเดลไม่เริ่มทำงาน:

API ไม่ตอบสนอง:

ประสิทธิภาพช้า:

สำหรับปัญหาที่ยังคงอยู่ โปรดปรึกษา Ollama GitHub หรือชุมชน Hugging Face สำหรับการสนับสนุน GPT-OSS

ขั้นตอนที่ 8: การเพิ่มประสิทธิภาพ GPT-OSS ด้วย Open WebUI

สำหรับอินเทอร์เฟซที่ใช้งานง่าย ให้จับคู่ Ollama กับ Open WebUI ซึ่งเป็นแดชบอร์ดบนเบราว์เซอร์สำหรับ GPT-OSS:

ติดตั้ง Open WebUI:

docker run -d -p 3000:8080 --name open-webui ghcr.io/open-webui/open-webui:main

เข้าถึงอินเทอร์เฟซ:

การอัปโหลดเอกสาร:

Open WebUI ทำให้การโต้ตอบง่ายขึ้นสำหรับผู้ใช้ที่ไม่ใช่ด้านเทคนิค ซึ่งช่วยเสริมความสามารถในการดีบักทางเทคนิคของ Apidog

สรุป: ปลดปล่อย GPT-OSS ด้วย Ollama และ Apidog

การรัน GPT-OSS บนเครื่องด้วย Ollama ช่วยให้คุณสามารถควบคุมโมเดล open-weight ของ OpenAI ได้ฟรี พร้อมการควบคุมความเป็นส่วนตัวและการปรับแต่งอย่างเต็มที่ ด้วยการทำตามคู่มือนี้ คุณได้เรียนรู้วิธีติดตั้ง Ollama ดาวน์โหลดโมเดล GPT-OSS ปรับแต่งพฤติกรรม ผสานรวมผ่าน API และดีบักด้วย Apidog ไม่ว่าคุณจะกำลังสร้างแอปพลิเคชันที่ขับเคลื่อนด้วย AI หรือทดลองกับงานให้เหตุผล การตั้งค่านี้ให้ความยืดหยุ่นที่ไม่มีใครเทียบได้ การปรับเปลี่ยนเล็กน้อย เช่น การปรับพารามิเตอร์หรือการใช้การแสดงภาพของ Apidog สามารถเพิ่มประสิทธิภาพเวิร์กโฟลว์ของคุณได้อย่างมาก เริ่มสำรวจ AI ในเครื่องวันนี้และปลดล็อกศักยภาพของ GPT-OSS!

button
Apidog Animate Post

ฝึกการออกแบบ API แบบ Design-first ใน Apidog

ค้นพบวิธีที่ง่ายขึ้นในการสร้างและใช้ API