Cara Menggunakan Llama 4 Maverick dan Llama 4 Scout melalui API

Pelajari cara pakai Llama 4 Maverick & Scout via API. Panduan teknis, contoh kode, optimasi. Lancarkan alur kerja dengan Apidog.

Ardianto Nugroho

Ardianto Nugroho

15 April 2025

Cara Menggunakan Llama 4 Maverick dan Llama 4 Scout melalui API

Model Llama 4 Meta, yaitu Llama 4 Maverick dan Llama 4 Scout, mewakili lompatan maju dalam teknologi AI multimodal. Dirilis pada tanggal 5 April 2025, model-model ini memanfaatkan arsitektur Mixture-of-Experts (MoE), memungkinkan pemrosesan teks dan gambar yang efisien dengan rasio kinerja terhadap biaya yang luar biasa. Pengembang dapat memanfaatkan kemampuan ini melalui API yang disediakan oleh berbagai platform, membuat integrasi ke dalam aplikasi menjadi lancar dan kuat.

💡
Sebelum kita mulai, sederhanakan pengujian API Anda dengan Apidog, alat gratis yang dirancang untuk menyederhanakan debugging dan integrasi endpoint. Unduh Apidog secara gratis hari ini di Apidog.com dan tingkatkan alur kerja Anda saat Anda menjelajahi kemampuan API Llama 4.
button

Memahami Llama 4 Maverick dan Llama 4 Scout

Sebelum menyelami penggunaan API, pahami spesifikasi inti dari model-model ini. Llama 4 memperkenalkan multimodality asli, yang berarti ia memproses teks dan gambar bersama-sama dari awal. Selain itu, desain MoE-nya hanya mengaktifkan sebagian parameter per tugas, meningkatkan efisiensi.

Llama 4 Scout: Andalan Multimodal yang Efisien

Llama 4 Maverick: Pusat Kekuatan Serbaguna

Kedua model ini mengungguli pendahulunya seperti Llama 3 dan bersaing dengan raksasa industri seperti GPT-4o, menjadikannya pilihan yang menarik untuk proyek berbasis API.

Mengapa Menggunakan API Llama 4?

Mengintegrasikan Llama 4 melalui API menghilangkan kebutuhan untuk menghosting model-model besar ini secara lokal, yang seringkali membutuhkan perangkat keras yang signifikan (misalnya, NVIDIA H100 DGX untuk Maverick). Sebagai gantinya, platform seperti Groq, Together AI, dan OpenRouter menyediakan API terkelola, menawarkan:

Selanjutnya, mari siapkan lingkungan Anda untuk memanggil API ini.

Menyiapkan Lingkungan Anda untuk Panggilan API Llama 4

Untuk berinteraksi dengan Llama 4 Maverick dan Llama 4 Scout melalui API, siapkan lingkungan pengembangan Anda. Ikuti langkah-langkah ini:

Langkah 1: Pilih Penyedia API

Beberapa platform menghosting API Llama 4. Berikut adalah opsi populer:

Untuk panduan ini, kita akan menggunakan Groq dan Together AI sebagai contoh karena dokumentasi dan kinerjanya yang kuat.

Langkah 2: Dapatkan Kunci API

Simpan kunci ini dengan aman (misalnya, dalam variabel lingkungan) untuk menghindari pengkodean keras.

Langkah 3: Instal Dependensi

Gunakan Python untuk kesederhanaan. Instal pustaka yang diperlukan:

pip install requests

Untuk pengujian, Apidog melengkapi pengaturan ini dengan membiarkan Anda men-debug endpoint API secara visual.

Melakukan Panggilan API Llama 4 Pertama Anda

Dengan lingkungan Anda siap, kirim permintaan ke API Llama 4. Mari kita mulai dengan contoh pembuatan teks dasar.

Contoh 1: Pembuatan Teks dengan Llama 4 Scout (Groq)

import requests
import os

# Set API key
API_KEY = os.getenv("GROQ_API_KEY")
URL = "https://api.groq.com/v1/chat/completions"

# Define payload
payload = {
    "model": "meta-llama/Llama-4-Scout-17B-16E-Instruct",
    "messages": [
        {"role": "user", "content": "Write a short poem about AI."}
    ],
    "max_tokens": 150,
    "temperature": 0.7
}

# Set headers
headers = {
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
}

# Send request
response = requests.post(URL, json=payload, headers=headers)
print(response.json()["choices"][0]["message"]["content"])

Output: Sebuah puisi ringkas yang dihasilkan oleh Scout, memanfaatkan arsitektur MoE-nya yang efisien.

Contoh 2: Input Multimodal dengan Llama 4 Maverick (Together AI)

Maverick bersinar dalam tugas-tugas multimodal. Berikut cara mendeskripsikan sebuah gambar:

import requests
import os

# Set API key
API_KEY = os.getenv("TOGETHER_API_KEY")
URL = "https://api.together.ai/v1/chat/completions"

# Define payload with image and text
payload = {
    "model": "meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8",
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {"url": "https://example.com/sample.jpg"}
                },
                {
                    "type": "text",
                    "text": "Describe this image."
                }
            ]
        }
    ],
    "max_tokens": 200
}

# Set headers
headers = {
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
}

# Send request
response = requests.post(URL, json=payload, headers=headers)
print(response.json()["choices"][0]["message"]["content"])

Output: Deskripsi rinci dari gambar, yang menunjukkan keselarasan gambar-teks Maverick.

Mengoptimalkan Permintaan API untuk Kinerja

Untuk memaksimalkan efisiensi, sesuaikan panggilan API Llama 4 Anda. Pertimbangkan teknik-teknik ini:

Sesuaikan Panjang Konteks

Parameter Fine-Tune

Pemrosesan Batch

Kirim beberapa perintah dalam satu permintaan (jika API mendukungnya) untuk mengurangi latensi. Periksa dokumen penyedia untuk endpoint batch.

Kasus Penggunaan Tingkat Lanjut dengan API Llama 4

Sekarang, jelajahi integrasi tingkat lanjut untuk membuka potensi penuh Llama 4.

Kasus Penggunaan 1: Chatbot Multibahasa

Maverick mendukung 12 bahasa. Bangun bot dukungan pelanggan:

payload = {
    "model": "meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8",
    "messages": [
        {"role": "user", "content": "Hola, ¿cómo puedo resetear mi contraseña?"}
    ],
    "max_tokens": 100
}
response = requests.post(URL, json=payload, headers=headers)
print(response.json()["choices"][0]["message"]["content"])

Output: Respons Spanyol, memanfaatkan kefasihan multibahasa Maverick.

Kasus Penggunaan 2: Peringkasan Dokumen dengan Scout

Jendela token 10M Scout unggul dalam meringkas teks besar:

long_text = "..."  # Insert a lengthy document here
payload = {
    "model": "meta-llama/Llama-4-Scout-17B-16E-Instruct",
    "messages": [
        {"role": "user", "content": f"Summarize this: {long_text}"}
    ],
    "max_tokens": 300
}
response = requests.post(URL, json=payload, headers=headers)
print(response.json()["choices"][0]["message"]["content"])

Output: Ringkasan ringkas, diproses secara efisien oleh Scout.

Debugging dan Pengujian dengan Apidog

Menguji API bisa jadi rumit, terutama dengan input multimodal. Di sinilah Apidog bersinar:

button

Untuk menguji contoh di atas di Apidog:

Alur kerja ini memastikan integrasi API Llama 4 Anda berjalan dengan lancar.

Membandingkan Penyedia API untuk Llama 4

Memilih penyedia yang tepat memengaruhi biaya dan kinerja. Berikut adalah rinciannya:

Penyedia Dukungan Model Harga (Input/Output per M) Batas Konteks Catatan
Groq Scout, Maverick $0,11/$0,34 (Scout), $0,50/$0,77 (Maverick) 128K (dapat diperluas) Biaya terendah, kecepatan tinggi
Together AI Scout, Maverick Kustom (endpoint khusus) 1M (Maverick) Terukur, fokus pada perusahaan
OpenRouter Keduanya Tingkat gratis tersedia 128K Bagus untuk pengujian
Cloudflare Scout Berdasarkan penggunaan 131K Kesederhanaan tanpa server

Pilih berdasarkan skala dan anggaran proyek Anda. Untuk pembuatan prototipe, mulai dengan tingkat gratis OpenRouter, lalu skala dengan Groq atau Together AI.

Praktik Terbaik untuk Integrasi API Llama 4

Untuk memastikan integrasi yang kuat, ikuti panduan ini:

Memecahkan Masalah API Umum

Menemui masalah? Atasi dengan cepat:

Apidog membantu mendiagnosis masalah ini secara visual, menghemat waktu.

Kesimpulan

Mengintegrasikan Llama 4 Maverick dan Llama 4 Scout melalui API memberdayakan pengembang untuk membangun aplikasi mutakhir dengan overhead minimal. Apakah Anda memerlukan efisiensi konteks panjang Scout atau kehebatan multibahasa Maverick, model-model ini memberikan kinerja tingkat atas melalui endpoint yang dapat diakses. Dengan mengikuti panduan ini, Anda dapat mengatur, mengoptimalkan, dan memecahkan masalah panggilan API Anda secara efektif.

Siap untuk menyelami lebih dalam? Bereksperimenlah dengan penyedia seperti Groq dan Together AI, dan manfaatkan Apidog untuk menyempurnakan alur kerja Anda. Masa depan AI multimodal ada di sini—mulai membangun hari ini!

button

Explore more

Cara Menggunakan Lovable AI (Alternatif Cursor untuk Pengembang Web)

Cara Menggunakan Lovable AI (Alternatif Cursor untuk Pengembang Web)

Pelajari cara buat web apa pun dgn Lovable. Panduan lengkap, fitur inovatif, & integrasi Apidog (API gratis).

15 April 2025

Cara Menambahkan Kunci API Kustom ke Cursor: Panduan Komprehensif

Cara Menambahkan Kunci API Kustom ke Cursor: Panduan Komprehensif

Tutorial ini memandu Anda menyiapkan & mengelola API key khusus di Cursor: OpenAI, Anthropic, Google, & Azure.

11 April 2025

Cara Menggunakan NVIDIA Llama Nemotron API untuk Agen AI Tingkat Lanjut

Cara Menggunakan NVIDIA Llama Nemotron API untuk Agen AI Tingkat Lanjut

Pelajari API NVIDIA Llama Nemotron utk buat agen AI canggih.

11 April 2025

Mengembangkan API dengan Apidog

Apidog adalah alat pengembangan API yang membantu Anda mengembangkan API dengan lebih mudah dan efisien.