Cara Menggunakan Venice API: Panduan Lengkap

Ashley Goolam

Ashley Goolam

4 February 2026

Cara Menggunakan Venice API: Panduan Lengkap

Apidog untuk Perusahaan

Penerapan On-Premises

SSO & RBAC

Sesuai SOC 2

Jelajahi Apidog Enterprise

Bagaimana jika Anda bisa beralih penyedia AI tanpa menulis ulang satu baris kode pun? Venice API menawarkan hal itu, endpoint yang kompatibel dengan OpenAI dengan retensi data nol, opsi model tanpa sensor, dan arsitektur yang mengutamakan privasi yang Anda kendalikan.

Sebagian besar API AI memaksa Anda menggunakan SDK khusus vendor, menyimpan data Anda untuk pelatihan model, dan membebankan tarif premium untuk fitur dasar. Anda menulis ulang aplikasi Anda saat beralih penyedia. Prompt Anda melatih model pesaing. Biaya Anda meningkat secara tidak terduga.

Venice API menghilangkan titik-titik gesekan ini. Ini mencerminkan struktur API OpenAI persis, ubah URL dasar dan kode Anda yang ada segera berfungsi. Data Anda tetap pribadi. Anda memilih dari berbagai model pembayaran termasuk staking kripto dan kredit USD bayar-sesuai-pakai.

💡
Ingin alat Pengujian API hebat yang menghasilkan Dokumentasi API yang indah?

Ingin platform All-in-One yang terintegrasi untuk Tim Pengembang Anda agar dapat bekerja sama dengan produktivitas maksimal?

Apidog memenuhi semua permintaan Anda, dan menggantikan Postman dengan harga yang jauh lebih terjangkau!
tombol

Membuat Kunci API Venice Anda

1.  Navigasi ke venice.ai/settings/api.

navigasi ke pengaturan api venice

2.  Klik "Buat Kunci API Baru" dan konfigurasikan kredensial Anda:

buat kunci api venice baru

3.  Segera salin kunci Anda. Venice menampilkannya sekali! Simpan di variabel lingkungan, jangan pernah di repositori kode.

export VENICE_API_KEY="your-key-here"
salin kunci api venice anda segera

Pertimbangan Keamanan Kunci

Kunci admin memberikan akses luas ke akun Venice Anda. Perlakukan mereka seperti kredensial root—gunakan untuk skrip rotasi kunci dan manajemen tim, jangan pernah dalam kode aplikasi. Kunci hanya-inferensi membatasi operasi pada eksekusi model, membatasi paparan jika bocor. Rotasi kunci setiap kuartal menggunakan log aktivitas dasbor untuk mengidentifikasi kredensial yang kedaluwarsa.

Autentikasi dan Konfigurasi Dasar API Venice

Venice menggunakan autentikasi token Bearer standar. Setiap permintaan memerlukan dua header:

Authorization: Bearer $VENICE_API_KEY
Content-Type: application/json

URL dasar mengikuti pola OpenAI persis:

import openai
import os

client = openai.OpenAI(
    api_key=os.getenv("VENICE_API_KEY"),
    base_url="https://api.venice.ai/api/v1"
)

Perubahan konfigurasi tunggal ini mengarahkan semua panggilan SDK OpenAI Anda yang ada melalui infrastruktur Venice. Tidak ada perubahan metode. Tidak ada penulisan ulang parameter. Kode Anda segera berfungsi.

Kompatibilitas SDK

Venice menjaga kompatibilitas dengan SDK resmi OpenAI di Python, TypeScript, Go, PHP, C#, Java, dan Swift. Pustaka pihak ketiga yang dibangun di atas spesifikasi OpenAI juga berfungsi tanpa modifikasi. Uji codebase Anda yang ada terhadap Venice dengan hanya mengubah URL dasar dan kunci API—jika Anda menggunakan penyelesaian chat standar, streaming, atau pemanggilan fungsi, migrasi hanya membutuhkan waktu beberapa menit.

Migrasi dari OpenAI

Migrasi memerlukan tiga perubahan: URL dasar, kunci API, dan nama model. Ganti https://api.openai.com/v1 dengan https://api.venice.ai/api/v1. Tukar kunci API OpenAI Anda dengan kunci Venice Anda. Ubah pengenal model dari gpt-4 atau gpt-3.5-turbo ke yang setara dengan Venice seperti qwen3-4b. Uji secara menyeluruh sebelum penerapan produksi. Verifikasi respons streaming diproses dengan benar. Konfirmasi skema pemanggilan fungsi valid. Periksa parameter pembuatan gambar sesuai dengan persyaratan Anda. Lapisan kompatibilitas Venice menangani sebagian besar kasus tepi, tetapi ada perbedaan halus dalam format pesan kesalahan dan header batas laju.

ProTip: Uji semua endpoint API Anda secara menyeluruh dengan Apidog.

Endpoint dan Kemampuan Inti API Venice

Venice menyediakan sembilan endpoint berbeda yang mencakup pembuatan teks, gambar, audio, dan video:

bekerja dengan api venice

Pembuatan Teks

Pemrosesan Gambar

Audio

Video dan Karakter

Setiap endpoint menjaga format permintaan/respons yang kompatibel dengan OpenAI jika berlaku. Anda menggunakan kembali logika parsing yang sudah ada.

Strategi Pemilihan Endpoint

Sesuaikan endpoint dengan kompleksitas kasus penggunaan Anda. Penyelesaian chat menangani sebagian besar kebutuhan pembuatan teks. Tambahkan embedding untuk pencarian semantik atau pipeline RAG. Gunakan endpoint gambar untuk alur kerja kreatif atau moderasi konten. Endpoint audio memungkinkan fitur aksesibilitas atau antarmuka suara. Mulai dengan satu endpoint, validasi integrasi Anda, lalu perluas ke alur kerja multimodal.

Bekerja dengan Respons Streaming

Streaming mengurangi latensi yang dirasakan untuk aplikasi chat. Venice menggunakan Server-Sent Events (SSE) yang identik dengan implementasi OpenAI. Proses konten parsial saat tiba daripada menunggu respons lengkap. Tangani penghentian stream dengan memeriksa pesan [DONE]. Implementasikan logika koneksi ulang untuk stream yang terganggu—simpan riwayat percakapan di sisi klien dan coba lagi permintaan yang gagal. Pantau penggunaan token dalam potongan stream untuk melacak biaya secara real-time.

Parameter Spesifik API Venice

Selain parameter standar OpenAI, Venice menambahkan kontrol kemampuan melalui objek venice_parameters:

{
  "model": "qwen3-4b",
  "messages": [{"role": "user", "content": "Latest AI developments?"}],
  "venice_parameters": {
    "enable_web_search": "on",
    "enable_web_citations": true,
    "strip_thinking_response": false
  }
}

Integrasi Pencarian Web

Setel enable_web_search ke auto, on, atau off. Otomatis memungkinkan model memutuskan kapan informasi terkini meningkatkan respons. Paksa untuk kueri real-time tentang peristiwa terkini atau teknologi yang berubah dengan cepat. Pasangkan dengan enable_web_citations untuk mengembalikan URL sumber—penting untuk alat penelitian dan verifikasi fakta.

Kontrol Penalaran

Model penalaran seperti DeepSeek R1 menunjukkan pemikiran langkah demi langkah secara default. Setel strip_thinking_response ke true untuk hanya mengembalikan jawaban akhir, mengurangi konsumsi token. Gunakan disable_thinking untuk melewati penalaran sepenuhnya untuk kueri sederhana.

Sintaks Alternatif

Teruskan parameter melalui sufiks model untuk permintaan ringkas:

model="qwen3-4b:enable_web_search=on&enable_web_citations=true"

Hierarki Parameter

Parameter spesifik Venice mengesampingkan default tetapi menghormati pengaturan eksplisit. Jika Anda menentukan temperature: 0.5 di objek root dan enable_web_search: on di venice_parameters, keduanya berlaku secara bersamaan. Uji kombinasi parameter secara terpisah sebelum menyebarkan ke produksi—beberapa parameter berinteraksi secara tidak terduga dengan model tertentu.

Contoh Implementasi Praktis Saat Menggunakan API Venice

Penyelesaian Chat Dasar

curl --request POST \
  --url https://api.venice.ai/api/v1/chat/completions \
  --header "Authorization: Bearer $VENICE_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "qwen3-4b",
    "messages": [{"role": "user", "content": "Explain zero-knowledge proofs"}],
    "stream": true
  }'

Streaming berfungsi identik dengan OpenAI—memproses potongan SSE saat tiba.

Pemanggilan Fungsi

curl --request POST \
  --url https://api.venice.ai/api/v1/chat/completions \
  --header "Authorization: Bearer $VENICE_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "qwen3-4b",
    "messages": [{"role": "user", "content": "Weather in Tokyo?"}],
    "tools": [{
      "type": "function",
      "function": {
        "name": "get_weather",
        "description": "Get weather for location",
        "parameters": {
          "type": "object",
          "properties": {
            "location": {"type": "string"}
          },
          "required": ["location"]
        }
      }
    }]
  }'

Model Venice mendukung pemanggilan fungsi paralel dan penegakan skema seperti implementasi OpenAI.

Pembuatan Gambar

curl --request POST \
  --url https://api.venice.ai/api/v1/image/generate \
  --header "Authorization: Bearer $VENICE_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "venice-sd35",
    "prompt": "Cyberpunk cityscape at night, neon reflections",
    "aspect_ratio": "16:9",
    "resolution": "2K",
    "hide_watermark": true
  }'

Rasio aspek yang tersedia termasuk 1:1, 4:3, 16:9, dan 21:9. Pilihan resolusi adalah 1K dan 2K.

Peningkatan Skala Gambar (Upscaling)

curl --request POST \
  --url https://api.venice.ai/api/v1/image/upscale \
  --header "Authorization: Bearer $VENICE_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "upscale-sd35",
    "image": "base64encodedimage..."
  }'

Analisis Visi

curl --request POST \
  --url https://api.venice.ai/api/v1/chat/completions \
  --header "Authorization: Bearer $VENICE_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "qwen3-vl-235b-a22b",
    "messages": [{
      "role": "user",
      "content": [
        {"type": "text", "text": "What architecture style is this?"},
        {"type": "image_url", "image_url": {"url": "data:image/jpeg;base64,..."}}
      ]
    }]
  }'

Teruskan gambar sebagai URI data base64 atau URL HTTPS. Model visi menerima beberapa gambar per pesan untuk tugas perbandingan.

Sintesis Audio

curl --request POST \
  --url https://api.venice.ai/api/v1/audio/speech \
  --header "Authorization: Bearer $VENICE_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts-kokoro",
    "input": "Welcome to Venice API",
    "voice": "af_sky",
    "response_format": "mp3"
  }'

Opsi suara menggunakan prefiks: af_ (perempuan Amerika), am_ (laki-laki Amerika), dan pola serupa untuk aksen lainnya.

Pola Penanganan Kesalahan

Venice mengembalikan kode status HTTP standar. 401 menunjukkan kegagalan autentikasi—verifikasi kunci API dan header Anda. 429 menandakan pembatasan laju (rate limiting); implementasikan exponential backoff mulai dari 1 detik. Kesalahan 500 menunjukkan masalah infrastruktur sementara; coba lagi setelah 5 detik. Uraikan respons kesalahan untuk pesan spesifik—Venice menyertakan alasan kegagalan terperinci dalam badan respons.

Privasi dan Arsitektur Data API Venice

Kebijakan retensi data nol Venice beroperasi melalui arsitektur teknis, bukan hanya janji hukum. Browser Anda menyimpan riwayat percakapan secara lokal menggunakan IndexedDB. Server Venice memproses prompt pada GPU yang hanya melihat permintaan saat ini—tidak ada riwayat percakapan, tidak ada metadata identitas pengguna, tidak ada informasi kunci API.

Setelah menghasilkan respons, server segera membuang prompt dan output. Tidak ada yang tersimpan di disk atau log. Data Anda tidak pernah melatih model. Ini berbeda secara fundamental dari layanan terpusat yang menyimpan data untuk deteksi penyalahgunaan dan peningkatan model.

Untuk privasi tambahan, Venice meng-hosting sebagian besar model pada infrastruktur pribadi daripada mengandalkan penyedia pihak ketiga. Opsi tanpa sensor berjalan pada perangkat keras yang dikendalikan Venice, memastikan tidak ada penyaringan atau logging eksternal.

Verifikasi Alur Data

Audit klaim privasi Venice dengan memantau lalu lintas jaringan. Permintaan API langsung menuju api.venice.ai dengan enkripsi TLS. Tidak ada skrip analitik pihak ketiga yang dimuat dalam dokumentasi. Header respons tidak menunjukkan arahan caching—mengkonfirmasi non-retensi sisi server. Untuk aplikasi sensitif, implementasikan enkripsi sisi klien sebelum mengirim prompt, meskipun ini mencegah model memahami konten.

Opsi Harga dan Pembayaran API Venice

Venice menawarkan tiga metode pembayaran untuk menyesuaikan pola penggunaan Anda. Langganan Pro berharga $18 setiap bulan dan termasuk $10 dalam kredit API ditambah prompt tanpa batas pada fitur konsumen. Staking DIEM memerlukan pembelian token VVV yang menyediakan alokasi komputasi harian permanen—ideal untuk aplikasi bervolume tinggi dengan lalu lintas yang dapat diprediksi. Pembayaran USD sesuai penggunaan memungkinkan Anda mendanai akun Anda dengan dolar dan mengonsumsi kredit sesuai kebutuhan, sempurna untuk eksperimen dan beban kerja yang bervariasi.

Akses API saat ini tetap gratis selama beta. Ini memungkinkan Anda memvalidasi pola integrasi dan memperkirakan biaya sebelum berkomitmen pada metode pembayaran. Pantau dasbor penggunaan Anda untuk melacak konsumsi token di seluruh endpoint dan model.

metode pembayaran api venice

Pedoman Pemilihan Model

Pilih model berdasarkan persyaratan kemampuan dan batasan latensi. Mulai dengan qwen3-4b untuk prototyping dan kueri sederhana—ini merespons dengan cepat dan menangani sebagian besar tugas pembuatan teks dengan memadai. Tingkatkan ke model yang lebih besar seperti llama-3.3-70b atau deepseek-ai-DeepSeek-R1 ketika Anda membutuhkan penalaran lanjutan, pembuatan kode, atau mengikuti instruksi yang kompleks. Tugas visi memerlukan model multimodal seperti qwen3-vl-235b-a22b. Pembuatan audio menggunakan model ucapan khusus. Kueri endpoint /api/v1/models secara terprogram untuk memeriksa ketersediaan real-time—Venice merotasi model berdasarkan permintaan dan kapasitas infrastruktur.

Kesimpulan

Venice API menghilangkan gesekan dari integrasi AI. Anda mendapatkan kompatibilitas OpenAI tanpa penguncian, privasi tanpa kompleksitas konfigurasi, dan harga fleksibel tanpa tagihan tak terduga. Pendekatan penggantian langsung berarti Anda dapat mengevaluasi Venice bersama penyedia Anda saat ini tanpa menulis ulang kode aplikasi.

Saat membangun integrasi API—baik menguji endpoint Venice, men-debug alur autentikasi, atau mengelola beberapa konfigurasi penyedia—gunakan Apidog untuk merampingkan alur kerja Anda. Ini menangani pengujian API visual, pembuatan dokumentasi, dan kolaborasi tim sehingga Anda dapat fokus pada pengiriman fitur.

tombol

Mengembangkan API dengan Apidog

Apidog adalah alat pengembangan API yang membantu Anda mengembangkan API dengan lebih mudah dan efisien.

Cara Menggunakan Venice API: Panduan Lengkap