무료 무제한 Gemini API 받기

Ashley Innocent

Ashley Innocent

9 May 2026

무료 무제한 Gemini API 받기

Apidog 엔터프라이즈

온프레미스 배포

SSO & RBAC

SOC 2 준수

Apidog Enterprise 살펴보기

Google의 Gemini 제품군은 대용량 워크로드에 가장 비용 효율적인 최신 모델 라인업으로, Gemini 2.5 Pro는 백만 토큰당 $1.25 / $10이며 Flash 변형은 훨씬 저렴합니다. 무료 공개 앱, 사이드 프로젝트 또는 해커톤 빌드의 경우, 수천 명의 사용자가 엔드포인트에 접속하면 이러한 요금도 빠르게 누적됩니다. Puter.js는 모델을 뒤집습니다. Google API 키 없이 전체 Gemini 라인업(2.5 Pro, 2.5 Flash, 2.0 Flash, 3 Flash 프리뷰, 오픈 Gemma 2/3/4 제품군)을 노출하고 사용자 대신 최종 사용자에게 청구합니다. 개발자에게는 무료이며 무제한입니다.

button

요약

“무료 무제한” 작동 방식

Puter.js는 LLM 과금 모델을 뒤집습니다. 개발자가 Google AI Studio 키를 보유하고 모든 토큰 비용을 부담하는 대신, 최종 사용자가 Puter에 로그인(무료 계정)하고 해당 사용자의 잔액에서 호출이 청구됩니다. 새 Puter 계정에는 초기 크레딧이 제공되며, 사용자는 더 많은 것을 원하면 충전합니다.

개발자에게는 다음과 같은 이점이 있습니다:

단점: 이 방식은 브라우저 우선입니다. 로그인한 사용자 세션 없이는 백엔드 크론 작업이 Puter를 사용할 수 없습니다.

1단계: 설치

하나의 CDN 태그, 빌드 단계 없음:

<script src="https://js.puter.com/v2/"></script>

이것이 전체 설치입니다. 번들된 앱의 경우:

npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';

2단계: 모델 선택

각 형태에 적합한 도구를 갖춘 Puter의 Gemini 라인업:

모델 ID 사용 시점
google/gemini-2.5-pro 가장 심층적인 추론; 복잡한 분석 및 긴 컨텍스트 작업
google/gemini-2.5-flash 기본 일상 작업용; 강력한 비용/품질 균형
google/gemini-2.5-flash-lite 가장 저렴한 Flash 변형; 대용량 분류
google/gemini-2.0-flash 안정적인 기준선; 잘 알려진 동작
google/gemini-3-flash-preview 최신 프리뷰; 최첨단 속도
google/gemma-3-27b-it 오픈 Gemma; 지시 튜닝, 미세 조정 기준선에 적합
google/gemma-4-31b-it 가장 큰 오픈 Gemma; 폐쇄형 Gemini 품질에 더 가깝습니다

대부분의 앱의 경우 gemini-2.5-flash를 기본으로 사용하고, 어려운 프롬프트에서만 Pro를 사용하세요. Lite 변형은 한 자릿수 이상 빠르며 태깅, 분류, 간단한 Q&A에 충분합니다.

3단계: Gemini와 대화하기

최소한의 호출:

<!DOCTYPE html>
<html>
<body>
  <script src="https://js.puter.com/v2/"></script>
  <script>
    puter.ai.chat(
      "머신러닝을 세 문장으로 설명해 주세요.",
      { model: 'google/gemini-2.5-flash' }
    ).then(response => {
      puter.print(response);
    });
  </script>
</body>
</html>

브라우저에서 엽니다. Puter가 호출을 처리하고, 사용자는 로그인(또는 처음 실행 시 무료 Puter 계정 생성)하며, 응답은 페이지에 인쇄됩니다. API 키, 환경 변수, 서버가 필요 없습니다.

4단계: 응답 스트리밍

채팅 UI 및 긴 답변의 경우 스트리밍이 올바른 기본값입니다:

const response = await puter.ai.chat(
  "광합성에 대해 자세히 설명해 주세요.",
  {
    model: 'google/gemini-2.5-flash',
    stream: true,
  }
);

for await (const part of response) {
  if (part?.text) {
    outputDiv.innerHTML += part.text;
  }
}

part.text는 응답의 청크입니다. UI에 추가하면 사용자는 텍스트가 단어 단위로 나타나는 것을 볼 수 있습니다.

5단계: 비전(이미지 입력)

Gemini의 가장 강력한 기능은 다중 모드 기반입니다. 두 번째 인수로 이미지 URL을 전달합니다:

puter.ai.chat(
  "이 이미지에서 무엇을 보시나요? 색상, 사물, 분위기를 설명해 주세요.",
  "https://assets.puter.site/doge.jpeg",
  { model: 'google/gemini-2.5-flash' }
).then(response => {
  puter.print(response);
});

사용 사례: 대체 텍스트 생성, 시각적 QA, 스크린샷 분석, OCR, 접근성 도구, 제품 이미지 태그 지정. Gemini의 비전 품질은 자연 이미지와 다이어그램에서 일관되게 강력합니다. 밀도 높은 텍스트 스크린샷에서는 GPT-5.x가 때때로 더 나은 성능을 보입니다.

6단계: 온도 조절

옵션 객체에 표준 매개변수를 전달합니다:

const response = await puter.ai.chat(
  '로봇 요리사에 대한 창의적인 단편 소설을 써 주세요.',
  {
    model: 'google/gemini-2.5-flash',
    temperature: 0.2,
  }
);

사실적이거나 구조화된 출력의 경우 낮은 온도(0.0–0.3)를 사용하고, 창의적인 글쓰기의 경우 높은 온도(0.7–1.0)를 사용합니다. Gemini Flash의 기본값은 대부분의 채팅 사용 사례에서 온도 0.7에서 잘 작동합니다.

7단계: 다중 턴 대화

메시지 배열을 전달합니다:

const messages = [
  { role: 'user', content: '저는 Postgres와 함께 Next.js 앱을 만들고 있습니다.' },
  { role: 'assistant', content: '알겠습니다. 무엇을 도와드릴까요?' },
  { role: 'user', content: '마이그레이션 구조를 어떻게 잡아야 할까요?' },
];

const response = await puter.ai.chat(messages, {
  model: 'google/gemini-2.5-pro',
});

console.log(response);

다음 호출 전에 모든 사용자 메시지와 모든 어시스턴트 응답을 배열에 푸시하세요. Gemini는 전체 대본을 읽고 턴 전체에서 일관성을 유지합니다.

동일한 프롬프트에서 Gemini와 다른 모델 비교

Puter는 하나의 인터페이스를 통해 모든 주요 LLM을 노출합니다. 사용 사례에 적합한 모델을 찾는 가장 빠른 방법은 여러 공급자에서 동일한 프롬프트를 스크립팅하는 것입니다:

const models = [
  'google/gemini-2.5-flash',
  'claude-sonnet-4-6',
  'gpt-5.5',
  'x-ai/grok-4.3',
];
const prompt = "이 React 컴포넌트를 훅을 사용하도록 리팩토링하세요: ...";

for (const model of models) {
  const start = performance.now();
  const response = await puter.ai.chat(prompt, { model });
  const elapsed = performance.now() - start;
  console.log(`${model}: ${elapsed.toFixed(0)}ms`);
  console.log(response);
  console.log('---');
}

한 번 실행하면 절충 패턴을 볼 수 있습니다. Gemini Flash는 일반적으로 지연 시간 우승자이며, Sonnet은 코딩에서 품질 우승자이고, GPT-5.5는 장문 글쓰기에서 품질 우승자이며, Grok 4.3은 비용에서 우승합니다. 사용 사례에 맞는 모델을 선택하세요.

얻는 것과 얻지 못하는 것

솔직한 구분:

얻는 것:

얻지 못할 수 있는 것 (Puter 버전에 따라 다름):

코드 실행 및 기반 기능이 필요한 심층적인 에이전트 흐름의 경우, 공식 Google AI Studio API가 더 많은 것을 제공합니다. 일반적인 채팅, Q&A, 콘텐츠 생성 및 시각적 작업의 경우 Puter로 충분합니다.

Puter와 공식 Gemini API 사용 시점

구분:

Puter를 사용해야 할 때:

공식 Gemini API를 사용해야 할 때:

독립형 Gemini 3 Flash 사용법은 Gemini 3 Flash Preview API 사용 방법을 참조하세요.

Apidog에서 통합 테스트

Puter 호출은 브라우저에서 발생하므로 백엔드 테스트 실행기에서 스크립팅할 수 없습니다. 작동하는 패턴:

  1. Puter 스크립트와 프롬프트용 쿼리 매개변수가 있는 작은 정적 페이지를 만듭니다.
  2. (결국 마이그레이션할 때) 업스트림 Google Gemini API 표면을 검증하는 데 Apidog를 사용합니다.
  3. 동일한 Apidog 컬렉션에 두 가지를 별도의 환경으로 유지하여 한 번의 클릭으로 전환할 수 있습니다.

Apidog를 다운로드하고 두 가지 환경을 설정합니다: puter-prototype (Puter 페이지를 호스팅하는 localhost URL) 및 gemini-prod (https://generativelanguage.googleapis.com/v1). 마이그레이션할 때 컬렉션이 깔끔하게 포팅됩니다. 더 광범위한 API 테스트 패턴은 QA 엔지니어를 위한 API 테스트 도구를 참조하세요.

Puter를 통한 기타 무료 LLM 경로

동일한 사용자 지불 모델이 모든 주요 LLM에 적용됩니다:

단일 Puter 스크립트가 이 모든 것을 처리합니다. model 문자열을 변경하면 공급자가 전환됩니다.

FAQ

이것이 정말 무제한인가요, 아니면 숨겨진 제한이 있나요? 개발자 측면에서는 진정으로 무제한입니다. 최종 사용자는 Puter 계정에 있는 잔액을 사용합니다. 새 계정에는 초기 크레딧이 제공되며, 사용자는 더 많은 것을 원하면 충전합니다.

Google 계정이나 Google Cloud 프로젝트가 필요한가요? 아닙니다. Puter가 Google 관계를 처리합니다. Google API 키를 볼 필요가 없습니다.

프로덕션에서 사용할 수 있나요? 예, 브라우저 기반 앱의 경우 가능합니다. Puter는 프로덕션 인프라를 운영합니다. 중요한 질문은 사용자가 Puter 로그인 단계를 허용하는지 여부입니다.

Puter를 통한 Gemini가 공식 API와 동일하게 작동하나요? 모델 출력은 동일합니다. Puter는 사용자를 대신하여 Google API를 호출합니다. 추가적인 단계로 인해 지연 시간이 약간 더 길어질 수 있지만, 모델 동작은 변경되지 않습니다.

Gemini의 거대한 2M 토큰 컨텍스트 창은 어떻습니까? Puter는 현재 모든 모델 변형에서 전체 2M 상한을 노출하지 않습니다. 극도로 긴 컨텍스트의 경우 공식 Google AI Studio API가 올바른 경로입니다. 대부분의 사용 사례는 200K 토큰 미만에서 잘 작동하며, 이 경우 Puter로 충분합니다.

Puter를 통해 Gemini를 Discord 봇이나 백엔드 서비스에서 사용할 수 있나요? 깔끔하지 않습니다. Puter는 브라우저 우선이며 사용자 세션을 가정합니다. 백엔드 서비스는 공식 Gemini API를 직접 사용해야 합니다.

어떤 모델을 기본으로 사용해야 하나요? google/gemini-2.5-flash. 대부분의 프롬프트에서 비용, 속도, 품질의 균형이 가장 좋습니다. 어려운 추론 작업에는 google/gemini-2.5-pro로, 대용량 분류에는 google/gemini-2.5-flash-lite로 전환하세요.

이미지 생성(Imagen)이 지원되나요? Puter는 현재 OpenAI의 gpt-image-2 및 DALL-E 변형을 통해 이미지 생성을 노출하며, Imagen은 아닙니다. 이미지 생성 경로는 무료 무제한 GPT-5.5 API 얻기를 참조하세요.

마무리

Puter.js를 통한 무료 무제한 Gemini는 Google Cloud 설정 없이 Google 품질의 멀티모달 출력을 원하는 모든 브라우저 기반 앱에 가장 깔끔한 경로입니다. 스크립트를 삽입하고 gemini-2.5-flash를 선택한 다음 프롬프트를 작성하세요. 최종 사용자가 사용량을 부담하고, 개발자는 키 없이 배포합니다.

서버 측 Gemini, 미세 조정, 코드 실행 도구 또는 전체 2M 토큰 컨텍스트의 경우 공식 Google AI Studio API가 여전히 올바른 답입니다. 프로토타입, 해커톤 빌드, 무료 공개 앱 및 정적 사이트의 경우 Puter가 답입니다.

Apidog에서 요청을 한 번 빌드하고, Puter와 공식 API를 벤치마킹하여 사용 사례에 맞는 경로를 선택하세요.

button

Apidog에서 API 설계-첫 번째 연습

API를 더 쉽게 구축하고 사용하는 방법을 발견하세요