DeepSeek-V3.1 API 사용법

개발자들은 AI 애플리케이션을 구동하기 위해 강력한 API를 자주 찾습니다. DeepSeek-V3.1 API는 다재다능한 옵션으로 돋보입니다. 이 API는 고급 언어 모델링 기능을 제공합니다. 채팅 완성 및 도구 통합과 같은 기능에 접근할 수 있습니다. 이 게시물은 DeepSeek-V3.1 API를 단계별로 사용하는 방법을 설명합니다.

먼저, DeepSeek 플랫폼에서 API 키를 얻으세요. 해당 사이트에 가입하고 키를 생성하세요. 이를 통해 요청을 시작할 수 있습니다.

💡

또한, DeepSeek-V3.1 API 호출을 번거로움 없이 테스트하고 관리하려면 Apidog를 무료로 다운로드하세요. Apidog는 API 디버깅을 간소화하고 응답을 빠르게 확인하는 데 도움을 주어 DeepSeek-V3.1과의 안정적인 통합 구축에 직접적으로 기여합니다.

버튼

다음으로, 핵심 구성 요소를 이해해야 합니다. DeepSeek-V3.1은 대규모 모델을 기반으로 구축되었습니다. 최대 128K 토큰의 컨텍스트를 지원합니다. 복잡한 쿼리를 효율적으로 처리할 수 있습니다. 또한, 더 깊은 추론을 위한 사고 모드를 포함합니다. 진행하면서 이러한 요소들이 어떻게 결합되는지 주목하세요.

DeepSeek-V3.1이란 무엇이며 왜 선택해야 하는가?

DeepSeek-V3.1은 AI 모델의 진화를 보여줍니다. DeepSeek-ai의 엔지니어들은 이를 하이브리드 아키텍처로 개발했습니다. 이 모델은 총 6,710억 개의 매개변수를 가지고 있지만, 추론 시에는 370억 개만 활성화됩니다. 이 설계는 높은 성능을 유지하면서 계산 요구 사항을 줄여줍니다.

두 가지 주요 변형인 DeepSeek-V3.1-Base와 전체 DeepSeek-V3.1을 찾을 수 있습니다. 기본 버전은 추가 학습을 위한 기반 역할을 합니다. 이는 두 단계의 긴 컨텍스트 확장을 거쳤습니다. 첫 번째 단계에서는 32K 컨텍스트를 위해 6,300억 개의 토큰으로 학습이 확장되었습니다. 그런 다음, 두 번째 단계에서는 128K 컨텍스트를 위해 2,090억 개의 토큰이 추가되었습니다. 추가적인 긴 문서들이 데이터셋을 풍부하게 만들었습니다.

성능 벤치마크는 그 강점을 잘 보여줍니다. 일반 작업의 경우, 비사고 모드에서 MMLU-Redux에서 91.8점, 사고 모드에서 93.7점을 기록했습니다. GPQA-Diamond에서는 각각 74.9점과 80.1점에 도달했습니다. 코드 관련 평가에서 LiveCodeBench는 비사고 모드에서 56.4점, 사고 모드에서 74.8점을 기록했습니다. AIME 2024와 같은 수학 벤치마크에서는 66.3점과 93.1점을 보여줍니다. 이 수치들은 여러 도메인에 걸쳐 신뢰성을 입증합니다.

DeepSeek-V3.1 API를 선택해야 하는 이유는 무엇일까요? 이 API는 에이전트 작업 및 도구 호출에서 탁월합니다. 검색 에이전트 또는 코드 에이전트에 통합할 수 있습니다. 다른 API와 비교하여 비용 효율적인 가격과 호환성 기능을 제공합니다. 결과적으로 팀들은 확장 가능한 AI 솔루션을 위해 이 API를 채택합니다. 설정을 시작하려면 환경을 신중하게 준비하세요.

DeepSeek-V3.1 API 통합 시작하기

개발 환경을 설정하는 것으로 시작합니다. 필요한 라이브러리를 설치하세요. Python의 경우, pip를 사용하여 requests 또는 호환되는 SDK를 추가하세요. DeepSeek-V3.1 API 엔드포인트는 표준 HTTP 프로토콜을 따릅니다. 기본 URL은 https://api.deepseek.com입니다.

대시보드에서 API 키를 생성하세요. 환경 변수에 안전하게 저장하세요. 예를 들어, 셸에서 DEEPSEEK_API_KEY를 설정하세요. 이제 첫 번째 요청을 만드세요. 채팅 완성 엔드포인트를 사용하세요. /chat/completions에 POST 요청을 보내세요.

Authorization: Bearer your_key 헤더를 포함하세요. 본문에는 "deepseek-chat" 모델, 메시지 배열, max_tokens와 같은 매개변수가 포함됩니다. 간단한 요청은 다음과 같습니다:

import requests

url = "https://api.deepseek.com/chat/completions"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}
data = {
    "model": "deepseek-chat",
    "messages": [{"role": "user", "content": "Hello, DeepSeek-V3.1!"}],
    "max_tokens": 100
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

이 코드는 응답을 가져옵니다. 출력은 content 필드를 확인하세요. 오류가 발생하면 키와 페이로드를 확인하세요. 또한, Apidog로 테스트하세요. 엔드포인트를 가져와서 호출을 시뮬레이션하세요. Apidog는 응답을 시각화하여 디버깅을 돕습니다.

모델 옵션을 탐색하세요. DeepSeek-chat은 일반 채팅에 적합합니다. DeepSeek-reasoner는 추론 작업을 처리합니다. 필요에 따라 선택하세요. 진행하면서 실시간 출력을 위해 스트리밍을 통합하세요. 요청에서 stream을 true로 설정하세요. 그에 따라 청크를 처리하세요.

보안도 중요합니다. 항상 HTTPS를 사용하세요. 키 노출을 제한하세요. 주기적으로 키를 교체하세요. 기본 사항을 다루었으니, 함수 호출과 같은 고급 기능으로 넘어가세요.

DeepSeek-V3.1 API에서 함수 호출 마스터하기

함수 호출은 DeepSeek-V3.1 API를 향상시킵니다. 모델이 호출하는 도구를 정의할 수 있습니다. 이를 통해 날씨 데이터 가져오기와 같은 동적 상호 작용이 가능합니다.

요청에서 도구를 정의하세요. 각 도구는 "function" 유형, 이름, 설명 및 매개변수를 가집니다. 매개변수는 JSON 스키마를 사용합니다. 예를 들어, get_weather 도구:

{
  "type": "function",
  "function": {
    "name": "get_weather",
    "description": "Get current weather",
    "parameters": {
      "type": "object",
      "properties": {
        "location": {"type": "string", "description": "City name"}
      },
      "required": ["location"]
    }
  }
}

이를 채팅 완성 요청의 tools 배열에 포함하세요. 모델은 사용자 메시지를 분석합니다. 관련성이 있다면, 응답에 tool_calls를 반환합니다. 각 호출에는 id, name, arguments가 있습니다.

호출을 처리하세요. 함수를 로컬에서 실행하세요. get_weather의 경우, 외부 API를 쿼리하거나 데이터를 모의하세요. 결과를 도구 메시지로 추가하세요:

{
  "role": "tool",
  "tool_call_id": "call_id_here",
  "content": "Temperature: 24°C"
}

업데이트된 메시지를 다시 보내세요. 모델이 최종 응답을 생성합니다.

더 나은 유효성 검사를 위해 엄격 모드를 사용하세요. strict를 true로 설정하고 베타 기본 URL을 사용하세요. 이는 스키마 준수를 강제합니다. 지원되는 유형에는 string, number, array가 포함됩니다. minLength와 같은 지원되지 않는 필드는 피하세요.

모범 사례에는 명확한 설명이 포함됩니다. Apidog로 도구를 테스트하여 응답을 모의하세요. 인수의 오류를 모니터링하세요. 결과적으로 애플리케이션은 더욱 상호 작용적이 됩니다. 다음으로, 다른 생태계와의 호환성을 살펴보세요.

DeepSeek-V3.1에서 Anthropic API 호환성 활용하기

DeepSeek-V3.1 API는 Anthropic 형식을 지원합니다. 이를 통해 Anthropic SDK를 원활하게 사용할 수 있습니다. 기본 URL을 https://api.deepseek.com/anthropic으로 설정하세요.

Anthropic SDK 설치: pip install anthropic. 환경 설정:

export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic
export ANTHROPIC_API_KEY=YOUR_DEEPSEEK_KEY

메시지 생성:

import anthropic

client = anthropic.Anthropic()
message = client.messages.create(
    model="deepseek-chat",
    max_tokens=1000,
    system="You are helpful.",
    messages=[{"role": "user", "content": [{"type": "text", "text": "Hi"}]}]
)
print(message.content)

이것은 Anthropic처럼 작동하지만 DeepSeek 모델을 사용합니다. 지원되는 필드: max_tokens, temperature (0-2.0), tools. 무시되는 필드: top_k, cache_control.

차이점이 존재합니다. 이미지 또는 문서 지원이 없습니다. 도구 선택 옵션이 제한적입니다. Anthropic에서 마이그레이션할 때 이를 사용하세요. Apidog로 테스트하여 응답을 비교하세요. 결과적으로 코드를 다시 작성하지 않고도 툴킷을 확장할 수 있습니다.

DeepSeek-V3.1 모델 아키텍처 및 토크나이저 이해하기

DeepSeek-V3.1-Base가 핵심을 이룹니다. 효율성을 위해 하이브리드 설계를 사용합니다. 컨텍스트 길이는 128K에 도달하여 긴 문서에 이상적입니다.

학습은 확장된 단계를 포함했습니다. 첫째, 32K 컨텍스트에서 6,300억 토큰으로 학습했습니다. 다음으로, 128K 컨텍스트에서 2,090억 토큰으로 학습했습니다. FP8 형식은 호환성을 보장합니다.

토크나이저 구성: add_bos_token true, model_max_length 131072. BOS 토큰 "<｜begin of sentence｜>", EOS "<｜end of sentence｜>". 채팅 템플릿은 User, Assistant, think 태그와 같은 역할을 처리합니다.

대화를 위해 템플릿을 적용하세요. 사고 모드의 경우, 추론을 태그로 감싸세요. 이는 복잡한 작업에서 성능을 향상시킵니다.

Hugging Face를 통해 모델을 로드합니다. from_pretrained("deepseek-ai/DeepSeek-V3.1")를 사용하세요. 입력을 신중하게 토큰화하세요. 토큰 수를 모니터링하여 제한을 넘지 않도록 하세요. 따라서 정확도를 최적화할 수 있습니다.

DeepSeek-V3.1 API 가격 및 비용 관리

가격은 채택에 영향을 미칩니다. DeepSeek-V3.1 API는 백만 토큰당 요금을 부과합니다. 모델: deepseek-chat 및 deepseek-reasoner.

2025년 9월 5일 16:00 UTC부터: 두 모델 모두 캐시 히트 입력 $0.07, 캐시 미스 입력 $0.56, 출력 $1.68입니다.

그 이전에는, 표준 시간(00:30-16:30 UTC): deepseek-chat은 히트 $0.07, 미스 $0.27, 출력 $1.10; reasoner는 히트 $0.14, 미스 $0.55, 출력 $2.19입니다. 할인 시간(16:30-00:30): 대략 절반 가격입니다.

무료 티어는 언급되지 않았습니다. 비용 계산: 요청당 토큰을 추정하세요. 반복되는 입력에는 캐싱을 사용하세요. 토큰을 줄이기 위해 프롬프트를 최적화하세요.

대시보드에서 사용량을 추적하세요. 예산을 설정하세요. Apidog를 사용하여 호출을 시뮬레이션하여 비용을 예측하세요. 따라서 비용을 효과적으로 관리할 수 있습니다.

DeepSeek-V3.1 API 모범 사례 및 문제 해결

성공을 위한 지침을 따르세요. 간결한 프롬프트를 작성하세요. 메시지에 컨텍스트를 제공하세요.

지연 시간을 모니터링하세요. 긴 컨텍스트는 응답을 느리게 합니다. 가능하다면 입력을 청크로 나누세요.

데이터 보안: 민감한 정보를 보내지 마세요.

문제 해결: 상태 코드를 확인하세요. 401은 잘못된 키를 의미합니다. 429는 너무 많은 요청을 의미합니다.

SDK를 정기적으로 업데이트하세요. 변경 사항은 문서를 읽으세요.

확장: 지원되는 경우 요청을 일괄 처리하세요. 병렬 처리를 위해 비동기를 사용하세요.

커뮤니티 포럼이 도움이 됩니다. 경험을 공유하세요.

이러한 사항을 적용하면 안정적인 통합을 달성할 수 있습니다.

결론: DeepSeek-V3.1 API로 AI 프로젝트 향상시키기

이제 DeepSeek-V3.1 API를 효과적으로 사용하는 방법을 알게 되었습니다. 설정부터 고급 기능까지, 이 API는 개발자에게 힘을 실어줍니다. 더 원활한 워크플로우를 위해 Apidog를 통합하세요. 오늘부터 구축을 시작하고 그 영향을 확인하세요.

버튼