5월 13일, GPT-4o라는 새로운 ChatGPT 모델이 발표되었습니다. 이전 모델들과 비교할 때, GPT-4o는 이전 모델들에 비해 두 배 더 빠른 응답 시간을 가지며 텍스트, 이미지, 오디오, 비디오를 이해할 수 있습니다. 이 기사에서는 OpenAI의 최신 GPT-4o 모델에 대한 기본 정보를 종합적으로 설명하고, GPT-4o API를 어떻게 자신의 서비스에 통합하는지 소개하겠습니다.
Apidog은 또한 완전히 무료 도구이므로 아래 버튼을 클릭하여 시작해 보세요! 👇👇👇
GPT-4o란 무엇인가요?
GPT-4o는 5월 13일 OpenAI에서 발표한 최신 AI 모델입니다. "4o"의 "o"는 "omni"를 의미하며 "모든 것을 아우르는"이라는 뜻을 가지고 있습니다. 이전 텍스트 및 이미지 기반의 ChatGPT 상호작용과는 달리, GPT-4o는 텍스트, 오디오, 이미지 및 비디오의 조합을 사용하여 상호작용할 수 있습니다.

자세한 내용은 공식 웹사이트를 방문하세요: https://openai.com/index/hello-gpt-4o/
GPT-4o의 주요 기능
그렇다면 OpenAI의 최신 모델인 GPT-4o는 이전 모델들과 비교해 어떤 기능이 있을까요?
2배 더 빠른 응답 시간
OpenAI에 따르면, GPT-4가 인간과 대화를 하기 위해 필요한 절차는 세 단계입니다:
- 음성을 텍스트로 변환하기
- 응답 텍스트 생성하기
- 텍스트를 음성으로 변환하기
이전 모델에서는 이 과정의 평균 지연 시간이 GPT-3.5는 2.8초, GPT-4는 5.4초였습니다. 그러나 현재의 GPT-4o는 232밀리초로 응답할 수 있으며, 평균 응답 시간은 320밀리초로, 이는 거의 인간과 동일한 반응 속도입니다. 즉, 최신 GPT-4o 모델을 사용하면 AI와 거의 실시간으로 상호작용할 수 있습니다.
오디오 톤 이해하기
이전의 GPT 모델들은 화자의 음성 톤이나 배경 소음을 인식할 수 없어 대화에서 일부 정보가 손실되는 경우가 있었습니다. 그러나 GPT-4o의 도입으로 이제 화자의 오디오 토큰 또는 감정을 이해할 수 있게 되어 훨씬 더 인간처럼 느껴집니다.

많은 언어에 대한 토큰 감소
또한, GPT-4o는 일본어와 같은 20개의 언어에서 사용되는 토큰 수를 압축했습니다. 일본어를 예로 들면, 일본어로 ChatGPT를 사용할 때 더 적은 토큰이 사용됩니다.
- "안녕하세요, 제 이름은 GPT-4o입니다. 저는 새로운 유형의 언어 모델입니다. 만나서 반갑습니다."라는 상호작용의 경우, 사용된 토큰 수가 37에서 26으로 줄어들어 1.4배 감소했습니다.


GPT-4o 발표에서의 다른 중요한 정보
GPT-4o 모델의 기능 외에도, GPT-4o 발표에서 다음과 같은 정보가 강조되었습니다:
거의 모든 서비스가 무료
이전의 유료 서비스인 GPTs, GPT 스토어, GPT-4는 GPT-4o 발표 이후 무료로 제공될 예정입니다.
데스크탑 앱 제공
지금까지 ChatGPT는 온라인에서만 제공되었지만, GPT-4o 모델 발표에서 새로운 macOS ChatGPT 데스크탑 앱이 발표되었습니다. 윈도우 앱도 올해 하반기에 출시될 것으로 기대됩니다.
GPT-4o의 세부 사항 이해하기
OpenAI의 새로운 AI 모델인 GPT-4o에 대한 자세한 정보를 알고 싶다면, 여기에서 그들의 기자 회견 동영상을 확인할 수 있습니다.
GPT-4o API에 접근하는 방법?
웹 애플리케이션을 개발할 때, 자신의 서비스에 AI 기능을 통합하기 위해 API를 사용하는 것이 매우 편리합니다. GPT-4o 모델 발표를 통해, GPT-4o의 탁월한 기능을 자신의 서비스에 도입하기 위해 GPT-4o API를 사용해야 합니다. 그렇다면 GPT-4o API는 사용할 수 있을까요? 비용은 얼마인가요? 이러한 질문들을 자세히 살펴보겠습니다.
GPT-4o API는 사용할 수 있나요?
OpenAI의 최신 정보에 따르면, GPT-4o 모델 API는 이미 텍스트 및 비전 모델로서 Chat Completions API, Assistants API 및 Batch API에서 사용할 수 있습니다.

GPT-4o API의 업데이트
이전 ChatGPT 모델 API와 비교할 때, GPT-4o API는 다음 영역에서 더 우수한 것으로 평가됩니다:
- 더 높은 지능: 텍스트, 추론, 코딩 능력에서 GPT-4 Turbo 수준의 성능을 제공하며, 다국어, 오디오, 비전 기능에서 새로운 높은 기준을 설정합니다.
- 2배 더 빠른 응답 속도: 토큰 생성 속도가 GPT-4 Turbo에 비해 두 배 빨라졌습니다.
- 50% 저렴한 가격: 입력 및 출력 토큰 모두 GPT-4 Turbo보다 50% 저렴합니다.
- 5배 더 높은 사용 한도: 사용 한도가 GPT-4 Turbo의 5배로 분당 최대 1000만 토큰입니다.
- 개선된 비전 기능: 대부분의 작업에서 비전 기능이 개선되었습니다.
- 비영어 언어 능력 개선: 비영어 언어 처리 개선 및 비영어 텍스트를 더 효율적으로 토큰화하는 새로운 토크나이저를 사용합니다.
GPT-4o API 가격
그렇다면 최신 GPT-4o API 모델의 사용 비용은 얼마일까요? OpenAI API 공식 웹사이트에 따르면, GPT-4o는 GPT-4 Turbo보다 더 빠르고 비용 효율적이며 더 강력한 비전 기능을 제공하고 있습니다. 이 모델은 128K 컨텍스트를 가지고 있으며 2023년 10월까지의 지식을 포함합니다. 또한, GPT-4 Turbo보다 50% 저렴합니다. 구체적인 가격 계획은 다음과 같습니다:
OpenAI API 가격 페이지에 따르면 GPT-4o의 비용/가격은 다음과 같습니다:
- 텍스트 입력: $5/ 1M 토큰
- 텍스트 출력: $15/ 1M 토큰
또한, 비전 처리(이미지 생성)의 비용은 이미지의 너비와 높이를 기준으로 계산됩니다. 예를 들어, 150px 높이와 150px 너비의 이미지를 처리하는 비용은 $0.001275입니다. 사용자는 이미지의 해상도를 자유롭게 조정할 수 있으며, 가격은 픽셀 수를 기준으로 합니다.

따라서 입력, 출력 또는 이미지 생성에 있어서 GPT-4o API 사용 비용은 GPT-4 Turbo의 절반입니다.
GPT-4o API 사용 시 중요 사항
GPT-4o API를 사용하거나 다른 모델에서 GPT-4o API로 전환 시, 다음 사항에 주의해야 합니다:
- GPT-4o API는 오디오 없이도 비디오를 인식할 수 있는 인식 능력을 가지고 있습니다. 구체적으로, 비디오를 프레임(초당 2-4프레임, 균일하게 샘플링되거나 키 프레임 선택 알고리즘을 사용하여)으로 변환한 후 해당 프레임들을 모델에 입력해야 합니다.
- 2024년 5월 14일 기준으로, GPT-4o API는 아직 오디오 모드를 지원하지 않습니다. 그러나 OpenAI는 다음 몇 주 내에 신뢰할 수 있는 테스트 사용자에게 오디오 모드를 제공할 것으로 기대하고 있습니다.
- 2024년 5월 14일 기준으로, GPT-4o API는 한동안 이미지 생성을 지원하지 않으므로 이미지 생성이 필요한 경우 DALL-E 3 API를 사용하는 것이 좋습니다.
- OpenAI는 현재 GPT-4 또는 GPT-4 Turbo를 사용하고 있는 모든 사용자에게 GPT-4o로의 전환을 고려할 것을 권장합니다. GPT-4o는 모든 경우에서 GPT-4 또는 GPT-4 Turbo보다 반드시 더 뛰어난 것은 아니므로 OpenAI는 출력 결과를 비교하고 GPT-4o의 기능을 평가해 본 후 전환을 고려할 것을 제안합니다.
Apidog로 GPT-4o API를 쉽게 테스트하고 관리하기
GPT-4o API를 사용할 때 API 테스트 및 관리 작업이 필수적입니다.
가장 편리한 API 관리 도구인 Apidog을 사용하면 어떤 API든 더 편리하고 효율적으로 처리할 수 있습니다. GPT-4o API는 이미 사용할 수 있으므로 Apidog에서 API 허브에 접속하여 OpenAI API 프로젝트에 쉽게 접근할 수 있습니다. 그런 다음 GPT-4o API 프로젝트를 자신의 프로젝트로 복제하고 GPT-4o API를 사용하고 테스트하며 Apidog으로 편리하게 관리할 수 있습니다.

또한 Apidog은 서버 전송 이벤트(SSE)를 지원하여 GPT-4o API를 쉽게 스트리밍할 수 있습니다! 자세한 내용은 이 기사를 확인해 보세요:

GPT-4o API 사용 전제 조건: OpenAI API 키
GPT-4o API를 사용하기 시작하려면 먼저 OpenAI API 토큰을 얻어야 합니다. 아래教程을 따라 OpenAI API 키를 얻어보세요.
1. OpenAI 계정 등록하기
GPT-4o API를 사용하기 시작하려면 먼저 OpenAI 계정을 생성해야 합니다. OpenAI 공식 웹사이트에 접속하여 오른쪽 상단의 "시작하기" 버튼을 클릭해 계정을 생성하세요.

2. OpenAI API 키 얻기
OpenAI 계정을 생성한 후, GPT-4o API를 사용하는 데 필요한 인증을 위한 API 키를 획득해야 합니다. 다음 단계를 따라 ChatGPT API 키를 받으세요:
1단계: OpenAI의 API 키 페이지에 접속하여 계정으로 로그인합니다 (새로운 계정이 필요하시면 새 계정을 생성하세요).
2단계: "새 비밀 키 만들기" 버튼을 클릭하여 새로운 API 키를 생성합니다.

API 키를 생성한 후, 즉시 화면에 표시됩니다. 그러나 API 키를 다시 조회할 수 없으므로 기록해 두고 안전하게 보관하는 것을 추천합니다.
Apidog로 GPT-4o API 테스트 및 관리하기
Apidog은 GPT-4o API 사용을 위한 매우 편리한 도구입니다. Apidog는 OpenAI에서 제공하는 모든 API를 포함하는 OpenAI API 프로젝트를 보유하고 있습니다. OpenAI에서 제공하는 API 리스트를 확인하려면 아래 페이지에 접속하세요:

현재 GPT-4o API는 Chat Completions API, Assistants API 및 Batch API에서만 사용할 수 있으므로 OpenAI API 프로젝트의 왼쪽 메뉴에서 각각을 선택하여 GPT-4o API를 사용해보세요.

단계별: Apidog로 GPT-4o API 사용하기
Apidog에서 OpenAI API 프로젝트에 액세스할 때, 다음 단계를 따라 OpenAI API를 쉽게 테스트할 수 있습니다. Chat Completions API를 사용하여 GPT-4o를 사용하는 방법을 알아보겠습니다.
1단계: Apidog에서 OpenAI API 프로젝트에 접속하여 왼쪽 메뉴에서 Chat Completions API 엔드포인트를 선택하고, 새로운 요청 화면에서 ChatGPT 사양에 따라 HTTP 메서드 및 엔드포인트 URL을 입력합니다. 그런 다음 "본문" 탭에서 ChatGPT에 보내고 싶은 메시지를 JSON 형식으로 작성합니다.
참고: GPT-4o를 사용하려면, "model":"gpt-4o"
를 포함하여 모델을 "gpt-4o"로 지정해야 합니다.

2단계: "헤더" 탭으로 전환하여 ChatGPT API 인증을 위해 Authorization 매개변수를 추가하고, 획득한 ChatGPT API 키를 입력한 후 "전송" 버튼을 클릭합니다.

참고: Apidog에서는 OpenAI API 키를 환경 변수로 저장할 수 있습니다. OpenAI API 키를 환경 변수로 저장하면 나중에 API 키를 다시 입력하지 않고도 환경 변수를 직접 참조할 수 있으므로 매우 편리합니다.

요약
이 기사에서는 OpenAI의 최신 모델인 GPT-4o에 대한 자세한 설명을 제공했습니다. GPT-4o는 이전 모델에 비해 두 배의 응답 시간을 가지며 텍스트, 이미지, 오디오 및 비디오를 이해할 수 있습니다. 또한 일본어에 사용되는 토큰 수가 감소하여 비용 성능이 향상되었습니다.
GPT-4o API는 Chat Completions API, Assistants API 및 Batch API에서 사용 가능하며, 이전 ChatGPT 모델 API에 비해 더 높은 지능, 2배 더 빠른 응답 속도, 50% 더 저렴한 가격, 5배 더 높은 사용 한도, 개선된 비전 기능 및 개선된 비영어 언어 능력을 제공합니다.
GPT-4o API를 사용하려면 먼저 OpenAI 계정을 생성하고 API 키를 획득해야 합니다. 그런 다음 Apidog에서 GPT-4o API를 쉽게 테스트하고 관리할 수 있습니다. Apidog에는 GPT-4o API 사양을 포함한 OpenAI API 프로젝트가 있으며, API 키를 환경 변수로 저장하여 반복적으로 입력하는 불편함을 피할 수 있습니다.
앞으로는 GPT-4o API에 오디오 지원이 추가될 예정입니다. GPT-4o의 우수한 기능을 활용하여 서비스를 통합하면 더욱 개선된 AI 경험을 제공할 수 있습니다.