GPT-4o

라이선스 사유웹사이트openai.com/index/hello-gpt-4o

GPT-4o(GPT-4 omni)는 OpenAI 가 설계한 다중 언어, 다중 모달 생성 사전 훈련 변환기이다. OpenAI의 CTO 인 Mira Murati가 2024년 5월 13일(현시 시각, 대한민국 기준 14일) 라이브 스트리밍 데모에서 발표했으며 같은 날 출시되었다.^[1]

GPT-4o는 모든 사용자에게 무료이다.^[2] API는 이전 버전인 GPT-4 Turbo보다 두 배 빠르고 가격은 절반에 불과하다.^[1]

GPT-4o(Omni)는 텍스트, 오디오, 이미지 및 비디오 입력을 원활하게 통합하는 동시에 텍스트, 오디오 및 이미지 출력을 생성하는 대규모 언어 모델이다. 기업은 복잡한 상호 작용을 처리하고, 효율성을 개선하고, 고객 지원과 내부 커뮤니케이션을 모두 간소화하는 능력을 통해 이익을 얻는다. 또한 GPT-4o는 강력한 데이터 보안을 보장하고 특정 비즈니스 요구에 맞는 광범위한 사용자 정의를 제공한다

기능

GPT-4o는 음성, 다국어 및 비전 벤치마크에서 가장 높은 점수를 달성하여 오디오 음성 인식 및 번역 분야에서 새로운 기록을 세웠다.^[3] GPT-4o는 MMLU(Massive Multitask Language Understanding) 벤치마크에서 88.7점을 얻었고, 이는 GPT-4의 86.5점과 비교해도 더 높은 수치이다.^[3]

이 모델은 50개 이상의 언어를 지원하며^[1] 전 세계 사람들의 97% 이상이 사용하는 언어를 포괄한다. Mira Murati는 2024년 5월 13일 라이브 스트리밍 OpenAI 데모 이벤트에서 이탈리아어로 말하고 영어와 이탈리아어 간에 번역하도록 하여 모델의 다국어 기능을 시연했다.

현재 GPT-4o는 버클리 캘리포니아 대학의 LMSYS(Large Model Systems Organization) Elo Arena 벤치마크에서 가장 뛰어난 모델이다.^[4]

배경

GPT-4o는 원래 LMSYS에서 3가지 다른 모델로 초기 출시되었다. 이 3가지 모델은 gpt2-chatbot, im-a-good-gpt2-chatbot 및 im- also-a-good-gpt2-chatbot이라고 불렸다. 2024년 5월 7일 Sam Altman은 OpenAI가 이 모델들에 대해 언급하여 OpenAI가 만들었음을 알게 됐다.^[5]

같이 보기

오픈AI
LLaMA

각주

↑ ^가 ^나 ^다 Wiggers, Kyle (2024년 5월 13일). “OpenAI debuts GPT-4o 'omni' model now powering ChatGPT”. 《TechCrunch》 (미국 영어). 2024년 5월 13일에 확인함.
↑ Mauran, Cecily (2024년 5월 13일). “OpenAI announces GPT-4o, a multimodal voice assistant that's free for all ChatGPT users”. 《Mashable》 (영어). 2024년 5월 13일에 확인함.
↑ ^가 ^나 “Hello GPT-4o”. 《OpenAI》.
↑ Fedus, William. “GPT-4o is our new state-of-the-art frontier model.”.
↑ Sam Altman "https://twitter.com/sama/status/1787222050589028528" Twitter, X. Retrieved 14 May 2024.

오픈AI

제품

언어 모델

오픈AI 코덱스
GPT
- GPT-2
- GPT-3
- GPT-4

인물

CEO

이사회

현재	로런스 서머스
이전	그렉 브로크만 (2017–2023) 리드 호프만 (2019–2023) 일론 머스크 (2015–2018) 일리야 수츠케버 (2017–2023)