• Home
  • News
  • 오픈AI, 더 똑똑해진 새로운 플래그십 GPT-4o 공개

오픈AI, 더 똑똑해진 새로운 플래그십 GPT-4o 공개

gpt-4o
gpt-4o

지난 5월 13일, 오픈AI가 오디오, 비주얼, 텍스트를 실시간으로 추론하는 새로운 플래그십 모델 GPT-4o를 발표했다. 특히, 대폭 강화된 음성과 비주얼 인식 기능으로 기술적 진보 뿐만 아니라 사람과 교감하는 감성적 진보까지 이뤘다는 평가가 이어지고 있다.

더 빠르고 똑똑해진 GPT-4o

GPT-4o는 텍스트, 오디오, 비전 데이터를 실시간으로 처리할 수 있는 고성능 모델이다. 평균 320밀리초로 응답 시간이 크게 단축되었고, 다중 언어와 다양한 입력 형태를 이해하고 처리할 수 있는 것이 특징이다. 특히 속도와 비용 면에서 효율성이 향상되었고, 무엇보다 사람과 더욱 자연스럽게 상호작용이 가능한 것이 인상적이다.

한국어도 자연스러워졌다

GPT-4o는 한국어 토큰 처리 성능이 크게 향상되었다. 기존 45에서 27로 기존대비 1.7배 적은 토큰을 사용하기 때문에 긴 문장과 복잡한 구문을 이해하고 자연스럽게 답변할 수 있게 되었다.

텍스트를 넘어 오디오, 비주얼까지 상호작용 가능

GPT-4o는 텍스트, 오디오, 비주얼 데이터를 통한 다채로운 상호작용 방식을 지원한다. 사용자는 자연어로 질문하고, 실시간으로 답변을 받을 수 있으며, 음성 명령을 통해서도 원활하게 소통할 수 있다.

음성 인식 기능을 활용하는 다양한 방법

  • 면접 준비: 면접 질문을 듣고 AI가 모범 답변을 제공, 실시간 피드백을 통해 효과적인 연습이 가능하다. 카메라로 면접자의 의상 상태를 평가해 더 나은 대안을 제시해주기도 한다.
  • 수학: 수학 문제를 음성으로 입력하면, AI가 풀이 과정을 상세히 설명하며 이해할 수 있도록 도움을 준다.
  • 실시간 통역 및 외국어 학습: 외국어 문장을 입력하면 실시간으로 번역해주고 음성으로 상호 대화가 가능하기 때문에 준실시간 통역 수준의 결과를 제공한다. 뿐만 아니라, 다양한 언어를 학습할 수 있는 팁을 제공한다.
  • 두 GPT의 대화: 두 AI 가 대화를 주고받을 수도 있다. 복잡한 주제에 대한 깊이 있는 논의가 가능해 다양한 분야에 대한 영감을 받을 수 있다.

챗GPT-4o는 플러스 플랜부터 이용 가능하다. 자세한 내용은 오픈AI 홈페이지에서 확인 가능하다.




오픈AI, 더 똑똑해진 새로운 플래그십 GPT-4o 공개 – AI 매터스 l AI Matters