섹션

오픈AI, GPT-4o 공개…'인간처럼 보고 듣고'

챗GPT 개발사 오픈AI가 텍스트는 물론, 음성 대화도 가능하고 텍스트와 이미지로도 추론하고 이를 말하는 새로운 대규모언어모델(LLM)인 ‘GPT-4o’를 공개했다.

14일(현지 시각) 로이터 통신에 따르면 오픈AI 연구원들은 라이브스트림 이벤트에서 새로운 오디오 기능을 통해 사용자는 챗GPT에 말을 걸고 지연 없이 실시간 응답을 받을 수 있으며, AI 음성 비서가 어려워했던 현실적인 대화의 두 가지 특징인 대화 도중 챗GPT를 중단할 수 있는 있다며 이를 시연했다.

오픈AI의 샘 알트만 CEO는 "영화에 나오는 AI처럼 느껴진다... 컴퓨터와 대화하는 것이 자연스럽다고 느껴진 적이 없었는데, 이제는 자연스럽다"라고 블로그 게시물에 썼다.

마이크로소프트의 지원을 받는 오픈AI는 인간처럼 작성된 콘텐츠와 최고 수준의 소프트웨어 코드를 생성하는 능력으로 전 세계를 놀라게 한 인기 챗봇 제품인 챗GPT의 사용자 기반을 확장해야 하는 경쟁과 압박에 직면해 있다.

라이브스트림 이벤트에서 오픈AI 연구원들은 챗GPT의 새로운 음성 비서 기능을 선보였다.

한 데모에서 챗GPT는 비전과 음성 기능을 사용하여 연구원과 대화하며 종이에 적힌 수학 방정식을 풀었다.

또 다른 데모에서는 연구원들이 GPT-4o 모델의 실시간 언어 번역 기능을 보여주었다.

오픈AI
[AP/연합뉴스 제공]

오픈AI의 데모는 공상 과학 소설에 가까운데, ChatGPT와 대화 상대가 한 때 농담을 주고받는 장면도 있었다.

알트만 CEO는 시연이 끝난 후 스칼렛 요한슨이 목소리를 연기한 AI 비서와 사랑에 빠진 남자의 이야기를 다룬 2013년 스파이크 존즈 감독의 영화 '그녀'를 언급하는 듯한 글을 X에 올렸다.

오픈AI의 최고 기술 책임자인 미라 무라티는 이 행사에서 새 모델이 회사의 이전 모델보다 비용 효율적이기 때문에 무료로 제공될 것이라고 말했다.

그녀는 GPT-4o의 유료 사용자는 회사의 무료 사용자보다 더 큰 용량 제한을 받게 될 것이라고 말했다.

GPT-4o 모델은 향후 몇 주에 걸쳐 챗GPT에서 사용할 수 있을 것이라고 회사는 밝혔다.

또한, 무료 챗GPT 사용자는 이제 웹에서 최신 정보를 표시할 수 있는 '찾아보기' 기능에 액세스할 수 있다고 무라티는 행사 후 로이터와의 인터뷰에서 말했다.

무라티 최고 기술 책임자는 무료 사용자들에게 광고를 판매하여 수익을 창출할 계획은 없다고 말했다.