인공지능(AI) 선도 기업 오픈AI가 인간처럼 보고, 듣고, 말할 수 있는 새로운 AI 모델 ‘지피티-4오(GPT-4o)’를 발표했습니다. 이 모델은 실시간 상호작용이 가능한 멀티모달(Multimodal) 인공지능으로, 특히 응답 속도가 비약적으로 향상된 점이 주목받고 있습니다.
실시간 상호작용과 감정 인식
미국 현지시각으로 13일, 오픈AI는 온라인 발표 영상을 통해 지피티-4오의 강력한 기능을 시연했습니다. 지피티-4오는 음성 인식을 통해 빠르게 질문을 이해하고, 자연스러운 대화가 가능합니다. 단순히 대답하는 것을 넘어 사용자의 감정을 인식하고 이에 맞게 반응하는 능력도 갖추고 있습니다.
‘오(o)’라는 이름은 ‘모든 것을 아우른다’는 의미의 ‘옴니(omni)’에서 따왔습니다. 발표에서 오픈AI 팀은 “로봇과 관련된 동화를 들려줘”라는 요청에 즉석에서 동화를 창작했고, “좀 더 드라마틱하게 들려줘”라는 추가 요청에도 어조를 바꾸어 이야기를 전달했습니다.
또한, 종이에 수학 방정식을 적어 카메라로 보여주며 “정답을 알려주지 말고 풀이 과정을 도와줘”라고 하자, 지피티-4오는 마치 선생님처럼 문제 풀이를 유도했습니다. 심지어 “내가 어떤 기분인 것 같아?”라는 질문에도 감정과 얼굴 표정을 인식해 반응하는 모습이 인상적이었습니다.
빨라진 응답 속도
미라 무라티 오픈AI 최고기술책임자(CTO)는 “지피티-4오는 지피티-4 수준의 지능을 더 빠르게 제공한다”고 강조했습니다. 실제로 지피티-4오의 평균 응답 시간은 232밀리초(ms)로, 평균 320밀리초에 반응하는 인간의 대화 속도와 비슷합니다. 이는 기존 지피티-4의 응답 시간인 5.4초에 비해 대폭 개선된 수치입니다.
오픈AI는 지피티-4오를 무료로 공개하면서 유료 사용자에게는 5배 더 많은 사용량을 제공할 예정입니다. 텍스트와 이미지 처리 기능은 이미 챗지피티 플랫폼에 적용되었으며, 음성 모드는 몇 주 내로 챗지피티 플러스 사용자에게 알파 모드로 제공될 계획입니다.
AI 비서 시장 경쟁 심화
오픈AI의 발표로 AI 비서 시장의 경쟁은 한층 더 치열해질 전망입니다. 구글은 14일 예정된 ‘개발자 컨퍼런스(I/O) 2024’에서 자사의 AI 모델 ‘제미나이(Gemini)’를 공개할 예정입니다. 오픈AI는 이 행사 하루 전에 지피티-4오를 발표하며 시장 선점을 위한 공격적인 행보를 보였습니다.
AI 기술이 점점 발전하면서 인간과 더욱 유사한 대화형 AI 모델이 등장하고 있으며, 사용자 경험은 한층 더 향상될 것으로 기대됩니다.