마이크로소프트(Microsoft)가 생성형 AI 모델의 최신작인 ‘Phi-4’를 발표했습니다.
Phi 시리즈의 새로운 모델로 소개된 Phi-4는 이전 버전들보다 여러 면에서 성능이 향상되었다고 마이크로소프트는 주장합니다. 특히 수학 문제 해결 능력이 크게 개선된 것으로 알려졌습니다. 이는 주로 훈련 데이터 품질의 향상 덕분입니다.
Phi-4는 목요일 밤 기준으로 매우 제한된 접근만 허용되며, 마이크로소프트의 최근 출시된 Azure AI Foundry 개발 플랫폼에서 연구 목적으로만 사용할 수 있습니다. 사용을 위해서는 마이크로소프트 연구 라이선스 계약이 필요합니다.
이 모델은 140억 개의 매개변수를 갖춘 소형 언어 모델로, GPT-4o Mini, Gemini 2.0 Flash, Claude 3.5 Haiku 등과 경쟁합니다. 소형 언어 모델은 실행 속도가 더 빠르고 비용이 저렴한 경우가 많지만, 최근 몇 년 동안 성능도 점진적으로 향상되고 있습니다.
마이크로소프트는 Phi-4의 성능 향상이 ‘고품질 합성 데이터셋’과 ‘인간이 생성한 콘텐츠로 구성된 고품질 데이터셋’의 사용, 그리고 특정 사후 훈련 개선 덕분이라고 설명했습니다.
최근 AI 연구소들은 합성 데이터와 사후 훈련에 대한 혁신적 접근 방식을 더욱 주목하고 있습니다. Scale AI의 CEO 알렉산드르 왕(Alexandr Wang)은 목요일 트윗을 통해 “우리는 사전 훈련 데이터의 한계에 도달했다”고 언급하며 최근 몇 주간 여러 보고서에서 제기된 문제를 확인했습니다.
특히 Phi-4는 마이크로소프트의 AI 모델 개발에 중요한 역할을 했던 세바스티앙 부벡(Sébastien Bubeck)의 이직 이후 처음으로 출시된 Phi 시리즈 모델입니다. 마이크로소프트에서 AI 부사장을 역임하며 Phi 모델 개발을 주도했던 부벡은 지난 10월 오픈AI(OpenAI)로 자리를 옮겼습니다.