복잡한 논리적 추론·자기교정 갖춰
총 8개 한국어 성능 지표 1위 기록
오픈소스 공개…생태계 활성화
![]() |
네이버가 자사 첫 추론형 모델 ‘하이퍼클로바X 씽크’를 30일 공개했다. / 사진: 네이버 제공 |
[대한경제=민경환 기자] 글로벌 소버린 AI(자국 인공지능) 경쟁이 본격화하는 가운데 네이버가 첫 추론형 모델 ‘하이퍼클로바X 씽크(HyperCLOVA X THINK)’를 공개했다.
네이버는 30일 하이퍼클로바X 씽크(이하 씽크) 모델 설계와 성능 등 세부 정보를 소개하는 테크니컬 리포트를 발표했다.
씽크는 추론 능력을 기반으로 한국어에 대한 이해를 한층 높은 수준으로 끌어올렸다. 추론 모델은 기존 생성형 AI를 넘어 복잡한 논리적 추론, 자기 교정, 계획 능력을 갖춘 것이 특징이다. 자율적 판단 능력 등 인간의 사고방식에 한층 더 가까워진 기술로 범용인공지능(AGI)으로 나아가는 중요한 단계로 평가받는다.
씽크는 약 6조개의 고품질 한국어·영어 데이터를 기반으로, 한국어 도메인에 특화된 합성 데이터를 대거 학습했다. 한국어 성능 벤치마크인 ‘KoBALT-700’을 비롯해 총 8개 한국어 성능 지표에서 1위를 기록했다.
네이버가 공개한 보고서에 따르면 ‘KoBALT-700’과 ‘HAERAE-Bench’ 등 주요 한국어 성능 평가 지표에서 LG 엑사원 딥(Deep)과 알리바바 큐원(Qwen) 등을 뛰어넘는 성과를 보였다. 일반 능력, 문화 및 언어, 지시 이해 등 벤치마크에서 LG AI연구원의 엑사원 Deep 32B, 알리바바 Qwen3 32B보다 높은 평가를 받았다.
특히 씽크는 언어뿐만 아니라 시각 정보를 바탕으로 추론할 수 있는 기술도 확보했다. STEM(과학·기술·공학·수학) 문제를 이미지 형식으로 입력했을 때 GPT-4.1 등 글로벌 인공지능 모델을 넘어서는 정확도를 보였다.
한국 대학수학능력시험 문제를 이미지로 입력한 STEM 테스트에서 46.4%의 정확도를 달성해 GPT-4.1의 40.3%를 넘어섰다. 기존 비추론 하이퍼클로바X 모델(21.7%) 대비 성능을 2배 이상 향상시켰다.
네이버는 추론모델을 오픈소스로 공개해 한국 AI 기술 생태계 활성에 기여한다는 구상이다. 지난 4월 공개한 오픈소스 경량모델 ‘하이퍼클로바X 시드(SEED)’는 한 달여 만에 50만 다운로드를 돌파했다.
하이퍼클로바X를 기반으로 ‘클로바 스튜디오’를 운영하며 기업 맞춤형 AI 모델 및 서비스 개발 도구를 제공하고 있다. 현재 1000개 이상의 기업과 기관이 활용하고 있다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 “하이퍼클로바X를 ‘지능의 향상’과 ‘감각의 확장’ 두 가지 축으로 고도화하고 있다”며 “사용자에게 실질적 가치를 제공할 수 있는 방법을 함께 찾아나갈 것”이라고 말했다.
민경환 기자 erutan@
〈ⓒ 대한경제신문(www.dnews.co.kr), 무단전재 및 수집, 재배포금지〉