 |
SKT LLM 개발 타임라인 /사진:SKT |
 |
사진:카카오 |
[대한경제=심화영 기자] 국내 대표 ICT기업들이 ‘K-LLM(대형언어모델)’ 기술의 주도권을 잡기 위한 오픈소스 전쟁에 돌입했다. 올해 들어 SK텔레콤, 카카오, LG, KT, 네이버 등 주요 기업들이 자체 개발한 LLM을 허깅페이스 등 오픈 플랫폼에 순차적으로 공개하며, 기술 자립과 생태계 확대에 속도를 내고 있다. 이는 정부가 주도하는 ‘독자 AI 파운데이션 모델’ 사업과 맞물려, K-AI 주권을 확보하기 위한 민간 차원의 핵심 전략으로 주목받고 있다.
SK텔레콤, 한국어 기반 풀스택 AI로 ‘소버린 AI’ 정조준
SK텔레콤은 24일 자체 개발한 초거대 언어모델 A.X 3.1 시리즈를 오픈소스 커뮤니티 허깅페이스에 공개했다. 이 모델은 340억(34B) 파라미터 규모의 표준형과 경량형으로 구성되며, 모델 설계부터 데이터 수집·학습까지 전 과정이 '프롬 스크래치(From Scratch)’ 방식으로 개발됐다.
A.X 3.1은 기존 A.X 3.0 대비 코드 및 수학 추론 성능이 대폭 향상됐다. SK텔레콤은 이와 함께 CPT(지속 사전학습) 기반으로 학습된 A.X 4.0 시리즈도 함께 공개했다. A.X 4.0은 외부 지식 기반의 추론 능력을 강화한 최신 모델로, 통화 요약ㆍ에이전트 등 실제 서비스에 적용되고 있다.
두 모델 모두 한국어 특화 AI 성능 벤치마크에서 의미 있는 성과를 거뒀다. KMMLU 기준 A.X 3.1은 A.X 4.0의 88%, CLIcK 기준 90% 수준의 성능을 기록하며, 경량화와 효율성을 동시에 확보했다. SK텔레콤은 자체 개발 LLM을 활용해 국가대표급 독자 AI 파운데이션 모델 구축을 추진 중이다. 크래프톤, 리벨리온, 셀렉트스타, 서울대ㆍKAIST 연구진 등과 컨소시엄을 구성하고, 반도체-모델-데이터-서비스를 아우르는 풀스택 AI 체계를 구축하고 있다.
SKT 파운데이션 모델 김태윤 담당은 “각 분야 선도기업들과의 컨소시엄 구성으로 향후 소버린 AI 분야에서 새로운 성과를 만들어낼 것”이라며, “국내 AI 생태계를 종합적으로 고려해 혁신적인 인공지능 모델을 선보일 계획”이라고 밝혔다.
카카오, 경량 멀티모달ㆍMoE 모델로 기술 자립 선언
이날 카카오도 오픈소스 LLM을 대거 추가 공개하며 기술 경쟁에 가세했다. 카카오는 경량 멀티모달 모델 ‘카나나 1.5-v-3b’와 MoE(전문가 혼합) 구조의 ‘카나나 1.5-15.7b-a3b’를 허깅페이스에 등록했다. 이는 지난 5월 언어모델 4종을 공개한 데 이어 두 달 만의 추가 공개다.
‘카나나 1.5-v-3b’는 이미지와 텍스트 입력을 받아 자연어로 응답하는 경량 멀티모달 모델로, 지시 이행 능력과 이미지 이해에서 GPT-4o와 견줄 성능을 갖췄다. 카카오는 “단순히 모델을 개발하는 수준을 넘어, 실제 서비스 적용과 기술 자립이라는 두 가지 목표를 함께 실현한 결과물”이라고 강조했다.
함께 공개된 ‘1.5-15.7b-a3b’는 MoE 아키텍처를 적용해 컴퓨팅 자원 활용 효율을 극대화한 모델이다. 추론 시 일부 전문가만 활성화하는 구조 덕분에 저비용 고효율 서비스 구현이 가능하다는 평가다. 카카오 김병학 카나나 성과리더는 “단순한 모델 아키텍처 진보를 넘어, 서비스 적용과 기술 자립이라는 두 가지 측면 목표에 부합하는 결과물”이라고 설명했다.
LGㆍKTㆍ네이버 각축전 중…K-LLM 확산 견인
LG AI연구원은 엑사원 시리즈를 중심으로 독자 생태계를 구축 중이다. 엑사원 딥(Exaone Deep, 32B)과 엑사원 3.5 등 주요 모델을 허깅페이스에 오픈소스로 공개했고, 7.8B 경량 모델은 딥시크 등 글로벌 모델과의 비교에서 우위 성능을 보였다고 밝혔다. 논리적 추론, 문제 해결력 등에서 경쟁력을 갖췄다는 평가다.
KT는 7월 믿음(Mi:dm) 2.0 시리즈를 공개하며 한국어 기반 오픈소스 경쟁에 본격적으로 뛰어들었다. 11.5B(기본형), 2.3B(경량형) 두 버전으로 구성된 이 모델은 문학ㆍ법률ㆍ특허ㆍ사전 등 방대한 한국어 데이터셋으로 학습됐다. 특히 자체 커스텀 토크나이저 및 저작권 클린 데이터셋을 통해 상업적 활용의 진입장벽을 낮춘 것이 특징이다.
네이버는 4월 하이퍼클로바X의 경량 Seed 모델 3종(3B, 1.5B, 0.5B)을 오픈소스로 공개하며, 중소기업과 연구기관도 쉽게 활용할 수 있도록 생태계 기반을 마련했다. 향후 추론형 에이전트 모델도 추가로 공개할 예정이다.
이날 신임 배경훈 과학기술정보통신부 장관은 네이버 데이터센터 ‘각세종’을 찾아 AI기업들에게 과감한 인프라 투자를 약속했다. 정부와 민간이 힘을 합쳐 AI 연산에 필요한 그래픽처리장치(GPU) 서버를 포함한 데이터센터의 글로벌 경쟁 대응을 강화하겠다는 구상이다.
배 장관은 “AI 데이터센터를 포함한 AI 고속도로 구축은 대한민국이 AI 3대 강국으로 도약하기 위한 출발점”이라며 “과감한 마중물 투자를 통해 AI 인프라를 확충하고 수요를 견인해 AI 생태계가 활성화하도록 민·관이 함께 노력하는 것이 중요하다”고 밝혔다.
이날 배 장관은 김유원 네이버클라우드 대표, 이준희 삼성SDS 대표, 하민용 SK텔레콤 부사장, 김세웅 카카오 부사장, 최지웅 KT클라우드 대표, 김동훈 NHN클라우드 대표, 박성율 LG유플러스 혁신그룹장, 강중협 데이터센터연합회장, 박윤규 한국정보통신산업진흥원장, 이경무 서울대 교수, 류석영 한국과학기술원(KAIST) 교수 등과 간담회를 갖고 데이터센터 규제 개선, AI 모델 개발, AX(AI 전환) 지원 등 방안을 논의했다.
심화영 기자 dorothy@
〈ⓒ 대한경제신문(www.dnews.co.kr), 무단전재 및 수집, 재배포금지〉