K-AI 주도권 잡아라…‘기술 자립’ 최전선 선 ‘오픈소스 LLM’

구독신청 기사제보 입찰정보 판매도서

대한경제 i 신문초판

회원가입

로그인

11/02/2020

월요일

- 건설산업
- 산업
- 부동산
  경제
  - 경제정책
  - 금융
  - 기업
  - 증권/IB
  - 종목뉴스
  - 공시
- 정치
  사회
  - 사회일반
  - 법조
  전국
  - 수도권
  - 지방
- 오피니언
- 기획연재
  해외뉴스
- 피플
  - 인터뷰
  - 게시판
  - 인사
  - 결혼
  - 부음
  레저/문화

K-AI 주도권 잡아라…‘기술 자립’ 최전선 선 ‘오픈소스 LLM’

기사입력 2025-07-24 11:09:34 폰트크기 변경

SK텔레콤·카카오도 오픈소스 공개…LG·KT·네이버 등 K-LLM 기술 경쟁 가열

SKT LLM 개발 타임라인 /사진:SKT

사진:카카오

[대한경제=심화영 기자] 국내 대표 ICT기업들이 ‘K-LLM(대형언어모델)’ 기술의 주도권을 잡기 위한 오픈소스 전쟁에 돌입했다. 올해 들어 SK텔레콤, 카카오, LG, KT, 네이버 등 주요 기업들이 자체 개발한 LLM을 허깅페이스 등 오픈 플랫폼에 순차적으로 공개하며, 기술 자립과 생태계 확대에 속도를 내고 있다. 이는 정부가 주도하는 ‘독자 AI 파운데이션 모델’ 사업과 맞물려, K-AI 주권을 확보하기 위한 민간 차원의 핵심 전략으로 주목받고 있다.

SK텔레콤, 한국어 기반 풀스택 AI로 ‘소버린 AI’ 정조준

SK텔레콤은 24일 자체 개발한 초거대 언어모델 A.X 3.1 시리즈를 오픈소스 커뮤니티 허깅페이스에 공개했다. 이 모델은 340억(34B) 파라미터 규모의 표준형과 경량형으로 구성되며, 모델 설계부터 데이터 수집·학습까지 전 과정이 '프롬 스크래치(From Scratch)’ 방식으로 개발됐다.

A.X 3.1은 기존 A.X 3.0 대비 코드 및 수학 추론 성능이 대폭 향상됐다. SK텔레콤은 이와 함께 CPT(지속 사전학습) 기반으로 학습된 A.X 4.0 시리즈도 함께 공개했다. A.X 4.0은 외부 지식 기반의 추론 능력을 강화한 최신 모델로, 통화 요약ㆍ에이전트 등 실제 서비스에 적용되고 있다.

두 모델 모두 한국어 특화 AI 성능 벤치마크에서 의미 있는 성과를 거뒀다. KMMLU 기준 A.X 3.1은 A.X 4.0의 88%, CLIcK 기준 90% 수준의 성능을 기록하며, 경량화와 효율성을 동시에 확보했다. SK텔레콤은 자체 개발 LLM을 활용해 국가대표급 독자 AI 파운데이션 모델 구축을 추진 중이다. 크래프톤, 리벨리온, 셀렉트스타, 서울대ㆍKAIST 연구진 등과 컨소시엄을 구성하고, 반도체-모델-데이터-서비스를 아우르는 풀스택 AI 체계를 구축하고 있다.

SKT 파운데이션 모델 김태윤 담당은 “각 분야 선도기업들과의 컨소시엄 구성으로 향후 소버린 AI 분야에서 새로운 성과를 만들어낼 것”이라며, “국내 AI 생태계를 종합적으로 고려해 혁신적인 인공지능 모델을 선보일 계획”이라고 밝혔다.

카카오, 경량 멀티모달ㆍMoE 모델로 기술 자립 선언

이날 카카오도 오픈소스 LLM을 대거 추가 공개하며 기술 경쟁에 가세했다. 카카오는 경량 멀티모달 모델 ‘카나나 1.5-v-3b’와 MoE(전문가 혼합) 구조의 ‘카나나 1.5-15.7b-a3b’를 허깅페이스에 등록했다. 이는 지난 5월 언어모델 4종을 공개한 데 이어 두 달 만의 추가 공개다.

‘카나나 1.5-v-3b’는 이미지와 텍스트 입력을 받아 자연어로 응답하는 경량 멀티모달 모델로, 지시 이행 능력과 이미지 이해에서 GPT-4o와 견줄 성능을 갖췄다. 카카오는 “단순히 모델을 개발하는 수준을 넘어, 실제 서비스 적용과 기술 자립이라는 두 가지 목표를 함께 실현한 결과물”이라고 강조했다.

함께 공개된 ‘1.5-15.7b-a3b’는 MoE 아키텍처를 적용해 컴퓨팅 자원 활용 효율을 극대화한 모델이다. 추론 시 일부 전문가만 활성화하는 구조 덕분에 저비용 고효율 서비스 구현이 가능하다는 평가다. 카카오 김병학 카나나 성과리더는 “단순한 모델 아키텍처 진보를 넘어, 서비스 적용과 기술 자립이라는 두 가지 측면 목표에 부합하는 결과물”이라고 설명했다.

LGㆍKTㆍ네이버 각축전 중…K-LLM 확산 견인

LG AI연구원은 엑사원 시리즈를 중심으로 독자 생태계를 구축 중이다. 엑사원 딥(Exaone Deep, 32B)과 엑사원 3.5 등 주요 모델을 허깅페이스에 오픈소스로 공개했고, 7.8B 경량 모델은 딥시크 등 글로벌 모델과의 비교에서 우위 성능을 보였다고 밝혔다. 논리적 추론, 문제 해결력 등에서 경쟁력을 갖췄다는 평가다.

KT는 7월 믿음(Mi:dm) 2.0 시리즈를 공개하며 한국어 기반 오픈소스 경쟁에 본격적으로 뛰어들었다. 11.5B(기본형), 2.3B(경량형) 두 버전으로 구성된 이 모델은 문학ㆍ법률ㆍ특허ㆍ사전 등 방대한 한국어 데이터셋으로 학습됐다. 특히 자체 커스텀 토크나이저 및 저작권 클린 데이터셋을 통해 상업적 활용의 진입장벽을 낮춘 것이 특징이다.

네이버는 4월 하이퍼클로바X의 경량 Seed 모델 3종(3B, 1.5B, 0.5B)을 오픈소스로 공개하며, 중소기업과 연구기관도 쉽게 활용할 수 있도록 생태계 기반을 마련했다. 향후 추론형 에이전트 모델도 추가로 공개할 예정이다.

이날 신임 배경훈 과학기술정보통신부 장관은 네이버 데이터센터 ‘각세종’을 찾아 AI기업들에게 과감한 인프라 투자를 약속했다. 정부와 민간이 힘을 합쳐 AI 연산에 필요한 그래픽처리장치(GPU) 서버를 포함한 데이터센터의 글로벌 경쟁 대응을 강화하겠다는 구상이다.

배 장관은 “AI 데이터센터를 포함한 AI 고속도로 구축은 대한민국이 AI 3대 강국으로 도약하기 위한 출발점”이라며 “과감한 마중물 투자를 통해 AI 인프라를 확충하고 수요를 견인해 AI 생태계가 활성화하도록 민·관이 함께 노력하는 것이 중요하다”고 밝혔다.

이날 배 장관은 김유원 네이버클라우드 대표, 이준희 삼성SDS 대표, 하민용 SK텔레콤 부사장, 김세웅 카카오 부사장, 최지웅 KT클라우드 대표, 김동훈 NHN클라우드 대표, 박성율 LG유플러스 혁신그룹장, 강중협 데이터센터연합회장, 박윤규 한국정보통신산업진흥원장, 이경무 서울대 교수, 류석영 한국과학기술원(KAIST) 교수 등과 간담회를 갖고 데이터센터 규제 개선, AI 모델 개발, AX(AI 전환) 지원 등 방안을 논의했다.

심화영 기자 dorothy@

〈ⓒ 대한경제신문(www.dnews.co.kr), 무단전재 및 수집, 재배포금지〉

산업부

심화영 기자

dorothy@dnews.co.kr

심화영 기자의 다른기사 보기

▶ 구글 플레이스토어에서 '대한경제i' 앱을 다운받으시면
- 종이신문을 스마트폰과 PC로보실 수 있습니다.
- 명품 컨텐츠가 '내손안에' 대한경제i

법률라운지

사회

제호 : 대한경제 / 인터넷신문등록번호 : 서울 아53255 / 등록일자 : 2020년 08월 25일 / 발행인 : 유일동 / 편집인 : 유일동 / 청소년 보호책임자: 장세갑
발행소 : 서울시 강남구 언주로 711 건설회관 12층 / 발행일자 : 1964년 3월 2일 / 대표번호 02-515-7321
대한경제신문의 모든 콘텐츠(기사)는 저작권법의 보호를 받는 바, 무단전재, 복사, 배포 등을 금합니다.