[이강훈 칼럼] 대한민국 초거대 언어모델 개발, ‘원팀'이 필요하다

● 이강훈 AI 칼럼 관련 시리즈

데일리연합 (SNSJTV. 타임즈M) 이강훈(사단법인 한국인공지능연구소 소장 및 주식회사 퀀텀아이 대표) 기고, 곽중희 기자 편집 | 한때 초거대 언어모델(LLM, Large Language Model)은 기업들이 앞다투어 도전하는 블루오션이었다.

하지만 이제 그런 시대는 끝나가고 있다. 단순히 거대한 AI 모델을 구축하는 것이 경쟁력이 되지 않는다는 것이 점점 명확해지고 있다. 기술 발전의 속도가 빨라지고, 오픈소스 기반의 모델들이 등장하면서, 거대 자본을 투입해 자체 모델을 개발하는 것이 더 이상 효율적인 전략이 아니게 되었다. 문제는 이를 인식하지 못한 채, 기업과 정부가 여전히 초거대 언어모델을 개발하겠다며 무리수를 두는 경우다.

기업이 단기적인 이익을 노리고, 정부가 무분별한 지원을 한다면 혈세 낭비, 시간 낭비, 기회 낭비라는 최악의 결과를 초래할 수 있다. 이제는 방향을 바꿔야 한다. 초거대 언어모델 개발은 정부 주도의 비영리 법인이 이끌고, 오픈소스 기반의 지속가능한 협력 모델로 전환해야 한다.

초거대 언어모델 개발, 더 이상 기업의 문제 아냐

과거에는 초거대 언어모델이 기술적 우위를 확보하는 핵심 무기였다. 구글, 오픈AI, 메타 같은 빅테크 기업들이 무제한에 가까운 자본을 투입해 AI 모델을 훈련하며 시장을 선점하려 했다. 그러나 최근 몇 가지 중요한 변화가 생겼다.

오픈소스 AI 모델의 등장

메타의 Llama, Mistral, 그리고 다양한 오픈소스 언어모델들이 기존의 폐쇄형 모델들과 경쟁할 만큼 성장했다. 오픈소스 모델들은 많은 연구자와 개발자들의 기여를 받으며 빠르게 개선되고 있다.

AI 개발의 비용 문제

초거대 언어모델을 훈련하는 데 드는 비용은 천문학적이다. GPU 자원 확보부터 전력 비용, 데이터 비용까지 고려하면, 수조 원대의 투자 없이는 유지하기 어려운 구조다.

오픈AI와 구글조차도 비용 절감을 위한 최적화에 집중하는 상황에서, 신규 기업이 자체적으로 초거대 모델을 만들려는 것은 무모하다.

기업의 ROI(Return on Investment) 문제

초거대 모델이 단순히 크다고 해서 돈이 되는 시대는 끝났다. AI 서비스의 수익 모델이 구체적으로 자리 잡지 않은 상황에서, 단순히 모델을 개발하는 것만으로는 시장에서 성공하기 어렵다. 이런 이유로, 이제 초거대 언어모델을 기업이 자체적으로 개발하는 시대는 지나가고 있다.

정부 주도, 비영리 법인 모델 개발 필요

그렇다면 초거대 언어모델 개발을 완전히 포기해야 하는가? 그렇지 않다. 오히려 더욱 체계적이고 지속가능한 방식으로 접근해야 한다.

정부가 초기 지원, 그러나 장기적으로는 오픈소스로 전환

초기에는 강력한 국가지원이 필요하다. 정부가 단순히 기업에 보조금을 지급하는 방식이 아니라, 비영리 법인을 설립하여 연구개발을 주도해야 한다. 이후에는 이를 오픈소스화하여 학계, 연구소, 기업이 함께 발전시킬 수 있는 구조를 만들어야 한다.

예를 들어, 유럽연합(EU)의 GAIA-X 프로젝트처럼 국가 차원에서 공공 데이터와 AI 연구를 통합 관리하는 플랫폼을 구축하는 방식이 필요하다. 이를 통해 한국이 자체적인 AI 인프라를 갖추고, 글로벌 오픈소스 커뮤니티와 협력할 수 있어야 한다.

사단법인·협회·연구소·대학·기업의 역할 분담

초거대 언어모델 개발은 한 조직이 단독으로 감당할 수 없는 대형 프로젝트다. 따라서 역할을 명확히 분담해야 한다.

정부: 초기 투자, 공공 데이터 제공, 연구소 지원
비영리 법인 (사단법인, 협회): 모델 개발 및 운영 주체, 오픈소스화 관리
대학·연구소: 연구개발, 알고리즘 최적화, 모델 개선
기업: 모델을 활용한 서비스 개발 및 상용화

모든 이해관계자가 한 팀으로 협력하는 국가 프로젝트 형태의 접근 방식이 필요하다.

한국형 오픈소스 AI 모델이 필요한 이유

현재 AI 생태계는 미국과 중국이 주도하고 있다. 한국은 자체적인 초거대 언어모델을 개발할 역량을 갖추고 있음에도, 글로벌 경쟁에서는 여전히 불리한 위치에 있다.

이를 극복하기 위해서는 한국형 오픈소스 AI 모델을 만들어야 한다. 단순한 기업의 경쟁이 아니라, 국가 차원의 프로젝트로 접근해 글로벌 AI 생태계에서 독립성을 확보하는 것이 중요하다.

한국어 특화 AI 모델 개발

현재 오픈AI의 GPT 시리즈나 메타의 Llama는 한국어 데이터가 부족하다. 따라서 한국어 특화 AI 모델을 오픈소스로 개발하여 글로벌 AI 생태계에서 주도권을 확보해야 한다.

공공 데이터 개방과 활용

국내 AI 연구가 발전하기 위해서는 양질의 데이터가 필요하다. 정부는 공공 데이터를 개방하고, AI 모델 개발에 활용할 수 있도록 지원해야 한다. 예를 들어, 법률, 의료, 행정 문서 등 다양한 분야의 데이터를 AI 학습용으로 제공하면 연구자들이 이를 활용할 수 있다.

글로벌 협력과 경쟁

한국이 AI 분야에서 경쟁력을 가지려면, 오픈소스 커뮤니티와 적극적으로 협력해야 한다. 이미 Hugging Face 같은 글로벌 AI 플랫폼에서 오픈소스 모델들이 활발하게 개발되고 있다. 한국형 AI 모델이 글로벌 표준으로 자리 잡을 수 있도록, 국제 협력 프로젝트를 강화해야 한다.

AI 개발, 이제 방향을 바꿔야 한다

초거대 언어모델을 둘러싼 경쟁은 이미 새로운 국면에 접어들었다. 이제는 기업이 무작정 덤비는 시대가 아니라, 국가가 체계적으로 접근해야 하는 시대다.

정부가 해야 할 일, 기업이 해야 할 일, 연구소와 대학이 해야 할 일이 분명하다. 단순히 "우리도 초거대 모델을 만들어야 한다"는 막연한 목표가 아니라, 비영리 법인이 주도하고, 정부가 초기 지원하며, 이후 오픈소스로 지속적으로 발전하는 구조가 필요하다.

2월 19일 한국인공지능연구소가 개최한 인공지능 커뮤니티 오프라인 모임. 국가의 인공지능 방향성에 대해 논의하고 있는 모습. /사진=한국인공지능연구소 제공

국가 차원의 AI 프로젝트에서 중요한 것은 ‘대한민국 원팀 정신’이다. 대한민국이 AI 강국으로 나아가기 위해서는, 모든 이해관계자가 협력하여 국가 주도의 AI 생태계를 만들어야 한다. 이제는 방향을 바꿔야 할 때다.

■ 기고 l 이강훈 (사단법인 한국인공지능연구소 소장 및 주식회사 퀀텀아이 대표)

기고인 이강훈은 사단법인 한국인공지능연구소의 소장으로 활동하고 있다. 한국인공지능연구소는 2018년 4월 19일에 설립되어, 인공지능 기술의 연구와 대중화를 목표로 다양한 활동을 전개하고 있다. 또한, 이 소장은 인공지능 전문 기업인 주식회사 퀀텀아이도 운영하고 있다.

칼럼

[이강훈 칼럼] 대한민국 초거대 언어모델 개발, ‘원팀'이 필요하다

초거대 언어모델, 더 이상 기업의 문제 아냐
국가 주도, 한국형 오픈소스 AI 모델 필요

SNS TV

가장 많이 본 뉴스

칼럼

[이강훈 칼럼] 대한민국 초거대 언어모델 개발, ‘원팀'이 필요하다

초거대 언어모델, 더 이상 기업의 문제 아냐 국가 주도, 한국형 오픈소스 AI 모델 필요

SNS TV

가장 많이 본 뉴스

초거대 언어모델, 더 이상 기업의 문제 아냐
국가 주도, 한국형 오픈소스 AI 모델 필요