[사이언스칼럼] 대형언어모델(LLM) 시대의 도전과 기회

  • 오피니언
  • 사이언스칼럼

[사이언스칼럼] 대형언어모델(LLM) 시대의 도전과 기회

황순욱 한국과학기술정보연구원(KISTI) 책임연구원

  • 승인 2023-09-21 16:25
  • 수정 2023-11-30 09:51
  • 신문게재 2023-09-22 18면
  • 임효인 기자임효인 기자
황순욱 사이언스칼럼 사진
황순욱 한국과학기술정보연구원(KISTI) 책임연구원
LLM 춘추 전국시대다. 세계 최대 AI 모델과 데이터 공유 오픈소스 플랫폼 허깅페이스에서 운영하는 LLM 성능 순위를 매기는 '오픈 LLM 리더보드'의 톱 순위가 며칠을 멀다하고 바뀌고 있다. 8월에 한국의 스타트업 업스테이지의 LLM이 세계 1위를 차지하는 쾌거를 올렸다. 9월 초에는 아랍에미리트(UAE) 과학연구센터첨단기술연구위원회(ATRC)의 기술혁신연구소(TII) 팰컨 180B(매개변수 1800억 개) 모델이 리더보드 정상에 올랐다. AI의 변방인 UAE에서 GPT-3(매개변수 1750억개) 크기의 사전학습 LLM을 개발한 것이 놀랍다. ATRC의 TII는 지난 5월 상업용 오픈소스 사전학습 모델의 첫 사례 중 하나인 팰컨 40B을 정상에 올리면서 세계적인 주목을 받았다.

LLM 서막을 알린 GPT-3가 출시된 2020년과 비교하면 격세지감을 느끼지 않을 수 없다. 불과 1~2년 전만해도 LLM 개발은 막대한 자본력과 기술력을 가진 미국의 특정 기업만이 할 수 있는 일이라 생각됐다. 도대체 어떻게 한국의 스타트업과 UAE의 한 연구소가 허깅페이스 오픈 LLM 리더보드 정상을 차지할 수 있게 됐는지를 한번 살펴보자.

그동안 LLM 기술의 글로벌 민주화가 꾸준히 진행돼 왔다. 첫째, 지난 수년간 트랜스포머 아키텍쳐가 LLM의 핵심으로 확고히 자리를 잡고 있다. 소스코드도 공개돼서 누구나 쉽게 트랜스포머를 구현할 수 있다. 트랜스포머의 각 층을 넓고 깊게 쌓기만 하면 대형모델이 된다. 둘째, 더 중요한 것은 거대 모델을 학습시키기 위해선 방대한 양의 데이터가 필요하다. 그동안 오픈소스 커뮤니티의 노력으로 허깅페이스와 같은 오픈소스 공유 플랫폼을 통해서 학습용 데이터 셋을 쉽게 구할 수 있다. 일례로, 지난 4월 레드파자마 프로젝트에서 1.2조 개의 토큰을 공개했다. 이는 GPT-3 사전학습용 데이터 토큰 3000억 개의 4배에 해당한다.

오픈 LLM 리더보드 정상에 오른 모델이 세계 최고 성능 LLM임을 의미하지는 않는다. 리더보드 4가지 벤치마크 지표인 초등수준 과학질의(ARC), 상식 추론(HellaSwag), 언어 이해 종합능력(MMLU), 환각현상방지(TruthfulQA)에서 제일 높은 평균 점수를 얻었다는 것이다. 여전히 오픈 AI의 챗GPT와 GPT-4가 세계 최고의 성능이다. 리더보드에 모델을 올릴 때 사전학습(pretrained), 미세 조정(fine-tuned), 명령어(instruction) 조정, 강화학습(RL) 조정한 모델인지를 명시하도록 돼 있다. 현재, 오픈 LLM 리더보드에는 미세조정 또는 명령어 조정한 모델이 거의 대부분이고, 라마2와 팰컨과 같이 사전학습 모델도 몇 개 보인다. 필자도 시험 삼아 허깅페이스에 공개된 데이터 셋을 이용해서 사전학습된 라마2를 양자화 미세조정한 모델을 리더보더에 올려보았다.



이번 한국 토종 스타트업의 오픈 LLM 리더보드 왕좌 등극을 계기로 앞으로 우리나라 AI 기업과 연구소 이름의 모델이 리더보드에서 많이 보이기를 기대한다. 좀 더 많은 기업이나 연구소에서 리더보드 4개 지표 공략 전략을 세우고, 성능 좋은 사전학습 모델과 데이터를 찾고, 미세 또는 명령어 조정한 토종 모델을 리더보드 정상에 올리는 데 적극 참여해야 한다. 처음에는 쉽지는 않겠지만 역량을 집중하면 단기적으로 할 수 있는 일이다. 이러한 작은 성공 경험과 할 수 있다는 조직 문화가 축적되면 UAE ATRC TII의 팰컨과 같이 세계적으로 인정받는 한국 토종 사전학습 LLM 모델도 조만간 나오게 될 것이다.

LLM 서비스 골드러시가 시작됐다. 오픈 LLM 리더보드에 1위 하는 것과는 차원이 다른 치열한 경쟁이다. LLM이 기존 서비스에 접목되어 새로운 기능을 추가하는 보조 역할에서 언어 이해와 추론 능력을 바탕으로 인터넷과 외부 툴을 연계·조율하는 중추 엔진 역할로 빠르게 변하고 있다. 이러한 LLM 중심의 혁신적인 서비스 패러다임의 변화를 감지하고 준비하는 자만이 황금을 캘 수 있게 될 것이다. 황순욱 한국과학기술정보연구원(KISTI) 책임연구원

중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지

기자의 다른기사 보기

랭킹뉴스

  1. 학대 마음 상처는 나았을까… 연명치료 아이 결국 무연고 장례
  2. 원금보장·고수익에 현혹…대전서도 투자리딩 사기 피해 잇달아 '주의'
  3. 김정겸 충남대 총장 "구성원 협의통해 글로컬 방향 제시… 통합은 긴 호흡으로 준비"
  4. [대전미술 아카이브] 1970년대 대전미술의 활동 '제22회 국전 대전 전시'
  5. 대통령실지역기자단, 홍철호 정무수석 ‘무례 발언’ 강력 비판
  1. 20년 새 달라진 교사들의 교직 인식… 스트레스 1위 '학생 위반행위, 학부모 항의·소란'
  2. [대전다문화] 헌혈을 하면 어떤 점이 좋을까?
  3. [사설] '출연연 정년 65세 연장법안' 처리돼야
  4. [대전다문화] 여러 나라의 전화 받을 때의 표현 알아보기
  5. [대전다문화] 달라서 좋아? 달라도 좋아!

헤드라인 뉴스


대전충남 행정통합 첫발… `지방선거 前 완료` 목표

대전충남 행정통합 첫발… '지방선거 前 완료' 목표

대전시와 충남도가 행정구역 통합을 향한 큰 발걸음을 내디뎠다. 이장우 대전시장과 김태흠 충남지사, 조원휘 대전시의회 의장, 홍성현 충남도의회 의장은 21일 옛 충남도청사에서 대전시와 충남도를 통합한 '통합 지방자치단체'출범 추진을 위한 공동 선언문에 서명했다. 대전시와 충남도는 수도권 일극 체제 극복, 지방소멸 방지를 위해 충청권 행정구역 통합 추진이 필요하다는 데에 공감대를 갖고 뜻을 모아왔으며, 이번 공동 선언을 통해 통합 논의를 본격화하기로 합의했다. 이날 공동 선언문을 통해 두 시·도는 통합 지방자치단체를 설치하기 위한 특별..

[대전 자영업은 처음이지?] 지역상권 분석 18. 대전 중구 선화동 버거집
[대전 자영업은 처음이지?] 지역상권 분석 18. 대전 중구 선화동 버거집

자영업으로 제2의 인생에 도전하는 이들이 늘고 있다. 정년퇴직을 앞두거나 다니던 직장을 그만두고 자신만의 가게를 차리는 소상공인의 길로 접어들기도 한다. 자영업은 자신이 가장 좋아하는 음식이나 메뉴 등을 주제로 해야 성공한다는 법칙이 있다. 무엇이든 한 가지에 몰두해 질리도록 파악하고 있어야 소비자에게 선택받기 때문이다. 자영업은 포화상태인 레드오션으로 불린다. 그러나 위치와 입지 등을 세밀하게 분석하고, 아이템을 선정하면 성공의 가능성은 충분하다. 이에 중도일보는 자영업 시작의 첫 단추를 올바르게 끼울 수 있도록 대전의 주요 상권..

[尹정부 반환점 리포트] ⑪ 충북 현안 핵심사업 미온적
[尹정부 반환점 리포트] ⑪ 충북 현안 핵심사업 미온적

충북은 청주권을 비롯해 각 지역별로 주민 숙원사업이 널려있다. 모두 시·군 예산으로 해결하기에 어려운 현안들이어서 중앙정부 차원의 지원이 절실한 사업들이다. 이런 가운데 국토균형발전에 대한 기대가 크다. 윤 정부의 임기 반환점을 돈 상황에서 충북에 어떤 변화가 있을 지도 관심사다. 윤석열 정부의 지난해 대통령직인수위원회가 발표한 충북지역 공약은 7대 공약 15대 정책과제 57개 세부과제다. 구체적으로 청주도심 통과 충청권 광역철도 건설, 중부권 동서횡단철도 구축, 방사광 가속기 산업 클러스터 구축 등 방사광 가속기 산업 클러스터 조..

실시간 뉴스

지난 기획시리즈

  • 정치

  • 경제

  • 사회

  • 문화

  • 오피니언

  • 사람들

  • 기획연재

포토뉴스

  • 대전-충남 행정통합 추진 선언…35년만에 ‘다시 하나로’ 대전-충남 행정통합 추진 선언…35년만에 ‘다시 하나로’

  • 대전 유등교 가설교량 착공…내년 2월쯤 준공 대전 유등교 가설교량 착공…내년 2월쯤 준공

  • 중촌시민공원 앞 도로 ‘쓰레기 몸살’ 중촌시민공원 앞 도로 ‘쓰레기 몸살’

  • 3·8민주의거 기념관 개관…민주주의 역사 잇는 배움터로 운영 3·8민주의거 기념관 개관…민주주의 역사 잇는 배움터로 운영