황순욱 한국과학기술정보연구원(KISTI) 책임연구원 |
2017년부터 2021년까지의 데이터에 의하면 한국은 AI 연구개발과 경제 분야 종합 순위에 있어 조사된 29개 국가 중에 미국, 중국, 인도, 영국, 캐나다에 이어 6위를 차지하고 있다. 한국보다 경제 규모가 훨씬 작은 이스라엘과 싱가포르가 9위와 10위, 그리고 일본은 13위인 것이 눈길을 끈다. 한국은 AI 인력, 고용, 투자, 논문 출판 수 등에서 국가 경제 규모 대비 나름 선방하고 있는 셈이다.
이번 보고서는 연구개발, 기술 성능, AI 기술 윤리, 경제, 교육, 정책·거버넌스, 다양성, 여론이라는 8개 장으로 구성돼 있다. 챗GPT가 촉발한 AI에 대한 대중의 높아진 관심 때문인지 AI에 활용에 대한 대중의 인식을 조사·분석한 '여론' 장이 새롭게 추가됐다. 안면인식과 같은 첨단 AI 기술에 의한 '빅브라더' 체제 의혹이 있는 중국이 응답자 중 78%가 AI 활용에 대해서 긍정적이라 답변해서 28개국 중에 1위를 차지한 사실이 약간 놀라웠다. 한국은 62%가 긍정적이라 답해서 9위에 위치한다. 프랑스는 31%만이 긍정적이라고 해서 최하위를 차지했다. 한편, 글로벌 AI 제품과 서비스를 이끌고 있는 미국은 응답자의 35%만이 긍정적으로 생각하고 있는 것으로 조사됐다.
올해는 컴퓨터비전, 자연어, 음성인식, 강화학습 분야 등의 'AI 기술 성능' 관련해서 예년보다 좀 더 자세히 조사·분석했다. 이미지넷 같은 전통적인 벤치마크의 성능 향상은 이제 포화상태에 도달해서 미미한 것으로 나왔다. 이미지 생성 AI인 달리2와 챗GPT와 같은 생성 AI 활용이 대중화되면서 AI 법적, 윤리적 문제가 점점 부각되고 있다. 이를 반영하기 위해서 2022년도에 생성 AI 모델의 정확성과 독성·편향 같은 AI 윤리 지수 등을 종합적으로 측정·평가할 수 있는 보다 복잡한 새로운 벤치마크인 빅벤치(BIG-bench)와 헬름(HELM)이 등장하게 됐다.
이번 보고서는 초거대 언어 및 멀티모달(multimodal) 모델에 대해서도 '연구개발' 장에서 상세히 다루고 있다. 2019년 개발된 GPT-2부터 2022년 개발된 오픈소스 다국어 언어모델인 블룸(2022년)까지 30여개 모델에 대해서 개발 시기, 개발 국가 및 기관, 매개변수 개수, 훈련 비용 등을 비교·분석했다. GPT-2와 GPT-3 모델 훈련 비용이 각각 5만 달러(약 6800만 원)와 180만 달러(약 24억 원)로 조사됐다. 네이버 하이퍼클로버의 훈련 비용은 27만 달러(약 3억 6000만 원)로 나왔다. 초거대 언어 모델의 최적의 매개변수 값을 찾기 위해서 모름지기 수 개월 동안 수백 번 이상 실험해야 하기 때문에 실제로는 보고서 수치보다 훨씬 큰 비용이 들 것이라 생각된다.
2022년은 생성 AI의 전성시대가 활짝 열린 해이다. 메타 'Make-A-Scene'(이미지 생성, 3월), 오픈 AI '달리2'(이미지 생성, 5월), 스터빌리티 AI 'Stable Diffusion'(이미지 생성, 8월), 오픈 AI 'Whisper'(음성 인식, 9월), 메타 'Make-A-Video'(비디어 생성, 9월), 오픈 AI '챗GPT'(챗봇, 11월)가 공개됐다. 2023년에도 구글 쳇봇 '바드'(3월)', 오픈 AI 'GPT-4'(4월), 구글 'PaLM2'(5월) 출시 등 생성 AI의 전성시대가 계속될 것으로 예상된다.
지난해 마침 GPT-3 규모의 오픈소스 언어모델 블룸과 OPT 등이 공개됐다. 최신 GPU 8000개 이상 규모로 기대되는 국가 슈퍼컴퓨터 6호기도 구축 중이다. 우리도 더 늦기 전에 지난 몇 년간 나름 축적한 국가 AI 역량을 모아 초거대 생성 AI 개발 대열에 뛰어들어야 한다. 황순욱 한국과학기술정보연구원(KISTI) 책임연구원
중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지