남용운 한국핵융합에너지연구원 선임연구원 |
핵융합반응이 일어날 정도로 높은 온도를 유지하면서도 주변의 벽면에 손상을 주지 않으려면 실시간으로 자기장의 세기를 바꾸어 가며 플라즈마의 위치와 형태를 정밀하게 제어해야 한다. 물론 이전에도 사람이 직접 핸들을 돌려가며 플라즈마를 운전했던 건 아니다. 플라즈마 바깥쪽에 설치된 센서가 플라즈마에서 발생한 신호를 측정하면 그에 따라 자동으로 자기장을 조절하는 전자석에 전압을 걸어 플라즈마를 제어했다. 다만 측정된 신호에 따라 어떤 전자석에 얼마나 전압을 걸어주어야 하는지는 사람이 미리 설정해야 했다.
이러한 설정은 신호를 이용해 플라즈마의 형태를 재구성한 뒤, 목표로 하는 형태와의 차이만큼 플라즈마를 움직일 수 있는 전자석에 전압을 걸어주는 직관적인 과정을 통해 이루어진다. 직접 형태의 차이를 확인하며 수많은 반복 작업을 거쳐 조금씩 더 나은 제어 방식을 찾아나가야 하므로 시간 소모가 크고 최적의 해답을 찾기도 힘들다.
이번에 개발된 인공지능은 이 과정을 대체한다. 목표 형태를 제시하면 시뮬레이션을 이용한 반복학습을 통해 측정된 신호에 따라 어떤 방식으로 전자석에 전압을 걸어줄지에 대한 해답을 찾는다. 이러한 제어 정책을 실제 토카막에 적용해 성공적으로 플라즈마의 형태를 유지한 것이 이번 연구의 결과다. 바둑에 적용된 알파고와 비교한다면 상대방이 놓은 수는 측정된 신호, 인공지능이 놓을 수는 전자석에 걸어줄 전압 그리고 게임의 승리는 목표로 하는 플라즈마의 형태에 해당한다.
인공지능으로부터 좋은 답을 얻으려면 우선 목표를 명확히 하고 그 목표를 달성할 수단을 쥐여준 뒤, 그걸 연습할 환경을 제공해 주어야 한다. 바둑은 승리라는 목표가 확실하고 사용할 수단이 규칙으로 정해져 있으며 시뮬레이션을 통해 게임 과정을 완벽히 재현할 수 있어 강화학습이 적용되기에 좋은 예다. 해답을 도출하는 과정의 복잡성은 아무런 문제가 되지 않으며 그렇게 얻은 해답은 인간의 직관을 아득히 뛰어넘는 효율을 보인다는 점은 이미 충분히 증명됐다.
핵융합 플라즈마의 제어 역시 인간의 직관으로는 감당하기 어려운 극도로 복잡한 문제다. 오랜 시간 과학자들의 노력으로 중요한 성과들을 얻어왔지만, 인공지능은 전혀 다른 차원의 돌파구가 되리라 기대된다. 이를 위해서는 목표와 수단, 환경이라는 조건이 필요하다. 이 중 가장 중요한 것이 환경인데 인공지능이 학습할 데이터를 실제 토카막에서 얻는 것은 매우 비효율적이므로 토카막 환경을 컴퓨터 내에서 재현할 가상 토카막이 필요해진다. 이 가상 토카막이 실제와 유사하면 유사할수록 인공지능에게 더 궁극적인 목표를 제시할 수 있게 된다.
이번 연구에서의 목표는 플라즈마의 형태였다. 어떤 플라즈마 형태에서 핵융합반응이 잘 일어나는지는 여전히 사람이 결정해야 한다. 이는 학습에 사용한 시뮬레이션이 플라즈마의 형태까지만 재현할 수 있었기 때문이다. 만일 우리가 더 완벽한 가상 토카막을 구현한다면 플라즈마의 형태가 아닌 밀도나 온도, 혹은 아예 핵융합 발전으로 얻어지는 전력을 목표로 제시할 수도 있다. 그러면 인공지능은 알파고가 바둑에서 보여줬던 수처럼 인간의 직관으로는 상상할 수도 없었던 플라즈마의 형태를 해답으로 내놓을지도 모를 일이다.
핵융합 연구는 과연 핵융합반응을 실제로 일으킬 수 있느냐의 단계는 예전에 넘어섰다. 하지만 그렇게 만들어 낸 에너지가 투입한 에너지보다 높은지, 더 나아가 생산한 에너지의 가치가 핵융합로를 건설하고 유지하는 데 투입한 비용보다 높은지를 놓고 경쟁하는 효율성의 단계에서 고전하고 있다. 바둑에서 인간을 초월하는 답을 내놓은 인공지능이 핵융합에서도 비슷한 성과를 내준다면 우리는 예상보다 더 빨리 핵융합 상용화의 단계에 진입할 수 있을 것이다. 남용운 한국핵융합에너지연구원 선임연구원
중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지