[사이언스칼럼] 인공지능 씨앗을 뿌릴 빅데이터 토양이 먼저다

  • 오피니언
  • 사이언스칼럼

[사이언스칼럼] 인공지능 씨앗을 뿌릴 빅데이터 토양이 먼저다

이영섭 한국한의학연구원 한의약데이터부 선임연구원

  • 승인 2023-07-27 17:06
  • 신문게재 2023-07-28 18면
  • 임효인 기자임효인 기자
이영섭 이영섭 한국한의학연구원 한의약데이터부 선임연구원
이영섭 한국한의학연구원 한의약데이터부 선임연구원
다들 알고 있는 것처럼, 4차 산업혁명 이후 데이터의 양이 급증하면서 이를 활용하기 위해 머신러닝이나 딥러닝과 같은 인공지능 분석기술이 개발됐다. 이러한 인공지능 기반 분석기술들은 단순히 유의한 차이가 있는지를 검정하는 전통적인 통계분석과 달리, 인간이 데이터를 학습하고 형성하는 판단 알고리즘을 모사할 수 있다는 장점이 있다.

처음에는 인공지능 분석이 영상분석이나 음성인식과 같은 일부 분야에서만 주로 활용됐지만, 현재는 인공지능 분석기술이 고도화되면서 자율주행부터 번역, 개인적 대화상대, 심지어 문화예술까지 인공지능이 활용되지 않는 분야가 없을 정도이다. 특히, 최근 ChatGPT(OpenAI)와 BingChat(Microsoft), Bard(google)와 같은 빅데이터 기반 언어모델들이 일반인들에게 서비스되면서, 빅데이터 기반 인공지능 알고리즘에 대한 엄청난 기대가 집중되고 있다.

마찬가지로 의학 분야에서도 인공지능이 의사의 판단을 대신하거나 지원할 수 있는지에 대한 많은 연구가 진행되고 있다. 이처럼 인공지능과 의료 빅데이터가 결합한 결과를 '정밀의료'라고 볼 수 있는데 2015년 미국의 오바마 전 대통령이 신년 국정연설에서 정밀의료 이니셔티브를 주장한 이래, 진료정보, 유전체정보, 인구집단 코호트, 모바일 헬스케어 그리고 보건의료 빅데이터까지 망라하여 개인에게 최적의 의료를 제공하기 위한 연구들을 전 세계적으로 추진하고 있다.

그러나 앞서 언급한 바와 같이, 인공지능 분석기술이 점차 고도화되면서, 반대로 고도화된 분석기술을 적용할 실제 빅데이터의 확보가 최근 당면과제로 떠오르고 있다. 이미 자연스럽게 빅데이터가 확보된 일부 분야를 제외하면, 대부분은 데이터가 파편화돼 있거나, 중요한 정보가 기록되지 않았거나, 항목이 있더라도 결측치가 너무 많거나, 혹은 개인의 민감정보가 포함돼 접근에 어려움이 있는 등, 인공지능 학습에 충분한 질과 양의 빅데이터를 확보하는 것이 쉽지 않은 탓이다. 이렇게 누락됐거나 부정확한 데이터셋을 활용한 인공지능 분석은 결국 왜곡된 결과를 도출할 가능성이 높다. 특히 일반적으로 딥러닝 알고리즘은 스스로 학습한 알고리즘을 기반으로 질문(입력값)에 대한 응답(결과값)을 알려주기는 하지만, 일반적으로 입력된 데이터를 학습한 결과로 도출한 알고리즘은 블랙박스에 가깝다는 제한점도 이러한 오류를 발견하거나 수정하기 어렵게 한다.



그 결과 먼저 방대한 데이터가 축적돼야 제대로 된 정밀의료 기술을 개발하여 의료 서비스에 적용할 수 있다는 공감대가 형성됐다. 미국, 영국, 중국, 일본 등 세계의 여러 나라들에서 정밀의료를 위한 대규모 코호트 등 빅데이터 수집과 활용에 막대한 예산을 투입하고 있다.

사실 개인에게 최적의 의료를 정밀하게 제공한다는 정밀의료의 관점은 한의학에서 말하는 체질이나 변증과도 같은 맥락이라고 할 수 있다. 그러나 기존 의료분야에서 수집되는 데이터에는 전통의학에서 중시하는 땀, 대변, 소변, 성격, 체형 등의 정보들이 누락된 경우가 많으며, 특히 한의학의 예방의학적 효과를 보기 위해서는 장기적인 데이터가 필요하기 때문에, 전통의학의 노하우를 인공지능 분석에 반영하기 위해서는 적절한 한의 빅데이터의 구축이 꼭 필요한 상황이다.

한국한의학연구원에서는 2000년대 중반부터 한의 임상 정보를 지속적으로 수집 및 DB화해 한의임상정보은행(Korean medicine Data Center·KDC) 시스템을 구축하고, 2007년 640여 건의 데이터를 시작으로 2022년 말 기준으로 3만255건의 데이터를 구축한 바 있다. 특히 임상 의료정보와 결합된 다양한 오믹스 데이터와 코호트 기반의 경시적 추적조사(시간 경과에 따른 특정 개체나 집단의 상태를 측정하는 연구방법) 정보를 포함하고 있다는 점에서 한·양방 융합 정밀의료 연구에 최적화된 한의계 최대의 빅데이터라고 할 수 있으며, 이를 활용한 정밀의료 기술을 개발하기 위한 연구를 지속적으로 수행하고 있다. 이영섭 한국한의학연구원 한의약데이터부 선임연구원

중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지

기자의 다른기사 보기

랭킹뉴스

  1. 대전 고교 당일 급식파업에 학생 단축수업 '파장'
  2. 대전 오월드서 에어컨 실외기 설치 작업자 추락해 사망
  3. 열악했던 대전 여성노숙인 쉼터…지원 손길로 '확 달라졌다'
  4. "뿌리부터 첨단산업까지… 지역과 함께 혁신·성장하는 대학"
  5. 대전 중구 교육부 평생학습도시 신규 선정 '중구가 대학, 온마을이 캠퍼스'
  1. 대전교사들 "학교 CCTV 의무화, 사건 예방에 도움 안돼" 의무화 입법에 반발
  2. 계룡산성 道지정문화재 등록 5년째 '보류'…성벽과 기와 무너지고 흩어져
  3. 대전 금고동 주민들 "매립장·하수처리 공사장 먼지에 농사 망칠판" 호소
  4. 사랑의 재활용 나눔장터 ‘북적북적’
  5. 대전시의원 후보자 3인 ‘저를 뽑아주세요’

헤드라인 뉴스


[르포] 4·2 재보궐 현장…"국민통합 민주주의 실현해야"

[르포] 4·2 재보궐 현장…"국민통합 민주주의 실현해야"

"탄핵정국 속 두 쪽으로 갈라진 국민을 하나로 통합하고 민주주의가 살아있다는 걸 보여주고 싶어요." 4·2 재보궐선거 본 투표 당일인 2일 시의원을 뽑는 대전 유성구 주민에게선 사뭇 비장함이 느껴졌다. '민주주의의 꽃' 선거를 통해 주권재민(主權在民) 이라는 헌법적 가치를 발현할 소중한 한 표를 행사하기 위해 저마다 투표소로 향한 것이다. 오전 10시에 방문한 유성구제2선거구의 온천2동 제6투표소 대전어은중학교는 다소 한산한 풍경이었다. 투표 시작 후 4시간이 흘렀지만 누적 투표수는 고작 200표 남짓에 불과했다. 낮은 투표율을 짐..

`눈덩이 가계 빚` 1인당 가계 빚 9600만 원 육박
'눈덩이 가계 빚' 1인당 가계 빚 9600만 원 육박

국내 가계대출 차주의 1인당 평균 대출 잔액이 약 9500여 만에 달하는 것으로 집계됐다. 특히 40대 차주의 평균 대출 잔액은 1억 1073만 원으로 가장 높은 수치를 기록했다. 2일 국회 기획재정위원회 소속 국민의힘 박성훈 의원이 한국은행에서 제출받은 자료에 따르면, 지난해 4분기 말 기준 가계대출 차주의 1인당 평균 대출 잔액은 9553만 원으로 조사됐다. 이는 관련 통계가 작성된 지난 2012년 이후 역대 최고 수준이다. 1인당 대출 잔액은 지난 2023년 2분기 말(9332만 원) 이후 6분기 연속 증가했다. 1년 전인 2..

요즘 뜨는 대전 역주행 핫플레이스는 어디?... 동구 가오중, 시청역6번출구 등
요즘 뜨는 대전 역주행 핫플레이스는 어디?... 동구 가오중, 시청역6번출구 등

숨겨진 명곡이 재조명 받는다. 1990년대 옷 스타일도 다시금 유행이 돌아오기도 한다. 이를 이른바 '역주행'이라 한다. 단순히 음악과 옷에 국한되지 않는다. 상권은 침체된 분위기를 되살려 재차 살아난다. 신규 분양이 되며 세대 수 상승에 인구가 늘기도 하고, 옛 정취와 향수가 소비자를 끌어모으기도 한다. 원도심과 신도시 경계를 가리지 않는다. 다시금 상권이 살아나는 기미를 보이는 역주행 상권이 지역에서 다시금 뜨고 있다. 여러 업종이 새롭게 생기고, 뒤섞여 소비자를 불러 모으며 재차 발전한다. 이미 유명한 상권은 자영업자에게 비싼..

실시간 뉴스

지난 기획시리즈

  • 정치

  • 경제

  • 사회

  • 문화

  • 오피니언

  • 사람들

  • 기획연재

포토뉴스

  • 친구들과 즐거운 숲 체험 친구들과 즐거운 숲 체험

  • 한산한 투표소 한산한 투표소

  • 윤 대통령 탄핵심판 선고 앞 ‘파면VS복귀’ 윤 대통령 탄핵심판 선고 앞 ‘파면VS복귀’

  • 대전시의원 후보자 3인 ‘저를 뽑아주세요’ 대전시의원 후보자 3인 ‘저를 뽑아주세요’