노인복지센터 등과 연계, ETRI의 노년층 음성 발화 분석 시스템을 실증하고 있는 모습. ETRI 제공 |
한국전자통신연구원(이하 ETRI)은 복합지능연구실 연구진이 일상생활 대화 등을 통해 입력되는 노년층의 음성 발화를 분석해 경도인지장애, 치매 등 퇴행성 뇌 기능 저하를 측정하고 예측하는 AI 기술을 개발하고 있다고 1일 밝혔다. 현재 태블릿 기반 앱 개발이 완료된 상태다.
음성 발화는 기억, 의도, 주의집중 등 인지기능과 음운, 통사, 의미 등 언어생성기능, 호흡, 조음, 발성 등 구어 운동 기능이 순차적으로 작용하는 복합적인 과정이다. 이러한 발화 분석을 통해 경도인지장애나 치매 환자에게 나타나는 인지, 언어, 운동 능력의 저하를 초기 판단하고 예측하는 게 가능하다.
ETRI 복합지능연구실은 음성처리 분야에서 축적된 AI 기술과 음성, 텍스트, 영상 멀티모달 기술을 바탕으로 디지털 치료제 등 헬스케어 분야까지 연구 범위를 넓히고 있다.
연구진은 기존 음성, 텍스트 분석 기술에 더해 세계 최초로 대형 언어모델(LLM)을 결합한 알츠하이머 치매 예측 연구를 통해 기존 85.4%보다 향상된 87.3%의 성능을 획득했다. 후속 연구를 통해 시각언어모델(VLM) 기술을 적용하기도 했다.
ETRI 연구진이 노년층 음성 발화 분석 시스템의 인공지능 치매 예측 기술을 설명하고 있는 모습. ETRI 제공 |
해당 기술은 한국전기연구원과 연계해 노인복지센터 등에서 실증할 계획이다.
강병옥 ETRI 복합지능연구실 책임연구원은 "기존 보건소에 직접 방문해 선별검사를 받는 방식에 비해 스마트기기를 통한 대화 기반 검사 방식은 지속적·주기적 모니터링이 가능하다는 장점이 있다"고 말했다.
한편 이번 연구는 국가과학기술연구회(NST) 창의형 융합연구사업 지원을 통해 이뤄졌다. 임효인 기자
중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지