인하대 컴퓨터 비전·영상처리 연구실 소속 김성호 석사과정생(좌측)과 지도교수인 송병철 전기컴퓨터공학과 교수/제공=인하대 |
김성호 학생은 참조 신원 영상에 의한 감정 편향 문제와 프레임별 감정 세기의 포화 문제를 완화할 수 있는 방법을 새롭게 제시했다.
이는 신원 정보 분리 기술과 연속적인 감정 인식 기술을 생성 연구에 접목시켰다는 점에서 기대를 모으고 있다. 또한 음성 신호만을 이용해 알고리즘을 개발했다는 점에서 기존 연구와 차별성을 보이고 있다.
김성호 학생은 이 같은 내용이 담긴 '필요한 건 목소리뿐: 감정적 얼굴 표현을 위한 오디오 관점의 감정적 대화 얼굴 생성'(All You Need is Your Voice: Emotional Face Representation with Audio Perspective for Emotional Talking Face Generation) 논문의 제1저자로 이름을 올렸다. 그는 오는 9월 29일부터 10월 4일까지 열리는 '유럽 컴퓨터 비전 학술대회(European Conference on Computer Vision·ECCV)'에서 논문을 발표할 예정이다.
ECCV는 국제 컴퓨터 비전·패턴 인식 학술대회(CVPR), 국제 컴퓨터 비전학회 학술대회(ICCV)와 함께 세계 3대 컴퓨터비전 학술대회로 손꼽힌다. 올해 ECCV엔 총 8천585편의 논문이 제출됐고, 이 중 27.9%인 2천395편만 발표 대상 논문으로 선정됐다.
인하대 컴퓨터 비전·영상처리 연구실은 최근 5년 동안 인공지능 분야 최고 권위의 학술대회에 연평균 2편의 논문을 발표하는 등 인공지능 분야 연구를 선도하고 있다.
송병철 교수는 "최근 큰 주목을 받고 있는 생성형 인공지능 분야에서 의미 있는 성과를 내 만족스럽다"며 "석사과정생이 주 저자로 ECCV 같은 최고 권위 학술대회에 논문을 발표하는 게 쉽지 않은데, 이번 연구 성과는 음성 신호를 이용한 감정 동영상 생성기술 분야 발전에 중요한 역할을 할 것"이라고 말했다. 인천=주관철 기자 orca2424002@
중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지