국내연구진이 한국어ㆍ영어ㆍ일본어ㆍ중국어 등 9개 언어를 음성인식하는 기술을 개발했다.
18일 ETRI(한국전자통신연구원)에 따르면, 인공지능의 한 분야인 딥러닝 기술을 바탕으로 대용량 데이터를 이용해 사람들의 일상대화에서 언어별로 최대 95% 수준의 성능을 보이는 기술을 개발했다.
최근 음성인식 기술을 스마트 가전, 인공지능 검색, 인공지능 뱅킹 등에 활용하기 위한 시도가 곳곳에서 활발히 진행 중이다.
그러나 인식률이 생각보다 높지 않아, 기기를 직접 제어하는 것보다 불편하다는 한계가 있다.
연구팀은 인공지능 학습 방식인 딥러닝 기술, 대용량 데이터 자동 정제기술, 다국어 발음 생성기술 등 다국어 음성언어처리 기술을 모두 적용해 음성인식기를 개발했다.
9개 이상의 국어를 인식하는 기기가 개발된 것은 이번이 처음이다.
구글과 비교하면 한국어 인식률은 96%로 우위에 있고, 다른 언어에 대한 인식률은 90∼95% 정도로 비슷한 수준이라고 ETRI는 설명했다.
앞으로 통역 서비스, 인공지능 비서, 방송 자막화, 콜센터 서비스 등에 활용할 수 있을 것으로 기대된다.
ETRI는 내년 평창 동계올림픽 기간에 자체 개발한 자동통역 애플리케이션 ‘지니톡(Genie Talk)’에 9개 언어 음성인식 기술을 적용할 예정이다.
ETRI 김상훈 박사는 “국내 이동통신업체와 기술 이전을 논의 중”이라며 “앞으로 동남아어, 힌디어 등 다른 언어로도 서비스를 확대할 계획”이라고 말했다. 최소망 기자 somangchoi@
중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지