한국전자통신연구원(ETRI)은 콜센터 녹취 데이터 음성인식 엔진인 '자연어 음성인식 소프트웨어'를 개발, 상용화에 나섰다고 22일 밝혔다.
현재 콜센터의 고객 음성DB는 데이터센터에 저장하는 형태로, 고객과의 분쟁, 사고 때에만 활용되는 상황이다.
하지만 이번에 개발된 기술은 콜센터에 고객 음성을 실시간 텍스트로 변환해 고객의 음성DB를 저장, 빅데이터 분석이 가능하다는 게 연구진의 설명이다.
콜센터로서는 녹취된 고객의 음성 데이터 분석을 통해 경영 전반에 반영할 수 있어 자료의 중요성이 날로 부각되고 있다. 고객의 연령, 성별에 따른 관심분야는 물론 고객 성향까지 파악이 가능한 만큼 기업의 경영전략 수립, 고객 마케팅, 고객 분쟁 감소 등에 활용할 수 있기 때문이다. 최근 금융권에서도 상담원과 고객 음성 데이터를 자동으로 음성인식 처리하는 기술이 본격 검토되고 있다.
이번에 개발된 기술의 핵심은 '자연어 음성인식 및 핵심어 검출기술'로 자연스럽게 발성한 음성을 인식, 문자로 변화하거나 특정 단어를 자동 추출하는 것으로 콜센터 발화특성에 최적화돼 있다.
다만, 아직은 콜센터 녹취 데이터와 같은 대화체 음성의 비정형 특성 탓에 인식 성공률이 70~80% 수준이어서 추가 기술개발이 필요하다.
ETRI 이윤근 자동통역인공지능연구센터장은 “외국산 제품은 영어 등 주요국가 언어를 분석 대상으로 하고 있기 때문에 독특한 우리말과 글을 인식하는데 한계가 있고, 유지보수에 많은 비용이 소요되는 것은 물론 자료의 해외 유출 문제도 우려된다”며 “아직 추가기술 개발이 필요하지만 외국산과 비교 테스트에서 10% 이상 우수한 성능 결과를 얻어 관련 기업에 기술이전을 통한 상용화가 추진되고 있다”고 말했다.
한편 이 기술은 모바일 플랫폼 기반 대화 모델 적용 자연어 음성 인터페이스 기술개발 사업으로 추진됐으며 특허 6건, 논문 10편, 기술이전 6건이 완료됐다.
이영록 기자 idolnamba2002@
중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지