논문 대표 그림. |
DICE Lab 연구팀의 임상훈 박사과정 학생과 오흥선 교수는 'Hierarchical Text Classification As Sub-Hierarchy Sequence Generation(부분 계층 시퀀스 생성으로서의 계층적 문서 분류)'라는 주제로 논문을 구두 발표키로 했다.
연구팀은 대규모 계층적 문서 분류(Large-scale Hierarchical Text Classification)에서 발생하는 파라미터 증가 문제를 해결하기 위해 분류 작업을 부분 계층 시퀀스 생성(Sub-hierarchy Sequence Generation) 문제로 변환하는 방법을 개발했다.
기존 대규모 계층적 문서 분류에서 딥러닝 모델의 파라미터 수가 계층에 종속적이기 때문에 계층 크기가 증가함에 따라 기하급수적으로 증가하는 문제가 발생한다.
연구팀은 문서의 레이블을 파스 트리(parse tree) 형태의 부분 계층 시퀀스로 표현하는 방법과 이를 디코딩하기 위한 HiDEC 모델을 제안해 그 성과를 인정받았다.
이번 연구 결과는 대규모 계층적 문서 분류에서 기존 모델 대비 295배 적은 파라미터를 통해 더 높은 성능을 달성할 수 있게 했다.
연구책임자인 오흥선 교수는 "상품, 뉴스, 도서 분류 등 실생활에서 직면한 대규모 계층 분류 문제를 효율적이고 효과적으로 해결해 지식 구조의 세분화에 한 발 더 다가갈 수 있는 연구 결과로 생각된다"고 말했다.
한편, AAAI 2023에는 총 8777편의 논문이 제출됐으며 엄정한 심사를 거쳐 1721편이 선정됐고 이 중 1031편만이 구두 발표 대상이다.
천안=하재원 기자
중도일보(www.joongdo.co.kr), 무단전재 및 수집, 재배포 금지