동향

model compression (인공지능 알고리듬의 소형화 기술)

최근 10년가까이 딥러닝(deep learning)분야에서 수많은 모델들이 개발되어 왔다. 이 모델들은 대부분 모델 예측의 정확성만을 높이는 데 노력해 왔기 때문에, 모델의 크기가 무척이나 크다. 이 모델들을 데이터 센터의 서버에서 실행시키는 데에는 아무런 문제가 없지만, 이것을 엣지 디바이스(edge device)에서 실행시키는 데에는 문제가 있다. 이를 해결하기 위해서 기존에 개발된 모델을 작게 만드는 model compression 또는 신경망 압축(Neural network pruning)기술이 주목받고 있다. 본 보고서에는 model compression의 전반적인 기술 동향 및 원리에 대해서 살펴보고자 한다.