동향

인공지능의 양자화기술

인공지능, 특히 딥러닝 모델에서의 양자화(quantization)는 딥러닝 모델을 더 빠르고 더 낮은 메모리 요구 사항으로 실행할 수 있는 저렴하고 쉬운 방법입니다.
딥러닝의 양자화는 정보 압축에 기초를 두고 있습니다. 딥러닝에서는 가중치(모델 파라미터) 및/또는 활성화(activation)의 수치적 정밀도를 줄이는 것을 의미합니다. 모델을 양자화하면 메모리가 작아지고, 소비전력이 줄어듭니다.
이 보고서에서 딥 러닝에서 양자화의 기초원리에 대해 설명하고 각 기술이 실제로 어떻게 실행되는 지 살펴볼 것입니다.