동향

딥러닝 기반 객체 인식 기술 동향

분야

전기/전자

발행기관

이진수, 이상광, 김대욱, 홍승진, 양성일

URL


사람은 해야 할 일을 컴퓨터를 이용하여 처리함으로써 많은 편의를 얻고자 해왔다. 특히 객체 인식은 사람이 가장 많은 정보를 받아들이는 시각정보를 컴퓨터가 대신하여 분석하고 해석할 수 있도록 하는 연구 분야이다. 이는 영상 감시, 얼굴 인식, 로봇 제어, IoT, 자율 주행, 제조업, 보안 등에 활용됨으로써 산업 전반에서 빠질 수 없는 핵심기술로 사용되고 있다. 이러한 중요성을 인지하여 객체 인식 분야의 연구자들은 PASCAL, ImagNet, 그리고 최근 MS COCO 에 이르기까지 객체 인식 관련 대회를 개최하여 이 분야의 발전을 도모 하고 있다.

과거의 객체 인식 연구는 SIFT(Scale Invariant Feature Transform), SURF(Speeded-Up Robust Features), Haar, HOG(Histogram of Oriented Gradients) 등과 같이 객체가 가지는 특징을 설계하고 검출함으로써 객체를 찾아내는 방식으로 진행되었다. 예를 들면 책의 경우, 영상에서 사다리꼴 형태로 나타나고 꼭짓점에서는 각이 생기며 두께가 어느 정도 있다는 특징이 있으므로, 이러한 정보를 어떻게 설계 및 검출 할 것인가에 다양한 방법들이 연구된 것이다. 그 후 DPM(Deformable Part-based Model)에서는 물체를 여러 부분으로 나누어 특징 정보를 구성하고, 각 부분의 유동적인 구조를 SVM(Soppot Vector Mach-ine)과 같은 기계학습 방법을 연결함으로써 객체인식 성능을 높였다.

하지만 합성곱 신경망(CNN: Convolutional Neural Network)이 ImageNet 2012 대회에서 기존 방식의 성능을 압도적으로 뛰어넘는 결과를 보여주면서, 딥러닝을 이용한 객체 인식 방법이 학계의 주목을 받고 주류가 되었다. CNN은 LeCun 교수의 필기체 숫자 인식에서 처음 등장하였는데, 기존의 신경망에서는 픽셀 주위의 지역적인 정보를 표현하지 못했으나 합성곱 연산을 도입함으로써 이를 극복하였다. 그후, CNN의 인식률을 향상시키기 위해 네트워크를 더 깊게 구성하는 방식으로 연구가 진행되었으며, ZFNet, VGG, ResNet, GoogLeNet, DenseNet 등이 등장 하였다. 본고에서는 이러한 네트워크의 발전 동향을 다룰 것이다. 

출처 - 한국전자통신연구원
 

리포트 평점  
해당 콘텐츠에 대한 회원님의 소중한 평가를 부탁드립니다.
0.0 (0개의 평가)
평가하기
등록된 댓글이 없습니다.