동향

딥러닝 기반 광학 문자 인식 기술 동향

분야

정보/통신

발행기관

한국전자통신연구원

발행일

2022.10.01


딥러닝 기반 광학 문자 인식 기술 동향 
Recent Trends in Deep Learning-Based Optical Character Recognition

민기현    (G. Min, ghmin@etri.re.kr)                                  광ICT융합연구실 선임연구원
이아람    (A. Lee, al246@etri.re.kr)                                       광ICT융합연구실 연구원
김거식    (K.S. Kim, keosikis@etri.re.kr)                       광ICT융합연구실 책임연구원
김정은    (J.E. Kim, j.kim@etri.re.kr)                                     광ICT융합연구실 선임연구원
강현서    (H.S. Kang, hskang87@etri.re.kr)           광ICT융합연구실 책임연구원/실장
이길행    (G.H. Lee, ghlee@etri.re.kr)                               호남권연구센터 책임연구원/센터장

ABSTRACT
Optical character recognition is a primary technology required in different fields, including digitizing archival documents, industrial automation, automatic driving, video analytics, medicine, and financial institution, among others. It was created in 1928 using pattern matching, but with the advent of artificial intelligence, it has since evolved into a high-performance character recognition technology. Recently, methods for detecting curved text and characters existing in a complicated background are being studied. Additionally, deep learning models are being developed in a way to recognize texts in various orientations and resolutions, perspective distortion, illumination reflection and partially occluded text, complex font characters, and special characters and artistic text among others. This report reviews the recent deep learning-based text detection and recognition methods and their various applications. 

KEYWORDS 광학 문자 인식, 딥러닝 문자 검출, 딥러닝 문자 인식, 인공지능

광학 문자 인식(OCR: Optical Character Recognition) 은 사람이 쓰거나 인쇄한 문서, 촬영된 사진이나 스 캔된 이미지 내의 문자를
인식하여 기계가 읽고 편 집할 수 있는 디지털 텍스트로 변환하는 기술을 의 미한다. 이것은 법률, 금융, 우편, 병원 등 기록 자료가 있는
모든 분야에서 아날로그 기록문서의 디지 털화를 위해 요구하는 핵심 기술로서 로보틱스, 산 업 자동화, 이미지 탐색, 자동 번역, 자율주행,
스포 츠 비디오 분석 등 컴퓨터 비전 기반 응용 분야의 주 요 기술이다[1]. 현재 문자 인식률과 인식속도의 획기적인 증가는 해당 기술 시장의 급속한 성장을 이끌고 있다. 특히 코로나19의 장기화로 인한
온라인 콘텐츠 및 스트 리밍 서비스 이용률이 증가하고 있는 가운데 도서 시장의 디지털 전환이 가속화되고 있으며, 비대면 서비스의 확장으로
문자인식 기술의 활용분야는 더 욱 확장될 것이다. Allied Market Research에 따르면 글로벌 광학 문 자 인식 시장은 2021년부터 2028년까지 연평균 16.7% 성장이 전망된다.
그중 북미 시장은 2025년 에 8,519백만 달러로 가장 큰 시장을 차지할 것으로 예상되며, 아시아-태평양 시장은 6,023백만 달러로
가장 큰 연평균 성장률(28.8%, ’17년~’25년)을 보일 것으로 전망된다[2]. 현재 OCR 기술은 인쇄본과 같이 정형화된 서류 문자들에 대해 높은 인식률을 보이고 있지만, 정형 화되지 않은 서류, 손글씨,
일상 이미지 내 문자 등 의 다양한 크기와 방향성을 가진 문자, 캡쳐 각도, 위치, 초점, 화질, 음영 등의 외적 요인에 의해 변형된 문자,
부분적으로 훼손된 문자의 텍스트화를 위 한 딥러닝 OCR 기술 개발이 진행되고 있다.
본고에 서는 딥러닝 기반 OCR 모델, 연구개발 동향 및 응 용 분야 등을 살펴보고, 향후 발전 방향을 검토하고 자 한다.

리포트 평점  
해당 콘텐츠에 대한 회원님의 소중한 평가를 부탁드립니다.
0.0 (0개의 평가)
평가하기
등록된 댓글이 없습니다.