동향

미래를 지향하는 유럽의 통계: UNECE의 연구 동향을 중심으로

분야

과학기술과 인문사회,정보/통신

발행기관

소프트웨어정책연구소

발행일

2021.06.14

URL


국가통계란 국가통계 제도를 통해 배포되는 통계를 의미한다. 국민에게 익숙한 국가통계는 국가통계포털(KOSIS)을 통해 쉽게 검색 및 참조할 수 있는 데이터들인데, 국가를 구성하는 산업, 일자리, 경제 등 거시적인 현황 지표가 주를 이룬다. 그러므로 개인 또는 개별 기업의 영리 목적보다는 국가단위의 사회적 이슈 및 실태를 진단하거나 통계 추이를 분석하는 등의 비영리적인 목적으로 활용된다.

이와 같은 국가통계 상당수는 모집단을 대상으로 한 설문조사에 의해 생산된다. 1948년 12월「제 1회 총인구조사 시행령」이 공포된 이후 현재에 이르기까지, 주된 통계작성 기법으로 활용되고 있는 설문조사는 그간 수많은 시행착오 및 고도화를 거치며 정교하고 표준화된 틀을 구축하였다. 국가통계의 작성 절차, 품질 진단, 표준 양식 등 많은 통계 작성 기준이 설문조사 방법론에 기반 하였음에도 현재까지 큰 논란이 없던 것은 이와 같은 맥락에서 설명된다.

 

그러나 최근 들어 설문조사의 강력한 대안이 고려되고 있다. 바로 기계학습이다. 국내외를 불문하고 국가통계 조사의 회수율 악화에 따른 정확도 하락, 높은 비용 등이 문제로 제기되자 인공지능 기술 도입을 통해 돌파구를 모색하려는 시도다. 이러한 논리는 기계학습이 기존 통계의 역할을 대체할 수 있음이 전제되어야만 하므로, 인공지능 기술이 재조명받기 시작한 이래 현재까지 지속적인 논의가 진행되고 있다. 2018년 네이처2가 통계와 기계학습 기법 간 갭(Gap)이 모호해지고 있음을 소개한 칼럼3이나, UN이 국가통계의 기계학습 활용에 관해 방법론적인 견해를 밝힌 보고서4 등은 이와 같은 논의의 대표적인 사례다.
 

이처럼 국제적인 관심사임에도 불구하고 국가통계가 공공재의 성격을 가지며 데이터에 관한 높은 품질을 요구하다보니 실제 도입은 아직 요원한 실정이다. 가령 국가통계에 기계학습 기술이 도입되기 위해서는 상기 언급한 설문조사 기반의 통계 작성 기준 전반의 수정이 불가피하다. 특히나 인공지능을 포함한 데이터 과학 이론의 경우 연역적인 절차에 의한 신뢰성 확보가 아닌 결과의 정확도에 근거한 신뢰성을 담보하는 방법론5으로서, 기존 사회조사방법론의 보편적 절차에 포용되기 어렵다. 이러한 문제들은 현시점에서 도입을 가로막는 병목(bottleneck)으로 작용하고 있다.
 

2021년 현재, 관련 이슈를 선도하고 병목을 해소하는데 실질적인 연구를 수행하는 기관은 단연 UNECE로 보인다. UN의 유럽 경제 위원회인 이곳은 국가통계의 현대화(modernization)의 방법으로 기계학습 도입을 고려한다. 그들은 유럽 국가의 통계분야 리더들을 주축으로 고위급 그룹(HLG-MOS)6을 결성하고 EU 23개국, 33개 국가 기관 및 4개 국제기관의 연구진이 모여 국가통계에 기계학습을 도입하기 위한 연구협력을 추진 중에 있다.
 

본고는 UNECE가 중심이 되어 추진 중인「국가통계를 위한 기계학습」프로젝트의 그간의 연구 결과 및 진행 현황을 간략히 소개해봄으로써, 해당 이슈에 관한 유럽의 입장을 들여다본다. 또한 국내 통계청의 관련 이슈에 관한 움직임을 짚어보고 향후 시사점을 진단해본다.


<목차>
국가통계(National Statistics) 분야에서의 기계학습
「국가통계를 위한 기계학습」프로젝트 추진 현황
「국가통계를 위한 기계학습」시범 연구의 성과 및 시사점
「국가통계를 위한 기계학습」기계학습 기술을 수용하기 위한 요소
「국가통계를 위한 기계학습」기계학습 기술 도입을 촉진하기 위한 요소
「국가통계를 위한 기계학습」2021년 연구 방향
한국의 통계 체계 개편 현황과 시사점

출처 : 소프트웨어정책연구소 산업동향
자세한 내용은 첨부파일을 참고하여 주시기 바랍니다.
 


리포트 평점  
해당 콘텐츠에 대한 회원님의 소중한 평가를 부탁드립니다.
0.0 (0개의 평가)
평가하기
등록된 댓글이 없습니다.