동향

비지도 학습 기반 빅데이터 라벨링 기술 동향

분야

정보/통신

발행기관

정보통신기획평가원

발행일

2021.03.03

URL


라벨링된 학습 데이터는 기계학습의 발전을 가속화하는 요인이자 때로는 저해 요인이 되기도 한다. 학습 세트 구축을 위해서 비용과 노력이 소요되기 때문이다. 학습 데이터 세트를 구축하여도 데이터의 보안성 때문에 외부로 반출하기 위해서는 대가를 지불해야 하는 경우도 많다. 이러한 문제를 해결하기 위해 최근 소규모의 라벨 데이터를 가공해서 전체 라벨을 확충하거나, 센서나 컴퓨터에서 수집되는 데이터를 프로그램 방식을 통해 전문가의 도움 없이 라벨링하는 기술이 제안되고 있다. 본 고에서는 약지도(weak supervision) 학습과 반지도(semi supervision) 학습 등 비지도 학습 방법에 기반한 데이터 라벨링 동향과 사례에 대해 살펴본다. 약지도 학습을 위한 대표적인 오픈소스인 스노클(Snorkel)을 살펴보고, 향후 비지도 학습기반 데이터 라벨링이 해결해야 할 과제도 언급함으로써 비지도 학습 기반 데이터 라벨링 기술들에 대한 이해를 돕고자 한다.

<목차>
Ⅰ. 서론
Ⅱ. 비지도 학습을 통한 라벨 생성 방법들
Ⅲ. 약지도 학습 기법과 사례
Ⅳ. 반지도 학습 기법과 사례
Ⅴ. 결론

* 출처 : ITFIND 
주간기술동향 1986호
* 자세한 내용은 첨부된 파일을 참고하여 주시기 바랍니다.
 

리포트 평점  
해당 콘텐츠에 대한 회원님의 소중한 평가를 부탁드립니다.
0.0 (0개의 평가)
평가하기
등록된 댓글이 없습니다.