환경 과학 및 공학 연구를 위한 데이터 분석 방법론
2021-11-07
org.kosen.entty.User@46905195
문철환(highmoon)
데이터 과학은 컴퓨터 과학, 정보과학, 수학, 통계학을 통합하는 복합 학문으로 최근 들어 빠르게 성장하고 있다. 데이터 과학은 정보를 추출하는 과정과 의사결정을 할 수 있도록 추출된 정보에서 유의미한 결과를 추론해내는 과정으로 구성된다. 현대 사회는 무수히 많은 데이터가 발생하고 있고, 이들을 저장하고 분석할 수 있는 자원이 충분하며, 많은 양의 데이터를 효율적으로 분석할 수 있는 알고리즘이 존재한다.
기계학습(machine learning)은 데이터에 숨겨져 있는 의미를 찾거나 예지모델 구축에 사용될 수 있는 알고리즘과 방법론을 포함하고 있는 새로운 과학분야 중 하나이다. 기계학습을 이용하면 많고 복잡한 데이터를 효과적으로 분석할 수 있다. 환경 과학 및 공학(environmental science and engineering; ESE) 분야 또한 이의 적용으로 다양한 데이터의 분석이 가능 해졌다. ESE 분야는 대기, 수질, 토양, 폐기물 등과 같은 다양한 매체를 연구하기 위해 여러 형태의 시공간적 데이터를 필요로 하며, 새로운 오염물질을 검출하고 오염물질의 분포를 지속적으로 모니터링 한 정보를 데이터로 축적하고 있다. 향후에는 분석 기술의 발달로 데이터 양이 더욱 많아지고 형태도 다양해질 것으로 전망된다.
이렇게 다양하고 많은 양의 데이터를 해석하기 위해서는 기계학습 기법의 적절한 적용이 필요하다. 본 리포트에서는 ESE 분야에 적용이 가능한 데이터 분석 방법론에 대해 서술하고자 한다. 우선 일반적인 데이터 분석 방법론에 대해 설명한 후 ESE 분야에 적용할 수 있는 기계학습에 대해 검토하고자 한다. 결론에서는 ESE 분야에 기계학습 기법을 활발하게 적용하기 위해 어떤 노력이 필요한지에 대해 제시하고자 한다.
기계학습(machine learning)은 데이터에 숨겨져 있는 의미를 찾거나 예지모델 구축에 사용될 수 있는 알고리즘과 방법론을 포함하고 있는 새로운 과학분야 중 하나이다. 기계학습을 이용하면 많고 복잡한 데이터를 효과적으로 분석할 수 있다. 환경 과학 및 공학(environmental science and engineering; ESE) 분야 또한 이의 적용으로 다양한 데이터의 분석이 가능 해졌다. ESE 분야는 대기, 수질, 토양, 폐기물 등과 같은 다양한 매체를 연구하기 위해 여러 형태의 시공간적 데이터를 필요로 하며, 새로운 오염물질을 검출하고 오염물질의 분포를 지속적으로 모니터링 한 정보를 데이터로 축적하고 있다. 향후에는 분석 기술의 발달로 데이터 양이 더욱 많아지고 형태도 다양해질 것으로 전망된다.
이렇게 다양하고 많은 양의 데이터를 해석하기 위해서는 기계학습 기법의 적절한 적용이 필요하다. 본 리포트에서는 ESE 분야에 적용이 가능한 데이터 분석 방법론에 대해 서술하고자 한다. 우선 일반적인 데이터 분석 방법론에 대해 설명한 후 ESE 분야에 적용할 수 있는 기계학습에 대해 검토하고자 한다. 결론에서는 ESE 분야에 기계학습 기법을 활발하게 적용하기 위해 어떤 노력이 필요한지에 대해 제시하고자 한다.