지식나눔

K-fold cross-validaion에 대한 간단한 질문

안녕하세요...제가 간단한 머신러닝 기법으로 estimation을 해야할 일이 생겼습니다. two class classification을 하는 과정인데 odds ratio가 대상 estimate이구요... 해당 data set을 가지고 K-fold cross-validation을 해서 model의 overfit을 방지하는것이 일차 목표이고 결국에는 최종적인 odds ratio값만 계산을 하면되는데요.. 일단 10fold 방법을 쓴다고 할때 먼저 10개로 균등분할한 데이터 set에서 9개를 트레이닝에 사용하고 남은 하나를 테스트해서 accuracy를 측정하는 것까지는 이해가 되었습니다. 이것을 계속 10번 반복해서 평균적인 accuracy를 계산하면 되고 해당 estimate도 역시 그렇게 계산하면 되는 것으로 아는데요... 사실 최종 목적은 가장 적절한 odds ratio에 대한 estimate를 구하는것이므로 cross-validation 을 해서 구한 accuracy는 어떻게 사용되는지 궁금합니다. 혹시 이것으로 ROC curve를 그릴 수 있는 것인지 좀 헷갈리네요.... p.s 이 분야 전공자가 아니라서 전체적인 이해가 부족한 관계로 질문이 좀 모호할 수 있지만 아시는 한도내에서 간단히 답변이나 참고문헌 정보 좀 부탁드립니다...
  • cross validation
  • ROC
  • classification
지식의 출발은 질문, 모든 지식의 완성은 답변! 
각 분야 한인연구자와 현업 전문가분들의 답변을 기다립니다.
답변 0