지식나눔

논문 자료의 통계중에서....

논문 figure에 보면 예를들어, p<0.01 이런 것들이 있는데 유의성을 나타내는 것인가요? 정확히 무슨 의미이죠? 아니면 다른 의미가 있는건인가요?
  • p
지식의 출발은 질문, 모든 지식의 완성은 답변! 
각 분야 한인연구자와 현업 전문가분들의 답변을 기다립니다.
답변 1
  • 답변

    이경우님의 답변

    >논문 figure에 보면 예를들어, p<0.01 이런 것들이 있는데 >유의성을 나타내는 것인가요? 정확히 무슨 의미이죠? >아니면 다른 의미가 있는건인가요? > +++++++++++++++++++++++++++++++++ 아래 내용은 hibrain에서 있는 내용입니다. 질문에 어느 정도 답변이 될 까 합니다. ++++++++++++++++++++++++++++++++++++ 아래에 통계에 대한 질문이 좀 나왔는데요. 다들 아시겠지만, 기본적인 아이디어를 설명해 보려구요. 다 아시는 내용이겠지만, 혹시 도움이 되실지 몰라서요...^^;; 통계적 추정을 어떤 test를 이용하였을때 모든 컴퓨터 소프트웨어들이 테스트 통계치와, p-value를 줍니다. 그러면 우리는 p-value가 적으면, 예를들어 0.05보다 적으면 95%의 확신으로 귀무가설을 기각하게 되지요. 그럼 p-value라는것은 이 표본에 근거해서 실현된 type-I 에러 확률이란것도 많은분들이 아실겁니다. 말하자면 실제로는 귀무가설이 사실 맞는데, 귀무가설을 기각할 확률이란것이지요. 사실 맞는데 맞지 않다는 결론을 내렸으니 실수이지요. 이런 실수를 할 확률이 5% 정도로 적으니 귀무가설을 기각해도 안심이 된다는 것이지요. 이러한 이유의 근거는 처음에 귀무가설이 맞다는 가정에서 출발합니다. 귀무가설이 맞다면... 예?들어 대한민국 고등학교 3학년들의 아이큐 평균이 100이다 라는 귀무가셜이 맞다고 가정하면... 전체의 아이큐 평균이 100인 가상적인 모집단에서 샘플들을 뽑았다고 생각해 보세요. 표본오차라는 것이 있어서, 이렇게 뽑은 샘플들에서 측정한 표본 평균들은 100에 가까운 수치가 나올겁니다. 즉 50명의 샘플들을 10개를 뽑았다. 첫번째 그룹 50명의 아이큐평균은 105, 두번째 50명의 아이큐평균은 97, ... , 열번째 그룹 50명의 아이큐평균은 109 등등이요... 그럼 우리는 이런 50명의 개인으로부터 계산한 평균 아이큐들의 분포를 생각해 볼수 있습니다. 이런 50명의 아이큐 평균으로부터 계산된 평균은 아마도 위에서 가정한 모집단의 평균 100이 될 것입니다. 왜냐햐면 샘플들이 모집단 평균이 100인 곳에서 채취되었으니까요. 그런데, 우리가 지금 한 그룹, 50명의 사람들의 아이큐를 알고 있습니다. 표본평균을 계산해보니 150 이 나왔네요. 만약 모집단의 아이큐평균이 100이라면 우리가 샘플을 그곳으로부터 채취했을때 표본평균이 150이 나올 확률이 얼마나 될까요? 아마도... 예컨대... 3%? 만약 그렇다면 지금 샘플은 우리가 가정한 그 모집단에서 나왔을 가능성이 거의 희박합니다. 이런 희박한 결과를 얻었다면... 우리는 우리의 가정... 모집단의 아이큐평균이 100 이라는것이 사실이 아니라고 의심을 해봐야 겠지요. p-value라는것이 바로 이 확률을 말해줍니다. 모집단의 평균이 우리가 가정한 값과 같다면 (귀무가설), 지금 우리가 가지고 있는 표본 평균이 나올 확률이 얼마나 되나... 이 확률 p-value가 적으면 적을수록 우리는 더욱더 확신을 할수 있습니다. 우리의 표본은 우리가 가정한 모집단에서 나온것이 아니라는 것을... 그래서 우리의 귀무가설을 기각할수 있는 것 이지요.
    >논문 figure에 보면 예를들어, p<0.01 이런 것들이 있는데 >유의성을 나타내는 것인가요? 정확히 무슨 의미이죠? >아니면 다른 의미가 있는건인가요? > +++++++++++++++++++++++++++++++++ 아래 내용은 hibrain에서 있는 내용입니다. 질문에 어느 정도 답변이 될 까 합니다. ++++++++++++++++++++++++++++++++++++ 아래에 통계에 대한 질문이 좀 나왔는데요. 다들 아시겠지만, 기본적인 아이디어를 설명해 보려구요. 다 아시는 내용이겠지만, 혹시 도움이 되실지 몰라서요...^^;; 통계적 추정을 어떤 test를 이용하였을때 모든 컴퓨터 소프트웨어들이 테스트 통계치와, p-value를 줍니다. 그러면 우리는 p-value가 적으면, 예를들어 0.05보다 적으면 95%의 확신으로 귀무가설을 기각하게 되지요. 그럼 p-value라는것은 이 표본에 근거해서 실현된 type-I 에러 확률이란것도 많은분들이 아실겁니다. 말하자면 실제로는 귀무가설이 사실 맞는데, 귀무가설을 기각할 확률이란것이지요. 사실 맞는데 맞지 않다는 결론을 내렸으니 실수이지요. 이런 실수를 할 확률이 5% 정도로 적으니 귀무가설을 기각해도 안심이 된다는 것이지요. 이러한 이유의 근거는 처음에 귀무가설이 맞다는 가정에서 출발합니다. 귀무가설이 맞다면... 예?들어 대한민국 고등학교 3학년들의 아이큐 평균이 100이다 라는 귀무가셜이 맞다고 가정하면... 전체의 아이큐 평균이 100인 가상적인 모집단에서 샘플들을 뽑았다고 생각해 보세요. 표본오차라는 것이 있어서, 이렇게 뽑은 샘플들에서 측정한 표본 평균들은 100에 가까운 수치가 나올겁니다. 즉 50명의 샘플들을 10개를 뽑았다. 첫번째 그룹 50명의 아이큐평균은 105, 두번째 50명의 아이큐평균은 97, ... , 열번째 그룹 50명의 아이큐평균은 109 등등이요... 그럼 우리는 이런 50명의 개인으로부터 계산한 평균 아이큐들의 분포를 생각해 볼수 있습니다. 이런 50명의 아이큐 평균으로부터 계산된 평균은 아마도 위에서 가정한 모집단의 평균 100이 될 것입니다. 왜냐햐면 샘플들이 모집단 평균이 100인 곳에서 채취되었으니까요. 그런데, 우리가 지금 한 그룹, 50명의 사람들의 아이큐를 알고 있습니다. 표본평균을 계산해보니 150 이 나왔네요. 만약 모집단의 아이큐평균이 100이라면 우리가 샘플을 그곳으로부터 채취했을때 표본평균이 150이 나올 확률이 얼마나 될까요? 아마도... 예컨대... 3%? 만약 그렇다면 지금 샘플은 우리가 가정한 그 모집단에서 나왔을 가능성이 거의 희박합니다. 이런 희박한 결과를 얻었다면... 우리는 우리의 가정... 모집단의 아이큐평균이 100 이라는것이 사실이 아니라고 의심을 해봐야 겠지요. p-value라는것이 바로 이 확률을 말해줍니다. 모집단의 평균이 우리가 가정한 값과 같다면 (귀무가설), 지금 우리가 가지고 있는 표본 평균이 나올 확률이 얼마나 되나... 이 확률 p-value가 적으면 적을수록 우리는 더욱더 확신을 할수 있습니다. 우리의 표본은 우리가 가정한 모집단에서 나온것이 아니라는 것을... 그래서 우리의 귀무가설을 기각할수 있는 것 이지요.
    등록된 댓글이 없습니다.