지식나눔

Student's T test 질문입니다.

안녕하세요... 논문을 보다가 Student's T test 보게 되었습니다.. 통계에 대해서는 옛날 정석책 수준이라 하나도 모르겠어요.. 중학생을 가르치신다고 생각하시고 가르쳐 주세요.. 감사합니다.
  • Student''s T test
지식의 출발은 질문, 모든 지식의 완성은 답변! 
각 분야 한인연구자와 현업 전문가분들의 답변을 기다립니다.
답변 3
  • 답변

    이상후님의 답변

    >안녕하세요... > >논문을 보다가 Student's T test 보게 되었습니다.. > >통계에 대해서는 옛날 정석책 수준이라 하나도 모르겠어요.. > >중학생을 가르치신다고 생각하시고 가르쳐 주세요.. > > >감사합니다. 고등학교때 배우신 통계부분을 이해하시면 될 것으로 생각됩니다. 간략히 말씀드리면, 정규분포의 모집단을 특정 표본집단으로 나타낼 수 있다는 가설을 검정하는 통계학 방법으로서, t-test에서 닮음지표는 평균값들의 차(평균오차)와 표본평균(평균의 표준오차)에 대한 불확실도의 측정값에 의해 계산된 비율 t입니다. 관찰값 t가 통계값 t(표로 작성된 확률값)보다 크면 가설은 기각된다. t의 통계값은 첫째, 표본의 독립변수 개수와 추정하고자 하는 변수 개수의 차이(자유도), 둘째, 실험자가 옳은 가설을 기각하려는 의지(유의수준)에 따라 선택됩니다. 예를들면, 한 실험자가 평균 ω가 75인 모집단을 평균 x가 79, 표준편차 s가 10, 크기 n이 26인 표본으로 나타낼 수 있다고 가정하고 이를 검정할 경우에, 공식을 이용하면, 0.05의 유의수준에서 통계값 t는 2.06이다. 따라서 가설은 채택되고 표본은 모집단을 대표하게 됩니다. t분포는 자유도에 따라 특정한 곡선이 정해지는 곡선족이고,t의 돗수분포는 t값과 표본크기로부터 계산되며,표본크기가 증가하면, t분포는 정규분포에 가까워지고,표본크기가 30이 넘으면 보통 정규분포로 간주하게 됩니다.
    >안녕하세요... > >논문을 보다가 Student's T test 보게 되었습니다.. > >통계에 대해서는 옛날 정석책 수준이라 하나도 모르겠어요.. > >중학생을 가르치신다고 생각하시고 가르쳐 주세요.. > > >감사합니다. 고등학교때 배우신 통계부분을 이해하시면 될 것으로 생각됩니다. 간략히 말씀드리면, 정규분포의 모집단을 특정 표본집단으로 나타낼 수 있다는 가설을 검정하는 통계학 방법으로서, t-test에서 닮음지표는 평균값들의 차(평균오차)와 표본평균(평균의 표준오차)에 대한 불확실도의 측정값에 의해 계산된 비율 t입니다. 관찰값 t가 통계값 t(표로 작성된 확률값)보다 크면 가설은 기각된다. t의 통계값은 첫째, 표본의 독립변수 개수와 추정하고자 하는 변수 개수의 차이(자유도), 둘째, 실험자가 옳은 가설을 기각하려는 의지(유의수준)에 따라 선택됩니다. 예를들면, 한 실험자가 평균 ω가 75인 모집단을 평균 x가 79, 표준편차 s가 10, 크기 n이 26인 표본으로 나타낼 수 있다고 가정하고 이를 검정할 경우에, 공식을 이용하면, 0.05의 유의수준에서 통계값 t는 2.06이다. 따라서 가설은 채택되고 표본은 모집단을 대표하게 됩니다. t분포는 자유도에 따라 특정한 곡선이 정해지는 곡선족이고,t의 돗수분포는 t값과 표본크기로부터 계산되며,표본크기가 증가하면, t분포는 정규분포에 가까워지고,표본크기가 30이 넘으면 보통 정규분포로 간주하게 됩니다.
    등록된 댓글이 없습니다.
  • 답변

    이응신님의 답변

    '학생'이라는 말에 현혹이 되면 안되겠지요? 유명한 통계학자가 자신의 검증 방법을 익명인 모학생이라고 발표하여서 student라는 말이 붙었다고 합니다. 아마 통계책에 다 나와있을 겁니다. T-test는 본질적으로 두 집단의 평균값의 차이가 진짜로 통계적으로 차이가 있느냐를 검정하는 통계처리 방법입니다. 정규분포라는 말을 들어보셨을텐데... 왜 정규분포를 이루고 있는가를 따져보면 쉽게 정규분포가 통계에서 중요한 역할을 하는지 짐작할 수 있을 것입니다. 입자나 개체수가 어떤 연관성이 있으면서 3개 이상일 때는 물리적으로 기술이 불가능합니다. 이럴 때는 할 수 없이 물리적인 특성은 포기하고 화학적인 성질을 알아서 기술하는 방법밖에 없습니다. (물리에서 3체 문제라고 해서 아직 해결이 되지 않은 문제입니다) 화학적인 성질을 알아낼수도 있으나 다른 성질을 가지고 연관성을 따지는 것이 더 합리적일때가 많습니다. 이럴 때 사용할 수 있는 방법이 통계적인 방법입니다. 중고교에서 치루는 시험을 생각해봅시다. 35명의 한 학급에서 수학성적이 나왔다고 하면 그 학급의 수학에 대한 이해도를 어떻게 평가해야 할까요? 35명의 성적을 가지고 도무지 알아낼 방법이 없습니다. 흔히 평균값이라는 대표값을 사용하지만 곰곰히 생각해보면 왜 평균값이 그 학급의 수학성적을 나타내는가에 대한 답이 나올 것입니다. 평균값은 학급의 수학 이해도를 평가하는 아주 좋은 대표값입니다. (대표값은 여러 종류가 많습니다. 평균값이 그래도 가장 합리적인 대표값이라고 할 수 있지요) 평균값이란 한 학급의 수학성적을 더해서 모든 구성원 35명에게 골고루 나누어 한 사람의 수학 이해도가 어떻게 배당이 되는가를 통계적으로 처리한 것입니다. 한 사람은 100점, 다른 사람은 60점을 받았다면 각각의 사람은 '평균' 80점으로, 80점을 두 사람이 공평하게 나누는 통계치입니다. (시험이라는 공통적인 환경에서 개별적인 점수가 나왔을 때 나온 점수들이 얼마나 서로 연관성이 있느냐를 따지는 것이 통계치입니다) 만약 한 사람은 90점, 다른 사람은 70점을 받았다면 평균값은 80점입니다. 그러나 앞의 경우와 비교해보면 평균값에 더 가까이 몰려있으므로 두 사람이 모두 '잘 한다'고 할 수 있습니다. 앞의 경우는 점수차가 많을 때 두 사람 중 한 사람을 골라서 잘한다고 결론을 내리면 틀릴 확률이 매우 높습니다. 이런 것을 여러 명으로 확대한 것이 유의수준에 따른 가정의 기각 정도라고 할 수 있습니다. 이제 정규분포(또는 정상분포)를 따져봅시다. 35명의 대표값을 평균값이라고 하면 그 학급의 수학 이해도라고 할 수있는 평균값에서 각각의 학생들이 받은 점수를 빼보면 오차가 존재할 것입니다. 그래서 평균값에서 각 학생의 점수를 뺀 오차를 모아보면 '틀림없이' 작은 오차와 큰 오차가 존재하며 작은 오차는 많고, 큰 오차는 적다는 것을 발견할 수 있을 것입니다.(당연히 평균값을 모르거나 없다면 오차들의 분포를 알 수 없지요) 오차들을 보면 평균과 가까운 오차는 많고 먼 오차는 적기 때문에 학생수가 많다면 틀림없이 정상분포라는 종모양을 이루고 있을 것입니다.(통계학에서는 대략 20개만 넘으면 정상분포를 이루고 있다고 가정해도 맞다고 합니다. 10개 이하를 다룰 때는 특별한 통계처리 방법이 있습니다) 오차 분포는 정상 분포를 이루지만 점수가 들쑥날쑥한 학급과 평균값에 소복히 모여있는 학급이 있습니다. 이렇게 평균값에서 떨어진 정도의 합을 나타내는 통계변수가 '분산'이라고 합니다. 분산이 크면 평균값에서 들쑥날쑥한 정도가 심하고 분산이 적으면 평균값에 몰려있겠지요. (편차, 또는 표준편차도 비슷한 개념) 이제 본론으로 들어와서 두 학급의 평균을 비교할 때 한 학급은 82점, 다른 학급은 85점이라고 할 때 대표값인 평균값에 따른 두 학급의 수학 이해도는 85점의 평균값을 가진 학급이 더 낫다고 할 수 있습니다. 여기까지는 아무런 문제가 없습니다. 그러나 문제는 어디에서 생기느냐면.... 학급에서 10명을 뽑아서 두 학급의 성적이라고 가정하고 앞에서 보았던 85점을 받은 학급에서 뽑은 10명의 성적 평균이 82점을 받은 학급의 학생들보다 성적(평균값)이 더 낫다고 하면 틀릴 가능성이 얼마나 되는가를 생각해봐야 합니다. 만약 85점을 받은 학급의 성적이 들쑥날쑥한 정도가 크다면 잘못 결론을 내릴 확률이 높습니다. 그렇다면 몇명을 뽑아서 비교를 할 때 틀릴 확률이 적을까를 고민해야 합니다. 이렇게 하는 방법이 유의수준에서 가정이 기각되었느냐 아니냐를 판단하는 것입니다. T-test는 두 집단의 평균값이 정말로 차이가 있는냐를 따지는 통계처리 방법입니다. 분산까지 고려해서 두 집단의 평균값이 차이가 있을 때 정말로 차이가 있다고 결론을 내려도 틀릴 확률이 5% 이하, 또는 1% 이하 등을 따지는 통계처리 방법입니다. 당연히 분포곡선과 개체수, 평균값, 분산 등을 알아야 평균값이 차이가 나도 진짜로 차이가 난다고 결론을 내려도 되는냐 아니냐를 따지는 통계처리 방법이지요. (t-test나 다른 통계처리 방법은 차이가 난다고 가정하면 틀릴 확률이 얼마나 되느냐, 또는 맞을 확률이 얼마나 되느냐를 따지는 것입니다. 다시 말하자면 한 집단에서 몇 명을 뽑아서 그 사람들의 통계치를 가지고 판단을 내릴 때 틀릴 확률이나 맞을 확률이 어느 정도인가를 유추하는 것입니다.) 35명의 학급에서 30명을 뽑은 통계치를 볼 때 한 집단이 다른 집단의 평균값보다 더 크다(또는 적다)라고 결론을 내려도 틀릴 가능성이 몇 %인가를 알아보는 것입니다. 또는 인원수를 늘려 뽑아서 평균값을 비교해서 결론을 내려도 틀릴 가능성이 얼마인가.... 혹은 회수로 따져서 한 한급의 평균값이 다른 학급의 평균값보다 크다고 몇 번 이야기해야 그런 결론을 내린 것이 틀릴 수 있느냐? 또는 맞은가의 확률입니다. >안녕하세요... > >논문을 보다가 Student's T test 보게 되었습니다.. > >통계에 대해서는 옛날 정석책 수준이라 하나도 모르겠어요.. > >중학생을 가르치신다고 생각하시고 가르쳐 주세요.. > > >감사합니다.
    '학생'이라는 말에 현혹이 되면 안되겠지요? 유명한 통계학자가 자신의 검증 방법을 익명인 모학생이라고 발표하여서 student라는 말이 붙었다고 합니다. 아마 통계책에 다 나와있을 겁니다. T-test는 본질적으로 두 집단의 평균값의 차이가 진짜로 통계적으로 차이가 있느냐를 검정하는 통계처리 방법입니다. 정규분포라는 말을 들어보셨을텐데... 왜 정규분포를 이루고 있는가를 따져보면 쉽게 정규분포가 통계에서 중요한 역할을 하는지 짐작할 수 있을 것입니다. 입자나 개체수가 어떤 연관성이 있으면서 3개 이상일 때는 물리적으로 기술이 불가능합니다. 이럴 때는 할 수 없이 물리적인 특성은 포기하고 화학적인 성질을 알아서 기술하는 방법밖에 없습니다. (물리에서 3체 문제라고 해서 아직 해결이 되지 않은 문제입니다) 화학적인 성질을 알아낼수도 있으나 다른 성질을 가지고 연관성을 따지는 것이 더 합리적일때가 많습니다. 이럴 때 사용할 수 있는 방법이 통계적인 방법입니다. 중고교에서 치루는 시험을 생각해봅시다. 35명의 한 학급에서 수학성적이 나왔다고 하면 그 학급의 수학에 대한 이해도를 어떻게 평가해야 할까요? 35명의 성적을 가지고 도무지 알아낼 방법이 없습니다. 흔히 평균값이라는 대표값을 사용하지만 곰곰히 생각해보면 왜 평균값이 그 학급의 수학성적을 나타내는가에 대한 답이 나올 것입니다. 평균값은 학급의 수학 이해도를 평가하는 아주 좋은 대표값입니다. (대표값은 여러 종류가 많습니다. 평균값이 그래도 가장 합리적인 대표값이라고 할 수 있지요) 평균값이란 한 학급의 수학성적을 더해서 모든 구성원 35명에게 골고루 나누어 한 사람의 수학 이해도가 어떻게 배당이 되는가를 통계적으로 처리한 것입니다. 한 사람은 100점, 다른 사람은 60점을 받았다면 각각의 사람은 '평균' 80점으로, 80점을 두 사람이 공평하게 나누는 통계치입니다. (시험이라는 공통적인 환경에서 개별적인 점수가 나왔을 때 나온 점수들이 얼마나 서로 연관성이 있느냐를 따지는 것이 통계치입니다) 만약 한 사람은 90점, 다른 사람은 70점을 받았다면 평균값은 80점입니다. 그러나 앞의 경우와 비교해보면 평균값에 더 가까이 몰려있으므로 두 사람이 모두 '잘 한다'고 할 수 있습니다. 앞의 경우는 점수차가 많을 때 두 사람 중 한 사람을 골라서 잘한다고 결론을 내리면 틀릴 확률이 매우 높습니다. 이런 것을 여러 명으로 확대한 것이 유의수준에 따른 가정의 기각 정도라고 할 수 있습니다. 이제 정규분포(또는 정상분포)를 따져봅시다. 35명의 대표값을 평균값이라고 하면 그 학급의 수학 이해도라고 할 수있는 평균값에서 각각의 학생들이 받은 점수를 빼보면 오차가 존재할 것입니다. 그래서 평균값에서 각 학생의 점수를 뺀 오차를 모아보면 '틀림없이' 작은 오차와 큰 오차가 존재하며 작은 오차는 많고, 큰 오차는 적다는 것을 발견할 수 있을 것입니다.(당연히 평균값을 모르거나 없다면 오차들의 분포를 알 수 없지요) 오차들을 보면 평균과 가까운 오차는 많고 먼 오차는 적기 때문에 학생수가 많다면 틀림없이 정상분포라는 종모양을 이루고 있을 것입니다.(통계학에서는 대략 20개만 넘으면 정상분포를 이루고 있다고 가정해도 맞다고 합니다. 10개 이하를 다룰 때는 특별한 통계처리 방법이 있습니다) 오차 분포는 정상 분포를 이루지만 점수가 들쑥날쑥한 학급과 평균값에 소복히 모여있는 학급이 있습니다. 이렇게 평균값에서 떨어진 정도의 합을 나타내는 통계변수가 '분산'이라고 합니다. 분산이 크면 평균값에서 들쑥날쑥한 정도가 심하고 분산이 적으면 평균값에 몰려있겠지요. (편차, 또는 표준편차도 비슷한 개념) 이제 본론으로 들어와서 두 학급의 평균을 비교할 때 한 학급은 82점, 다른 학급은 85점이라고 할 때 대표값인 평균값에 따른 두 학급의 수학 이해도는 85점의 평균값을 가진 학급이 더 낫다고 할 수 있습니다. 여기까지는 아무런 문제가 없습니다. 그러나 문제는 어디에서 생기느냐면.... 학급에서 10명을 뽑아서 두 학급의 성적이라고 가정하고 앞에서 보았던 85점을 받은 학급에서 뽑은 10명의 성적 평균이 82점을 받은 학급의 학생들보다 성적(평균값)이 더 낫다고 하면 틀릴 가능성이 얼마나 되는가를 생각해봐야 합니다. 만약 85점을 받은 학급의 성적이 들쑥날쑥한 정도가 크다면 잘못 결론을 내릴 확률이 높습니다. 그렇다면 몇명을 뽑아서 비교를 할 때 틀릴 확률이 적을까를 고민해야 합니다. 이렇게 하는 방법이 유의수준에서 가정이 기각되었느냐 아니냐를 판단하는 것입니다. T-test는 두 집단의 평균값이 정말로 차이가 있는냐를 따지는 통계처리 방법입니다. 분산까지 고려해서 두 집단의 평균값이 차이가 있을 때 정말로 차이가 있다고 결론을 내려도 틀릴 확률이 5% 이하, 또는 1% 이하 등을 따지는 통계처리 방법입니다. 당연히 분포곡선과 개체수, 평균값, 분산 등을 알아야 평균값이 차이가 나도 진짜로 차이가 난다고 결론을 내려도 되는냐 아니냐를 따지는 통계처리 방법이지요. (t-test나 다른 통계처리 방법은 차이가 난다고 가정하면 틀릴 확률이 얼마나 되느냐, 또는 맞을 확률이 얼마나 되느냐를 따지는 것입니다. 다시 말하자면 한 집단에서 몇 명을 뽑아서 그 사람들의 통계치를 가지고 판단을 내릴 때 틀릴 확률이나 맞을 확률이 어느 정도인가를 유추하는 것입니다.) 35명의 학급에서 30명을 뽑은 통계치를 볼 때 한 집단이 다른 집단의 평균값보다 더 크다(또는 적다)라고 결론을 내려도 틀릴 가능성이 몇 %인가를 알아보는 것입니다. 또는 인원수를 늘려 뽑아서 평균값을 비교해서 결론을 내려도 틀릴 가능성이 얼마인가.... 혹은 회수로 따져서 한 한급의 평균값이 다른 학급의 평균값보다 크다고 몇 번 이야기해야 그런 결론을 내린 것이 틀릴 수 있느냐? 또는 맞은가의 확률입니다. >안녕하세요... > >논문을 보다가 Student's T test 보게 되었습니다.. > >통계에 대해서는 옛날 정석책 수준이라 하나도 모르겠어요.. > >중학생을 가르치신다고 생각하시고 가르쳐 주세요.. > > >감사합니다.
    등록된 댓글이 없습니다.
  • 답변

    안길홍님의 답변

    >안녕하세요...>>논문을 보다가 Student's T test 보게 되었습니다..>>통계에 대해서는 옛날 정석책 수준이라 하나도 모르겠어요..>>중학생을 가르치신다고 생각하시고 가르쳐 주세요..>>>감사합니다. student t-test는 처음 이러한 software를 만들어낸 이유는 말 그대로 학생들의 성적을 평가할 수 있는 방법이 없을까 하고 생각하다가 분포곡선에 대하여 착안하여 만들어낸 software입니다. 학생들의 성적이 50,75,90,60,70등으로 나왔을 때 이를 판단하는 통계적 방법입니다.이러한 측정을 많이 할 수록(자유도:측정회수)정규분포에 접근할 통계적 확율이 높아지게 되는 것입니다.이와같이 정규분포에 가까우면 그 측정한 값의 신뢰도는 높아지는 것입니다. t-test는 적용하는 목적이 분포상태가 어떻게 되며, 그 분포상태의 신뢰도는 어느정도 가지느냐 하는 것을 판단하는 하나의 통계적인 수단인 software입니다.
    >안녕하세요...>>논문을 보다가 Student's T test 보게 되었습니다..>>통계에 대해서는 옛날 정석책 수준이라 하나도 모르겠어요..>>중학생을 가르치신다고 생각하시고 가르쳐 주세요..>>>감사합니다. student t-test는 처음 이러한 software를 만들어낸 이유는 말 그대로 학생들의 성적을 평가할 수 있는 방법이 없을까 하고 생각하다가 분포곡선에 대하여 착안하여 만들어낸 software입니다. 학생들의 성적이 50,75,90,60,70등으로 나왔을 때 이를 판단하는 통계적 방법입니다.이러한 측정을 많이 할 수록(자유도:측정회수)정규분포에 접근할 통계적 확율이 높아지게 되는 것입니다.이와같이 정규분포에 가까우면 그 측정한 값의 신뢰도는 높아지는 것입니다. t-test는 적용하는 목적이 분포상태가 어떻게 되며, 그 분포상태의 신뢰도는 어느정도 가지느냐 하는 것을 판단하는 하나의 통계적인 수단인 software입니다.
    등록된 댓글이 없습니다.