ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • ADsP 데이터분석준전문가 - 모수, 비모수 추론
    S T U D Y/DataBase 2023. 1. 30. 23:00
    728x90
    반응형

    모수적추론

    모집단에 특정 분포를 가정하고 분포의 특성을 결정하는 모수에 대해 추론하는 방법
    자료가 정규분포, 등간척도, 비율척도인 경우(온도, 물가지수, 몸무게, 자녀수)
    n>30일 경우 정규성 검정 없이 모수적 추론 가능
    10~30사이일 경우 정규성 검정한 뒤, 정규성 가지면 모수적추론
    6월 "평균 기온은 30도"이다

    모수적검정

    검정하고자 하는 모집단의 분포에 대해 가정하고 그 가정하에 검정 통계량과 검정 통계량의 분포를 유도해 검정 실시

    모수적 통계의 전제조건

    표본의 모집단이 정규분포
    집단 내의 분산 같아야 함
    변인(=변수)은 등간척도나 비율척도로 측정돼야 함. 그게 아니면 비모수통계를 사용해야됨

    모수적 검정방법

    [T-test]
    one sample T test
    - 단일 표본의 평균 검정을 위한 방법
    (예시) S사 USB의 평균 수명은 20,000시간이다.



    Paired T test(대응표본 T검정)
    - 동일 개체에 어떤 처리를 하기 전, 후의 자료를 얻을 때 차이 값에 대한 평균 검정
    (예시) 매일 1시간 한 달 걸으면 2kg이 빠진다(걷기 수행 전, 후)
    - 가능한 동일한 특성을 갖는 두 개체에 서로 다른 처리를 해서 그 처리의 효과 비교하는 방법
    (예시) X질병 환자들을 두 집단으로 나눠 A, B 약을 투약해 약의 효과 비교



    Two sample T test(독립표본 T검정)
    - 서로 다른 두 그룹의 평균을 비교해 두 표본의 차이가 있는지 검정하는 방법
    - 귀무가설 - 두 집단의 평균 차이 값이 0이다
    (예시) 2학년과 3학년의 결석률은 같다


    ANOVA test
    * T-test, ANOVA test는 평균에 대해 검정
    한 개의 모집단의 분산 추론에 사용 = 카이제곱분포 (근데 비모수적 검정에서도 쓰임)
    두 개의 모집단의 분산을 비교하기 위한 추론에 사용 = F분포
    모집단의 평균에 대한 추론에 사용 : z분포, T분포
    ***모수적검정방법 암기해둬야함



    비모수적추론

    모집단에 대해 특정 분포 가정을 하지 않음
    모수 자체보다 분포 형태에 관한 검정을 실시
    표본 수가 적고, 명목척도, 서열척도인 경우(성별, 혈액형, 만족도, 메달)
    n<10일 경우, 비모수적 추론을 함
    10~30사이일 경우 정규성 검정한 뒤, 정규성 갖지 않으면 비모수적 추론 or 정규성 검정 없이 비모수적 추론
    남/여 두 그룹의 혈액형 "분포는 동일" 하다

    자유도(degree of freedom)

    통계적 추정에서 표본자료 중 모집단에 대한 정보를 주는 독립적인 자료의 수
    n개 데이터를 이용해 통계량 A를 계산하려고 할 때 다른 통계량 B가 있다면 B는 A를 계산하기 전에 고정된 값을 가져야 하고 이 데이터가 자유도에서 제외됨
    표본평균에서의 자유도 : n
    표본분산에서의 자유도 : n-1
    (예시) 다른 통계량을 한 개 사용한 크기가 n인 표본의 자유도 : n-1
    (예시) 1 3 5 7 9 데이터는 합계가 25고 평균이 5이다
    이때, 숫자를 하나 모르더라도 평균을 알면 그 숫자를 찾아낼 수 있다
    즉, 표본 평균 값을 알고 있으면 전체 자료 중 자유롭게 값을 취할 수 있는 관찰치의 개수는 4개이다
    df = n - 1



    728x90
    반응형

    댓글

Designed by Tistory.