-
ADsP 데이터분석준전문가 - 모수, 비모수 추론S T U D Y/DataBase 2023. 1. 30. 23:00728x90반응형
모수적추론
모집단에 특정 분포를 가정하고 분포의 특성을 결정하는 모수에 대해 추론하는 방법
자료가 정규분포, 등간척도, 비율척도인 경우(온도, 물가지수, 몸무게, 자녀수)
n>30일 경우 정규성 검정 없이 모수적 추론 가능
10~30사이일 경우 정규성 검정한 뒤, 정규성 가지면 모수적추론
6월 "평균 기온은 30도"이다모수적검정
검정하고자 하는 모집단의 분포에 대해 가정하고 그 가정하에 검정 통계량과 검정 통계량의 분포를 유도해 검정 실시
모수적 통계의 전제조건
표본의 모집단이 정규분포
집단 내의 분산 같아야 함
변인(=변수)은 등간척도나 비율척도로 측정돼야 함. 그게 아니면 비모수통계를 사용해야됨모수적 검정방법
[T-test]
one sample T test
- 단일 표본의 평균 검정을 위한 방법
(예시) S사 USB의 평균 수명은 20,000시간이다.
Paired T test(대응표본 T검정)
- 동일 개체에 어떤 처리를 하기 전, 후의 자료를 얻을 때 차이 값에 대한 평균 검정
(예시) 매일 1시간 한 달 걸으면 2kg이 빠진다(걷기 수행 전, 후)
- 가능한 동일한 특성을 갖는 두 개체에 서로 다른 처리를 해서 그 처리의 효과 비교하는 방법
(예시) X질병 환자들을 두 집단으로 나눠 A, B 약을 투약해 약의 효과 비교
Two sample T test(독립표본 T검정)
- 서로 다른 두 그룹의 평균을 비교해 두 표본의 차이가 있는지 검정하는 방법
- 귀무가설 - 두 집단의 평균 차이 값이 0이다
(예시) 2학년과 3학년의 결석률은 같다
ANOVA test
* T-test, ANOVA test는 평균에 대해 검정
한 개의 모집단의 분산 추론에 사용 = 카이제곱분포 (근데 비모수적 검정에서도 쓰임)
두 개의 모집단의 분산을 비교하기 위한 추론에 사용 = F분포
모집단의 평균에 대한 추론에 사용 : z분포, T분포
***모수적검정방법 암기해둬야함비모수적추론
모집단에 대해 특정 분포 가정을 하지 않음
모수 자체보다 분포 형태에 관한 검정을 실시
표본 수가 적고, 명목척도, 서열척도인 경우(성별, 혈액형, 만족도, 메달)
n<10일 경우, 비모수적 추론을 함
10~30사이일 경우 정규성 검정한 뒤, 정규성 갖지 않으면 비모수적 추론 or 정규성 검정 없이 비모수적 추론
남/여 두 그룹의 혈액형 "분포는 동일" 하다자유도(degree of freedom)
통계적 추정에서 표본자료 중 모집단에 대한 정보를 주는 독립적인 자료의 수
n개 데이터를 이용해 통계량 A를 계산하려고 할 때 다른 통계량 B가 있다면 B는 A를 계산하기 전에 고정된 값을 가져야 하고 이 데이터가 자유도에서 제외됨
표본평균에서의 자유도 : n
표본분산에서의 자유도 : n-1
(예시) 다른 통계량을 한 개 사용한 크기가 n인 표본의 자유도 : n-1
(예시) 1 3 5 7 9 데이터는 합계가 25고 평균이 5이다
이때, 숫자를 하나 모르더라도 평균을 알면 그 숫자를 찾아낼 수 있다
즉, 표본 평균 값을 알고 있으면 전체 자료 중 자유롭게 값을 취할 수 있는 관찰치의 개수는 4개이다
df = n - 1728x90반응형'S T U D Y > DataBase' 카테고리의 다른 글
ADsP 데이터분석준전문가 - 다중공선성, 설명변수 선택방법 (0) 2023.02.03 ADsP 데이터분석 준전문가 - 회귀분석, 회귀 모형의 가정, 회귀 모형의 해석 (0) 2023.01.31 ADsP 데이터분석준전문가 - 추정량, 점추정, 구간추정, 가설검정 (0) 2023.01.30 ADsP 데이터분석준전문가 3과목 - 확률분포, 이산형 확률분포, 연속형 확률분포, 통계적 추론 (0) 2023.01.28 ADsP 데이터분석준전문가 3과목 - 집중화 경향, 통계 기본 용어, 사건의 종류 (0) 2023.01.28