-
ADsP 데이터분석준전문가 3과목 - 통계량, 표본추출, 척도의 종류S T U D Y/DataBase 2023. 1. 27. 23:02728x90반응형
모집단
- 잘 정의된 연구목적과 이와 연계된 명확한 연구대상 (데이터 전체 집합)
- 예시) 대통령 후보의 지지율 - 유권자모수
- 모집단의 특성을 나타내는 수치들
- 모집단의 평균(그리스어 뮤 기호), 분산(시그마 제곱) 같은 수치들을 모수라고 함표본
- 모집단의 개체 수가 많아 전부 조사하기 힘들 때 모집단에서 추출한 것
- 추출한 표본으로 모집단의 특성을 추론함(오차발생)
- (예시) 각종 여론조사에 참여한 유권자통계량
- 표본의 특성을 나타내는 수치들
- 표본의 평균(엑스바), 분산(s제곱) 같은 수치를 통계량이라고 함
모수와 통계량 기호를 구분해서 인지하기확률적 표본추출법의 종류
단순 무작위추출
- 모집단의 각 개체가 표본으로 선택될 확률이 동일하게 추출되는 경우
- 모집단의 개체수 N, 표본 수 n일 때 개별 개체가 선택될 확률은 n/N계통추출
- 모집단 개체에 1, 2, ..., N 이라는 일련번호를 부여 한 뒤, 첫 번째 표본을 임의로 선택하고 일정 간격으로 다음 표본을 선택
- 1~100까지 번호 부여한 뒤, 10개 선택한다면 1, 11, 21, ..., 91까지를 선택층화추출
- 모집단을 서로 겹치지 않게 몇 개의 집단 또는 층으로 나눈 뒤, 각 집단 내에서 원하는 크기의 표본을 단순 무작위추출법으로 추출
- 층 : 성별, 나이대, 지역 등 차이가 존재하는 그룹군집추출
- 모집단을 차이가 없는 여러 개의 집단으로 나눔.
- (예) 경상대학 내에 경영학과 경제학과
- 이들 집단 중 몇 개를 선택한 뒤, 선택된 집단 내에서 필요한 만큼 표본을 임의로 선택함
비확률 표본 추출법은 특정 표본이 선정될 확률을 알 수 없어서 통계학에서 사용 불가
층화추출은 차이가 존재하는 경우, 군집추출은 차이가 크지 않은 경우 사용하는 추출법척도의 종류
명목척도
- 측정대상의 특성을 분류하거나 확인하기 위한 목적
- 숫자로 바꿔도 값이 크고 작음을 나타내지 않고 범주를 표시
- 단순히 측정 대상의 특성을 분류하거나 확인하기 위한 목적으로 숫자를 부여함
- 성별, 혈액형, 출생지서열(순위)척도
- 대소 또는 높고 낮음 등의 순위만 제공할 뿐 양적인 비교는 불가
- 항목간에 서열이나 순위가 존재
- 금, 은, 동메달, 선호도, 만족도등간척도(구간척도)
- 순위를 부여하되 순위 사이의 간격이 동일해서 양적인 비교가 가능
- 절대 0점이 존재하지 않음
- 온도계 수치, 물가지수비율척도
- 절대 0점이 존재하기 때문에 측정 값 사이의 비율 계산이 가능함
- 나이, 몸무게, 형제의 수, 직장까지 거리
v 서열척도는 양적인 비교 할 수 없고 등간척도(구간척도)는 양적인 비교가 가능하다는 점 꼭 알아두기
v 각각의 특징 구분해야 함
v 연속형자료 : 등간척도, 비율척도
V 범주형자료 : 명목, 순위728x90반응형'S T U D Y > DataBase' 카테고리의 다른 글
ADsP 데이터분석준전문가 3과목 - 확률분포, 이산형 확률분포, 연속형 확률분포, 통계적 추론 (0) 2023.01.28 ADsP 데이터분석준전문가 3과목 - 집중화 경향, 통계 기본 용어, 사건의 종류 (0) 2023.01.28 ADsP 데이터분석준전문가 3과목 - 결측치, 이상치 (2) 2023.01.27 ADsP 데이터분석준전문가 - 그래프 종류, 특징 (0) 2023.01.26 R관련 기출 문항 풀이 정리 (0) 2023.01.26