ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • ADsP 데이터분석준전문가 3과목 - 통계량, 표본추출, 척도의 종류
    S T U D Y/DataBase 2023. 1. 27. 23:02
    728x90
    반응형

    모집단

    - 잘 정의된 연구목적과 이와 연계된 명확한 연구대상 (데이터 전체 집합)
    - 예시) 대통령 후보의 지지율 - 유권자

    모수

    - 모집단의 특성을 나타내는 수치들
    - 모집단의 평균(그리스어 뮤 기호), 분산(시그마 제곱) 같은 수치들을 모수라고 함

    표본

    - 모집단의 개체 수가 많아 전부 조사하기 힘들 때 모집단에서 추출한 것
    - 추출한 표본으로 모집단의 특성을 추론함(오차발생)
    - (예시) 각종 여론조사에 참여한 유권자

    통계량

    - 표본의 특성을 나타내는 수치들
    - 표본의 평균(엑스바), 분산(s제곱) 같은 수치를 통계량이라고 함

    모수와 통계량 기호를 구분해서 인지하기

    확률적 표본추출법의 종류

    단순 무작위추출

    - 모집단의 각 개체가 표본으로 선택될 확률이 동일하게 추출되는 경우
    - 모집단의 개체수 N, 표본 수 n일 때 개별 개체가 선택될 확률은 n/N

    계통추출

    - 모집단 개체에 1, 2, ..., N 이라는 일련번호를 부여 한 뒤, 첫 번째 표본을 임의로 선택하고 일정 간격으로 다음 표본을 선택
    - 1~100까지 번호 부여한 뒤, 10개 선택한다면 1, 11, 21, ..., 91까지를 선택

    층화추출

    - 모집단을 서로 겹치지 않게 몇 개의 집단 또는 층으로 나눈 뒤, 각 집단 내에서 원하는 크기의 표본을 단순 무작위추출법으로 추출
    - 층 : 성별, 나이대, 지역 등 차이가 존재하는 그룹

    군집추출

    - 모집단을 차이가 없는 여러 개의 집단으로 나눔.
    - (예) 경상대학 내에 경영학과 경제학과
    - 이들 집단 중 몇 개를 선택한 뒤, 선택된 집단 내에서 필요한 만큼 표본을 임의로 선택함


    비확률 표본 추출법은 특정 표본이 선정될 확률을 알 수 없어서 통계학에서 사용 불가
    층화추출은 차이가 존재하는 경우, 군집추출은 차이가 크지 않은 경우 사용하는 추출법

    척도의 종류

    명목척도

    - 측정대상의 특성을 분류하거나 확인하기 위한 목적
    - 숫자로 바꿔도 값이 크고 작음을 나타내지 않고 범주를 표시
    - 단순히 측정 대상의 특성을 분류하거나 확인하기 위한 목적으로 숫자를 부여함
    - 성별, 혈액형, 출생지

    서열(순위)척도

    - 대소 또는 높고 낮음 등의 순위만 제공할 뿐 양적인 비교는 불가
    - 항목간에 서열이나 순위가 존재
    - 금, 은, 동메달, 선호도, 만족도

    등간척도(구간척도)

    - 순위를 부여하되 순위 사이의 간격이 동일해서 양적인 비교가 가능
    - 절대 0점이 존재하지 않음
    - 온도계 수치, 물가지수

    비율척도

    - 절대 0점이 존재하기 때문에 측정 값 사이의 비율 계산이 가능함
    - 나이, 몸무게, 형제의 수, 직장까지 거리

    v 서열척도는 양적인 비교 할 수 없고 등간척도(구간척도)는 양적인 비교가 가능하다는 점 꼭 알아두기
    v 각각의 특징 구분해야 함
    v 연속형자료 : 등간척도, 비율척도
    V 범주형자료 : 명목, 순위

    728x90
    반응형

    댓글

Designed by Tistory.