-
ADsP 데이터분석준전문가 3과목 - dataframe 생성함수, dataframe 예시, 인덱싱 예시S T U D Y/DataBase 2023. 1. 25. 22:33728x90반응형
data.frame
엑셀 워크시트와 같은 2차원 데이터
여러 가지 데이터 유형을 가질 수 있음
벡터가 모여 프레임을 구성함
(Ex)
----------------------------
Vector Vector
[name] [gender]
Tom F => data.frame
Jerry M
Cindy F
Mark F
---------------------------data.frame 생성함수
data.frame(vector나 matrix, stringsAsFactors)
벡터의 길이는 모두 같아야 함
stringsAsFactors를 TRUE로 지정하면 문자열을 factor로 저장함dataframe 예시
name <- c('tom', 'jerry', 'cindy', 'mark')
Gender <- c('f','m','f', 'm')
Kor <- c(90,100,80,95)
Eng <- c(90, 95, 100, 80)
Df1 <- data.frame(name, gender, kor, eng)4 obs. Of 4 variables
name gender kor eng
1 tom f 90 90
2 jerry m 100 95
3 cindy f 80 100
4 mark m 95 80
Df2 <- data.frame(matrix(seq(1, 9), nrow=3)1 4 7
2 5 8
3 6 9
Df3 <- data.frame(gender = c('f', 'm', 'f', 'm'),
score = c(90, 100, 80, 95),
stringsAsfactors = TRUE)gender score
1 f 90
2 m 100
3 f 80
4 m 95
Str(Df3)$gender : Factor w/ 2 levels "f", "m" : 1 2 1 2
$score : num 90 100 80 95데이터프레임 인덱싱 예시
df <- data.frame(name, gender,kor, eng)
name gender kor eng
1 tom f 90 90
2 jerry m 100 95
3 cindy f 80 100
4 mark m 95 80df[1, 3]
90
df1<- df[2,] #서로 다른 타입 여러개가 있으니까 data.frame으로 사용
jerry m 100 95
V2 <- df[,'name'] #같은 타입 여러개이므로 vector 사용 df$name과 같은 표현
tom, jerry, cindy, mark
v3 <- df$name
tom, jerry, cindy, mark
df2 <- df[1] #1번 열에 대한 정보임, 열에대한 정보만 주어서 만든 결과는 df이 됨
Tom
Jerry
Cindy
MarkDf3<- df['name']
Tom
Jerry
Cindy
MarkV4 <- df[[1]] # 1번 열, vector타입으로 리턴
df4<- df[seq(1,3)], c(1, 2)]Tom f
Jerry m
Cindy f
Mark mDf5 <-df[,2:4]
Gender kor eng
F 90 90
M 100 95
F 80 100
M 95 80
Df6 <- df[1:3] #column으로 1, 2, 3번째 column을 가져옴name gender kor
1 tom f 90
2 jerry m 100
3 cindy f 80
4 mark m 95Df7<- df[-2]
name kor eng
1 tom 90 90
2 jerry 100 95
3 cindy 80 100
4 mark 95 80
Df8 <- df [-c(1, 3)]gender eng
1 f 90
2 m 95
3 f 100
4 m 80728x90반응형'S T U D Y > DataBase' 카테고리의 다른 글
ADsP 데이터분석준전문가 - dataframe 핸들링 정의, 예시 (0) 2023.01.26 ADsP 데이터분석준전문가 - list (1) 2023.01.25 ADsP 데이터분석준전문가 3과목 matrix(행렬), array(리스트) 실행 예시 (2) 2023.01.25 Adsp 데이터분석준전문가 3과목 - 벡터 생성, 연산, 인덱싱, 벡터 결과값 예시 (0) 2023.01.25 ADsP - 확률분포 (0) 2023.01.18