-
ADsP 데이터분석준전문가 - dataframe 핸들링 정의, 예시S T U D Y/DataBase 2023. 1. 26. 20:18728x90반응형
데이터프레임 핸들링
데이터 프레임의 새로운변수를 만들거나 조건이나 목록으로 선택하고 열, 열 목록을 제거하고 열 이름을 바꾸는 것을 말함
R의 데이터셋 사용
head(x, n) : 데이터 셋 처음 여섯 개 반환, n지정 시 개수 만큼 반환
tail(x, n) : 데이터 셋 마지막 여섯 개 반환, n지정 시 개수 만큼 반환
View(x) : 창을 열고 엑셀과 유사한 형태로 데이터 셋을 보여줌
summary(x) :
데이터 셋을 구성하는 항목의 기초 통계량을 보여줌
(최솟값, 1사분위수, 중간값, 평균, 3사분위수, 최댓값)
str(x) :
데이터의 구성을 표시
head, tail, summary, str : vector, matrix 등의 다양한 객체에 적용 가능
View : matrix, data.frame, list 등 Data 구조에 적용 가능dataframe핸들링의 예시
df1 <- df[, c(2, 4, 8, 9)]
2, 4, 8, 9번째 컬럼의 값들
df1$score <- c(90, 80, 50, 70, 100, 95, 85, 70, 95, 75)
행추가됨
df2 <- subset(df1, subset=(salary>=5000))
salary가 5000이상인 데이터만 출력됨
df3 <- subset(df2, select=-score)
score 열만 빼고 가져옴
df4<- subset(df1, subset=salary>=5000), select=-score)
salary가 5000이상이고 score 열 빼고 가져옴
df5 <- subset(df2, select = c(pname, dept, salary))
salary가 5000이상인 데이터에서 pname, dept, salary 열만 가져옴
colnames(df5)[2] <- 'department' #데이터프레임의 열이름 바꾸기
dept라는 열 이름이 department로 변경됨
head(iris, 3)
앞에서부터 3개
tail(iris, 3)
뒤에서부터 3개
summary(iris)
Min, 1st Qu., Median, Mean, 3rd Qu, Max랑 범주가 나옴
str(iris)
attach(iris)
Print(Sepal.Width)Sepal.Width가 출력됨
detach(iris)
print(Sepal.Width)객체 Sepal.Width를 찾을 수 없다고 에러가 뜸
print(iris.Sepal.Width)
Sepal.Width가 출력됨
728x90반응형'S T U D Y > DataBase' 카테고리의 다른 글
ADsP 데이터분석준전문가 - 그래프 종류, 특징 (0) 2023.01.26 R관련 기출 문항 풀이 정리 (0) 2023.01.26 ADsP 데이터분석준전문가 - list (1) 2023.01.25 ADsP 데이터분석준전문가 3과목 - dataframe 생성함수, dataframe 예시, 인덱싱 예시 (0) 2023.01.25 ADsP 데이터분석준전문가 3과목 matrix(행렬), array(리스트) 실행 예시 (2) 2023.01.25