ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [R] 변수명 변경하기
    R/Contents 2021. 10. 18. 00:19

    Change_VariableName.csv
    0.00MB

    데이터 분석을 하기 이전에 데이터에 있는 변수의 이름을 변경해야 하는 경우가 종종 발생한다. 변수의 이름을 변경하는 방법에는 크게 두가지가 있는데 사용자의 편의에 따라 코드를 사용하면 된다. 

    우선, 변수명을 바꿔보는 연습을 하기 위해 첨부되어 있는 Change_VariableName.csv 파일을 사용하고자 한다.

    pra <- read.csv("Change_VariableName.csv", stringsAsFactors=FALSE) 명령어를 실행해서 첨부되어 있는 파일을 R로 불러왔다. 참고로 Change_VariableName.csv 파일이 working driectory 안에 있으면 위의 명령어처럼 사용하면 된다. 그러나 working directory 안에 파일이 없으면 명령어에 파일이 있는 위치정보를 같이 입력해줘야 한다.

    pra <- read.csv(file="C:\\Users\\OneDrive\\Desktop\\Change_VariableName.csv", stringsAsFactors=FALSE)

    [그림1] csv 파일 불러오기

     

    첫번째로 변수명을 바꾸는 방법은 names(데이터이름)[names(데이터이름) == "기존변수명"] <- "새로운 변수명" 이다. 이 명령어를 이용하여 우리 데이터에 있는 StudentID 변수를 STDID로 변경해보자. 

    names(pra)[names(pra)=="StudentID"] <- "STDID"
    View(pra)

    명령어를 실행 한 후 View(pra)를 실행시키면 데이터를 볼 수 있고 이때 변수명을 확인할 수 있다. 변수명이 재대로 바뀌었는지 확인하는 방법은 str(데이터이름) 또는 names(데이터이름)을 실행하면 확인할 수 있다.

    [그림2] 변수명 변경 후의 데이터
    [그림3] names(데이터이름) 과 str(데이터이름)

     

    두번째 방법은 "dplyr" 패키지를 사용하는 것이다. 설치가 되어 있지 않다면 install.packages("dplyr")을 실행하여 설치한 후 library(dplyr) 명령어를 실행시켜야 한다. 만약 이전에 설치한 적이 있다면 library(dplyr) 명령어만 입력한 후 실행시키면 된다. 

    데이터이름%>%rename(새로운변수명 = 기존변수명, 새로운변수명 = 기존변수명....)으로 입력하면 된다. 여기에서는 SchoolID를 SCHID로 Location을 LOC로 변경하고자 한다. 

    pra %>% rename(SCHID = SchoolID, LOC = Location)
    
    또는 
    
    pra %>% rename(SCHID = SchoolID)
    pra %>% rename(LOC = Location)

    여기에서는 pra 데이터에 직접 변수명을 변경해주었는데 만약 변수명을 변경한 후 pra가 아닌 새로운 데이터로 만들고 싶다면 pra 앞에 새로운 데이터명 <- 을 넣어주면 된다. 

    pra2 <- pra %>% rename(SCHID = SchoolID, LOC = Location)

    [그림4] dplyr을 활용한 변수명 변경

    View(pra2)를 실행하면 변수명이 변한 것을 확인할 수 있다. 

     

    이 외에 다른 방법으로는 아래와 같다. 첫번째 방법은 데이터에 변수명(열의 이름)을 추가해 주는 것으로 열(변수)의 개수가 5개이면, 5개의 이름을 다 입력해줘야 한다.

     

    colnames(데이터명) <- c('변수명1','변수명2','변수명3'...)

    두번째 방법은 변수의 위치를 지정하여 특정변수의 이름만 변경해 주는 것으로 2번째 열에 있는 변수라면 변수명 위치에 2를 입력해주면 된다. 변수명의 위치는 names(데이터)를 실행하면 알 수 있다.

    colnames(데이터명)[변수명 위치] <- "변수명"

    댓글

Designed by Tistory.