[스터디_R] 분석을 위한 데이터 기본 정리

Brad Pitt·2022년 5월 23일
0
  1. 데이터 파악 함수

  1. 실습

-install.packages("readxl")함수를 이용해 패키지를 다운한다.

  • library(readxl)함수를 이용해 패키지를 로드한다.
  • 샘플 excel 파일을 실행한다.

  • 8개의 변수와 10개의 관측지를 가지고 있다.

  • View() 함수를 이용해 표로 확인한다.

  • str() 함수를 이용해 구조를 확인한다.

  • dim() 함수를 이용해 몇 행, 몇 열로 구성되어 있는지 확인한다.

  • ls() 함수를 이용해 변수의 값을 확인한다.

  1. 변수명 변경
  • install.packages("dplyr")함수를 이용해 패키지를 다운한다.

  • library(dplyr)함수를 이용해 패키지를 로드한다.

  • rename() 함수를 이용해 AMT17 > Y17_AMT, AMT16 > Y16_AMT 로 변경한다.

<변경전>

<rename() 사용>

<변경후>

  1. 파생변수 생성
  • 보유한 데이터를 기반으로 연산 작업 등을 이용해 새로운 결과를 얻고 , 그 결과로 새로운 변수를 생성하는 것

data set$ 파생변수명 <- data set$ 기존변수명 + data set$기존 변수명

  • 변수간 덧셈으로 새로운 변수 생성

  • 변수간 나눗셈으로 새로운 변수 생성

  1. 변수 변환 방식
  • 파생변수 생성 방식에는 기존 데이터를 기준으로 조건에 따라 새로운 값을 부여하여 새로운 변수를 생성하는 변수 변환 방식도 있다.

data set$파생 변수명 <- ifelse(조건절, "참일 때 값", "거짓일 때 값")

  • ifelse 조건문은 중첩해서 사용가능하다.
  • 중첩해서 쓸 때는 처음에 쓴 괄호를 닫지 않고 다시 ifelse 조건을 쓰고 마지막에 닫아준다.


[출처] 처음 시작하는 R데이터 분석, 강전희

profile
데이터는 철저하게 해석은 자유롭게

0개의 댓글