R - data.table

는는·2023년 4월 5일
0

R

목록 보기
6/23
post-thumbnail

data.table

데이터프레임 형식을 확장시킨 데이터 구조
속도가 빨라 데이터를 읽고 쓰는데에 큰 장점을 가짐
read.table()함수를 사용하여 파일 읽음

header = TRUE/FALSE
첫 번째 행의 문자를 변수명으로 설정할지의 여부를 결정
header = TRUE: 첫 번째 행의 문자를 변수명으로 설정

ns.strings ="" 미싱 밸류(결측값)
ns.strings="
":'*'로 입력된 것은 모두 미싱 밸류로 처리

stringAsFactors= TRUE/FALSE
문자형을 Factor로 받아들일 것인지의 여부를 결정
stringAsFactors = TRUE: 문자로 되어 있는 건 Factor로 받아들임

직접적으로 data.table유형으로 읽는 함수는 fread() 명령어 사용

data.table과 data.frame의 차이점

data.frame
2차원 구조인 Matrix형식과 비슷한 구조입니다. 하지만 Matrix은 하나의 데이터 유형으로 구성 되어 있지만 data.frame은 여러 유형의 데이터 사용 가능합니다

tibble

tidyverse패키지에 포함되어 있는 다양한 라이브러리 중에서 readr에 포함된 read_csv를 통해서 .csv파일을 읽음
-> tibble 타입으로 데이터가 읽혀짐

[ ]안에 조건식을 적으면 해당하는 조건의 대상자를 추출하게 됨

fwrite()라이브러리 : data.table에서의 파일 저장

.csv 파일 형식에 대한 입출력하는 방법

csv란? 각 데이터들을 콤마로 구분하여 필드를 구성하는 형태

업그레이드 되면서 첫째줄의 변수명이 default로 지정되어 지정하지 않아도 내용을 그대로 입력 받을 수 있음

한글자료 인코팅 오류 시 fileEncoding으로 지정하거나 csv파일 저장 시 인코딩(utf-8)로 저장

  • 출처 통계청 통계교육원

0개의 댓글