데이터프레임 형식을 확장시킨 데이터 구조
속도가 빨라 데이터를 읽고 쓰는데에 큰 장점을 가짐
read.table()함수를 사용하여 파일 읽음
header = TRUE/FALSE
첫 번째 행의 문자를 변수명으로 설정할지의 여부를 결정
header = TRUE: 첫 번째 행의 문자를 변수명으로 설정
ns.strings ="" 미싱 밸류(결측값)
ns.strings="":'*'로 입력된 것은 모두 미싱 밸류로 처리
stringAsFactors= TRUE/FALSE
문자형을 Factor로 받아들일 것인지의 여부를 결정
stringAsFactors = TRUE: 문자로 되어 있는 건 Factor로 받아들임
직접적으로 data.table유형으로 읽는 함수는 fread() 명령어 사용
data.frame
2차원 구조인 Matrix형식과 비슷한 구조입니다. 하지만 Matrix은 하나의 데이터 유형으로 구성 되어 있지만 data.frame은 여러 유형의 데이터 사용 가능합니다
tidyverse패키지에 포함되어 있는 다양한 라이브러리 중에서 readr에 포함된 read_csv를 통해서 .csv파일을 읽음
-> tibble 타입으로 데이터가 읽혀짐
[ ]안에 조건식을 적으면 해당하는 조건의 대상자를 추출하게 됨
fwrite()라이브러리 : data.table에서의 파일 저장
csv란? 각 데이터들을 콤마로 구분하여 필드를 구성하는 형태
업그레이드 되면서 첫째줄의 변수명이 default로 지정되어 지정하지 않아도 내용을 그대로 입력 받을 수 있음
한글자료 인코팅 오류 시 fileEncoding으로 지정하거나 csv파일 저장 시 인코딩(utf-8)로 저장