
R에서 데이터를 불러오는 함수들은 파일 형식에 따라 다릅니다. 각 함수는 특정 파일 형식에 최적화되어 있으며, 적절한 옵션을 통해 데이터를 효율적으로 로드할 수 있습니다. 여기서는 read.table(), read.csv(), read.sav(), read.spss()를 상세히 설명하겠습니다.
read.table()read.table()은 가장 일반적인 텍스트 파일을 읽어오는 데 사용됩니다. 데이터를 읽어올 때 다양한 구분자를 지원하며, 매우 유연하게 사용할 수 있습니다.
.txt)뿐 아니라 기타 구분 파일도 처리 가능.data <- read.table("path/to/your/file.txt", header = TRUE, sep = "\t")
head(data)
header: 첫 번째 행을 열 이름으로 사용할지 여부 (기본값: FALSE).sep: 데이터의 구분자 지정 (기본값: 공백 " ").stringsAsFactors: 문자열을 팩터로 변환 여부 (기본값: FALSE).fill: 열의 길이가 다른 경우 빈 값을 채울지 여부 (기본값: FALSE).na.strings: 결측값을 특정 문자열로 지정.read.csv()read.csv()는 CSV(Comma-Separated Values) 형식의 데이터를 읽어오기 위해 설계된 함수입니다. read.table()과 비슷하지만, CSV 파일의 일반적인 기본값에 맞게 설정되어 있습니다.
read.table()의 특별한 설정 버전으로 이해할 수 있음.data <- read.csv("path/to/your/file.csv", header = TRUE)
head(data)
header: 첫 번째 행을 열 이름으로 사용할지 여부 (기본값: TRUE).sep: 구분자 지정 (기본값: 쉼표 ,).stringsAsFactors: 문자열을 팩터로 변환 여부 (기본값: FALSE).na.strings: 결측값을 특정 문자열로 지정.read.sav()read.sav()는 SPSS 소프트웨어에서 생성된 .sav 파일을 읽어오는 함수로, haven 패키지에서 제공됩니다.
haven 패키지 필요)install.packages("haven") # 패키지 설치
library(haven)
data <- read_sav("path/to/your/file.sav")
head(data)
user_na: SPSS에서 지정된 사용자 결측값을 R의 NA로 변환할지 여부 (기본값: FALSE).read.spss()read.spss()는 foreign 패키지에서 제공되며, 오래된 SPSS 파일 형식을 읽을 수 있습니다.
.sav 파일을 읽어올 수 있음.foreign 패키지 필요)install.packages("foreign") # 패키지 설치
library(foreign)
data <- read.spss("path/to/your/file.sav", to.data.frame = TRUE)
head(data)
to.data.frame: 데이터를 데이터 프레임 형태로 반환할지 여부 (기본값: FALSE).use.value.labels: SPSS 값 레이블을 사용 여부 (기본값: TRUE).| 함수 | 파일 형식 | 주요 패키지 | 특징 |
|---|---|---|---|
read.table() | 일반 텍스트 파일 | base | 유연성 높음, 다양한 구분자 지원 |
read.csv() | CSV 파일 | base | CSV 파일에 최적화된 기본값 제공 |
read.sav() | SPSS .sav 파일 | haven | 최신 SPSS 파일 형식 지원, 메타데이터 보존 |
read.spss() | SPSS .sav 파일 | foreign | 오래된 SPSS 파일 형식 지원, 최신 형식에서는 제약 있음 |
read.table(), read.csv().read_sav() (haven 패키지), 오래된 형식은 read.spss() (foreign 패키지).data.table 패키지의 fread()도 고려할 수 있습니다. 데이터 파일 형식과 환경에 맞는 적절한 함수를 선택하여 사용하세요!