[R데이터분석] 데이터 불러오기

근이의 개발일기·2024년 10월 21일

R데이터분석 (2-2 데이터분석및실습 강소영교수님)

목록 보기

3/17

R에서 데이터를 불러오는 함수들은 파일 형식에 따라 다릅니다. 각 함수는 특정 파일 형식에 최적화되어 있으며, 적절한 옵션을 통해 데이터를 효율적으로 로드할 수 있습니다. 여기서는 read.table(), read.csv(), read.sav(), read.spss()를 상세히 설명하겠습니다.

1. `read.table()`

read.table()은 가장 일반적인 텍스트 파일을 읽어오는 데 사용됩니다. 데이터를 읽어올 때 다양한 구분자를 지원하며, 매우 유연하게 사용할 수 있습니다.

특징

다양한 구분자와 형식을 지원.
일반 텍스트 파일(.txt)뿐 아니라 기타 구분 파일도 처리 가능.

사용 예시

data <- read.table("path/to/your/file.txt", header = TRUE, sep = "\t")
head(data)

주요 옵션

header: 첫 번째 행을 열 이름으로 사용할지 여부 (기본값: FALSE).
sep: 데이터의 구분자 지정 (기본값: 공백 " ").
stringsAsFactors: 문자열을 팩터로 변환 여부 (기본값: FALSE).
fill: 열의 길이가 다른 경우 빈 값을 채울지 여부 (기본값: FALSE).
na.strings: 결측값을 특정 문자열로 지정.

2. `read.csv()`

read.csv()는 CSV(Comma-Separated Values) 형식의 데이터를 읽어오기 위해 설계된 함수입니다. read.table()과 비슷하지만, CSV 파일의 일반적인 기본값에 맞게 설정되어 있습니다.

특징

CSV 파일(쉼표로 구분된 데이터)을 효율적으로 불러오기 위해 사용.
read.table()의 특별한 설정 버전으로 이해할 수 있음.

사용 예시

data <- read.csv("path/to/your/file.csv", header = TRUE)
head(data)

주요 옵션

header: 첫 번째 행을 열 이름으로 사용할지 여부 (기본값: TRUE).
sep: 구분자 지정 (기본값: 쉼표 ,).
stringsAsFactors: 문자열을 팩터로 변환 여부 (기본값: FALSE).
na.strings: 결측값을 특정 문자열로 지정.

3. `read.sav()`

read.sav()는 SPSS 소프트웨어에서 생성된 .sav 파일을 읽어오는 함수로, haven 패키지에서 제공됩니다.

특징

최신 SPSS 파일 형식을 읽을 수 있음.
데이터 레이블과 메타데이터를 보존할 수 있음.

사용 방법 (`haven` 패키지 필요)

install.packages("haven")  # 패키지 설치
library(haven)

data <- read_sav("path/to/your/file.sav")
head(data)

주요 옵션

user_na: SPSS에서 지정된 사용자 결측값을 R의 NA로 변환할지 여부 (기본값: FALSE).

4. `read.spss()`

read.spss()는 foreign 패키지에서 제공되며, 오래된 SPSS 파일 형식을 읽을 수 있습니다.

특징

SPSS의 .sav 파일을 읽어올 수 있음.
레이블 값 및 데이터 구조를 유지할 수 있음.
최신 SPSS 파일 형식에서는 제한적인 기능.

사용 방법 (`foreign` 패키지 필요)

install.packages("foreign")  # 패키지 설치
library(foreign)

data <- read.spss("path/to/your/file.sav", to.data.frame = TRUE)
head(data)

주요 옵션

to.data.frame: 데이터를 데이터 프레임 형태로 반환할지 여부 (기본값: FALSE).
use.value.labels: SPSS 값 레이블을 사용 여부 (기본값: TRUE).

함수 간 비교

함수	파일 형식	주요 패키지	특징
`read.table()`	일반 텍스트 파일	base	유연성 높음, 다양한 구분자 지원
`read.csv()`	CSV 파일	base	CSV 파일에 최적화된 기본값 제공
`read.sav()`	SPSS `.sav` 파일	haven	최신 SPSS 파일 형식 지원, 메타데이터 보존
`read.spss()`	SPSS `.sav` 파일	foreign	오래된 SPSS 파일 형식 지원, 최신 형식에서는 제약 있음

요약

일반 텍스트 데이터: read.table(), read.csv().
SPSS 데이터: 최신 형식은 read_sav() (haven 패키지), 오래된 형식은 read.spss() (foreign 패키지).
파일 크기가 크거나 속도가 중요한 경우, data.table 패키지의 fread()도 고려할 수 있습니다.

데이터 파일 형식과 환경에 맞는 적절한 함수를 선택하여 사용하세요!

근이의 개발일기

SSU 21 CSE

이전 포스트

[R데이터분석] ifelse / case_when

다음 포스트

[R데이터분석] 데이터 불러오기

R데이터분석 (2-2 데이터분석및실습 강소영교수님)

1. `read.table()`

특징

사용 예시

주요 옵션

2. `read.csv()`

특징

사용 예시

주요 옵션

3. `read.sav()`

특징

사용 방법 (`haven` 패키지 필요)

주요 옵션

4. `read.spss()`

특징

사용 방법 (`foreign` 패키지 필요)

주요 옵션

함수 간 비교

요약

[R데이터분석] ifelse / case_when

[R데이터분석] aov와 관련된 검정

0개의 댓글

[R데이터분석] 데이터 불러오기

R데이터분석 (2-2 데이터분석및실습 강소영교수님)

1. read.table()

특징

사용 예시

주요 옵션

2. read.csv()

특징

사용 예시

주요 옵션

3. read.sav()

특징

사용 방법 (haven 패키지 필요)

주요 옵션

4. read.spss()

특징

사용 방법 (foreign 패키지 필요)

주요 옵션

함수 간 비교

요약

[R데이터분석] ifelse / case_when

[R데이터분석] aov와 관련된 검정

0개의 댓글

1. `read.table()`

2. `read.csv()`

3. `read.sav()`

사용 방법 (`haven` 패키지 필요)

4. `read.spss()`

사용 방법 (`foreign` 패키지 필요)