이 포스팅은 R 기초 특강을 듣고 작성되었으며, 예제는 직접 재구성하였습니다.
R은 파이썬과 마찬가지로 대표적인 데이터분석 언어입니다.
아래 예제들을 직접 작성해보면서 R 기초 문법을 익히는데 도움이 되었으면 좋겠습니다.
R project 다운
https://cran.r-project.org/mirrors.html
Korea 미러사이트 중 아무 사이트나 들어가서 Windows / Mac 등 환경에 맞는 파일을 다운 받으면 됩니다.
R studio 다운
https://www.rstudio.com/products/rstudio/download/
Windows / Mac 등 환경에 맞는 파일을 다운 받으면 됩니다.
설치과정에서 기본값 변경없이 전부 다음을 클릭 후 설치
R studio 작업화면
1) 스크립트: R 코드를 작성하는 화면 (ctrl+enter로 코드 실행)
2) 콘솔: 실행한 코드 결과가 나타나는 화면
3) 환경창: 객체 확인 가능
4) 파일경로, plot 확인
getwd()
setwd('작업경로')
scores <- c(70,80,90,100,65)
students <- c('Jane','Tommy','Anna','Alex')
info <- data.frame(name = students,
age = c(18,17,19,18),
points = c(100,85,70,90))
data <- c('good','bad','soso','soso','bad','good','good','bad','good')
table(data) #빈도표로 생성
factor(data) #범주형 변수를 집단 구분 요인으로 변경
barplot(table(data))
pie(table(data), col = c('blue','red','black'))
(1) 벡터
mean(info$points)
sd(info$points)
range(info$points)
summary(info$points)
install.packages('psych') #패키지 설치
library(psych)
describe(info, IQR=T) #사분위수범위(IQR) 요청
apply(cars, 2, mean)
apply(cars, 2, range)
cars는 R의 내장데이터 중 하나이다.
도수분포표를 그래프로 나타낸 것.
※ 도수분포표: 표본의 다양한 산출분포를 보여주는 표
hist(cars$speed)
데이터의 중심과 산포 확인 가능한 데이터 분포를 나타낸 것.
boxplot(cars$dist)
상자그림을 통해 극단값이 존재함을 알수있다.
두개의 연속형 변수의 관계를 보여주는 것.
plot(cars$speed, cars$dist)
model <- lm(dist ~ speed, cars)
plot(cars$speed, cars$dist)
abline(model)
속도(speed)가 증가함에 따라 dist(거리)가 증가하는 관계를 가지는 것을 알 수 있다.
시간 경과에 따른 연속형 변수의 변동을 보여주는 것.
plot(cars$speed, cars$dist, type='l')