[R] R패키지 관련, 통계 관련, 변수 관련 함수 정리

isitcake_yes·2022년 10월 20일
0
post-thumbnail

🔍 R 패키지

R 패키지 설치 및 사용

# 1.  패키지 설치 install.packages("패키지명")
#    install.packages(c("패키지명1", "패키지명2")) 로 여러개 설치 가능
#    cran이 아닌 github로부터 패키지를 설치하려면, devtools패키지가 설치되어 있어야 함
install.packages(c("ggplot2","devtools"))

# 2. 패키지 로드 library(패키지명)
library(ggplot2)  

# 3. 함수 사용하기
x <- c("a", "a", "b", "c")
qplot(x)  # ggplot2에 있는 함수 qplot 사용하기 (빈도 막대그래프 출력)

R 패키지 관리

# 1. 설치된 패키지 보기
installed.packages()

# 2. 패키지가 설치된 폴더 확인 
.libPaths()

# 3. 로드된 패키지 확인 
search()
#>  [1] ".GlobalEnv"        "package:ggplot2"   "package:stats"    
#>  [4] "package:graphics"  "package:grDevices" "package:utils"    
#>  [7] "package:datasets"  "package:methods"   "Autoloads"     
#> [10] "package:base"

# 4. 패키지 언로드 
detach(package:ggplot2, unload = TRUE)

# 5. 설치된 패키지 제거 
remove.packages("rpart")

# 6. 패키지 업데이트
update.packages() # 모든패키지
update.packages(oldPkgs = c("readr", "ggplot2")) # 특정 패키지

🔍 R 산술 함수

통계함수

sum(c(10, 20, 30))    # 합계
#> [1] 60
mean(c(10, 20, 30))   # 평균
#> [1] 20
sd(c(10, 20, 30))     # 표준편차
#> [1] 10
var(c(10, 20, 30))    # 분산
#> [1] 100
median(c(10, 20, 30)) # 중위수
#> [1] 5
max(c(1, 3, 5, 7))    # 최대값
#> [1] 7
min(c(1, 3, 5, 7))    # 최소값
#> [1] 1
IQR(c(1, 3, 5, 7))    # 사분위 범위
#> [1] 3
quantile(c(1, 3, 5, 7), 0.25)  # 백분위 수
#> 25% 
#> 2.5
range(c(1, 3, 5, 7)) # 최대값과 최소값
#> [1] 1 7

로그 및 지수함수

log(10)     # 자연로그 logarithms base e of x, e=2.7182818284⋯
#> [1] 2.3
log2(8)     # 이진로그 logarithms base 2 of x
#> [1] 3
log10(100)  # 상용로그 logaritms base 10 of x
#> [1] 2
exp(10)     # 지수 Exponential of x
#> [1] 22026

기타 수학함수

pi        # 파이 값
#> [1] 3.14
abs(-3)   # 절대 값 
#> [1] 3
sqrt(4)   # 제곱근 square root 
#> [1] 2
round(2.345, 2)   # 반올림
#> [1] 2.35
ceiling(2.345)    # 정수로 올림
#> [1] 3
floor(2.345)      # 정수로 내림
#> [1] 2
trunc(2.345)      # 소수점 아래 버리기, 0에 더 가까운 값 반환
#> [1] 2
signif(2.345, 3)  # 전체 자릿수에 맞게 반올림
#> [1] 2.35

🔍 변수 관련 함수

기본 데이터 타입

: 기본 데이터 타입으로 숫자(numeric), 문자(character), 논리(logical), 날짜(date), 결측치(missing) 등이 있다.

# 숫자를 변수에 담기
x <- 3 
y <- 5   
z <- 4  

# 변수 리스트 보기
ls()
#> [1] "x" "y" "z"

# 변수 지우기
rm(x, y)
ls()
#> [1] "z"
my_age <- 26   # 숫자 
my_name <- "릴로"  # 문자 - 따옴표(" 또는 ')
is_student <- TRUE  # 논리 - TRUE, FALSE
my_birthday <- as.Date("1997-06-30")  # 날짜 
my_missing <- NA  # 결측치 - 논리 데이터의 일종

# 데이터 타입 확인
class(my_name)     #> [1] "character"
is.numeric(my_age) #> [1] TRUE
is.na(my_missing)  #> [1] TRUE
is.logical(my_missing)  #> [1] TRUE
is.character(my_missing) #> [1] FALSE

# 데이터 타입 변경
as.numeric("26") #> [1] 26
as.character(26) #> [1] "26"

# 논리데이터 TRUE:1, FALSE:0
TRUE * 3   #> [1] 3
FALSE * 3  #> [1] 0

Ref

profile
주니어 개발자 주니어발록 주니어예티 주니어레이스

0개의 댓글