[R] vector(벡터)

·2022년 10월 5일
2

R 프로그래밍

목록 보기
5/12
post-thumbnail

1. 변하는 수, '변수' 이해하기

1) 변수

  • 변수는 '변하는 수'
  • vector 라고도 함.
  • 변수는 데이터 분석의 대상이다.
    -> 데이터 분석은 변수 간에 어떤 관계가 있는지 파악하는 작업이다.
  • 상수는 분석할 것이 없다.
    -> 상수: 하나의 값으로만 되어 있는 속성
  • 변수의 자료형
자료형예시설명
숫자형1, 2, 3, -4정수와 실수 모두 가능
문자형'Tom;, "Jane"작은 따옴표나 큰 따옴표로 묶어서 표현
논리형TRUE(T), FALSE(F)반드시 따옴표가 없는 대문자로 표기
특수값NULL- 정의되어 있지 않음을 의미
- 자료형도 없고, 길이도 0임
특수값NA- 결측값(missing value)
특수값NaN수학적으로 정의가 불가능한 값 (ex.sqrt(-3))
특수값Inf, -Inf양의 무한대, 음의 무한대

2) 변수 만들기

a <- 1  #a에 1 할당
a
 
b <- 2
b

c <- 3
c

d <- 3.5 
d

3) 변수의 연산

a+b

a+b+c

4/b

5*b

4) 여러 값으로 구성된 변수 만들기

함수설명
c( )combine, 데이터나 객체들을 하나로 결합
콜론( : )연속된 숫자로 구성되는 변수 만들기
seq( )함수로 연속 값을 지닌 변수 만들기
by 파라미터 (매개변수, parameter)일정한 간격을 두고 연속된 숫자 생성
  • 예시 코드

#c()
var1 <- c(1, 2, 3, 5, 7, 8) 숫자 5개로 구성된 var1 생성
#콜론(:)
var2 <- c(1:5) #1~5까지 연속 값으로 var2 생성
var2
#seq()
var3 <- seq(1, 5) #1~5까지 연속 값으로 var3 생성 
var3
#by파라미터   
var4 <- seq(1, 10, by = 2) #1~10까지 2 간격 연속 값으로 var4 생성
var4

5) 여러 값으로 구성된 변수의 연산

var1
var1+2

6) 문자로된 변수 만들기

str1 <- "a"
str1

str2 <- "text"
str2

str3 <- "Hello World!"
str3

str4 <- c("a", "b", "c")
str4

str5 <- c("Hello", "World", "is", "good!")
str5

7) 문자로된 변수는 연산할 수 없다.

  • 문자로 된 데이터로 분석 작업을 하려면 문자 처리 기능을 가지고 있는 함수 이용해야 한다.
  • 예를 들어, str1+2를 연산하려면 에러 메시지가 출력된다.


2. 마술 상자 같은 '함수' 이해하기

1) 데이터 분석은 함수로 시작해 함수로 끝난다.

  • 데이터 분석? 함수를 이용해 변수를 조작하는 일

2) 숫자를 다루는 함수 이용하기

함수설명예시
mean( )평균 구하는 함수
max( )최댓값 구하는 함수max(3, 9, 5)
min( )최솟값 구하는 함수min(3, 9, 5)
abs( )절대값abs(-10)
sqrt( )제곱근sqrt(36)
log( )로그함수log(10)
factorial( )팩토리얼factorial(5)
sin( ), cos( ), tan( )삼각함수sin(pi/2)
  • 예시 코드들
x <- c(1, 2, 3) #변수 생성

mean(x) #평균 구하기
max(x) #최댓값 구하기
min(x) #최솟값 구하기

3) 문자를 다루는 함수 이용하기

  • paste( ) 함수
    -> 여러 문자를 합쳐 하나로 만드는 함수

  • 문자를 하나로 합치기
    -> collapse = "," : 단어들을 쉼표로 구분

str5 <- c("Hello", "World", "is", "good!")
str5
paste(str5, collapse = ",")
  • 함수의 옵션 설정하기 - 파라미터
    -> collapse = "" : 쉼표 대신 빈칸 지정
paste(str5, collapse = " ")
  • 함수의 결과물로 새 변수 만들기
x_mean <- mean(x)
x_mean

str5_paste <- paste(str5, collapse = " ")
str5_paste


3. 함수 꾸러미 '패키지' 이해하기

1) 패키지란?

  • 함수가 특정한 기능을 가진 상자라면, 패키지는 이런 상자들이 여러 개 들어 있는 상자 꾸러미
  • 패키지 설치/로드
설치로드
install.packages( )library( )
#ggplot2 패키지 설치
install.packages("ggplot2")
suppressPackageStartupMessages("ggplot2")

#ggplot2 패키지 로드
library(ggplot2)

2) 함수 사용하기

  • 여러 문자로 구성된 변수 생성
x <- c("a", "a", "b", "c")
x
  • 빈도 막대 그래프 출력
qplot(x)

3) ggplot2의 mpg 데이터로 그래프 만들기

  • data에 mpg, x축에 hwy 변수 지정해 그래프 생성
qplot(data = mpg, x = hwy)
  • qplot( )의 파라미터를 바꿔가며 코드 실행
# x축 cty
qplot(data = mpg, x = cty)

# x축 drv, y축 hwy
qplot(data = mpg, x = drv, y = hwy)

# x축 drv, y축 hwy, 선 그래프 형태
qplot(data = mpg, x = drv, y = hwy, geom = "line")

# x축 drv, y축 hwy, 상자 그림 형태
qplot(data = mpg, x = drv, y = hwy, geom = "boxplot")

# x축 drv, y축 hwy, 상자 그림 형태, drv별 색 표현
qplot(data = mpg, x = drv, y = hwy, geom = "boxplot", colour = drv)



profile
열심히 하는 나를 위한 기록

0개의 댓글