R & SQL 개발일지 (06.09)

moony_moon·2020년 6월 11일
0

R 객체의 자료형 (data type)은 크게 5가지로 구분할 수 있다.

벡터(Vectors): R에서 가장 기본이 되는 자료형으로, 속성이 같은 원소를 갖는 1차원 자료형입니다.
행렬(Matrices): 벡터를 행과 열이 있는 2차원의 형태로 변환한 자료형
배열(Arrays): 행렬을 몇 겹으로 쌓은 3차원 자료형
데이터프레임 (Data Frame): 길이가 같은 열벡터를 원소로 갖는 2차원 자료형. 벡터끼리는 서로 속성이 달라도 됨
리스트(Lists): 모든 자료형을 원소로 가질 수 있는 가장 광범위하게 사용되는 1차원 자료형임

벡터의 특징:

  • 속성이 같은 스칼라(원소가 1개인 벡터)를 원소로 갖는다
  • 기존 벡터에 속성이 다른 스칼라가 추가되면 강제변환 (coercion) 발생
    logical(논리형) , factor (범주형) < integer (정수형) < numeric (실수형) < character (문자형)
    예) '논리형 벡터'와 '범주형 벡터'가 하나로 합쳐지면 '정수형 벡터'로 속성이 변함

2개 이상의 원소를 갖는 벡터 생성 관련 함수

seq()함수: 연속된 숫자를 생성한다. 'by'인자의 기본값은 1
seq(from = 1, to =3, by= 1) or 1:3 -> 1부터 3까지 1씩 증가하면서 값을 보여줌
seq(from = 3, to =1, by = - 1) or 3:1 -> 3부터 1까지 1씩 감소하면서 값을 보여줌
seq(from = -1, to=10, by length.out= 19) -> -1부터 10까지 19등분해서 값들을 보여줌

rep()함수: 'x'인자에 할당된 값 또는 벡터를 반복합니다.
rep(x= 1:3, times = 10) #1부터 3까지 10번 반복x를 할당하는 형태는 seq()함수에서는 되지 않음
rep(x=1:3, each =10) #1부터 3을 각각 10번씩 반복
rep(x=1:3, c(1,2,3)) #1은 한번 2는 2번 3은 3번씩 반복

rep_length()함수: 'x'인자에 할당된 값을 'length_out'만큼 반복한다.
rep_len(x=1:3, length.out = 9)
rep_len(x-1:3, length.out = 10)

두 개 이상의 문자열을 커다란 문자열로 합칠 때에는 paste()함수를 사용합니다.

Paste('I', 'am', 'a', 'boy, sep= ' ') #문자열 사이에 구분자를 추가하려면 'sep'인자에 추가할 문자열 패턴을 지정합니다
Paste (terms, collapse = ' ') #문자형 벡터의 원소를 하나를 합칠 때에는 'sep' 대신 'collapse' 인자를 사용해야 합니다.

문자형 벡터 관련 함수 (계속)

  • 문자형 벡터에서 각 원소별로 특정 패턴을 포함하고 있는지 확인할 수 있습니다.
    grep(pattern = 'a', x=terms) #'a'를 포함하는 원소의 인덱스를 반환합니다.
    grepl(pattern = 'a', x=terms) #인덱스 대신 TRUE, FALSE를 반환합니다.
profile
끝없이 배우는 개발자가 되고 싶습니다.

0개의 댓글