추가숙제
장점 | 1차원 | 2차원 | n차원 |
---|---|---|---|
단일형 | 벡터 | 행렬 | 배열 |
다중형 | 리스트 | 데이터프레임 | - |
<- 기호
, C() 함수
변수명 <- c(값)
ex_vector1 <- c(-1, 0, 1) #데이터 생성
ex_vector1 # 변수 조회
>> [1] -1 0 1
[1]
: 데이터 위치 표시 , 출력한 벡터 중 첫번째 요소부터 표시
>> [1] 1 2 3 4 5 # 1번째 요소부터 표시
>> [6] 6 7 8 9 10 # 6번째 요소부터 표시
mode(ex_vector1)
str(ex_vector1)
length(ex_vector1)
>> [1] "numeric"
num [1:3] -1 0 1
[1] 3
mode() 함수
: 데이터 유형 확인, "numeric"은 벡터가 숫자형 이라는 의미
str() 함수
: 데이터 유형 값을 전체적으로 확인 // num(숫자형), 변수에 포함된 데이터 전체 값 출력
length() 함수
: 데이터 길이 확인 // 벡터의 길이가 3, 즉 3개의 값을 가진 벡터임
참고 : str() 함수 / mode() 함수 / typeof() 함수
#정수형 | #문자형 | #논리형 |
---|---|---|
str(12345) >>num 12345 mode(12345) >>[1] "numeric" typeof(12345) >>[1] "double" | str("helloworld") >>chr "helloworld" mode("helloworld") >>[1] "character" typeof("helloworld") >>[1] "character" | str(TRUE) >>logi TRUE mode(TRUE) >> [1] "logical" >> typeof(TRUE) >> [1] "logical" |
ex_vector2 <- c('Hello', 'Hi~!')
ex_vector2
ex_vector3 <- c('1', '2', '3')
ex_vector3
>> [1] 'Hello' 'Hi~!'
[1] '1' '2' '3'
mode(ex_vector2)
str(ex_vector2)
mode(ex_vector3)
str(ex_vector3)
>> [1] 'character'
chr [1:2] 'Hello' 'Hi~!'
[1] 'character'
chr [1:3] '1' '2' '3'
ex_vector4 <- c(TRUE, FALSE, TRUE, FALSE)
ex_vector4
mode(ex_vector4)
str(ex_vector4)
>> [1] TRUE, FALSE, TRUE, FALSE
[1] 'logical'
chr [1:4] TRUE, FALSE, TRUE, FALSE
참고 : 데이터 세트 삭제하기
remove(ex_vector2) # ex_vector2 벡터 삭제
rm(ex_vector3) # ex_vector3 벡터 삭제
ex_vector5 <- c(2, 1, 3, 2, 1)
ex_vector5
cate_vector5 <- factor(ex_vector5, labels = c('Apple', 'Banana', 'Cherry'))
cate_vactor5
>> [1] 2 1 3 2 1 #그룹 순서 범주화
[1] Banana Apple Cherry Banana Apple
Levels: Apple Banana Cherry
matrix(벡터, nrow = 행 개수, ncol = 열 개수)
x <- c(1, 2, 3, 4, 5, 6)
matrix(x, nrow = 2, ncol = 3)
matrix(x, nrow = 3, ncol = 2)
>> [,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
[,1] [,2]
[1,] 1 3
[2,] 2 4
[3,] 3 6
byrow
: 데이터를 왼쪽 -> 오른쪽, 열부터 채운다는 옵션 / T, F 대문자만 가능 / 기본값 F는 생략가능x <- c(1, 2, 3, 4, 5, 6)
matrix(x, nrow = 2, ncol = 3)
matrix(x, nrow = 3, ncol = 2, byrow = T)
>> [,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
[,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
[,1] [,2]
[1,] 1 3
[2,] 2 4
[3,] 3 6
array (변수명, dim = c(행 수, 열 수 , 차원 수))
참고 : 인덱스
list[[1]]
>> [1] 123
data.frame(변수명1, 변수명2, ... , 변수명n)
10obs. : 관측치 (observations) 줄임말
기본숙제
문자형으로 이루어진 데이터 1, 2, 3, 4, 5는 ID 변수로,
숫자형으로 이루어진 데이터 10, 25, 100, 75, 30은 MID_EXAM 변수로,
문자형으로 이루어진 데이터 1반, 2반, 3반, 1반, 2반은 CLASS 변수로 구성해보세요.
data.frame() 함수와 3번 문항에서 구성한 ID, MID_EXAM, CLASS 변수를 사용하여 example_test 데이터 세트를 저장해보세요.