Rstudio(1) 데이터 종류

hyukstory 혁스토리·2020년 8월 22일
0

Rstudio

목록 보기
2/16

< 1 > 데이터 종류

vector : 연속형 / factor : 범주형

var1 <- 1:4 ;var1
var2 <- factor(var1) ;var2 
var3 <- c("a", "b", "c", "b") ;var3
var4 <- factor(var3) ; var4
class(var4) # 변수타입 확인

var1 +2 # vector 값들에 각각 +2
var2 +2 # factor는 연산 불가 # 연산하고 싶으면 as.numeric 함수 통해 숫자로 변경

matrix : 긴 벡터를 잘라서 행렬로 변환

x <- c(1,2,3,4,5,6)
x <- matrix(x, nrow = 2, ncol = 3)
x[ ,3]

matrix(x, nrow = 3, ncol = 2)
matrix(x, nrow=2, ncol=3, byrow=T)

array1 <- c(1,2,3)
array2 <- c(4,5,6)
array3 <- c(7,8,9)

mat1 <- rbind(array1, array2, array3) #rbind : 여러개의 벡터를 위아래로 붙여서 행렬로 변환
mat2 <- cbind(array1, array2, array3) #cbind : 여러개의 벡터를 좌우로 붙여서 행렬로 변환

array : 행렬의 구조를 n차원으로 확대한 데이터 세트

array_1 <- c(1,2,3,4,5,6)
array(array_1, dim = c(2, 2, 3))

list : 1차원이며 다중형데이터

list1 <- list(c(1,2,3), "Hello") #숫자형 벡터, 문자형 벡터로 구성된 list1 생성
list1  
str(list1)

dataframe

ID <- c(1,2,3,4,5,6,7,8,9,10)
SEX <- c("F", "M", "F", "M", "M", "F", "F", "F", "M", "F")
AGE <- c(50,40,28,50,27,23,56,47,20,38)
AREA <- c("서울", "경기", "제주", "서울", "서울", "서울", "경기", "서울", "인천", "경기")

dataframe_ex <- data.frame(ID, SEX, AGE, AREA)
dataframe_ex

mean(dataframe_ex$AGE) #평균 : mean
sum(dataframe_ex$AGE) #합계 : sum

List 관련 연습 문제

L1 <- list(name="scott", sal=3000)
#1) 3000의 원소를 추출하여 2를 곱한 값에 result3 변수에 저장한다
result3 <- L1$sal*2

#2) 다음과 같이 값이 구성되는 리스트를 정의하여 L2에 저장한다.
L2 <- list("scott", c(100,200,300)) ; L2

#3) 다음 리스트를 L3로 저장하고 A의 값을 "APPLE"로 대체한다
# list(c(3,5,7), c("A","B","C"))
L3 <- list(c(3,5,7), c("A","B","C")) ; L3
L3[[2]][1] <- "APPLE"

#4) 다음 리스트에서 첫 번째 원소 (alpha)의 각 값에 10을 더하여 출력한다. (L4)
# list(alpha=0:4, beta=sqrt(1:5)) 
L4 <- list(alpha=0:4, beta=sqrt(1:5)) ; L4
L4$alpha <- L4$alpha + 10 #방법 1
L4[[1]] <- L4[[1]] + 10  #방법 2

#5) 다음리스트는 math, writing. reading의 중간고사 및 기말고사 점수이다.전체 평균을 계산하여 출력
L5 <- list(math=list(95,90), writing=list(90,85), reading=list(85,80))
mean(unlist(L5))
profile
문돌이의 고군분투 개발 공부

0개의 댓글