[R] 기초문법

JONGYOON JEON·2024년 2월 4일

R

목록 보기
1/4

R + R studio 설치

setwd("지정경로")
R은 역\ 를 읽지 못한다. /슬래쉬로만 써야함
getwd() 현재 경로

rm(list=ls()) 변수 다지운다
save(변수, file="변수파일명.rda""
load("변수파일명.rda") 변수 파일 불러오기

변수 명명규칙

문자 또는 마침표.로 시작
문자, 마침표, 숫자, 밑줄 사용
대문자와 소문자 구분
사용할 수 없는 키워드
break, else, FALSE, for, function, if, lnf, NA, NaN, next, NULL, repeat, return, TRUE, while
명명법
1. Doteed syle : stock.price
2. Camel case style : computerAveragePrice

기초 함수

installed.package()
install.package("라이브러리명")
search() 현 라이브러리 확인
library(라이브러리명) 라이브러리 메모리에 넣기
detach(라이브러리명) 라이브러리 메모리에서 빼기

.libpath(경로)
ls("package:ggplot2") 내부 함수 보기

data() 기본 데이터들 보기
data(datasetname) 데이터 가져오기 
tail(), head() 요약보기
library(MASS) MASS package data 가져오기

help.start() 
help("median")
?median
example("median")
help.search("xyplot")
??xyplot

[package:apropos] 문자열 찾기

apropos("vector") vector가 포함된 모든
apropos("q$") q로 끝나는 모든
apropos("[7-9]") 7 ,8 ,9가 포함된 모든

https://search.r-project.org/
rseek.org

[package:sos] 외부 창에서 데이터 이쁘게 보기

install.packages("sos")
library("sos")
findFn("social network analysis")

데이터 구조

벡터

1차원 집합. 하나의 데이터 유형만으로 존재함.

c(1,2,3,4,5)
3:9
5:-3
seq(from=3, to=9, by=2) seq(from=0, to=100, length.out=4)
rep(c(1,2,3), each=3)
rep(c(1,2,3), times=3)
rep(c(1,2,3), times=c(1,2,3))
rep(c(1,2,3), length.out=8)
month <- c(12,9,3,5,1) 
month.name[month]

벡터연산
벡터는 원소단위로 연산됨

c(1,2,3) + c(4,5,6) 
> c(5,7,9)

+, -, /, %%(나머지), %/%(몫)
!=, ==, <=, >=, !x(x가 아니다) 
x | y,  x & y, isTRUE()

c(10,20,30,40) %/% c(2,5)
짧은 벡터를 반복 사용

as.numeric
any 하나라도 TRUE 면 TRUE 반환
all 모두가 TRUE 면 TRUE 반환
all.equal(a,b) 아주 작은 값은 무시함

factor <- 범주형 문자열 factor(c("A","B","C","B","A"))
matrix <- 2개의 차원을 가진 벡터. 행과 열로 구성. matrix(1:12, 4, 3)
array <- 3개의 차원을 가진 벡터. array(1:12, c(2,3,2))
data.frame <- 각 열이 다른 데이터 유형을 가질 수 있음. data.frame(product=c("A","B","C"), price=c(100,200,300))
list <- 객체의 집합(자료 주머니). 가장 유연한 데이터 구조.

profile
효율적인 걸 좋아해요

0개의 댓글