https://www.youtube.com/watch?v=RmpEe1UIHGY&list=PLPiTdFurtYLLD-afK1o9C-dAN_XUW5o9-&index=1
R의 소개
R설치, R스튜디오 설치
데이터를 가지고 그래프를 그리고 통계를 사용할 것임
데이터는 문자와 숫자로 되어있음
숫자는 입력 받을 수 있음 #숫자형 자료형
복소수는 3+2i 의 식으로 입력
문자는 정해진 약속이 있음 #문자형 자료형
"김함수" or '김함수'
True / False
ex) 2==3 >> False 반환
> 2==3
[1] FALSE
변수 : 메모리 공간에 붙인 이름
ex) A=100
A=100
A
[1] 100
자료구조 : 자료형을 담는 그릇
KYJ=c('김영준','남',181,80) >> 이렇게 문자 + 숫자의 벡터는 모두 문자처럼 표시됨
데이터프레임 : 벡터로 이루어짐
[1] FALSE FALSE FALSE
|(or)
: 피연산자가 하나만 TRUE 일 때, TRUE 반환
TRUE | FALSE
[1]TRUE
!(not)
: 피연산자의 반대를 반환
ex.)
!TRUE
[1] FALSE
!FALSE
[1] TRUE
: if(조건){
조건을 만족하면 실행할 코드
}
x=5
if (x>=3){
print("HI)
}
주로 in 뒤에는 벡터를 사용함
for (i in c(1,2,3,4,5))
{
print(i*10)
}
[1] 10
[2] 20
[3] 30
[4] 40
[5] 50
age = c(35,27,42,33,25,47)
mean(age) #mean은 평균을 내는 함수
cal_bmi=function(w , h){ #w,h는 함수를 내면 사라지는 매개 변수
bmi=w/(h/100)^2
return(bmi)
}
cal_bmi(181,80)
: 여러 유용한 함수의 모음
데이터도 패키지에 포함시킬 수 있음
install.packahes("readxl") #패키지 설치 방법
library(readxl)
#R을 껐다 키면 다시 reset되므로 시작할 때 마다 써줘야함
#이 패키지(readxl)는 엑셀파일을 읽어주는 패키지
name=c('김함수','박산술','이비교','송논리','최검정','유반복')
gender=c('남','남','남','여','여','여')
age=c(35,27,42,33,25,47)
height=c(183,177,175,167,155,173)
weight=c(72,69,78,58,47,65)
df=data.frame(name,gender,age,height,weighy)
두 집단의 평균을 비교할 땐, t검정을 사용함
하지만 t검정을 사용한다면 표본의 크기가 각각 30이상이여야함
보통 엑셀에 데이터를 정리해놓고 R로 불러옴
name=c('김함수','박산술','이비교','송논리','최검정','유반복')
gender=c('남','남','남','여','여','여')
age=c(35,27,42,33,25,47)
height=c(183,177,175,167,155,173)
weight=c(72,69,78,58,47,65)
df=data.frame(name,gender,age,height,weighy)
#목적 : 각 성별의 키 상자수염을 각각 그리고 싶은 것
boxplot(height~gender,df) #df라는 데이터프레임에서 성별에 따라 키의 상자수염 그림을 그려라
# t검정
t.test(height~gender,df) #df라는 데이터프레임에서 성별에 따라 키를 비교하여라 (p값이 0.05보다 크다면 크게 유의차가 없는 것으로 판단 하지만 표본의 크기가 너무 작다면 잘못된 결과가 나올 수 있음)
Ctrl + Enter : 선택된 줄 실행
Ctrl + Alt + R : 모든 줄 실행
Ctrl + L : 콘솔 창 비우기 (데이터는 그대로 남아있음)
: 함수의 설명을 출력해주는 기능
help(설명받을 것)
or
?설명받을 것
help(t.test)
or
?t.test