R의 기초

김영준·2023년 9월 26일
0

R

목록 보기
2/3
post-thumbnail

하루만에 끝나는 R기초

https://www.youtube.com/watch?v=RmpEe1UIHGY&list=PLPiTdFurtYLLD-afK1o9C-dAN_XUW5o9-&index=1

[1교시]

R의 소개

  • 코딩이 필요로 하는 데이터 다루는 언어
  • 데이터가 커질 수록 R이 강력해짐

[2교시]

R설치, R스튜디오 설치

[3교시]

[자료형]

-데이터

데이터를 가지고 그래프를 그리고 통계를 사용할 것임
데이터는 문자와 숫자로 되어있음

-숫자형

숫자는 입력 받을 수 있음 #숫자형 자료형
복소수는 3+2i 의 식으로 입력

-문자형

문자는 정해진 약속이 있음 #문자형 자료형
"김함수" or '김함수'

-논리형

True / False
ex) 2==3 >> False 반환
> 2==3
[1] FALSE

[4교시]

[변수]

변수 : 메모리 공간에 붙인 이름
ex) A=100

A=100
A
[1] 100

변수 생성 규칙

  1. 알파벳, 숫자, 언더바, 점을 사용할 수 있다.
  2. 알파벳 또는 점으로 시작한다.
  3. 점으로 시작한다면 뒤에 숫자는 올 수 없다.

[5교시]

[자료구조]

자료구조 : 자료형을 담는 그릇
KYJ=c('김영준','남',181,80) >> 이렇게 문자 + 숫자의 벡터는 모두 문자처럼 표시됨

데이터프레임 : 벡터로 이루어짐

[6교시]

[연산자]

  1. 산술 연산자
      • / **(^)
  1. 비교 연산자
    == != < <= > >=
    v1=c(1,2,3)
    v2=c(4,5,6)
    v1>v2

[1] FALSE FALSE FALSE

  1. 논리 연산자
    &(and)
    : 피연산자가 모두 TRUE 일 때, TRUE 반환
    TRUE & TRUE
    [1]TRUE

|(or)
: 피연산자가 하나만 TRUE 일 때, TRUE 반환
TRUE | FALSE
[1]TRUE

!(not)
: 피연산자의 반대를 반환
ex.)
!TRUE
[1] FALSE

!FALSE
[1] TRUE

[7교시]

조건문

: if(조건){
조건을 만족하면 실행할 코드
}

x=5
if (x>=3){
	print("HI)
}

반복문

주로 in 뒤에는 벡터를 사용함

for (i in c(1,2,3,4,5))
{
	print(i*10)
}

[1] 10
[2] 20
[3] 30
[4] 40
[5] 50

[8교시]

함수

age = c(35,27,42,33,25,47)
mean(age) #mean은 평균을 내는 함수

cal_bmi=function(w , h){ #w,h는 함수를 내면 사라지는 매개 변수 
bmi=w/(h/100)^2
return(bmi)
}

cal_bmi(181,80)

패키지

: 여러 유용한 함수의 모음
데이터도 패키지에 포함시킬 수 있음

install.packahes("readxl") #패키지 설치 방법

library(readxl)
#R을 껐다 키면 다시 reset되므로 시작할 때 마다 써줘야함
#이 패키지(readxl)는 엑셀파일을 읽어주는 패키지

[9교시]

그래프

name=c('김함수','박산술','이비교','송논리','최검정','유반복')
gender=c('남','남','남','여','여','여')
age=c(35,27,42,33,25,47)
height=c(183,177,175,167,155,173)
weight=c(72,69,78,58,47,65)

df=data.frame(name,gender,age,height,weighy)

t검정

두 집단의 평균을 비교할 땐, t검정을 사용함
하지만 t검정을 사용한다면 표본의 크기가 각각 30이상이여야함
보통 엑셀에 데이터를 정리해놓고 R로 불러옴

상자 수염 그림

name=c('김함수','박산술','이비교','송논리','최검정','유반복')
gender=c('남','남','남','여','여','여')
age=c(35,27,42,33,25,47)
height=c(183,177,175,167,155,173)
weight=c(72,69,78,58,47,65)

df=data.frame(name,gender,age,height,weighy)

#목적 : 각 성별의 키 상자수염을 각각 그리고 싶은 것
boxplot(height~gender,df) #df라는 데이터프레임에서 성별에 따라 키의 상자수염 그림을 그려라

# t검정
t.test(height~gender,df) #df라는 데이터프레임에서 성별에 따라 키를 비교하여라 (p값이 0.05보다 크다면 크게 유의차가 없는 것으로 판단 하지만 표본의 크기가 너무 작다면 잘못된 결과가 나올 수 있음)

10교시

단축기 소개

Ctrl + Enter : 선택된 줄 실행
Ctrl + Alt + R : 모든 줄 실행
Ctrl + L : 콘솔 창 비우기 (데이터는 그대로 남아있음)

help 기능

: 함수의 설명을 출력해주는 기능
help(설명받을 것)

or

?설명받을 것

help(t.test)

or

?t.test
profile
개발의 신이 될거다

0개의 댓글