R수업 시작: 22.08.23 ~ (1 Week) 강사님:정순진
R은 액셀과 같다. "통계 프로그램에서 다룬다."
액셀탄생, 액셀의 단점: 데이터가 많으면 오류가 발생함.
->SPSS탄생,SPSS 단점:
->SAS탄생, SAS단점: 비싸다
->R탄생
R의 장점:
1.다양한 통계학, 데이터마이닝 분석기법 가능.
2.오픈소스
3.운영체제 영향 받지 않는다.
4.무료
R의 특징:
1.등호, 화살표로 직관적인 설명을 함.
-R과 PYTHON 둘 다 데이터 분야(의료, 생명공학) 사용 많이 한다.
-CLI
-CUI: 그림, Window 검은창, cmd, 콘솔
-딥러닝: 케라스
-R에서 처음 만나는 함수: C(), #Combin():묶어주는 함수
-working derectory: 여기에서만 벌어지는 일.
-library(라이브러리) = 패키지. #install.packages()
-library 보조기억 장치에서 주기억장치로 옮겨옴.
cpu->ram(주기억장치)->하드디스크(보조기억장치)
%Warning messages:주의하시오.(괜찮음)
-ctrlt+L: 콘솔 깨끗하게 지움.
-ctrlt+R: 편집기 R로 가져옴. #편집기는 파일-새 창에 있음.
-Window+E: 파일 탐색기
-ctrlt+SHIFT+N:RSTUDIO
qplot(): 값을 그림으로 표현해 준다.
ex) a<-("a","s","s","d"), qplot(a):그림으로 표현됨.
-qplot(diamonds$cut): 막대그래프로 표현됨
-ggplot(data=diamonds,aes(x=carat,y=price)) +geom_point():그래픽 표현됨
-ggplot(data=diamonds,aes(x=carat,y=price, color=cut))+geom_point(): 색이 표현됨
SHIFT+ENTER(변경가능): 값 콘솔에 보여줌
-숫자열:numeric
-문자열:character
-참과 거짓:logical #(T,F-축약가능)
-두 개 이상 타입 시 문자->숫자->참,거짓 순
벡터(vector):한 줄
vectorise:여러줄을 한줄로 줄 세운다.
비교연산자
-a&&b: a와b 앞에꺼만 비교한다.
-a||b :a와b 앞에꺼만 비교한다.
-a==3 :a가3 인지 아닌지 확인한다.
-a!=3 :a가 3같지 않다.
변수이름
-영문자와 숫자 혼합 사용가능.
-앞머리 숫자로 시작하지말라.
-첫 글자로 '_'가 나올 수 없다.
-특정 예약어 사용할 수 없다.(IF)
matrix(1:12):1부터 12까지
matrix(1:12,nrow = 3): 로그의 행 갯수가 3개구나
matrix(1:12,ncol = 3): 로그의 열 갯수가 3개구나
rownames(mat)<-c("국어","영어","수학"): 행이름
colnames(mat)<-c("a1","a2","a3","a4"): 열이름
mat[1,2]
mat[,2]
mat[1,]
- mat[1,2][1] 2
- mat[,2]
국어 영어 수학
2 6 10- mat[1,]
a1 a2 a3 a4
1 2 3 4
:행과 열로 구성된 사각형 모양의 표처럼 생겼습니다. 가장 많이 사용하는 데이터의 형태
data.frame(x1) #표처럼나옴(세로로)
data.frame(x2)
data.frame(x1,x2)
- data.frame(x1)
x1
1 100
2 80
3 60
4 40
5 30- data.frame(x2)
x2
1 a
2 b
3 C
4 a
5 b- data.frame(x1,x2)
x1 x2
1 100 a
2 80 b
3 60 C
4 40 a
5 30 b
df <- data.frame(score=x1,grade=x2)
df[,'score']
df$score
- df
score grade
1 100 a
2 80 b
3 60 C
4 40 a
5 30 b- df[,'score'][1] 100 80 60 40 30
- df$score
[1] 100 80 60 40 30
air <- airquality[1:6,]
sum(air[c(1,4),c(1,5)])
air <- airquality[,3:6]
- Ozone Solar.R Wind Temp Month Day
1 41 190 7.4 67 5 1
2 36 118 8.0 72 5 2
3 12 149 12.6 74 5 3
4 18 313 11.5 62 5 4
5 NA NA 14.3 56 5 5
6 28 NA 14.9 66 5 6
air<-6행이 출력 됨.
- 69,
- air<-
3~6열 출력됨.
install.packages("readxl")
library(readxl)