R스튜디오를 설치하고 사용법을 간단하게 익혔다.R에서 변수는 데이터 분석의 대상이다. 데이터 분석은 변수 간에 어떤 관계가 있는지 파악하는 작업이다.상수는 고정된 값이기 때문에 분석 대상이 될 수 없다.b <- 2bc <- 3cd <- 3.5da+ba+
데이터 분석은 함수가 매우 중요하다.함수의 옵션을 설정하는 명령어를 파라미터라고 한다.
함수를 이용하려면 함수가 들어있는 패키지를 설치해야한다.R의 장점은 다양한 패키지가 존재 한다는 것이다.데이터를 그래프로 표현하는 작업을 할 때 가장 많이 사용하는 패키지이다.
행과 열로 구성된 사각형 모양처럼 생김.열은 속성이다. 컬럼 또는 변수라고 불린다.행은 정보이다데이터가 크다 = 행이 많다 또는 열이 많다
네 명의 학생이 영어 시험과 수학 시험을 봤다고 가정하고 데이터 프레임 생성$는 데이터 프레임 안에 있는 변수를 지정할 때 사용1\. 평균
외부 데이터 이용하기 다운 받은 데이터 파일을 프로젝트 폴더에 넣는다. readxl 패키지 설치하고 로드 엑셀 파일 불러기 분석하기 영어 점수와 과학 점수 평균 엑셀 파일 첫 번째 행이 변수명이 아니면? 원래 엑셀 파일은 첫 번째 행에 변수명이 입력되어 있다. r
head() : 데이터 앞부분 출력 tail() : 데이터 뒷부분 출력view() : 뷰어 창에서 데이터 확인dim() : 데이터 차원 출력str() : 데이터 속성 출력summary() : 요약 통계량 출력파일 불러와 데이터 프레임 생성head() - 데이터 앞부분
변수명을 이해하기 쉽게 바꾸면 데이터를 파악하는데 더욱 도움이된다.1\. 2개의 변수로 구성된 데이터 프레임 생성rename()을 이용하기위해 dplyr 패키지 설치하고 로드데이터 프레임 복사본 만들기변수명 바꾸기
변수를 조합하거나 함수를 적용해 새 변수를 만들어 분석할 수 있다.2개의 변수로 구성된 데이터 프레임 생성var1과 var2 변수의 값을 더한 var_sum이라는 파생 변수를 만들어 df에 추가var1과 var2를 더한 후 2로 나눠 var_mean이라는 파생변수 만들
기준값 정하기hist를 이용하면 히스토그램을 그릴 수 있다.빈도표로 합격 판정 자동차 수 살펴보기막대 그래프로 빈도 표현하기mpg$grade <- ifelse(mpg$total >= 30, "A", ifelse(mpg$total>=20,"B","C"))head(m
주말을 통으로 쉬었다... KDT 하기시작하니까 시간이 매우 부족하다... 여튼 시작!dplyr은 가장 많이 사용하는 패키지이다.filter() - 행 추출select() - 열 추출arrange() - 정렬mutate() - 변수 추가summarise() - 통계치
| 기호를 이용하여 여러 조건 나열%in% rlghtkdyd
exam에서 math변수만 추출해 출력한다.exam %>% select(english)exam %>% select(class, math, english) \`\`\`4\. 변수 제외하기추출할 변수를 지정하는 방법 말고 특정 변수만 제외하고 나머지 모든 변수를 추출하는