48\*78975+5'안녕하세요'75+578+2''' 24-08-03 강의자료 ''''''실행 단축키: ctrl + enter되돌리기: cral + z전체 블록 선택: ctrl + a'''a <- 15'''데이터 구조간 관계 및 데이터 유형벡터: 한 가지 데이터
a = 1aa <- 1a <- 2aa == 1 a == 2 a != 1 a > 1a < 1a <- "abc" abc <- 2 a <- "abc" a <- 3b <- "abcd"class(a) class(b) a2 <- a
워킹 디렉토리 지정https://statti.tistory.com/5

''' 24 - 08 - 10 강의 자료 ''''''변수(Variable)다양한 값을 지니고 있는 하나의 속성변수는 데이터 분석의 대상'''a <- 1ab <- 3.589ba + ba\*b4/b var1 <- c(1,2,5,7,8) var1var2 &l

빠진 데이터, 이상한 데이터 제거\-> 누락된 값, 비어있는 값\-> 함수 적용 불가, 분석 결과 왜곡\-> 제거 후 분석 실시df <- data.frame(s = c("M","F", NA, "M","F"), score = c(5,4,3,4,NA))dfis.na(

정상 범주에서 크게 벗어난 값\-> 이상치 포함시 분석 결과 왜곡\-> 결측처리 후 제외하고 분석존재할 수 없는 값 ex) 성별 변수에 3 -> 결측 처리극단적인 값 ex) 몸무게 변수에 230 -> 정상 범위 기준 정해서 결측 처리 존재할 수 없는 값outlier &

2차원 그래프, 3차원 그래프지도 그래프네트워크 그래프모션 차트인터랙티브 그래프1단계 : 배경 설정 (축)2단계 : 그래프 추가(점, 막대, 선...)3단계 : 설정 (축 범위, 색, 표식)'''데이터를 x축과 y축에 점으로 표현한 그래프 \-> 나이와 소득 처럼 연속

한국복지패널데이터한국보건사회연구원 발간가구의 경제활동을 연구해 정책 지원에 반영할 목적2006 ~ 2015년까지 전국에서 7천여 가구를 선정해 매년 추적 조사경제활동, 생활실태, 복지욕구 등 수천 개 변수에 대한 정보로 구성install.packages('foreign

\-Review결측치 확인table(is.na(df$score))함수의 결측치 제외 기능mean(df$score, na.rm=T)이상치 확인table(outlier$s)ggplot2 함수들geom_point() : 산점도geom_col() : 막대그래프 - 요약표ge

텍스트 마이닝(Text Mining) 문자로 된 데이터에서 가치 있는 정보를 얻어 내는 분석 기법 sns나 웹 사이트에 올라온 글을 분석해서 사람들이 어떤 이야기를 나누고 있는지 파악할 때 자주 사용 형태소 분석(Morphology Analysis) : 문장을
국정원 트윗 텍스트 마이닝국정원 계정 트윗 데이터\-> 국정원 대선 개입 사실이 밝혀져서 논란이 되었던 2013년 6월, 독립 언론 뉴스타파 인터넷을 통해 공개한 데이터03:551\. 데이터 로드twitter <- read.csv('twitter.csv',

인터렉티브 그래프 - 움직이는 그래프패키지 준비install.packages('plotly')library(plotly)1\. ggplot으로 그래프 생성library(ggplot2)p <- ggplot(data=mpg, aes(x=displ, y=hwy, col

단계 구분도지역별 통계치를 색깔의 차이로 표현한 지도인구나 소득 같은 특성이 지역별로 얼마나 다른 이해하기가 쉽다.패키지설치install.packages('ggiraphExtra')library(ggiraphExtra)str(USArrests)library(tibble
통계적 분석 기법을 활용한 가설 검정데이터를 요약해서 설명하는 통계 기법ex) 사람들이 받는 월급을 집계해 전체 월급 평균 구하기단순히 숫자를 요약하는 것을 넘어서 어떤 값이 발생할 확률을 계산하는 통계 기법ex) 수집된 데이터에서 성별에 따라 월급 차이가 있는것으로

import pandas as pdimport numpy as npimport osimport tarfilefrom six.moves import urllibimport matplotlib.pyplot as plt항상 동일한 결과를 위한 random.seed 값 설정n

업데이트 버전 확인트루 나오면 설치해야 함install.packages("installr")library(installr)check.for.updates.R()R에서 수동 설치 (참고)https://hongong.hanbit.co.kr/r%EA%B3%BC-r-