R이란?
- 통계데이터수정과 분석에 주로 사용되는 언어
- 무료프로그램이지만 프로그래밍, 그래픽측면(시각화)에서는 상용프로그램과 대등하거나 월등함
- 통계기능 뿐만 아니라 일반적인 프로그래밍이 가능
ex) 분석자동화, 새로운 함수 생성
- 오픈소스 소프트웨어임으로 사용자들이 수많은 함수를 공유하고 있음
- 데이터 분석 또는 시각화가 목적이라면 R언어를, 웹 애플리케이션과 연동할 목적이라면 Python을 사용
R을 사용하는 이유
- Reproducibility(재현성, 재현가능성)
- Automation(자동화)
- 데이터가 변하거나 무엇인가 잘 못 되었을 경우 분석을 다시 신속하게 할 수있는 것
- Communization(소통)
- 프로그래밍 코드는 텍스트이기 때문에, 이미 시중에 나와 있는 R과 관련된 책들은 물론, F-mail/ Google/ Stack overflow 등을 통해서 다른 사람들과 교류하여 도움 받을 수 있음
세계적인 기업들이 사용하는 R
- 구글, 페이스북 => 분석기번에 사용
- 우버, 에어비엔비 => 고객 성향 데이터 분석
R을 활용한 데이터시각화의 예
- 나이팅게일 차트(Nightingale Chart)
- 상관행렬 히트맵(Correlation Matrix Heatmap)
- 의사결정나무(Decision Tree)
- 스타차트(Star Chart)
- 산포토(Degree of Scattering)
- 소셜 네트워크분석
- 지도 시각화
- 텍스트마이닝
- 워드클라우드