R은 시각화에 높은 성능을 보이는 언어라고 생각하면 된다. R의 특징을 정리해보자면 다음과 같다.
이중에서 필자가 생각하는 R을 쓰는 가장 큰 이유는 다름아닌 Communication이 아닐까 생각한다. 실제로 장고닌자를 공부할 때도 레퍼런스가 상대적으로 너무나도 적어서 웹설계에 상당히 애를 먹었던 경험이 있다. 하지만 R은 당장 Stackoverflow만 보아도 상당히 많은양의 정보를 서로 공유하고 있기에 내가 실행중 발생한 오류코드만 잘보아도 모든 레퍼런스를 찾을수 있을 정도라고 느꼇다.
대표적으로는 Goggle, facebook, uber, microsoft, twitter, airbnb등 세계적으로 유명한 기업들 모두 자사의 데이터를 가공해야 할때는 R을 쓴다. 그만큼 데이터 관련해서는 처리가 용이하다는걸 알수 있다.
kaggle에 또어떤 데이터셋이 올라왔나 마실 나가시는 정도의 사람들 이라면 당연한 이야기 이겠지만 세계에서 가장큰 빅데이터 전문 사이트에서 조차도 R을 빼고 이야기 하기란 어렵다. 1/3은 R언어로 작성된 코드이기 때문이다. kaggle은 알다시피 수많은 데이터 사이언티스트와 빅데이터 전문가들이 많이 사용하는 사이트인데 그사람들이 java나 python을 다루지 못하여 R을 사용하는 것이 아니라, R이 데이터 분석에 많은 장점이 있기에 오히려 배워서 사용한다는걸 알수 있다.
R을 활용한 데이터 시각화에는
나이팅게일 차트
상관행렬 히트맵
의사결정 나무
스타 차트
산포도
소셜 네트워크 분석
텍스트마이닝
등등 예제만 보아도 상당히 시각화에 뛰어난 언어 이구나...!를 알 수 있다! 앞으로 R언어를 좀더 능숙히 다루기 전에 나 스스로에게도 R언어의 필요성을 리마인드 하면서 다시 집중할 수 있게만드는 포스팅 이였던것 같다!