R- R고쓰자!

be1le·2022년 4월 12일
4

ML-R

목록 보기
1/3
post-thumbnail

R이 뭔데?

R은 시각화에 높은 성능을 보이는 언어라고 생각하면 된다. R의 특징을 정리해보자면 다음과 같다.

  • 통계데이터수정과 분석에 자주 사용된다
  • 무료프로그램이지만 프로그래밍, 그래픽측면(시각화)에서는 상용프로그램과 대등하거나 월등하다.
  • 통계기능 뿐마 아니라 일반적인 프로그래밍이 가능
    ex) 분석자동화, 새로운 함수 생성
  • 오픈소스 소프트웨어임으로 사용자들이 수많은 함수를 공유하고 있음
  • 데이터 분석 또는 시각화가 목적이라면 R언어를, 웹 애플리케이션과 연동할 목적이라면 Python을 사용

이중에서 필자가 생각하는 R을 쓰는 가장 큰 이유는 다름아닌 Communication이 아닐까 생각한다. 실제로 장고닌자를 공부할 때도 레퍼런스가 상대적으로 너무나도 적어서 웹설계에 상당히 애를 먹었던 경험이 있다. 하지만 R은 당장 Stackoverflow만 보아도 상당히 많은양의 정보를 서로 공유하고 있기에 내가 실행중 발생한 오류코드만 잘보아도 모든 레퍼런스를 찾을수 있을 정도라고 느꼇다.

누가 쓰고있나요?

대표적으로는 Goggle, facebook, uber, microsoft, twitter, airbnb등 세계적으로 유명한 기업들 모두 자사의 데이터를 가공해야 할때는 R을 쓴다. 그만큼 데이터 관련해서는 처리가 용이하다는걸 알수 있다.

kaggle 에서의 R

kaggle에 또어떤 데이터셋이 올라왔나 마실 나가시는 정도의 사람들 이라면 당연한 이야기 이겠지만 세계에서 가장큰 빅데이터 전문 사이트에서 조차도 R을 빼고 이야기 하기란 어렵다. 1/3은 R언어로 작성된 코드이기 때문이다. kaggle은 알다시피 수많은 데이터 사이언티스트와 빅데이터 전문가들이 많이 사용하는 사이트인데 그사람들이 java나 python을 다루지 못하여 R을 사용하는 것이 아니라, R이 데이터 분석에 많은 장점이 있기에 오히려 배워서 사용한다는걸 알수 있다.
R을 활용한 데이터 시각화에는

  • 나이팅게일 차트

  • 상관행렬 히트맵

  • 의사결정 나무

  • 스타 차트

  • 산포도

  • 소셜 네트워크 분석

  • 텍스트마이닝

등등 예제만 보아도 상당히 시각화에 뛰어난 언어 이구나...!를 알 수 있다! 앞으로 R언어를 좀더 능숙히 다루기 전에 나 스스로에게도 R언어의 필요성을 리마인드 하면서 다시 집중할 수 있게만드는 포스팅 이였던것 같다!

profile
그저 그런 개발자가 되지 않겠습니다.

0개의 댓글