구글링을 하다가 정말 괜찮은 R 시각화 함수를 찾아서 소개하려고 합니다.CGPfunctions 패키지의 PlotXTabs2 함수가 그 주인공인데, 이 함수는 두 범주형 변수 간의 관계를 막대 그래프로 표현하되 각각의 막대 그래프에서 나머지 범주형 변수가 차지하는 비율을
상관관계 그래프는 연속형 변수들 간의 관계를 파악할 때 가장 많이 사용되는 그래프입니다.R에서는 ggcorrplot 패키지를 활용해 이러한 상관관계 그래프를 좀 더 보기 좋게 시각화할 수 있습니다.물론 corrgram 패키지나 corrplot 패키지 또한 상관관계 그래
https://programmers.co.kr/learn/courses/30/parts/17047루시와 엘라 찾기이름에 el이 들어가는 동물 찾기중성화 여부 파악하기오랜 기간 보호한 동물(2)DATETIME에서 DATE로 형 변환
없어진 기록 찾기있었는데요 없었습니다오랜 기간 보호한 동물(1)보호소에서 중성화한 동물
고양이와 개는 몇 마리 있을까동명 동물 수 찾기입양 시각 구하기(1)입양 시각 구하기(2)
모든 레코드 조회하기역순 정렬하기아픈 동물 찾기어린 동물 찾기동물의 아이디와 이름여러 기준으로 정렬하기상위 n개 레코드
Dataset : https://www.kaggle.com/loveall/email-campaign-management-for-sme이번 시간에는 이메일 켐페인 데이터셋을 활용해 EDA 및 가설 검정을 연습해보도록 하겠습니다.먼저 데이터를 불러와 중복행을 제거
이번 시간에는 정규성 가정을 확인할 때 자주 쓰이는 그래프인 Q-Q plot을 그리는 방법에 대해서 소개하려고 합니다.연속형 변수 1개에 대한 Q-Q plot을 그리기 위해서는 ggplot() 함수의 aes() 함수 안의 sample 인자(x 인자가 아닙니다!)에 원하
Dataset : https://www.kaggle.com/ghoshsaptarshi/av-genpact-hack-dec2018이번 시간에는 음식 배달 회사 데이터셋을 가지고 EDA 및 가설 검정을 진행하도록 하겠습니다.먼저 데이터를 불러와야 하는데, 이번 데
Dataset : https://www.kaggle.com/jahnveenarang/cvdcvd-vd이번 시간에는 Kaggle의 Social-Network-Ads 데이터셋을 활용해 EDA 및 가설 검정을 진행해보겠습니다.먼저 데이터를 불러온 다음 중복행을 제거
데이터 분석가를 지향하는 저로써는 항상 데이터 분석 프로젝트의 실무는 어떤 방식으로 구성되고 흘러갈까? 혹은 본인이 공부하고 있는 내용과 실제 데이터 분석 프로젝트 간의 차이는 어느 정도 될까? 등의 궁금증을 늘 가지고 있었습니다.그러던 와중 IT, 데이터 분석, AI
Dataset : https://www.kaggle.com/harrimansaragih/dummy-advertising-and-sales-data이번 시간에는 Dummy Marketing and Sales 데이터셋을 가지고 EDA 및 가설 검정을 진행하도록 하
예시 데이터셋 : https://www.kaggle.com/davinwijaya/customer-retention막대 그래프는 하나의 범주형 변수와 두 개의 범주형 변수를 시각화하는 데 있어서 가장 효과적인 그래프 중 하나입니다.ggplot2의 geom_bar
Dataset : https://www.kaggle.com/fayomi/advertising 이번 시간에는 Kaggle의 advertising 데이터셋을 가지고 EDA를 진행해보도록 하겠습니다. 먼저 데이터를 불러와 중복값을 제거하고 전체적인 구조를 파악해보겠습니다
Dataset : https://www.kaggle.com/davinwijaya/customer-retention이번 시간에는 Kaggle의 Marketing Promotion Campaign 데이터셋을 활용해 A/B test와 A/B test를 확장한 A/B
예시 데이터 : https://www.kaggle.com/prathamtripathi/drug-classificationggplot2에서는 geom_histogram(), geom_boxplot(), geom_bar() 등의 함수 안에서 fill 인자를 통해
R에서는 factor형 변수의 level을 조작할 수 있는 패키지인 forcats를 제공하고 있습니다. 이번 시간에는 forcats 패키지의 함수 중 fctinfreq()와 fctreorder() 함수를 ggplot2에서의 막대 그래프 및 박스 플롯의 정렬에 응용해보
Dataset : https://www.kaggle.com/zhangluyuan/ab-testing이번에는 Kaggle의 A/B testing 샘플 데이터셋을 활용해 A/B test를 연습해보도록 하겠습니다.데이터를 불러온 뒤 중복행 제거 후 데이터의 구조를