
예시 데이터 : https://www.kaggle.com/mirichoi0218/insurance1\. 1개의 범주형 변수에 대한 시각화1개의 범주형 변수에 대한 시각화는 주로 막대그래프를 사용하는 방법이 가장 효율적이고 보기도 좋습니다. 예시 데이터에서 re

예시 데이터 : https://www.kaggle.com/mirichoi0218/insurance1\. 1개의 연속형 변수에 대한 시각화1개의 연속형 변수는 주로 히스토그램, 커널 밀도 곡선 그리고 박스 플롯을 통해 해당 분포를 시각화할 수 있습니다.bmi 변

예시 데이터 : https://www.kaggle.com/mirichoi0218/insurance범주형 변수와 연속형 변수 사이의 관계는 대부분 여러 개의 그룹에 따른 연속형 변수의 분포에 대해 시각화하는 것이라고 말할 수 있습니다.범주형 변수와 연속형 변수

범주형 변수와 연속형 변수 사이의 관계를 파악할 시에 범주형 변수가 가지고 있는 level에 따른 각 그룹 별 연속형 변수의 분포, 그 중 특히 평균을 파악하는 것은 매우 중요한 일입니다.예를 들어 독립표본 t 평균 검정, 일원분산분석, 이원분산분석(factorial

R에서는 factor형 변수의 level을 조작할 수 있는 패키지인 forcats를 제공하고 있습니다. 이번 시간에는 forcats 패키지의 함수 중 fctinfreq()와 fctreorder() 함수를 ggplot2에서의 막대 그래프 및 박스 플롯의 정렬에 응용해보

예시 데이터 : https://www.kaggle.com/prathamtripathi/drug-classificationggplot2에서는 geom_histogram(), geom_boxplot(), geom_bar() 등의 함수 안에서 fill 인자를 통해

예시 데이터셋 : https://www.kaggle.com/davinwijaya/customer-retention막대 그래프는 하나의 범주형 변수와 두 개의 범주형 변수를 시각화하는 데 있어서 가장 효과적인 그래프 중 하나입니다.ggplot2의 geom_bar

이번 시간에는 정규성 가정을 확인할 때 자주 쓰이는 그래프인 Q-Q plot을 그리는 방법에 대해서 소개하려고 합니다.연속형 변수 1개에 대한 Q-Q plot을 그리기 위해서는 ggplot() 함수의 aes() 함수 안의 sample 인자(x 인자가 아닙니다!)에 원하

상관관계 그래프는 연속형 변수들 간의 관계를 파악할 때 가장 많이 사용되는 그래프입니다.R에서는 ggcorrplot 패키지를 활용해 이러한 상관관계 그래프를 좀 더 보기 좋게 시각화할 수 있습니다.물론 corrgram 패키지나 corrplot 패키지 또한 상관관계 그래

구글링을 하다가 정말 괜찮은 R 시각화 함수를 찾아서 소개하려고 합니다.CGPfunctions 패키지의 PlotXTabs2 함수가 그 주인공인데, 이 함수는 두 범주형 변수 간의 관계를 막대 그래프로 표현하되 각각의 막대 그래프에서 나머지 범주형 변수가 차지하는 비율을