SeabornMatplotlib 기반 통계 시각화 라이브러리로, 구성, 분포, 관계 등 통계적인 정보나 데이터를 살피는데 적합한 라이브러리쉬운 문법과 깔끔한 테마 디자인으로 많은 사람들이 선호일반적으로 import seaborn as sns 로 사용시각화의 목적과 방법
Grid 이해하기default grid기본적인 Grid는 축과 평행한 선을 사용하여 거리 및 값 정보를 보조적으로 제공한다.다른 표현들을 방해하지 않도록 무채색으로 사용하며, 검정색 보다는 회색, 실선보다는 점선으로 사용한다꼭 X, Y축 두 개의 Grid를 사용할 필요
Facet이란 분할을 의미하는데, 화면 상의 View를 분할 및 추가하여 다양한 관점을 전달한다.같은 데이터셋에 대해 서로 다른 인코딩을 통해 다른 인사이트를 보여 줄 수 있다. ex) 같은 데이터셋에 대해 막대 그래프와 도넛 차트 비교같은 방법으로 동시에 여러 fea
Color가 중요한 이유어떠한 데이터를 구분하는데 있어서 가장 중요한 요소는 위치적 정보이고, 그 다음이 바로 색상이다.사람이 공통적으로 색이 가지는 느낌이 있기 때문에, 색상에 따라 우리의 인사이트를 더 매력적으로 잘 전달할 수 있다.무조건 화려하다고 좋은 것이 아닌
시각화에서 Text가 필요한 이유Visual representation으로 줄 수 없는 설명을 추가할 수 있다.잘못된 전달에서 생기는 오해를 방지할 수 있다.하지만 Text를 과하게 사용하게 된다면 가독성과 이해를 방해할 수 있다.Anatomy of a Figure(T
Scatter Plot흔히 점을 사용하여 두 feature 간의 관계를 알기 위해 사용하며, 산점도라 불린다.scatter는 기본적으로 2차원적인 데이터를 표현하는데, 색, 모양, 크기를 통해 차원을 늘려 갈 수 있다.주로 상관관계를 확인하거나 군집, 값 사이의 차이,
Line plotLine Plot은 연속적으로 변화하는 값을 순서대로 점으로 나타내고, 이를 선으로 연결한 그래프시간/순서에 대한 변화에 적합하여 추세를 살피기 위해 사용하며 시계열 분석에 특화되어 있다.시각화에서 기본적인 plot이기 때문에 .line이 아닌 .plo
기본적으로 직사각형 막대를 사용하여 데이터의 값을 표현하는 차트/그래프막대 그래프, bar chart, bar graph 등의 이름으로 사용됨범주에 따른 수치 값을 막대로 표현하고 막대들을 서로 비교하는 방법막대의 방향에 따른 분류수직(vertical) : bar()를
Maplotlibnumpy와 scipy를 베이스로 하여 다양한 라이브러리와 호환성이 좋다.코드상에서 일반적으로 matplotlib은 줄여서 mpl로 사용한다.기본 plot matplotlib 에서 그리는 시각화는 figure 라는 큰 틀에 ax라는 서브 플롯을 추가해서
데이터 시각화란?데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것데이터를 잘 다룰줄 알아야 하며, 그래픽 요소가 무엇인지 알아야 하고, 데이터가 그래픽 요소를 매핑할 수 있어야 하며 남들이 이해하기 쉽게 전달하고 싶은 내용을 잘 전달하는 것시각화의 Task목적 :