시각화 학습을 통하여 얻은 인사이트, 작품, 프로젝트에 대해 포스팅.(사진출처: 페가님 블로그)라인차트중 꺾은 선형 차트는 연속된 기간 혹은 간격동안 양적 값을 표시하는데 잘 사용되어진다. 주로 y축은 정량적 값을 가지고 있으며, x축은 시간의 척도 또는 일정한 간격을
데이터 선정 및 이유 코로나가 극성인 요즘 코로나 데이터를 통해 여러 의미를 뽑아보고자 시작하게되었습니다. 데이터는 캐글에서 가져오게 되었습니다. 시간의 흐름에 따른 국가별 코로나19 확진자 변화량 https://user-images.githubusercontent
먼저 오른쪽에 있는 Y축을 사용하는 이유가 무엇일까요?? 위에 보이는 그림은 코로나19로 인해 월별 확진자, 사망자, 회복자의 수를 나타내는 그래프입니다. 그래프를 봤을때 어떤 생각이 드나요?? 저는 처음 위의 시각화를 했을때 "뭐지? 사망자는 별로없네??" 라고
들어가기 지난번에 visualization에서 코로나 19시각화를 matplotlib과 seaborn, plotly를 이용해서 만들본적이 있습니다.(링크 참고)
보고서를 위해 일반 그래프에서 색상 넣기 -> 지역별로 색상 추가이해를 돕기위한 레이블 추가서식기능을 이용하여 전체적으로 폰트크기조절, 범례 위치 변경, 값 단위 및 소수점 변경, 필요없는 범례 제거
복수개의 object가 있을때 lineplot보다 효과적으로 정보전달이 가능한 areaplot필터와 하이라이트를 넣어서 필요한 데이터를 효과적으로 보고, 커스텀 하는방법
파이썬 혹은 SQL에서 여러 테이블(table)을 합치는 경우가 많다, 특히나 e-commerce데이터의 경우 여러가지 테이블로 나누어 두는데 이유가 쿼리문을 처리하는데 있어서 데이터를 불러오는데 시간을 단축시키고 효율적이기 때문이라고 알고있다.파이썬에서는 merge,
가장먼저 "계층작업" 이라고 지도 시각화시 데이터에 국가, 주, 도시 등등이 있는데 이것을 하나의 계층으로 묶어서 필요한정도만큼 표현하는것을 학습특정 필터 혹은 하이라이트를 설정하고 이를 여러 시트동시에 컨트롤 하는 방법을 학습 -> 대시보드에 사용시 매우 효율적이다.
데이터 블렌딩(Data Blending) : 여러형태의 데이터를 가공해서 피룡한 데이터를 만드는것 (데이터 연결, 데이터통합)JOIN과 블렌딩의 차이 : JOIN의 경우 처음에 먼저 데이터를 결합한후 집계를 하는 방식이다. 하지만 블렌딩의 경우 반대로 시트에서 각각 집
블렌딩을 활용하여 데이터 합치기이중축 차트 그리기이중축 차트 세부 설정 먼저 해당데이터는 3개의 데이터를 합친것이다. 첫번째와 두번째 데이터는 상품id를 통해서 inner join을 실시하였고, 세번째 데이터는 블렌딩을 통해 열결하였는데 세번째 데이터는 각 상품의 분기
블랜딩한 테이블에서 계산된 필드 사용하기먼저 2개의 테이블은 join으로 연결해서 계산된필드를 하나 만들어서 시각화를 통해 표현을 했고, 이후 블랜딩으로 다른 테이블을 추가로 붙였을때 이미 만든 join테이블 들의 계산된필드와 블랜딩된 테이블과의 계산된 필드에 대한 설
태블로에서 데이터간의 관계형성하기 -> 스키마 구성하기 데이터 베이스 중에서도 관계형 데이터 베이스(RDBMS)를 알고있을것이다. MySQL을 예로 workbench 혹은 bigquery로 작업을 쿼리를 날리고 테이블을 만들때 우리는 각각의 스키마를 구성하게 되고 ER
지난시간에 구성한 스키마를 통한 지도시각화 시행스키마를 구성했을때의 장점화면을 보시면 이전에 만들어 둔 스키마를 그대로 지도로 표현을 해본것입니다. 지도상에는 판매자(Seller)들의 판매량을 크기로 그리고 지역별로 색을 다르게 표현한 것입니다.자세히 보면 각각의 위,
각 시트를 이용하여 대시보드 만들기필터를 통해 필터에 맞는 값들을 보여주기위의 대시보드는 Real Data 는 아니지만 영국의 한 은행권의 고객 데이터를 바탕으로 만든 대시보드 입니다.해당 금융사의 고객의 특징을 왼쪽부터 고객들의 주소, 잔액, 연령, 성별, 직업 이렇
작성한 시트, 대시보드를 활용하여 스토리라인을 만드는 방법을 학습대시보드를 통해서 인사이트를 얻거나 전달하고, 분석을 할때 우리는 필요한 스토리라인을 구성하게되고 어떻게 스토리라인을 구성하느냐에 따라서 매끄러운 정보 전달이 되느냐 안되느냐를 결정하는 중요한 요소인 태블
직장인들을 대상으로 약 2주간 무료로 태블로 교육을 해준다고 해서 신청을 했습니다... ㅎㅎ 퇴근하고 강의를 수강하는데 생각보다 퇴근 후 공부가 힘드네요 ㅠㅠㅠ 입사 전 : 일 잘하고, 퇴근 후 코딩하는 행복한 직장인이 되야지입사 후 : 퇴근하면 가서 자야지...그래
2일차에는 코로나 데이터들을 연속형 불연속형에 따른 특성을 배웠고 이에맞춰 시각화 하는 방법을 배웠습니다. 위의 결과물이 2일차 교육의 결과물입니다. 이렇게 각각의 시도별로 확진자수를 최신 날짜 기준으로 맵차트로서 표현하는 것을 익혔습니다.
3일차는 구글 스프래드 시트로 데이터를 따와서 시각화 하는 작업을 했습니다. 데이터는 주식데이터 네이버와 카카오 종목으로 했습니다.가장 기본적인 형태는 위와 같은 형태인데 위의 시각화를 보면 네이버의 주식이 많이 오른것으로 보입니다. 하지만 잘 생각해보면 가격의 차이가
태블로를 사용하다보면 아래와 같이 파란색으로 데이터 타입이 나타나기도 하고, 초록색으로 데이터 타입이 나타나기도 합니다. 잘 보면 "측정값 이름" 이라는 컬럼 아래에 실선이 그려져 있고, 이 실선을 기준으로 위는 파란색, 아래는 초록색으로 데이터 타입에 색상이 들어 있
이번에는 류현진 선수의 데이터를 통해 시각화를 했습니다.먼저 대시보드를 보겠습니다.간단히 설명을 해보면, 먼저 류현진 선수의 기록을 대시보드로 만든것입니다. 맨위에 보면 조금 짤렸으나... "Type of piches" 라는 던진 공의 종류를 나타내는 필터를 넣었습니다
이번에는 코로나19 전세계 현황 데이터를 사용해서 현황 대시보드를 만들어보았습니다.맨위에는 정보를 요약하는 Summary를 배치하였고아래쪽 왼쪽에는 지도를 통해 확산추이에 따라 크기로 표현을 했습니다. 아래쪽 오른쪽에는 해당하는 국가가 순위가 몇위이고 해당국가의 상황을
오늘은 세일즈 데이터 랭킹을 시각화 해보았습니다.이번 시각화의 중요 포인트는 사람들에게 친숙하게 순위별로 단상에서 메달을 받는 느낌처럼 시각화를 함으로서 추가적인 정보 없이 시각화 자료만으로 받아들일 수 있게 색상과 꾸밈을 하여 효과적으로 만들어 보았습니다.
folium은 지도 시각화를 하는데 강력한 도구이다. 이 folium으로 어디까지 활용할 수 있을지, 빅데이터와 folium의 활용의 무궁무진함을 꾸준히 기록하려고 한다.가장 먼저 folium의 기본적인 기능부터 시작해서 다양한 API와 라이브러리 들을 함께 사용하여
목적 입력받은 단지의 원하는 반경(km)내에 있는 단지만 표현하는 것, 이를 통해 향후 알고싶어하는 아파트 단지의 주변에 있는 유사한 성질의 아파트 단지와 상호 비교를 통하여 여러가지 인사이트를 얻을수있다.
태블로에서 "계산된필드"를 만들때 여러 조건식이 필요한데 이때 사용할 수 있는것이 if 와 iif이다. if의 경우 아래와 같이 흐름이 이어진다.iif는 여러 케이스를 고려하지 않고 True 혹은 False를 구분할때 사용한다.
마지막 주차는 여러 주제중 본인이 골라서 연습해 보는 시간을 가지는데 프롭테크 업계에서 활동중인 저는 당연(?)하게도 인구데이터에 손이 가게되어 시군구별 인구 시각화 를 해보았습니다.기본적인 대시보드 형태입니다. 먼저, 왼쪽아래에 인구순위 별로 표가 있고 오른쪽 위에는
부동산으로 대시보드를 만들게 된 계기 요즘 작년부터해서 벌써 약 1년여간 인플레이션으로 인한 금리인상이 이어지고 있습니다. 이때문에 부동산 시장역시 휘청이고 있으며, 실제로 엄청나게
태블로에서는 바로 위 사진처럼 멋있게 위성지도를 클릭 한번으로 표현할 수 있습니다. 하지만, 저는 지도를 보면서 좀 더 많은 정보를 얻고싶고, 내가 알고싶은 정보들을 우선적으로 보고 싶다는 생각을 했습니다. 위성지도를 사용하면서도 내가 원하는 정보를 노출 시키기 위
아파트 단지들의 월별 순위 변동 차트를 만들면 재밌을것 같아서 만들어본 간단한 결과물을 공유합니다.월별로 평당가에 따라서 순위를 만들어본것인데요, 22년 7월에 6등으로 시작했던 "디에이치반포라클라스"단지가 갑자기 사라진것을 볼수 있습니다. 이것은 23년7월에 순위권밖
인구 피라미드는 많이 볼 수 있지만, 부동산을 나이 피라미드 형태로 본적은 아마 대부분 없을것같아서만들어봤습니다.왼쪽 파란색 막대가 아파트, 오른쪽 분홍색 막대가 오피스텔입니다.서울에서 2005년식 아파트라고 하면 구축은 아니라고 할수 있으려나요??ㅎㅎㅎ 서울의 아파트
아래 사진은 링크에 가시면 자세히 볼 수 있습니다.부동산도 캔들차트로 표현할 수 있지 않을까?? 라는 생각에 시작하게된 이번시각화는 한개의 단지(e편한세상 송도)를 캔들차트로 표현해보았습니다.캔들차트는 총 네가지의 요소로 이루어져 있습니다. 부동산가격을 캔들차트로 표현