대시보드용 테이블 생성(퍼플팀) 대시보드용 테이블 생성(블루팀) CS별 경기 수 & 승리 수 승리 / 패배 / 전체 평균 CS 평균 레벨별 경기 수 & 승리 수 승리 / 패배 / 전체 평균 레벨 킬별 경기 수 & 승리 수 승리 / 패배 / 전체 평균 킬 획득 골드별 경기 수 & 승리 수 승리 / 패배 / 전체 평균 획득 골드 요소별 승리 상관계수
2021. 01. 12 화요일 대시보드에 사용할 지표를 정리하였다. 스코어카드 승률(원형 차트 사용) 평균 킬 수 평균 데스 수 평균 어시스트 평균 CS 평균 획득 골드 평균 설치 와드 평균 파괴 와드 평균 파괴 타워 첫 킬 차지률 평균 레벨 차트 CS에 따른 승패 비율 획득 골드에 따른 승패 비율 킬 수에 따른 승패 비율 데스 수에 따른 승패 비율 타워 철거 수에 따른 승패 비율 평균 레벨에 따른 승패 비율 와드 설치 수에 따른 승패 비율 첫 킬 차지에 따른 승패 비율 어제 결정한 방법을 바탕으로 쿼리를 작성하였다. 팀별로 승률을 따로 구하기 위해 두개의 테이블을 생성하였다. 요소별 버킷을 생성하고 퍼플팀의 경우에는 bluewins를 퍼플팀에 해당하는 데이터로 수정하였다. 퍼플팀 대시보드 쿼리
대시보드용 테이블 생성(퍼플팀) 대시보드용 테이블 생성(블루팀) CS별 경기 수 & 승리 수 승리 / 패배 / 전체 평균 CS 평균 레벨별 경기 수 & 승리 수 승리 / 패배 / 전체 평균 레벨 킬별 경기 수 & 승리 수 승리 / 패배 / 전체 평균 킬 획득 골드별 경기 수 & 승리 수 승리 / 패배 / 전체 평균 획득 골드 요소별 승리 상관계수
2021. 01. 08 금요일 프로젝트 진행을 기획 2번안으로 결정하였다. 이전부터 다뤄보고 싶은 주제이기도 하고, 전에 다뤘던 주제와는 다른 내용이어서 결정하게 되었다. 다만 비지니스 상황에 대한 문제는 계속 고민해 보아야 할 것이다. Query를 몇가지 작성해보았다. 게임, 그리고 데이터의 특성상 하나의 gameid에 양 팀의 데이터가 모두 존재한다. 각 팀의 상황별 승률을 계산하는 것은 문제가 없지만, 팀 구분 없이 상황별 양팀 통합 승률을 구하는 것은 조금 복잡한 query가 될 것 같았다. 블루팀, 퍼플팀(레드팀) 각각의 데이터를 CTE로 구하고, 메인 쿼리에서 데이터를 합산하는 방법이 좋을 것 같다. 지금은 아직 기획을 검토하는 기간이고, 실제로 분석에 들어가는 것은 다음주 부터지만, 해당 내용에 맞는 query를 미리 작성해보았다. 평균 레벨별 경기수 & 승리수 평균 레벨별 승률을 구하기
2020. 12. 09 수요일 새로운 테이블에 대해 알아보았다. UDEMY Course 테이블에는 UDEMY의 강의에 대한 데이터가 담겨있다. 코스는 크게 4가지로 나뉜다. 웹 개발 비지니스 금융 그래픽 디자인 악기 강의의 제목, 수강생 수, 수강료 유무, 수강비, 등록일자, 레벨(난이도), 코스 등의 데이터가 담겨있다. 지표를 선정하였다. 이번 분석에서 도출해야할 결론은 다음과 같다. 가장 인기있는 코스 수강생 수 총 매출 차기 콘텐츠 선정 코스 수강료 유무 레벨 선정한 지표는 다음과 같다. 코스별 수강생 수 코스별 총 매출 코스별 유/무료 강의 비율 코스별 유료 강의 수강생 비율 난이도별 강의 비율 난이도별 수강생 비율 지표를 구하기 위한
SQL의 기본 문법과 Query에서의 실행 순서 SQL에서 가장 기초가 되는 문법들은 다음과 같다. SELECT FROM WHERE GROUP BY HAVING ORDER BY LIMIT ; 그리고 이 문법들로 Query를 작성했을 때 실행 순서는 다음과 같다. FROM SELECT WHERE GROUP BY HAVING ORDER BY LIMIT ; 그리고 각자의 역할을 간략히 표현하자면 다음과 같다. FROM : Coulmn을 불러올 테이블을 선택 SELECT : FROM 에서 선택한 테이블에서 불러올 Column을 선택 WHERE : SELECT 에서 불러온 Column 필터링하기 GROUP BY : 집계함수 결과를 그룹화하기 HAVING : 집계함수의 결과 기준으로 필터링하기 ORDER BY : 정렬 순서 정하기 LIMIT : 출력
데이터 분야에서 가장 많이 쓰이는 데이터베이스는 바로 관계형 데이터베이스이다. 많이 쓰이는 만큼 관계형 데이터베이스와 나머지 데이터베이스를 구분하기 위해 그 나머지 데이터베이스를 통틀어 칭하는 명칭이 따로 있는데 바로 NoSQL라는 명칭이다. 말 그대로 No SQL, SQL을 사용하지 않는 데이터베이스라는 의미인데, 반대로 생각해보면 관계형 데이터베이스를 다루기 위해서는 SQL에 대한 지식이 요구된다는 의미이다. Data Analyst로서의 커리어를 꿈꾸고 있다면, 우리는 업계에서 가장 많이 필요로하는 SQL이라는 프로그래밍 언어를 필수적으로 익힐 필요가 있다. 따라서 오늘은 Data Analyst가 되기 위한 첫번째 관문, SQL에 대해서 알