선정 책
빅데이터 시대, 성과를 이끌어 내는 데이터 문해력
CHAPTER 3-4
[주제]
데이터 활용 프로세스 中 현상 파악과 평가, 원인 분석 방법 배우기
[아티클 요약]
현상 파악 시 중요한 점
다른 것과의 비교(평가)
원인 분석 시 중요한 점
원인 후보를 이끌어내는 방법
원인 후보 열거 → 지표 결정 → 관련성 확인
관련성 확인법
시각적으로 관련성 확인(시각화)
통계 지표 확인(상관분석)
+) 데이터 수집이 어려운 경우
주의사항
[인사이트]
내용이 1-2장에 비해 상대적으로 길고 어려워서 완전히 이해했는지는 잘 모르겠지만, 데이터 분석 은 ‘한 걸음 더 나아가 생각하는 것’이 중요한 것 같아요.
단순 비교로 그치는 게 아니라 그래서 말하고자 하는 것이 무엇인지? 말하고자 하는 근거에 충분한 뒷받침(사용하는 지표나 평가 기준에서도)이 되는지?를 늘 생각하면서 작업을 진행해야겠습니다.
지금 우리는 파이썬이나 SQL 등 툴을 배우는 식으로 학습하고 있지만, 역시 결국은 도구를 어떻게 사용하느냐가 중요하네요!
[팀원 공통 인사이트]
데이터 분석에 앞서 선행되어야 하는 목표설정, 그리고 문제를 정의 후 현상파악&평가 및 원인 분석과 올바른 해결 방안을 모색하는 데이터 분석가가 되고싶다.
중요부분 ✅표시!
정의
실제 분석을 수행하기 전, 분석을 수행할 과제의 정의 및 결과를 도출할 수 있도록 관리하는 방안을 사전에 계획하는 작업
특징
데이터 사이언티스트의 요구 역량인 수학/통계학적 지식, 분석 도구인 데이터 및 프로그래밍 기술, 해당 비즈니스에 대한 이해와 전문성에 대한 고른 역량과 시각 등이 요구됨
분석 대상과 방법에 따른 4가지 분석 주제✅

목표 시점별 분석 기획✅
범위 넓음
구성
방해요소
생성 과정

업무 특성에 따른 모델
KDD 분석 방법론
순서와 단계별 구성 중점
프로세스✅

1단계/데이터셋 선택
비즈니스 도메인에 대한 이해와 프로젝트 목표 설정
필요한 데이터를 선택
2단계/데이터 전처리
의미 있는 데이터로 재가공
3단계/데이터 변환
정제된 데이터에 분석 목적에 맞게 변수를 생성, 선택하고 데이터의 차원을 축소
4단계/데이터 마이닝
분석 목적에 맞는 데이터 마이닝 기법을 선택, 알고리즘 적용
5단계/해석과 평가
결과에 대한 해석과 평가, 그리고 분석 목적과의 일치성 확인
CRISP-DM 분석 방법론
KDD 분석 방법론과 비슷하나 조금 더 세분화
단계 간 피드백을 통해 완성도 UP
프로세스✅


분석 기획
비즈니스 도메인과 문제점 인식
분석 계획 및 프로젝트 수행계획 수립
데이터 준비
원천 데이터 수집 및 정합성 체크
- 데이터 분석
다양한 분석 기법과 알고리즘 이용해 분석
모델링 및 모델 평가
시스템 구현
설계 및 구현
분석 기획에 맞는 모델 도출
평가 및 전개
프로젝트 종료 단계
성과 평가 및 정리, 모델 발전 계획 수립
문제가 정해져 있는 상황에서 답을 구하는 것
문제 탐색 → 문제 정의 → 해결 방안 탐색 → 타당성 평가✅
비즈니스 모델 기반 문제 탐색
업무, 제품, 고객 단위로 문제 발굴
분석 기회 발굴의 범위 확장
각 관점을 고려해 비즈니스 문제 발굴
원천 데이터로부터 통찰과 지식을 얻는 방법
(+) 지도학습
정답이 있는 데이터를 활용하여 분석 모델 학습
비지도학습✅
일반적인 상향식 접근방식 수행방식
정답을 알려주지 않고 학습
프로토타이핑 접근
분석 후 결과를 확인해가며 반복적으로 개선
Time Boxing 기법
현재 할당된 작업이 주어진 시간 동안 완수되지 못하였더라도 다음 작업으로 넘어가는 방법
SQL 실전! 실제 DB에서 연습해요 LV.1 - 데이터 속 김서방 찾기
SQL 실전! 실제 DB에서 연습해요 LV.2 - 날짜별 획득포인트 조회하기
SQL 실전! 실제 DB에서 연습해요 LV.3 - 이용자의 포인트 조회하기
ADSP 9주차✅ 3주차 복습✅
한 장 요약.
3강 복습할 것도 많고, 9강 내용도 많아서 상당히 오래 걸린다. 엉엉 나 억덕계.. 이번주는 주말에도 공부 시간을 오래 가져야 할 것 같다.
데이터 문해력 CHAPTER 5-6✅
이 선생님도 내용이 조금씩 복잡해지기 시작.
대신 ADSP 강의에서 배운 용어들이 조금씩 나와서 반갑다!
하루에 두 장씩 읽는 게 조금 힘들긴 하다
완전히 이해하는 게 중요한데 그냥 정보를 우겨넣고만 있는 건 아닐쥐 걱정
그래도 본캠프 일정은 이것보다 더 힘들테니 견뎌라..! 나..!
SQL 달리기반 퀘스트 1-3✅
걷기반 문제는 실제 DB에서 바로바로 뽑으면서 확인하는 게 아니여서 불편했는데, DB 활용하니까 훨 재밌다. 기억나지 않는 게 등장해도 알음알음 찾아내고 있음
아직까지는 역시 SQL이 제일 재밌다
NO SHIBAL KEEP GOING.......🍀