# 자동차 대여 기록에서 대여중 / 대여 가능 여부 구분하기 # 오늘 코드카타 시간 중 가장 많은 시간을 사용 # max 함수를 사용하여 풀었으나 왜 그런지에 대한 이해가 필요 # if 대신 case when 문을 사용할 수 있음 SELECT car_id, if(max('2022-10-16' between start_date and end_date) = 1, "대여중", "대여 가능") AVAILABILITY from CAR_RENTAL_COMPANY_RENTAL_HISTORY group by 1 ORDER BY CAR_ID desc ;
# 년, 월, 성별 별 상품 구매 회원 수 구하기 # year, month 함수 사용 가능 # 1 YEAR(sales_date) YEAR # 2 MONTH(sales_date) MONTH select substr(sales_date,1,4) YEAR, # 1로 대체 가능 substr(sales_date,6,2) MONTH, # 2로 대체 가능 GENDER, count(distinct u.user_id) USER from user_info u join online_sale o on u.user_id = o.user_id where gender is not null group by 1,2,3 order by 1,2,3 ;
# 서울에 위치한 식당 목록 출력하기 # 1 sum(review_score)/count(review_score) 대신 avg(review_score)로 작성 가능 # 2 SUBSTR(ADDRESS,1,2) = '서울' 대신 address like '서울%' 사용 가능 SELECT i.rest_id, rest_name, food_type, favorites, address, round(sum(review_score)/count(review_score),2) score # 1로 대체 가능 from rest_info i join rest_review r on i.rest_id = r.rest_id where SUBSTR(ADDRESS,1,2) = '서울' # 2로 대체 가능 group by 1 order by 6 desc, 4 desc ;
요약 : 정략적 경험 데이터를 기술 통계와 추론 통계를 통해 분석하고 시각화 하는 법
주요 포인트 : 수집된 데이터의 특성을 파악하기 위해 기술 통계를 활용하고, 샘플을 통해 모집단을 추론하거나 가설을 검정하기 위해 추론 통계를 활용한다.
1) 기술 통계는 범주형, 수치형, 방사형 등의 데이터 종류가 있으며,
2) 추론 통계에는 t 검정과 분산분석, 상관 분석과 회귀 분석을 할 수 있다.
3) 현업에서 활용하는 법
분석 기획
1) 분석 기획의 정의와 특징
(1) 분석 기획의 정의
분석 방법론 개요
1) 분석 방법론 개요
(1) 분석 방법론이란?
전통적인 분석 방법론 두 가지 ★
1) KDD 분석 방법론
(1) KDD 분석 방법론(5단계)★
빅데이터 분석 방법론
1) 빅데이터 분석 방법론 개요
(1) 빅데이터 분석 방법론
- 계층적 프로세스 모델로 단계, 태스크, 스텝의 3계층 레벨과 5단계로 구성
(2) 빅데이터 분석 방법론의 계층적 프로세스
- 분석 기획 → 데이터 준비 → 데이터 분석 → 시스템 구현 → 평가 및 전개
참고 : 빅데이터 분석 방법론 플로우 및 단계별 수행 프로세서 꼭 읽어보기★★
02 분석 과제 발굴
분석 과제 발굴 개요
1) 분석 과제 '발굴'의 개념과 '탐색' 방법
(1) 분석 과제 발굴
하향식 접근법★★★
1) 1단계 - 문제 탐색 단계
(1) 비즈니스 모델 탐색 기법 ★★
상향식 접근법
1) 상향식 접근법 개요
(1) 상향식 접근법 개념
- 원천 데이터로부터 통찰과 지식을 얻는 접근 방법
(2) 상향식 접근법의 특징
- 분석부터 시작하고 그 결과로부터 가치가 있는 문제를 도출하는 방법
2) 지도학습과 비지도학습★★
(1) 지도학습
- 정답이 있는 데이터를 활용하여 분석 모델을 학습시키는 것
(2) 비지도학습
- 정답을 알려주지 않고 학습하는 것
- 데이터 자체의 결합, 연관성, 유사성 등을 중심으로 데이터의 상태를 표현
- 일반적으로 상향식 접근방식의 데이터 분석은 비지도학습에 의해 수행
3) 시행착오를 통한 문제 해결(프로토타이핑 접근법)
(1) 개념
- 상향식 접근법 중 하나로 시행착오 해결법, 먼저 분석 후 그 결과를 조금씩 개선하는 방법
(2) 프로세스
- 가설의 생성 → 디자인에 대한 실험 → 실제 환경에서의 테스트 → 인사이트 도출 및 가설 확인
03 분석 프로젝트 관리 방안
분석 프로젝트 관리 개요
1) 분석 프로젝트의 특성
2) 분석 과제를 관리할 때 고려해야 할 5가지 속성
(1) 데이터의 양
(2) 데이터 복잡도
(3) 분석의 속도
(4) 분석 복잡도
(5) 정확도 & 정밀도 - 값의 차이가 적은 '정확도' / 편차 수준을 나타내는 '정밀도'
분석 과제 관리 방안