<팀 과제관련 회의>
이번주에 해야할 팀 과제가 오늘 발표 되었음!
사실상 처음 팀 프로젝트인데 크게 어려운 느김은 아닌고 배운거에서 활용하는 느낌인것 같음
총 4가지 주제 중 하나를 골라 세부주제를 정하고 공통주제인 SQL 함수를 이용하여 그에 맞는 인사이트를 추출하는 방식임 (결국 주제 정해 SQL로 우리만의 인사이트를 뽑는 것!!)
우리 조는 기존에 DA 관련 프로젝트를 해본 사람들이 몇명 있어서 쉽게 주제를 정할 수 있었음
우리가 주제를 정한 기준은 "얼마나 많은 인사이트를 뽑아낼 수 있는가?"
그래서 서로 데이터를 직접 보면서 어떻게 세부 주제를 정하면 좋을지 간략히 얘기를 해보았음
신기하게도 다들 생각하는게 다르다 보니 활용하고 싶은 데이터의 종류나 방법도 달랐음
그러나 4가지 주제 중 하나는 너무 모집단이 적고, 하나는 흥미로운 주제지만 NULL값 (데이터가 없는 것)이 너무 많아 다른 데이터를 추가로 필요로하여 둘 중 하나를 선택 함 (공공자전거 / 보험)
그래서 우리의 최종 주제는 '보험'이다.
감사하게도 의견을 많이 내줘서 나이, BMI, 흡연자 정도의 모집단으로 화요일까지 각자 해보기로 했음!!
난 아직... 전체 보험료 평균, 흡연자 유무에 따른 평균 밖에 못했다ㅠㅠ
(디비버, 데이터베이스 삽입하는데 씨름을 해버렸다)
일단 PPT 양식을 먼저 만들고 추후에 진행할듯 하다!!
<오늘 배운 것 요약>
서브쿼리에 관련된 그림을 강의자료에 첨부해주셨다
사전캠프를 수강해서 서브쿼리의 기본 정의는 알고 있었지만
이렇게나 서브쿼리의 종류가 다양한지 처음 알았다
100% 이해는 못하고 있었는데 "상관 서브쿼리"는 무슨 말인지 못알아 들었다
튜터님께서 추가로 설명해주신 예시를 듣고 완벽하게 이해한듯 싶다.
상관 서브쿼리란?
상관 서브쿼리의 종류는 (서브쿼리 이하 생략)
1. 비상관 - 상관이 없다 = 독립적으로 존재하는 쿼리들
서브쿼리 -> 외부쿼리 (독립적으로 1번만 실행)
쉽게 말하면 외부 데이터를 가져와서 하는 반복문...?
BUT, 반복 실행으로 처리능력 저하 가능성이 있어
=> 대신 JOIN / WINDOW 함수로 바꾸기!!