임상도(나무 지도), 산업 기상정보, 기상청의 기온, 강수량, 습도
현재의 산불위험 지역을 알려주는 "국가 산불위험 예보" 서비스 개선
범죄 데이터를 연계한 빅데이터 분석을 통해 수원시 cctv 사각 지대와 우선 설치 지역 선정(2014년)
송도해수욕장에 대한 뉴스와 관광객 및 시민의 방문 후기 등을 게시자료로 분석해 관련 업무에 활용
저수율 생산경로 추적 분석
진동 분석을 통한 고장 예측 진단 정밀화
ex. 차량 배터리 방전되기 전 조기 경보를 통해 조치시간을 사용자에게 줌.
변수 개수가 상당히 크다
불균형 자료(ex. 양품 vs 불량 비율)
데이터 분석에 있어, good 과 bad case가 적절해야 좋음
도서 구매 추천
연관성을 기반으로 이러한 상품을 구매하는 사람 => 다른 상품을 구매할 비율이 높은것을 바탕으로 추천알고리즘
영화 추천
상권 분석 사례
numpy => 4차원배열을 최적화 수치계산하는 라이브러리
리스트 가지고 4차원 배열 계산 가능, but numpy가 훨씬 속도가 빠름
pandas => 엑셀 파일, serial data을 다루는데 최적화 되어 있는 라이브러리
가독성 좋은 그래프를 지원하는 라이브러리: https://matplotlib.org/
내가 갖고 있는 데이터가 어떻게 표현되었음 좋겠다!
라이브러리, 샘플에 대해 수업시간 2시간 동안 다룰 예정.