데이터분석프로그래밍_0310_Fri

allzeroyou·2022년 3월 10일
0

산업별 분석 사례

산림청 산불 예측 분석 사례

임상도(나무 지도), 산업 기상정보, 기상청의 기온, 강수량, 습도
현재의 산불위험 지역을 알려주는 "국가 산불위험 예보" 서비스 개선

수원시 CCTV 설치 위치 최적화

범죄 데이터를 연계한 빅데이터 분석을 통해 수원시 cctv 사각 지대와 우선 설치 지역 선정(2014년)

송도해수욕장 웹 데이터 분석(비정형 데이터)

송도해수욕장에 대한 뉴스와 관광객 및 시민의 방문 후기 등을 게시자료로 분석해 관련 업무에 활용

제조업

품질/수율 분석사례

저수율 생산경로 추적 분석

  • 수율(생산품 대비 결함이 없는 합격품 비율)에 영향을 미치는 설비와 인자를 탐색 후 개선

예지정비 사례

진동 분석을 통한 고장 예측 진단 정밀화
ex. 차량 배터리 방전되기 전 조기 경보를 통해 조치시간을 사용자에게 줌.

제조데이터 특징

  1. 변수 개수가 상당히 크다

    • 다중공선성(독립변수 간에 높은 선형관계가 존재함, 적절히 제거 필요) 문제
  2. 불균형 자료(ex. 양품 vs 불량 비율)
    데이터 분석에 있어, good 과 bad case가 적절해야 좋음

  3. 도서 구매 추천
    연관성을 기반으로 이러한 상품을 구매하는 사람 => 다른 상품을 구매할 비율이 높은것을 바탕으로 추천알고리즘

  4. 영화 추천

  5. 상권 분석 사례

  • 위치 기반 데이터를 활용한 상권분석 및 매장 분석
  1. 이상 금융 거래 탐지 사례
  • FDS(Fraud Detected System) 작동 방식
  • 보험 마케팅 및 고객 유치 사례
    - 운전 습관을 통해 보험료율 책정/할인
    자동차 보험 요율 산정 기준 외 급가속, 급제동, 주행시간대 주행도로 등의 운전습관 관련 데이터를 수집해 보험료율 책정
    • 건강 증진 프로그램
  1. 의료 빅데이터 및 AI
    개인별 맞춤 치료, AI 기반 질병판독
  • 과제
    4장 p122
    데이터 슬라이싱으로 1번 풀기
    str은 20201342..
    mmdd에 인덱스 슬라이싱
    슬라이싱해 대입변수에 넣어라
    3번
    5번 for문 연습(*)
    6번(입력파라미터에 의해 변수가 나오면 됨.
    리스트, 튜플 => return)
    7번(pandas-데이터 => csv로 저장)
    8번
    7번에서 짠 코드(csv) => 떨어뜨린 다음 8번으로=> 다음주 목요일 수업 전까지

numpy => 4차원배열을 최적화 수치계산하는 라이브러리
리스트 가지고 4차원 배열 계산 가능, but numpy가 훨씬 속도가 빠름

pandas => 엑셀 파일, serial data을 다루는데 최적화 되어 있는 라이브러리

가독성 좋은 그래프를 지원하는 라이브러리: https://matplotlib.org/

내가 갖고 있는 데이터가 어떻게 표현되었음 좋겠다!

라이브러리, 샘플에 대해 수업시간 2시간 동안 다룰 예정.

profile
모든 건 zero 부터, 차근차근 헛둘헛둘

0개의 댓글

관련 채용 정보