[실무] 데이터 분석 관련 학습 정리

Jihoon·2023년 8월 30일
0

실무

목록 보기
1/1
  • 간단한 소개글

현재 LS전선 데이터 분석 직무에서 실무 과제를 부여 받아서 업무를 수행하고 있습니다. 해당 과정에서 부족한 부분을 학습하기 위해 정리한 내용입니다.

[Pandas] Series

  • Series는 Values와 Index로 (값과 인덱스) 구성되어 있습니다
  • Dataframe은 이러한 한 개의 Series가 여러 개로 구성된 형태로 볼 수 있습니다.
  1. Values : A가 시리즈일 경우, A.values
  2. Index : A가 시리즈일 경우, A.index
  • Series에서도 사용되는 Method

출처: https://digital-play.tistory.com/31

상관분석 & 회귀분석

상관분석: 상관성을 분석하는 것
회귀분석: 원인-결과로 설명하는 것 Y(결과) = aX(원인) + b

분석 방법론

  1. 통계 기반 분석 방법론

가설을 설정하여 분석을 진행하는 것인데, 분석을 진행하면서 상황에 따라 가설을 세워 통계적 방법론을 적용하면 될 것 같다. 그러나, 주어진 과제의 주된 분석 방법론으로는 적합하지 않다고 판단한다.

  • 용도
  1. 연관성 분석(교차분석, 스피어만 서열상관분석)
  2. 가설 검정(Z-test, T-test)
  3. 분산 분석(ANOVA, MANOVA)
  4. 연관성 분석(피어슨 상관분석)
  1. 머신러닝 기반 분석 방법론
  • AutoML (전처리 완료 후?)
profile
장난감이 데이터인 사람

0개의 댓글