[패스트캠퍼스_권장] 기초 3교시 - 1

HoRi·2022년 12월 29일
0

FastCampus_WorkSheet

목록 보기
4/5

권장 강의 3교시 : 데이터분석 기초 - 1


통계(Statistics)

  • 산술적 방법을 기초로 하여, 주로 다량의 데이터를 관찰하고 정리 및 분석하는 방법을 연구하는 수학의 한 분야
  • 관찰 및 조사로 얻을 수 있는 데이터로부터, 응용 수학의 기법을 이용해 수치상의 성질, 규칙성 또는 불규칙성을 찾아냄
  • 통계적 기법은, 실험 계획, 데이터의 요약이나 해석을 실시하는데 있어서의 근거를 제공하는 학문
  • 폭넓은 분야에서 응용되어 실생활에 적용되고 있음

통계를 통한 데이터 표현

  • 수치적 접근(quantitative)
    - 데이터를 숫자로 설명(평균, 중앙값, 분산, 표준편차, 등)

  • 시각적 접근(visual)
    - 그래프를 그려 설명(차트, 플롯, 히스토그램, 바 그래프, 지도 그래프, 등)

신뢰구간(Confidence Interval)

  • 모수가 어느 범위 안에 있는지를 확률적으로 보여주는 방법
  • 사건에 대한 분포를 모를 때 유용

가설의 종류

  • 귀무가설(H0, null-hypothesis)
    - 우리가 증명하고자 하는 가설의 반대되는 가설, 효과와 차이가 없는 가설을 의미

  • 대립가설(H1, alternative hypothesis)
    - 우리가 증명 또는 입증하고자 하는 가설, 효과와 차이가 있는 가설을 의미

데이터를 통해 통계적인 비교 후 귀무가설을 기각할지 말지 결정


p-value

  • 어떤 확률을 기준으로 구간을 선택하는 대신에, H0가 참이라고 가정하고 실제로 관측된 값보다 더 극단적인 값이 나올 확률
  • p-value가 5%(0.05)보다 크면 귀무가설을 기각하지 않고, 작으면 귀무가설이 틀력다고 말하고, 귀무가설을 기각

통계에서 사용되는 함수

  • mean : 평균
  • median : 중앙값
    - 값의 개수가 홀수일 때는 가운데 값이 중앙값이 되지만, 짝수일 때는 중앙값에 가까운 두 수 사이의 값이 됨
  • variance : 분산
  • stdev : standard deviation으로 표준편차
profile
무지성 작성소

0개의 댓글