[부스트캠프 AI Tech] 1주차 Day 4

Mattaaa·2022년 1월 20일
0

[부스트캠프 AI Tech]

목록 보기
4/23

오늘 학습 내용


1. 통계학 기초

2. 베이즈 정리




1. 통계학 기초

  • 통계적 모델링은 적절한 가정에서 확률분포 추정(Inference) 이 목적이다.

  • 유한한 데이터를 이용하여 정확한 분포를 추정하는 것은 불가능 하기 때문에, 근사적으로 추정 할 수 밖에 없다.

  • 모수는 특정 모집단의 특성을 나타내는 것으로 모평균, 모분산 등이 이에 해당한다.

  • 모수적(Parametric) 방법론 VS 비모수적(nonparametric) 방법론

    • 모수적방법론은 데이터가 특정 확률분포를 따른다고 가정 후, 해당 분포의 모수를 추정하는 방법이다.

    • 비모수적방법론은 특정 확률분포를 가정하지 않고, 데이터에 따라 모델의 구조 및 모수가 유연하게 바뀌는 방법이다.

    • 단, 비모수적방법론이라고 모수를 사용하지 않는 것은 아니다.


  • 확률분포의 가정

    • 데이터가 2개의 값만 가지는 경우 → 베르누이 분포

    • 데이터가 n개의 이산값을 가지는 경우 → 카테고리 분포

    • 데이터가 [ 0 , 1 ] 사이의 값을 가지는 경우 → 베타 분포

    • 데이터가 0 이상의 값을 가지는 경우 → 감마, 로그정규 분포

    • 데이터가 실수전체의 값을 가지는 경우 → 정규, 라플라스 분포

    • 기계적으로 분포를 가정해서는 안되며, 데이터 생성 원리를 고려하여야 한다.


  • 통계량의 확률분포를 표집분포(sampling distribution)라 부르며, N이 클수록 정규분포를 따른다.

  • 가장 가능성이 높은 모수를 추정하는 방법 중 하나는 최대가능도 추정법(Maximum Likelihood Estimation, MLE) 이다.

  • 로그가능도의 사용

    • 가능도의 곱셈을 덧셈으로 바꿈으로써 컴퓨터의 연산이 가능해짐.

    • 연산량을 O(n2)O(n^2) 에서 O(n)O(n)으로 줄여준다.




소감

오늘은 통계학의 기초와 베이즈 정리에 대해 강의를 들었다. 베이즈 정리에 대한 언급이 없는 이유는 지난 학기 때 베이즈 정리에 대해 공부했었는데 , 특별히 블로그에 포스팅 할 만큼 현재 알고있는 내용에서 벗어나지 않았기 때문이다. 또한 나머지 심화 과제를 하느라 시간이 부족한 것도 어느정도 영향을 미쳤다.

어느덧 부스트캠프 첫주의 마무리에 접어들고 있다. 아직까진 마음가짐이 흐트러지지 않았지만, 점점 처음에 비해 살짝 나태해지는 느낌이 든다. 내일까지 열심히 공부해서 알찬 한주를 보낼 수 있도록 하겠다.

0개의 댓글