머신러닝 model training = 좋은 parameter set을 찾는것 좋은 parameter set = 최적화 문제를 해결 convex convex: 볼록하다는 의미 convex set: set 안에 두점 $x1$,$x2$를 이은 선분이 set안에 포함될 때
PCA는 차원축소와 변수추출 기법으로 쓰인다.주 성분 분석: 전체 데이터(독립변수)의 분산을 잘 설명하는 성분을 말함예를 들어 집을 고를 때 고려하던 것이 5가지 였으면 단순히 고려사항인 2가지로만 출인다면 이것이 PCA가 하는 일이다.Centering(평균이동): 데
통계학은 크게 빈도주의자(freqentist)와 베이즈주의자(Bayesian)으로 나뉜다.둘은 확률을 해석 하는 방법이 다르다."동전을 던졌을 때 앞면이 나올 확률이 50%이다."빈도주의자: '동전 하나 던지기를 수천번 하면 그 중 앞면이 50%, 뒷면이 50%나온다'
강화 학습은 주로 Markov Desion Process(MDP)라는 확률 모델로 표현된다. MDP는 의사결정 과정을 확률과 그래프를 이용하여 모델링한 것으로, 시간 t에서의 상태는 t-1에서의 상태에만 영향을 받는다 라는 가정을 갖는다. Markov: 의사 결정을
Non-Sequential vs Sequential(Time-series) DataNon-Sequential시간 정보를 포함하지 않고 생성되는 데이터(순서가 없음) Sequential시간 정보를 포함하여 순차적으로 생성되는 데이터(순서가 있음), 순환구조기본 RNN(
convolution 연산을 통해 이미지로부터 필요한 특징(feature)을 스스로 학습할 수 있는 능력을 갖춘 심층 신경망 구조이미지는 3차원의 tensor로 표현모든 pixel을 하나의 입력 노드로 간주하고 서로 다른 가중치로 연결하면 input, hidden la
특정 문장(=단어 나열)이 등장할 확률을 계산해주는 모델(언어모델)Attention의 병렬적 사용을 통해 효율적인 학습이 가능: 내부 인코더 파트와 디코더 파트가 존재하며 둘 사이를 이어주는 연결고리 존재: Encoder의 output은 다음 Encoder의 Input