컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야이다.
머신러닝은 데이터 수집 - 전처리 - 피쳐추출 - 학습 - 검증 총 5단계로 진행된다.
지도 학습은 정답이 있는 데이터를 활용해 데이터를 학습시키는 것이다. 입력 값(X)이 주어지면 입력값에 대한 Label(Y)를 주어 학습시킨다.
종류 | 의미 |
---|---|
회귀(Regression) | 데이터의 Feature를 기준으로 연속된 값을 예측 |
분류(Classification) | 데이터를 정해진 카테고리(라벨)에 따라 분류 |
🔎 회귀, 분류의 차이
회귀 : 종속변수가 수치형(숫자)일 경우
분류 : 종속변수가 범주형(이름⋅문자)일 경우
비지도 학습은 지도 학습과는 달리 정답 라벨이 없는 데이터를 비슷한 특징끼리 군집화하여 새로운 데이터에 대한 결과를 예측하는 방법이다.
종류 | 의미 |
---|---|
군집화(Clustering) | 주어진 데이터의 속성값들을 고려해 유사한 개체끼리 그룹화 |
변환 / 차원축소(Dimentionality Reduction) | 다차원의 데이터셋을 차원 축소하여 새로원 차원의 데이터셋을 생성 |
연관규칙 | 어떤 항목이 어떤 항목을 동반하여 등장하는지 연관성에 대한 규칙 |
어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 행동 순서를 선택하는 방법이다.