생활코딩 - Machine Learning 1 강의를 듣고 요약, 필기한 내용입니다.
모델 = 판단력 = '추측을 위한 기준'
어떤 컴퓨터든 모델이 주어지면 그걸 통해서 추측을 하고 판단을 내릴 수 있다.
좋은 모델을 만들기 위해선 정확한 데이터, 많은 데이터를 통한 학습 과정 필요
복잡한 현실을 데이터화하여 학습을 위해 사용할 수 있어야 함.
표 = 행 + 열 = 데이터들의 모임 (데이터셋)
행 = 개체, 관측치
열 = 특성, 변수
독립변수: 원인이 되는 열
종속변수: 결과가 되는 열
상관관계: 한쪽이 변할 때 다른 한쪽도 변하는, 즉 영향을 주고 받는 관계
인과관계: 상관관계 중 원인과 결과로 나누어지는 관계, 즉 독립변수와 종속변수의 관계
기계학습 = 지도학습 + 비지도학습 + 강화학습
=> '공식의 대중화', 모델을 누구나 더욱 쉽게 만들어 사용할 수 있게 함.
과거의 데이터를 학습해서 미래의 데이터를 예측하기 위한 것. 인과관계로 이루어진 데이터를 독립변수와 종속변수로 나누고, 컴퓨터가 이를 학습하여 모델을 생성.
미지의 세계를 탐험하는 것과 같음. 데이터들의 성격을 파악하는 것이 목적. 독립변수/종속변수 구분이 중요하지 않음. 데이터를 정리정돈.
배움이 아닌 '경험', 일단 해보는 것을 통해 학습하는 것. 상과 벌을 이용.
ex. 게이머는 관찰하고, 판단하고, 행동하면서 게임을 진행하고, 이를 반복하면서 게임 결과에 따라 자신의 판단력을 적절한 방향으로 강화할 수 있음.
=> 상태에 따라서 더 많은 보상을 얻는 행동을 에이전트가 할 수 있도록 하는 정책을 만드는 것.
머신러닝 지도: 어떤 문제를 해결하기 위해 어떤 머신러닝 기법을 써야 할까?
데이터의 종류