머신 러닝은 훈련 데이터(Training Data)를 통해 학습된 알려진 속성을 기반으로 예측에 초점을 두고 있다.
머신 러닝은 데이터 마이닝이나 기타 학습 알고리즘을 통하여 지식을 추출하고 이를 학습한 경험 내용을 바탕으로 비슷한 상황의 미래 사건의 결과를 예측하는 프로그램이다.
인공지능의 한 분야로서 데이터의 패턴을 발견하는 핵심 알고리즘이 동일하지만, 머신러닝은 자체 학습 알고리즘을 사용하며 시간이 경과함에 따라 경험을 축적, 성능이 향상한다.
데이터를 모델링하는 알고리즘은 여러가지가 있다.
결과를 알고있는 label이 있는 데이터를 바탕으로 예측 분석하는것 ex) 회귀 분석, 분류
데이터 속에 어떤 의미가 숨겨져 있는지 정확히 모르는 경우에 사용한다. label이 없는 데이터에서 패턴을 발견하고, 구조를 찾아내는 것 ex) 군집화, 의사결정트리
경험과 시행착오를 통해 얻은 데이터를 바탕으로 모델을 지속적을 개선하는 방식. 어떤 상황에서 어떤 조치가 취해졌냐에 따라 점수를 부여하고 학습한다.
데이터 마이닝은 데이터의 미처 몰랐던 속성을 발견하는 것에 집중한다. 이는 데이터베이스의 지식 발견 부분의 분석 절차에 해당한다.
보유한 데이터를 다양한 관점에서 분석하며, 결과를 유용한 정보로 조합.
방대한 데이터 속 숨어있던 패턴들과 상관성을 통계적 수법들로 가치를 부여한다.
숫자가 아닌 데이터도 처리한다는 점에서 통계처리와 구분된다.
데이터 마이닝은 입력된 데이터의 품질에 따라 달라진다. 데이터 분류가 잘못되거나 부정확한 데이터는 그릇된 예측을 낳는다. ‘데이터 마이닝’은 이전에 발생했던 데이터의 추세에 의존한다는 점에서 응용에 한계가 있다. 지나간 사건을 기반으로 하므로 미래에 벌어질 새로운 추세를 진단하기엔 역부족이다. 머신러닝과의 차이점.
데이터 마이닝 기법에는 세가지 유형이 있다.
주어진 데이터 셋에서 자주 발생하는 속성값들을 연결 및 연관 규칙을 발견
ex) 장바구니 내 개별 상품간의 상관관계를 식별
독립 변수 분석을 통해 종속 변수가 무언지 밝혀내는 일
ex) 상품의 예상판매실적을 주요 고객의 소득 수준과 판매가격 상관관계로 예측하는 방법
개체들을 여러 카테고리로 분류. 의사결정 트리, 수학공식 또는 if-then 규칙 등이 사용된다.
https://news.samsungdisplay.com/12538
https://ko.wikipedia.org/wiki/%EA%B8%B0%EA%B3%84_%ED%95%99%EC%8A%B5
당신이 할수 있다고 믿든 할수 없다고 믿든 믿는 대로 될것이다.- 헨리 포드