AI 기본 이론

Ayla’s·2022년 4월 4일

🌈Machine Learning이란?

인간이 개발한 알고리즘을 컴퓨터 언어를 통해 기계에게 학습 시키는 행위
데이터를 많이 주어서 기계가 문제해결법을 찾게 함
문제 해결 과정을 담아 놓은 것이 model
수학으로 데이터를 분석 / 수학적인 방법들 알고리즘
Research, Engineering 두 분야로 나뉨
Artificial Intelligence -> Machine Learning -> Deep Learning
수학으로 도저히 풀기 어려워지자 사람의 뇌 구조를 형상화 시켜 스스로 풀 수 있도록 문제를 학습시킴 (deep learning) NLP 자연어처리 챗봇

✨Machine Learning algorithm

1. supervised learning (지도학습)
문제와 정답 제공(Feature & Label)
예측 regression(회귀) - 키에 따른 신발 사이즈, 시간에 따른 커피 소비량...
/ 추정 forecast / 분류 classification
2. unsupervised learning (비지도학습)
문제만 제공(Feature)
패턴, 구조 발견 / 그룹화
-Anomaly(이상징후감지) : 카드사에서 주로 사용
인계치가 넘어갔을 때 금융사고 예방 차원으로 거래 중단, 콜센터에서 확인
-Clustering(군집) : raw data를 알고리즘에 의해 그룹핑
raw data -> algorithm -> automated clusters
-> manual review -> product
3. reinforcement learning (강화학습) : 게임, 로봇에서 사용
보상(reward) 제공 , 인과관계가 중요, 가장 많이 사용

✨orange data mining

(http://orangedatamining.com/)

데이터에 대한 기본 지식이 없이도 데이터 처리 및 시각화, 그리고 머신 러닝을 직접적으로 적용해볼 수 있는 도구 / 본격적인 개발 전 데이터를 검증하는 용도로 활용하기도 함 / GPL 라이선스 / 파이썬 라이브러리를 적극적으로 활용 / 대부분의 알고리즘을 테스트 해 볼 수 있음
코딩없이 데이터를 분석할 수 있는 도구로, 최근 python과 함께 성장

orange data mining 주요 기능
Data: 데이터 입력, 데이터 필터링, 샘플링 및 대치, 조작 등
Evaluate: 모델 평가를 위한 위젯 제공
Unsupervised: 비지도학습을 위한 기능들
Visualization: 박스 플롯, 히스토그램, 산점도 및 다변수 시각화를 위한 위젯 제공

주요 알고리즘
Classify: 분류를 위한 알고리즘
Regression: 회귀 분석을 위한 알고리즘
Clustering: 군집 분석을 위한 알고리즘

0개의 댓글