2022.04.04 월

gunho-sung.log·2022년 4월 4일
0

학습내용

AI 기본 이론
김영욱 강사님 AI입문 첫 수업 진행

VSCODE 편집기 개발자가 IBM출신 개발자라고 한다. 현재는 MS에 고액연봉으로 입사한 걸로 밝혀져...


머신러닝 학습 3가지 분류
1. Unsupervised Learning (비지도학습)
2. Supervised Learning (지도학습)
3. Reinfircement Learning (강화학습)
보상(Reward)제공 - 잘 할 때 마다 점수를 부여한다고 함
인과관계가 중요
게임(알파고), 로봇


비행기 하나에서 발생되는 데이터량이 10TB라고한다. 어마어마한데?

클러스터링
군집



주로 기존에 있던 알고리즘들을 활용한다.
기존 알고리즘으로도 문제를 충분히 해결 가능하다.


타이타닉호 생존율 분석
주요 요인 : 나이, 성별, 선실등급
부수적 요인 : 티켓요금, 부모자식, 형제자매
이런 식으로 수 많은 데이터를 학습시키고 새로운 값을 입력했을 때
생존여부 확률을 계산해준다.

학습이 잘 되었는지 테스트를 위해서 전체 데이터를 7:3, 8:2 정도로
나누고 학습과 학습 결과를 테스트한다.
데이터가 편중될 수 있기 때문에 분할하기 전에 충분히 섞는다.

https://kosis.kr/index/index.do
오픈데이터


오렌지
슬로베니아에서 만든 오픈 서비스?

new 버튼으로 새 프로젝트 시작.

_
카카오뱅크 MySQL로 돌아간다

MySQL 오픈소스였는데 오라클이 사들이면서 유료로 변화
그래서 개발자들이 뛰쳐나와서 만든게 마리아DB라고 한다._

승무원의 경우 대부분 사망
1등급 > 2등급 > 3등급 생존율 높음


CA : 정확도 (tree 알고리즘으로 예측했을 때)

정확도를 높이는 2가지 방법
1. 적합한 알고리즘 찾기
2. 데이터 노이즈를 제거해서 정확도 높이기

Random Forest 알고리즘 추가

2가지 알고리즘 결과가 같음
이런 경우 데이터의 문제일 가능성이 높아서 의심하기


숫자 타입이라고 명시해주기


리니어 = 선형 회귀
모델을 만드는 가장 기본적인 형태


뉴럴 네트웍만 딥러닝, 나머지는 머신러닝(13개로는 너무 부족해)

사이킥런 최소 샘플50개 이상 필요


https://kbig.kr/portal/

해당 사이트에서 강의 추천하심

profile
프로그래밍 초보 입문

1개의 댓글

comment-user-thumbnail
2022년 4월 4일

안녕하세요 혹시 대구AI스쿨 관련해서 질문해도되나용?

답글 달기

관련 채용 정보