[개발일지 4월 4일] [공통교육-AI] AI 기본 이론 - 김영욱 강사

박재준·2022년 4월 4일
0

1. 학습한 내용

필기내용

  • What is the Machine Learning :
    김영욱 강사(Hello AI)대표님(작년 3월까지 MS근무 등)

  • 학습목표
    : 머신러닝의 원리와 기본이론 설명 / 다양한 머신러닝 사례, 활용방안 찾을 수 있다 / 머신러닝 주요 알고리즘 설명

  • 학습내용
    : 머신러닝 소개와 사례 / 머신러닝의 주요 알고리즘

    1. Introduction to ML
      머신러닝 분야 : 리서치 / 엔지니어링


→ 머신러닝 : Math : 문제해결을 위한 수학 → 알고리즘
→ 딥러닝 : 이후 수학이 아니라 사람의 뇌 구조를 형상화시킨 스스로 학습(GPU 사용)

→ 챗봇 : 텍스트를 분석하는 NLP(Natural Language Processing) → 이후 봇이 분석

→ 데이터 많이 주고 기계한테 직접 찾게함
cf) coumputer sicence : 사람이 찾아서 기계한테 알려줌

    1. ML algorithm

  • 지도학습
    → 문제와 정답 제공 : Feature(문제) & Label(정답)
    → 예측, 추정, 분류 : Regression, Forecast, Clasification

  • 비지도학습(Clustering)

  • (군집) : 답이 없이 데이터만 나누는 방법
    집합을 만들어내기 위한 방법 두 가지
  1. 데이터에 임의로 선을 긋고 군집화
  2. 대표 데이터를 만들고 뭉쳐보는 방법
  • 강화학습(Reinfrocement learning)
    보상제공, 인과관계가 중요, 게임(알파고), 로봇

    1. 데이터?(DATA?)
  • Steps
    First-Understand the Business Domain : 해당되는 영역 이해
    Second-Understand the Business Problem : 진짜 문제가 무엇인지 이해
    Third-What Is the Right Data, Right Column and Right Alogrithm : 정확한! 데이터, 정확한 칼럼 그리고 정확한 알고리즘을 선택!
    Last-Combine Knowledge With ML : 마지막은 머신러닝


→ 흔히 train과 test dataset은 7:3, 8:2로 나눔


→ 데이터를 Random으로 섞고 Split함

  1. Open Data : 주변 공개되어있는 데이터
    ex) 국가통계포털(kosis)

ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ

Kaggle 데이터 사이트(관련 사이트)

→ 기업들이 자기가 풀고 싶은 문제들을 공개
→ 가장 문제를 잘 해결한 머신러닝 팀에게 리워드 제공

ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ

Orange Data Mining

  1. Introduction to Orange
  2. Orange Data Mining 주요 기능


그림 orange data mining 소개(관련 사이트)
→ GPL 라이선스 : 라이선스를 내가 가져다 쓰면, 내가 askems 코드도 다 오픈해야함
→ 오렌지가 들고 있는 풍선 = 위젯(우리가 사용할 만한 기능들 갖고 있음)


→ QT : UI를 만드는 라이브러리(window, mac, linux 지원)
→ Orange Data Mining (관련 사이트)
→ 프로그램 설치 후 실행

  • 메뉴 : data / visualize / model(ai 모델을 만들 때 기능) / evalutate(모넬이 잘 동작하는지 평가)
    → 지도학습(supervised) 기능들 지원
    밑에 unsupervised 메뉴도 있음!

  • csv파일 : ‘,’를 통해 데이터를 구분해서 저장해놓은 데이터셋 파일

→ CA : Accuracy(정확도)

  • 핵심정리_Orange Data Mining
    Orange Data Mining 도구는 코딩업싱 데이터를 분석할 수 있는 도구
    Orange Data Mining은 최근 Python 새태계와 함께 성장하고 있음

ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ

  • 엑셀 실습!(sample-1.csv / sample-2.csv)
    TIP
  • 관련 사이트에서 해도 됨!

  • MSE : 오차
    RMSE : 그림 rmse
    MAE(Mean Absolute Error) : 절대오차들의 합을 구하고 나누기하면 절대 평균오차

→ 오류(편차)를 제곱함으로써 도드라지 보이게 할 수 있음

→ Neural Network : 머신러닝 모델

ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ

내일은 Classification 실습

  • 나머지 과제 : 밑의 사이트 로그인해서 가입하고, 잘 둘러보기
    ICT Big data center (관련 사이트 ; https://kbig.kr/portal/)
    → 교육실습콘텐츠 안의 내용 보기! → 교육 동영상 미리 보기
    → 데이터셋을 참고하면 데이터 공개 사이트 안내해줌
profile
초급 개발자

0개의 댓글