[DAY1]_개발일지: AI 기본이론

hanseungjune·2022년 4월 12일
0

DaeguAI

목록 보기
3/15

1. 학습내용

  1. Machine Learning
  2. Data
  3. Orange Data Mining

2. 상세내용


  • 머신러닝이란?
  •     : 인간이 개발한 알고리즘을 컴퓨터 언어를 통해 기계에게 학습시키는 행위

       1. 이 수업은 머신러닝이 핵심
       2. 앞으로 이론을 기반을 코딩 예정
       3. 각 알고리즘의 의미를 잘 이해하기


  • 지도학습(Supervised Learning)
  •    - Label(데이터 분류 기준, 0 or 1)
       - feature(Label 제외한 나머지 속성들)
       - Regression(회귀) : 일정한 수치 예측을 위해서 수렴하는 것
       - Classification(분류) : 말그대로 분류하는 것


  • 비지도학습(Unsupervised Learning)
  •    - Feature만 제공(Label 없음)
       - Anomaly(이상반응) ex) 가짜뉴스, 대금결제 등
       - Clustering(군집)


  • 강화학습(Reinforcement Learning)
  •    - 점수 제공 등의 보상(reward)
       - 인과관계 중요 ex) 알파고(딥마인드)

    * Regression을 제일 많이 쓰고 있음


  • 데이터란?
  •     : 말그대로 자료

  • 효과적인 데이터 관리 단계
    1. 자료에 대한 이해
    2. 문제에 연관 지을 수 있는가
    3. 적절한 알고리즘이 적용되나
    4. 올바른 자료인가
    5. 머신러닝에 잘 적용되는가

  • RandomSplit
  •     : Training 과 Test로 자료를 쪼개는 것(랜덤하게 섞어서)을 칭함


  • 데이터 대표 출처
  •    1. kaggle
       2. KOSIS

    3. 실습(Orange)


  • Orange Data Mining 주요 기능
  •    1. 구성




    파일을 주로 csv로 작업하는 것이 효율적
    Test and Score로 오차(MSE, RMSE, MAE) 및 일관성(R2) 측정

  • MSE, RMSE, MAE는 숫자가 클수록 에러가 많고, 데이터 간 오차가 크다.
  • R2는 숫자가 클수록 일치의 정도가 크다.

  • Orange Data Mining 후기
  •    1. 코딩이 없어서 재밌었다
       2. 전반적으로 머신러닝을 이해할 수 있었다.

    4. 금일소감

    <ol>
    	<li>내가 이 수업을 먼저 들었어야했다...</li>
    	<li>이제야 뭔가 보이기 시작한다</li>
    	<li>알고리즘 코딩자료 손코딩해보려고 한다.</li>
        <li>K-ICT센터 학습자료-머신러닝 강의도 따로 들어야겠다.</li>
    </ol>
    profile
    필요하다면 공부하는 개발자, 한승준

    0개의 댓글