Machine Learning - #1 개요

임다이·2023년 12월 4일
0

Machine Learning

목록 보기
2/15

  • 인공지능(Artificial Intelligence)
    사람의 지능을 모방하는 인공지능

  • 인공지능의 역사

    앨런 매시슨 튜링(Alan Mathison Turing)
    -영국의 수학자, 암호학자, 컴퓨터 과학자
    -컴퓨터와 AI아버지
    -1950년 발표 논문
    '기계도 생각할 수 있을까?(Can Machine Think?)'

    앨런튜링 모티브한 작품
    제 2차 세계대전 암호학과 관련된 영화

  • 튜링테스트(Turing Test)
  • Turing Test 최초 통과 유진 구스트막
  • 역사

  • AI vs ML vs DL
  • 머신러닝 / 딥러닝
  • Rule-based expert system(규칙 기반 전문가 시스템)
    "if"와 "else"로 하드 코딩된 명령을 사용하는 시스템

  • 머신러닝(Machine Learning)이란?

머신러닝(Machine Learning)

데이터를 이용하여 특성과 패턴을 학습하고, 그 결과를 바탕으로 미지의 데이터에 대한 미래결과(값, 분포)를 예측하는 것

  • 인공지능의 3가지 요소
  • 인공지능의 종류
  1. 약한인공지능(Artificial Narrow Intelligence)
    -특정분야를 위해 제작된 인공지능
    -체스, 퀴즈, 자율주행, 상품 추천, 번역시스템, 알파고(특정임무수행) 등

  2. 강한인공지능(Artificial General Intelligence)
    -모든 방면에서 인간급의 인공지능
    -사고, 계획, 문제해결, 추상화, 복잡한 개념 학습

    ex) SF영화 같은 것

  • 초인공지능(Artificial Super Intelligence)
    -과학기술, 사회적 능력 등 모든 영역에서 인간보다 뛰어남
    -"충분히 발단한 과학은 마법과 구분할 수 없다" - 아서C.클라크

  • 인공지능 컨퍼런스

-인공지능 컨퍼런스의 질문

  • 불쾌한 골짜기
    인간이 로봇에 대해 호감도가 증가하다가 어느 정도에 도달하면 갑자기 강한 거부감을 느끼는 현상


  • 지능, 윤리 & 도덕 관점
    단순히 똑똑한 것을 넘어서서 옳고, 그름을 판별할 수 있는 지능을 가지는 것이 인공지능

  • 의료인공지능 분야 사례
    복잡한 의료 데이터 분석 및 insight 도출
    -AI의사 IBW Watson
  • 챗봇인공지능 분야 사례
    인공지능 챗봇
    -ChatGPT
  • 음성인공지능 분야 사례
    사람의 음성을 학습해서 노래를 부를 수 있음

  • 머신러닝 종류

    • 지도학습(Supervised Learning)
      -데이터에 대한 Label(명시적인 답) 이 주어진 상태에서 컴퓨터를 학습시키는 방법
      -분류(Classification)와 회귀(Regression)로 나뉘어진다.

      • 분류(Classification)
        -미리 정의된 여러 클래스 레이블 중 하나를 예측하는 것
        -속성 값을 입력, 클래스 값을 출력으로 하는 모델
        -붓꽃(iris)의 세 품종 중 하나로 분류, 암 분류
        -이진 분류, 다중 분류 등이 있다.

      • 회귀(Regression)
        -연속적인 숫자를 예측하는 것
        -속성 값을 입력, 연속적인 실수 값을 출력으로 하는 모델
        -어떤 사람의 교육수준, 나이, 주거지를 바탕으로 연간 소득 예측
        -예측 값의 미묘한 차이가 크게 중요하지 않다.

      • 분류와 회귀

      • 분류

    • 비지도학습(Unsupervised Learning)
      -데이터에 대한 Label(명시적인 답) 이 없는 상태에서 컴퓨터를 학습시키는 방법
      -데이터의 숨겨진 특징, 구조, 패턴을 파악하는데 사용
      -데이터를 비슷한 특성끼리 묶는 클러스터링(Clustering)과 차원축소(Dimensionality Reduction)등이 있다.

    • 강화학습(Reinforcement Learning)
      -지도학습과 비슷하지만 완전한 답(Label)을 제공하지 않는 특징이 있다.
      -기계는 더 많은 보상을 얻을 수 있는 방향으로 행동을 학습
      -주로 게임이나 로봇을 학습시키는데 많이 사용

ex) 게임 등


  • 머신러닝이 유용한 분야
    • 기존 솔루션으로는 많은 수동 조정과 규칙이 필요한 문제
    • 전통적인 방식으로는 전혀 해결 방법이 없는 복잡한 문제
    • 새로운 데이터에 적응해야하는 유동적인 환경
    • 대량의 데이터에서 통찰을 얻어야 하는 문제
  • 머신러닝(Machine Learning) 과정
  1. Problem Identification (문제 정의)
    • 비지니스 목적 정의
      모델을 어떻게 사용해 이익을 얻을까?
    • 현재 솔루션의 구성 파악
    • 지도 vs 비지도 vs 강화
    • 분류 vs 회귀
  2. Data Collect(데이터 수집)
    • File(CSV, XML, JSON)
    • Database
    • Web Crawler(뉴스, sns, 블로그)
    • IoT 센서를 통한 수집
    • Survey (설문조사)
  3. Data Preprocessing (데이터 전처리)
    • 결측치, 이상치 처리
    • Feature Engineering(특성공학)
  1. EDA (탐색적 데이터분석)
    • 기술통계, 변수간 상관관계
    • 시각화
      Pandas, matplotlib, seaborn
    • Feature Selection(사용할 특성 선택)
  2. Model 선택, Hyper Parameter 조정
    • 목적에 맞는 적절한 모델 선택
    • KNN, SVM, Linear Regression, Ridge, Lasso, Decision Tree, Random forest, CNN,…
    • Hyper Parameter
      model의 성능을 개선하기 위해 사람이 직접 넣는 parameter
  3. Training (학습)
    • model.fit(X_train, Y_train)
      train 데이터와 test 데이터를 7:3 정도로 나눔
    • model.predict(X_test)
  1. Evaluation (평가)
    • accuracy(정확도)
    • recall(재현율)
    • precision(정밀도)
    • f1 score


  • 실습
  • 훈련세트와 테스트세트 나누기

profile
노는게 제일 좋아~!

0개의 댓글