# 4일차

CoriniΒ·2022λ…„ 5μ›” 1일

λ¨Έμ‹ λŸ¬λ‹(μ™„λ£Œ)

λͺ©λ‘ 보기
3/4

https://velog.velcdn.com/images/tataki26/post/74543115-a803-407e-824f-daba01354cb0/ai_title.png

πŸ€– κ°•ν™” ν•™μŠ΅

  • κ°•ν™” ν•™μŠ΅(reinforcement learning)
    • 일단 ν•΄λ³΄λŠ” 것
    • κ²½ν—˜μ„ 톡해 μ‹€λ ₯을 ν‚€μ›Œλ‚˜κ°€λŠ” 것
    • ν–‰λ™μ˜ κ²°κ³Όκ°€ μœ λ¦¬ν•œ κ²ƒμ΄μ—ˆλ‹€λ©΄ 상을 λ°›λŠ”λ‹€
    • ν–‰λ™μ˜ κ²°κ³Όκ°€ λΆˆλ¦¬ν•œ κ²ƒμ΄μ—ˆλ‹€λ©΄ λ²Œμ„ λ°›λŠ”λ‹€
    • μœ„ 과정을 맀우 많이 λ°˜λ³΅ν•˜λ©΄ 더 λ§Žμ€ 보상을 받을 수 μžˆλŠ” 더 쒋은 닡을 μ°Ύμ•„λ‚Ό 수 μžˆλ‹€
    • 더 λ§Žμ€ 보상을 받을 수 μžˆλŠ” 정책을 λ§Œλ“œλŠ” 것
    • κ²½ν—˜μ„ 톡해 점점 더 λ˜‘λ˜‘ν•΄μ§€λŠ” 기계
    • μ•ŒνŒŒκ³ , μžμœ¨μ£Όν–‰ μžλ™μ°¨
  • κ²Œμž„μ˜ μ‹€λ ₯μžκ°€ λ˜λŠ” κ³Όμ •
    • κ²Œμž„μ€ κ²Œμ΄λ¨Έμ—κ²Œ ν˜„μž¬ μƒνƒœλ₯Ό 보여쀀닀
      • μΊλ¦­ν„°μ˜ μœ„μΉ˜μ™€ μž₯μ• λ¬Όμ˜ μœ„μΉ˜, ν˜„μž¬μ˜ 점수
      • μ μˆ˜κ°€ λ†’μ•„μ§€λŠ” 것은 상
      • μž₯애물에 λΆ€λ”ͺν˜€ λͺ©μˆ¨μ„ μžƒλŠ” 것은 벌
    • κ΄€μ°°μ˜ 결과에 따라 μ–΄λ–€ μƒνƒœμ—μ„œ μ–΄λ–»κ²Œ 행동해야 더 λ§Žμ€ 상을 λ°›κ³  더 적은 λ²Œμ„ 받을 수 μžˆλŠ”μ§€ μ•Œκ²Œ λœλ‹€
      • νŒλ‹¨λ ₯의 κ°•ν™”
    • νŒλ‹¨μ— 따라 λ‹€μŒ 행동을 ν•œλ‹€
    • 행동은 κ²Œμž„μ— λ³€ν™”λ₯Ό μ€€λ‹€
  • κ²Œμž„κ³Ό λ¨Έμ‹ λŸ¬λ‹
    • κ²Œμž„ >> ν™˜κ²½(Environment)
    • 게이머 >> μ—μ΄μ „νŠΈ(Agent)
    • κ²Œμž„ ν™”λ©΄ >> μƒνƒœ(State)
    • 게이머의 μ‘°μž‘ >> 행동(Action)
    • 상과 벌 >> 보상(Reward)
    • 게이머의 νŒλ‹¨λ ₯ >> μ •μ±…(Policy)
  • 슀슀둜 μˆ˜λ ¨μ„ ν†΅ν•΄μ„œ 더 쒋은 선택을 ν•˜λŠ” κΈ°λŠ₯이 ν•„μš”ν•˜λ‹€λ©΄ κ°•ν™” ν•™μŠ΅μ„ 선택
  • κ°•ν™” ν•™μŠ΅μ„ ν†΅ν•΄μ„œ ν•  수 μžˆλŠ” 일 https://velog.velcdn.com/images%2Ftataki26%2Fpost%2F412942fe-6ee6-40a0-a7c1-35606656d9f5%2F%EA%B0%95%ED%99%94.PNG

πŸ€– λ‚˜μ—κ²Œ ν•„μš”ν•œ λ¨Έμ‹ λŸ¬λ‹μ€?

  • λ¨Έμ‹ λŸ¬λ‹ 지도 https://velog.velcdn.com/images%2Ftataki26%2Fpost%2Fb7e1d18c-8986-406b-a4a7-2bd335ae599c%2F12374.jpg
  • 레λͺ¨λ„€μ΄λ“œ 카페 사둀(νšŒκ·€)
    • 과거의 데이터λ₯Ό κ°€μ§€κ³  μžˆλ‹€
    • κ°€μ§€κ³  μžˆλŠ” 데이터가 λ§Žλ‹€
    • μΆ”μΈ‘ν•˜κ³  싢은 λ―Έμ§€μ˜ 쒅속 λ³€μˆ˜κ°€ μžˆλ‹€
    • λ―Έμ§€μ˜ 쒅속 λ³€μˆ˜κ°€ λ²”μ£Όν˜• 데이터닀
    • λ―Έμ§€μ˜ 쒅속 λ³€μˆ˜κ°€ 양적 데이터닀
  • μ•ŒνŒŒκ³ (κ°•ν™” ν•™μŠ΅)
    • 과거의 데이터λ₯Ό κ°€μ§€κ³  μžˆλ‹€
    • 보상을 λ˜λŒλ €μ£ΌλŠ” ν™˜κ²½μ΄ μžˆλ‹€
  • μž₯λ°”κ΅¬λ‹ˆ 뢄석(μ—°κ΄€ κ·œμΉ™ ν•™μŠ΅)
    • 과거의 데이터λ₯Ό κ°€μ§€κ³  μžˆλ‹€
    • κ°€μ§€κ³  μžˆλŠ” 데이터가 λ§Žλ‹€
    • μΆ”μΈ‘ν•˜κ³  싢은 λ―Έμ§€μ˜ 쒅속 λ³€μˆ˜κ°€ μžˆλ‹€
    • λΉ„μŠ·ν•œ κ΄€μΈ‘μΉ˜λ₯Ό κ·Έλ£Ήν•‘ν•˜κ³  μ‹Άλ‹€
    • νŠΉμ„± μ‚¬μ΄μ˜ 상관 관계λ₯Ό μ°Ύκ³  μ‹Άλ‹€

🍊 Orange3

μ˜€λ¦¬μ—”ν…Œμ΄μ…˜

  • Orange3
    • λ“œλž˜κ·Έ μ•€ λ“œλ‘­ 방식 ν™œμš©
    • ν‘œμ˜ 뢄석, μ‹œκ°ν™”, λ¨Έμ‹ λŸ¬λ‹ κ°€λŠ₯
    • 톡계, 데이터 λ§ˆμ΄λ‹, 데이터 κ³Όν•™ 뢄야에 ν™œμš©
    • ν‘œλ₯Ό λ‹€λ£¨λŠ” 도ꡬ

μ‹œλ‚˜λ¦¬μ˜€μ™€ μ „λž΅

  • Orangeμ—μ„œ ν•  수 μžˆλŠ” 것
    • 데이터 ν‘œμ— μ΅μˆ™ν•΄μ§€κΈ°
      • μ›ν•˜λŠ” 행을 검색
      • μ›ν•˜μ§€ μ•ŠλŠ” μ—΄ 감좔기
      • μ—΄μ˜ 값을 계산 >> μƒˆλ‘œμš΄ 행을 λ™μ μœΌλ‘œ λ§Œλ“€κΈ°
    • ν‘œμ˜ μ‹œκ°ν™”
      • μ’Œν‘œ 평면
      • κ·Έλž˜ν”„
    • λ¨Έμ‹ λŸ¬λ‹
      • ν˜„μž¬μ— λŒ€ν•œ κ²°μ •
      • 미래 예츑

μ„€μΉ˜

  • Orange3 λ‹€μš΄λ‘œλ“œ νŽ˜μ΄μ§€Β μ ‘μ†
  • Download Orange 클릭
  • 였λ₯˜λ₯Ό λ°©μ§€ν•˜λ €λ©΄ μ„€μΉ˜ κ²½λ‘œμ— ν•œκΈ€μ΄ μ—†μ–΄μ•Ό ν•œλ‹€
    • μ‚¬μš©μž 계정이 ν•œκΈ€μ΄λ©΄ Cλ“œλΌμ΄λΈŒμ— orange 폴더 μƒμ„±ν•˜κ³  ν•΄λ‹Ή κ²½λ‘œμ— μ„€μΉ˜ν•˜κΈ°
  • Orange3 μ‹€ν–‰
profile
Coding is playing!

0개의 λŒ“κΈ€