머신러닝 야학 4일차

타키탸키·2021년 7월 22일

ML 강화학습 머신러닝 머신러닝 야학 생활코딩

0

머신러닝

목록 보기

4/6

🤖 강화 학습

강화 학습(reinforcement learning)
- 일단 해보는 것
- 경험을 통해 실력을 키워나가는 것
- 행동의 결과가 유리한 것이었다면 상을 받는다
- 행동의 결과가 불리한 것이었다면 벌을 받는다
- 위 과정을 매우 많이 반복하면 더 많은 보상을 받을 수 있는 더 좋은 답을 찾아낼 수 있다
- 더 많은 보상을 받을 수 있는 정책을 만드는 것
- 경험을 통해 점점 더 똑똑해지는 기계
- 알파고, 자율주행 자동차

게임의 실력자가 되는 과정
- 게임은 게이머에게 현재 상태를 보여준다
  - 캐릭터의 위치와 장애물의 위치, 현재의 점수
  - 점수가 높아지는 것은 상
  - 장애물에 부딪혀 목숨을 잃는 것은 벌
- 관찰의 결과에 따라 어떤 상태에서 어떻게 행동해야 더 많은 상을 받고 더 적은 벌을 받을 수 있는지 알게 된다
  - 판단력의 강화
- 판단에 따라 다음 행동을 한다
- 행동은 게임에 변화를 준다

게임과 머신러닝
- 게임 >> 환경(Environment)
- 게이머 >> 에이전트(Agent)
- 게임 화면 >> 상태(State)
- 게이머의 조작 >> 행동(Action)
- 상과 벌 >> 보상(Reward)
- 게이머의 판단력 >> 정책(Policy)

스스로 수련을 통해서 더 좋은 선택을 하는 기능이 필요하다면 강화 학습을 선택

강화 학습을 통해서 할 수 있는 일
- 더 많은 강화 학습 사례가 궁금하다면?
- 좋은 강화 학습 사례를 알고 있다면?

🤖 나에게 필요한 머신러닝은?

머신러닝 지도

레모네이드 카페 사례(회귀)
- 과거의 데이터를 가지고 있다
- 가지고 있는 데이터가 많다
- 추측하고 싶은 미지의 종속 변수가 있다
- ~~미지의 종속 변수가 범주형 데이터다~~
- 미지의 종속 변수가 양적 데이터다

알파고(강화 학습)
- ~~과거의 데이터를 가지고 있다~~
- 보상을 되돌려주는 환경이 있다

장바구니 분석(연관 규칙 학습)
- 과거의 데이터를 가지고 있다
- 가지고 있는 데이터가 많다
- 추측하고 싶은 미지의 종속 변수가 있다
- ~~비슷한 관측치를 그룹핑하고 싶다~~
- 특성 사이의 상관 관계를 찾고 싶다

🍊 Orange3

오리엔테이션

Orange3
- 드래그 앤 드롭 방식 활용
- 표의 분석, 시각화, 머신러닝 가능
- 통계, 데이터 마이닝, 데이터 과학 분야에 활용
- 표를 다루는 도구

시나리오와 전략

Orange에서 할 수 있는 것
- 데이터 표에 익숙해지기
  - 원하는 행을 검색
  - 원하지 않는 열 감추기
  - 열의 값을 계산 >> 새로운 행을 동적으로 만들기
- 표의 시각화
  - 좌표 평면
  - 그래프
- 머신러닝
  - 현재에 대한 결정
  - 미래 예측

설치

Orange3 다운로드 페이지 접속
Download Orange 클릭
오류를 방지하려면 설치 경로에 한글이 없어야 한다
- 사용자 계정이 한글이면 C드라이브에 orange 폴더 생성하고 해당 경로에 설치하기
Orange3 실행

출처: 생활코딩 - 머신러닝 야학

There's Only One Thing To Do: Learn All We Can

이전 포스트

머신러닝 야학 3일차

다음 포스트

머신러닝

0개의 댓글

관련 채용 정보