타키탸키
로그인
타키탸키
로그인
머신러닝 야학 4일차
타키탸키
·
2021년 7월 22일
팔로우
0
ML
강화학습
머신러닝
머신러닝 야학
생활코딩
0
머신러닝
목록 보기
4/6
🤖 강화 학습
강화 학습(reinforcement learning)
일단 해보는 것
경험을 통해 실력을 키워나가는 것
행동의 결과가 유리한 것이었다면 상을 받는다
행동의 결과가 불리한 것이었다면 벌을 받는다
위 과정을 매우 많이 반복하면 더 많은 보상을 받을 수 있는 더 좋은 답을 찾아낼 수 있다
더 많은 보상을 받을 수 있는 정책을 만드는 것
경험을 통해 점점 더 똑똑해지는 기계
알파고, 자율주행 자동차
게임의 실력자가 되는 과정
게임은 게이머에게 현재 상태를 보여준다
캐릭터의 위치와 장애물의 위치, 현재의 점수
점수가 높아지는 것은 상
장애물에 부딪혀 목숨을 잃는 것은 벌
관찰의 결과에 따라 어떤 상태에서 어떻게 행동해야 더 많은 상을 받고 더 적은 벌을 받을 수 있는지 알게 된다
판단력의 강화
판단에 따라 다음 행동을 한다
행동은 게임에 변화를 준다
게임과 머신러닝
게임 >> 환경(Environment)
게이머 >> 에이전트(Agent)
게임 화면 >> 상태(State)
게이머의 조작 >> 행동(Action)
상과 벌 >> 보상(Reward)
게이머의 판단력 >> 정책(Policy)
스스로 수련을 통해서 더 좋은 선택을 하는 기능이 필요하다면 강화 학습을 선택
강화 학습을 통해서 할 수 있는 일
더 많은 강화 학습 사례가 궁금하다면?
좋은 강화 학습 사례를 알고 있다면?
🤖 나에게 필요한 머신러닝은?
머신러닝 지도
레모네이드 카페 사례(회귀)
과거의 데이터를 가지고 있다
가지고 있는 데이터가 많다
추측하고 싶은 미지의 종속 변수가 있다
미지의 종속 변수가 범주형 데이터다
미지의 종속 변수가 양적 데이터다
알파고(강화 학습)
과거의 데이터를 가지고 있다
보상을 되돌려주는 환경이 있다
장바구니 분석(연관 규칙 학습)
과거의 데이터를 가지고 있다
가지고 있는 데이터가 많다
추측하고 싶은 미지의 종속 변수가 있다
비슷한 관측치를 그룹핑하고 싶다
특성 사이의 상관 관계를 찾고 싶다
🍊 Orange3
오리엔테이션
Orange3
드래그 앤 드롭 방식 활용
표의 분석, 시각화, 머신러닝 가능
통계, 데이터 마이닝, 데이터 과학 분야에 활용
표를 다루는 도구
시나리오와 전략
Orange에서 할 수 있는 것
데이터 표에 익숙해지기
원하는 행을 검색
원하지 않는 열 감추기
열의 값을 계산 >> 새로운 행을 동적으로 만들기
표의 시각화
좌표 평면
그래프
머신러닝
현재에 대한 결정
미래 예측
설치
Orange3 다운로드 페이지
접속
Download Orange
클릭
오류를 방지하려면 설치 경로에 한글이 없어야 한다
사용자 계정이 한글이면 C드라이브에 orange 폴더 생성하고 해당 경로에 설치하기
Orange3 실행
출처: 생활코딩 - 머신러닝 야학
타키탸키
There's Only One Thing To Do: Learn All We Can
팔로우
이전 포스트
머신러닝 야학 3일차
다음 포스트
머신러닝
0개의 댓글
댓글 작성
관련 채용 정보