[ml-agents] how to park a car (1)

공부·2022년 11월 8일
1

참고영상

머신러닝을 이용해 어떻게 자동차를 주차구역에 주차시킬 것인가?

학습시키기 앞서 기본적인 변수들과 툴을 알아보도록하자.

car

  • Car Agent(Script)
    -- Max Step : 학습 횟수
    -- Material : 실패/성공/기본 했을 때 땅 질감 어떻게 달라지는지

  • Box Collider
    : collider로 보상을 조정

  • Rigid Body
    : car가 힘을 받고 속도가 바뀜
    ** frozee Rotation

  • Behavior Parameters
    : 무슨 값을 받고 학습시킬지 정함
    전진 후진, 회전, idle 상태, 좌우(vector값)
    Vector Observation : space
    Vector Action : 전후, 좌우
    Model : 돌리는 모델 종류

    ** Behavior type : default/hueristic only(사람)

  • car Controller
    speed(fast), torque, roatate
    animator

  • Rayperception sensor 3d
    tag : 콜라이더에 걸리는 element 정리 (car, goal, barriar, tree) -> 성능향상에 도움 (raysensor로 tag 구분할 수 있어야 하니까)
    Ray Per Detection : ray 정도
    ** ..another ray : ray 종류와 정도

  • Decision Requester (중요)
    : 매 학습마다 요구되는 판단들
    ** Decision Period : 학습 몇 번마다 보여줄 것인지. (5번이 정당하다)

DashBoard

Dashborad에 매 트레이닝마다 성공 정도를 보여줌.

Car Sport

최소 1, 최대 2, empty prefab, boxColider추가하여 확인.

  • Car goal
    Goal Reward : spot에 들어갈 때마다 부여할 reward도 정해주어야함.
    Goal Min Ratation : 정답 기준 제시 (edge)

how the agent actually perform

tensorboard -logic dir-/result

왼쪽 바에 모델을 추가하여 모델 별 실시간 모델 학습 정도를 비교 확인할 수 있다.

profile
리액트

0개의 댓글