agent간 통신 없이도 + agent가 partially observable 한 상황에서도, multi-agent 주행을 잘 하고 싶다.(충돌이 적고, 서로 협력적으로 도와가며 주행).partially observable: 한 agent는 내 주변 상황만 센서로 부분
DiscreteSACGRUCOMACoreDiscreteSACGRUCoreDiscreteSACCoreSACCore
이 논문 기여 centralized critic에 attention 알고리즘을 적용하여, 매 순간 더 집중해야할 와 덜 집중해야할 가 무엇인지 학습합니다. 복잡한 환경에서 성능 향상이 있고, 더 scalable 합니다. (agent수가 많아져도 성능이 좋습니다.