[240408] 논문 조사

About_work·2024년 4월 8일
0

브레인스토밍

목록 보기
1/1

  • LIP-Fields 모델은 장면의 분할, 각 요소를 식별하는 건 물론이고,
    • 공간적인 정보를 검색하거나 어디를 보고 있는지 파악하는 등 다양한 일을 할 수 있음
  • 특히나 CLIP-Fields는 공간적인 위치를 어떤 의미가 담긴 벡터로 변환시키는 학습을 함
  • 이게 중요한 이유는, 이러한 변환 작업이 웹에서 흔히 볼 수 있는 이미지나 텍스트로 학습된 모델들, 예를 들면 CLIP이나 Detic, Sentence-BERT와 같은 것들의 도움을 받아서 이뤄진다는 것
    • 이는 인간이 직접 감독하지 않고도 가능
  • CLIP-Fields를 이용하면 로봇이 실제 세계에서 주변을 의미 있게 탐색할 수 있다는 걸 보여줘요.














profile
새로운 것이 들어오면 이미 있는 것과 충돌을 시도하라.

0개의 댓글