[데브코스 자율주행 TIL] DAY 76 (01/11) 🧬

happy_quokka·2024년 1월 30일
0
post-thumbnail

2024.01.11 DAY76

딥러닝 프로젝트를 시작했다!! 이번주는 온라인으로 진행하고 다음주부터 오프라인으로 진행한다. 딥러닝보다 AWS를 사용해보는게 기대가 되었다. 객체 인식 딥러닝을 진행하는데 nuScene 데이터로 center point 모델을 사용하여 학습하는 프로젝트이다.

처음에는 local에서 모델을 사용해보려고 했다. 하지만 환경 설정하는 중에 에러가 났다. 알고 보니 CUDA가 필수인데 local 환경에는 GPU가 없어서 발생하는 에러였다. 그래서 팀원들과 AWS 인스턴스를 만들고 docker로 환경설정을 진행했다. 오늘 환경설정을 다 하지는 못했다ㅠㅠ 에러가 너무 많이 나고 그 이유를 찾기 힘들어서 오래걸렸다... AWS를 처음 사용해봐서 인스턴스 만들고 사용하는 것부터 쉽지 않았다. docker 환경설정을 오늘 다 끝내기 못했다ㅠㅠ 내일 이어서 해야겠다!!


🧬 딥러닝 프로젝트 과정 및 어려웠던 점

Center Point 환경 설정하기

  • 결국... local은 GPU가 없어서 환경을 설정하지 못하였다. AWS에서 docker로 환경 설정을 해야한다
  • 발생하는 에러들을 하나씩 해결하며 환경 설정을 하려고 시도하였다
  • 하지만 CUDA가 없어서 발생하는 에러였고 AWS로 진행해야한다는 것을 알게 되었다

AWS 인스턴스 만들기

  • AWS를 처음 사용해봐서 인스턴스를 만드는 것부터 생소했다
  1. IAM에서 MFA 인증하기
  2. 원하는 Image 선택하기 : GPU + pytorch + ubuntu 18.04를 선택했다
  3. 인스턴스 유형 선택 : g5.xlarge
  4. key pair 설정
  5. 인스턴스 시작
  • 그 후에는 ssh로 연결하면 된다

docker container 생성 & 환경 설정

docker run -it --gpus all -v [host 경로]:[container 경로] -p 8888:8888 --name [container명] [image명] /bin/bash
  • 위의 명령어로 docker container를 생성했다
  • --gpus all 이 옵션을 넣어야 gpu를 사용할 수 있다
  • center point를 설치하고 필요한 라이브러리도 설치했다
  • nuscenes-devkit 설치를 진행했다
  • APEX 설치를 진행하면서 에러가 많이 발생했는데 알고보니 docker image에 포함되어 있어서 설치할 필요가 없었다

0개의 댓글