AI 모델을 개발하다보면 학습 속도가 너무 느리거나, 컴퓨팅 용량 문제로 CUDA error가 발생하는 것을 경험하게 된다. 이럴 때 모델을 경량화해서 용량 문제와 속도 문제를 모두 해결할 수 있는 방법이 있어 소개하려 한다.AMP는 Automatic Mixed Pre

오늘은 Machine Learning 코드를 보면 사용자가 편리하게 하이퍼파라미터 지정할 수 있도록 활용되는 파이썬 패키지인 argparse에 대해서 알아보겠습니다.깃허브를 통해 배포된 소스코드나 모델을 돌릴 때 Terminal에 위와 같은 방식으로 실행시키는 경우가

파이썬을 통해 다양한 클래스들을 생성하고 구현된 코드들을 보다보면 클래스마다 \_\_에 의해 감싸진 특수한 메소드들을 많이 볼 수 있습니다. 이 때 각 메소드들이 어떤 함수인지 알고 코드를 보면 클래스에 구현된 함수들을 이해하거나 동작 방식을 이해할 때 도움이 될 것
이런저런 코드들을 보다가 string을 길이에 맞춰 앞에 0을 채워주는 string 내장함수 zfill를 발견하였다! 항상 파일 이름을 저장하거나, 불러올 때 이 숫자들 앞에 있는 0을 어떻게 처리해야 하나 고민이 많았고, 함수를 하나 만들어서 사용하곤 했는데 이런 메

DataLoader를 작성할 때 collate_fn이라는 함수가 종종 쓰이곤 합니다. 오늘은 이 collate_fn이 무엇이고, 어떤 역할을 하는지 한 번 알아보겠습니다.위와 같이 DataLoader를 정의할 때 collate_fn 라는 인자가 있습니다. collate

안녕하세요:) 혹시 여러분들은 RAM의 부족으로 인해 python으로 돌리려던 모델이 killed된 경우를 경험하신 적이 있으신가요? 최근 LLM이 점점 거대해지면서 이 LLM을 활용하다보면 RAM 메모리를 초과해 컴퓨터가 자동으로 실행을 중지시키는 일이 생기곤 합니다

nn.Parameter를 활용하면 된다.예시위와 같이 torch의 tensor로 matrix를 계산하기 위해서 nn.parameter로 학습가능한 형태로 만들어줬다.실행결과위와 같이 layer의 파라미터로 모델이 받아들인다.

드디어 6개월 장정의 네이버 커넥트재단에서 주관하는 부스트캠프 AI-Tech를 마무리했습니다. 마무리 프로젝트를 하면서 다양한 고민과 공부를 했지만 블로그로 따로 정리는 하지 못해 몰아서 정리를 해보려 합니다.첫번째는 텍스트 전처리 과정에서 많이 활용했던 re 모듈입니

안녕하세요:) 오늘은 네이버 부스트캠프 최종 프로젝트를 하면서 처음으로 접했던 병렬처리 (멀티프로세스)에 대해서 알아보겠습니다.프로젝트에서 하이퍼클로바 API와 DALL-E API를 차례대로 불러오는 과정이 있었는데요, 이를 순차적으로 수행하면서 API 통신의 시간이

안녕하세요! 그루비한 입니다. 이번 포스트는 파이썬에 로그를 활용하는 방법입니다.파이썬 파일을 10시간 정도 실행시켰는데, 뭔가 코드의 오류로 실행 결과가 저장되지 않는다면 정말 절망적일 수 밖에 없습니다. (실제 경험담..) 그래서 저는 이런 불안감을 잠재우고자 파이

ONNX는 Pytorch, Tensorflow, TensorRT 등 다양한 모델의 프레임워크들의 중심에 있는 모델을 표현하는 프레임워크로, 각 프레임워크에서 다른 프레임워크로 변환할 때 ONNX를 거쳐서 변환할 수 있도록 지원해줍니다.torch 모델을 ONNX로 변환하