profile
개발자
post-thumbnail

언어 모델의 학습 속도를 FLOPs로 측정하기

FLoating-point Operations를 줄여서 FLOPs라고 합니다. 이름 그대로 부동소수점 연산의 개수를 뜻합니다. 모델 학습에 정수 연산이나 논리 연산이 없는 것은 아니지만, 부동소수점 연산의 비중이 대부분이기 때문에 FLOPs를 측정하면 모델 학습에 걸리

2023년 9월 9일
·
0개의 댓글
·

HuggingFace에 여러 태스크로 이루어진 데이터셋 만들기

Hugging Face에는 딥러닝 모델뿐만 아니라 수많은 데이터셋이 있습니다.허깅페이스 라이브러리를 통해서 이것들을 다운 받을 수도 있고, 새로 만들어서 올릴 수도 있습니다.꼭 웹사이트에 올리지 않고 로컬에서 작업할 때에도 허깅페이스의 datasets 라이브러리는 유용

2023년 9월 3일
·
0개의 댓글
·

"챗GPT보다 한국어 6500배 학습"했다는 네이버, 6500배는 어떻게 나온 계산일까요?

2023년 8월 24일에 네이버 하이퍼클로바X가 공개됩니다. 관련 기사를 찾아보면 네이버가 OpenAI보다 한국어를 6500배 더 많이 학습했다는 언급을 자주 접하게 됩니다. 그런데 6500배라는 수치는 어떻게 나온 것일까요? 오픈AI에서 챗GPT나 GPT4를 발표하면

2023년 8월 18일
·
1개의 댓글
·
post-thumbnail

웹브라우저로 python 실행하기

Python 코드를 웹에서 직접 실행할 수 있으면 편할 것입니다. PHP나 Django에서 파이썬 스크립트 파일을 실행하는 방법이 아니라, JavaScript처럼 HTML 파일에 직접 파이썬 스크립트를 포함시켜서 실행하는 방법을 설명합니다. 이를 위한 프로젝트로 Pyo

2023년 8월 6일
·
1개의 댓글
·

NGC 도커 login

NGC란 NVIDIA GPU cloud의 약어입니다. 도커에서 NGC를 얘기할 때에는 보통 엔비디아에서 배포하는, 딥러닝에 최적화된 도커 이미지를 뜻합니다. https://catalog.ngc.nvidia.com/containers 페이지를 보시면 다양한 환경

2023년 7월 29일
·
0개의 댓글
·
post-thumbnail

ChatGPT가 한국어도 잘하는데 한국어 언어모델을 따로 만들 필요가 있을까

ChatGPT를 사용해 보면 한국어를 꽤 잘합니다.비록 한국에 대한 지식이나 최신 유행에 대한 정보가 부족할 때도 있지만 옛날 번역기를 보듯이 말 자체를 이해하지 못하는 일은 거의 없습니다.OpenAI에서 API를 제공하니까 한국 기업들도 자연스럽게 ChatGPT AP

2023년 7월 23일
·
2개의 댓글
·

한글을 출력했는데 \u로 시작하는 코드로 깨질 때 복구하는 방법

번역 API를 통해서 영문을 한글로 번역하다가 아래와 같은 에러를 만났습니다뒤에 파일명을 써 주어도 되고, 파이프에 붙여 쓸 수도 있습니다

2023년 6월 18일
·
0개의 댓글
·

Confluence에 HTML 백업 파일을 일괄 업로드하는 프로그램 개발기

지난번에 Quip에서 Confluence 이사하기에 대해 설명했습니다.꼭 Quip이 아니더라도 다량의 백업파일이 있고 이를 Confluence에서 가져와야 할 때가 있습니다.안타깝게도 Confluence의 기본 메뉴에서는 파일 하나만 가져오는 기능을 제공할 뿐, 일괄로

2023년 6월 6일
·
0개의 댓글
·

Quip에서 Confluence로 이사하기

TL;DR 아래 명령으로 quip에서 추출할 수 있습니다. 추출한 결과는 confluence에 수동으로 import시키거나, https://github.com/Sazar24/confluence-docs-importer 등을 사용합니다. quip이란 Quip은 협

2023년 6월 6일
·
0개의 댓글
·

git 패치 파일 만들기

git 변경사항을 저장하고 적용할 수 있는 패치 파일을 만드는 방법을 설명합니다.협업하다 보면 미완성인 코드를 공유할 일이 생깁니다. 다른 구성원한테 공유할 수도 있고, 한 기계에서 작업하던 내용을 다른 기계로 옮겨서 이어서 하고 싶을 수도 있습니다. 작업이 완료됐다면

2023년 5월 6일
·
0개의 댓글
·

Meta AI에서 개발한 ChatGPT의 대항마, LLaMA

LLaMA: Open and Efficient Foundation Language ModelsChatGPT로 세계가 떠들썩한 2023년 2월 24일, 메타AI (페이스북)에서 라마(LLaMA)를 발표했습니다.사실 메타가 언어 모델을 발표한 것은 이번이 처음이 아닙니다.

2023년 5월 3일
·
0개의 댓글
·

git에서 커밋 작성자 변경하기

git에서 커밋을 했는데 작성자를 변경하고 싶을 때가 있습니다. 회사 업무를 하는데 외부에서 쓰는 개인 명의로 커밋하거나 반대로 사적인 작업을 하는데 회사 이메일로 커밋하는 경우 등이 있겠습니다. 동료가 세팅한 환경에서 작업하다가 커밋을 해야 하는 경우도 가끔 생기고요

2023년 4월 9일
·
0개의 댓글
·
post-thumbnail

VSCode에서 유용한 GitHub 익스텐션 GitHub Pull Requests and Issues

볼랜드의 터보-C의 아성을 무너뜨린 뒤로 마이크로소프트의 비주얼 스튜디오는 오랫동안 통합 개발 환경의 최강자로 군림해 왔습니다. 젯브레인즈의 인텔리제이, 아이비엠의 이클립스, 애플의 엑스코드, 델파이 등 강력한 경쟁자들이 등장했지만 감히 왕좌를 빼앗지는 못했습니다. 그

2023년 4월 2일
·
0개의 댓글
·

gitstatus 소개

터미널에서 git을 사용하다 보면 git status를 자주 쳐서 상태를 확인하게 됩니다. 간단한 명령이지만 수십 번 반복하는 것도 번거롭기 때문에 최대한 간단히 보고 싶습니다. IDE를 쓰면 수월하게 확인할 수 있지만 터미널이 필요한 일은 생기게 마련이고요. 가장 좋

2023년 1월 29일
·
0개의 댓글
·

소프트 스킬 2판

2016년 가을 다이칸야마 츠타야에 갔을 때 소프트 스킬이라는 제목의 책이 눈길을 끌었다. 지금 생각해 보면 책꽂이에 평범하게 꽂혀 있던 이 책이 왜 눈길을 끌었는지 잘 기억나지는 않는다. 다자인이 특별히 눈에 띄는 것도 아니었고, 제목이 특별해 보이지도 않았다. 아마

2022년 11월 26일
·
0개의 댓글
·