시리즈

DNN

1.Transfer Learning과 Fine Tuning의 차이

Deep Learning이라는 개념이 폭발하기 시작한지도 한 10년쯤 지난듯 하다. 물론 대중적으로는 알파고의 파급력이 제일 컸겠지만 학술적으로는 2012년에 발표된 AlexNet이 사실 현대 DeepLearning의 시발을 알린 모델이기에 10년이라 표현한것이다. D

2023년 7월 24일

2.localGPT Implementation

오프라인 GPT를 구동하기 위한 localGPT 설치 및 실행과정에서 발생하는 문제, 해결방법을 적고 있습니다.

2023년 7월 26일

3.논문번역: MADGRAD

인공신경망 훈련은 반복계산과 역전파를 통한 gradent descent를 통해 모델을 최적화 해왔습니다. 기본적으로 너무 큰 계산 범위기 때문에 모델 최적화는 여러 어려움에 직면합니다. 이를 효율적으로 진행하기 위해 여러 방법이 개발되었는데, 근본중의 근본이 SGD를

2023년 11월 4일

4.번역: Illustrating Reinforcement Learning from Human Feedback (RLHF)

이 글은 clova hyperX로 번역되었습니다. 논문 번역은 chatGPT로 하고 있으니 정성적인 번역 성능 비교도 될수 있지만, 클로바x로는 별다른 Prompt를 사용하지 않고 번역만 요청했습니다. 저작권은 오롯이 원글 저작자에게 있습니다. 원글은 HuggingFa

2023년 12월 18일

5.번역: Understanding GPU Memory 1: Visualizing All Allocations over Time

이 글은 clova hyperX로 번역되었습니다. 논문 번역은 chatGPT로 하고 있으니 정성적인 번역 성능 비교도 될수 있지만, 클로바x로는 별다른 Prompt를 사용하지 않고 번역만 요청했습니다. 첫글은 clova로 진행했으나 api가 아닌 챗봇 상에서 few-s

2023년 12월 20일

6.번역: Understanding GPU Memory 2: Finding and Removing Reference Cycles

2023년 12월 20일

7.Paper translator Development

논문은 학술공부를 하고자 하는 많은 분들이 필수로 읽어야 하는 기본 Context이다. 다만 읽어야 하는 대부분의 논문이 영어로 되어 있고, 한글로 작성된 논문도 읽기 쉽지 않은 상황에서 다른 언어로 작성된 논문을 읽는 것은 영어를 잘하는 사람에게도 쉬운 일은 아니다.

2024년 1월 15일

8.EleutherAI의 DPS 알아보기

EleutherAI is a non-profit AI research lab that focuses on interpretability and alignment of large models. EleutherAI는 대형 모델의 해석 가능성과 정렬에 중점을 둔 비영리 AI

2024년 2월 19일

9.Transformers Inference Optimization Toolset

대규모 언어 모델(Large Language Models, LLM)은 인공지능의 경계를 확장하고 있지만, 그 방대한 크기는 상당한 계산적 도전 과제를 안겨줍니다. 이러한 모델이 커질수록, 이를 현대 하드웨어에서 효율적으로 실행할 수 있게 하는 스마트한 최적화 기술의 필

2024년 12월 6일