Deep Learning이라는 개념이 폭발하기 시작한지도 한 10년쯤 지난듯 하다. 물론 대중적으로는 알파고의 파급력이 제일 컸겠지만 학술적으로는 2012년에 발표된 AlexNet이 사실 현대 DeepLearning의 시발을 알린 모델이기에 10년이라 표현한것이다. D
오프라인 GPT를 구동하기 위한 localGPT 설치 및 실행과정에서 발생하는 문제, 해결방법을 적고 있습니다.
인공신경망 훈련은 반복계산과 역전파를 통한 gradent descent를 통해 모델을 최적화 해왔습니다. 기본적으로 너무 큰 계산 범위기 때문에 모델 최적화는 여러 어려움에 직면합니다. 이를 효율적으로 진행하기 위해 여러 방법이 개발되었는데, 근본중의 근본이 SGD를
이 글은 clova hyperX로 번역되었습니다. 논문 번역은 chatGPT로 하고 있으니 정성적인 번역 성능 비교도 될수 있지만, 클로바x로는 별다른 Prompt를 사용하지 않고 번역만 요청했습니다. 저작권은 오롯이 원글 저작자에게 있습니다. 원글은 HuggingFa
이 글은 clova hyperX로 번역되었습니다. 논문 번역은 chatGPT로 하고 있으니 정성적인 번역 성능 비교도 될수 있지만, 클로바x로는 별다른 Prompt를 사용하지 않고 번역만 요청했습니다. 첫글은 clova로 진행했으나 api가 아닌 챗봇 상에서 few-s
이 글은 clova hyperX로 번역되었습니다. 논문 번역은 chatGPT로 하고 있으니 정성적인 번역 성능 비교도 될수 있지만, 클로바x로는 별다른 Prompt를 사용하지 않고 번역만 요청했습니다. 첫글은 clova로 진행했으나 api가 아닌 챗봇 상에서 few-s
논문은 학술공부를 하고자 하는 많은 분들이 필수로 읽어야 하는 기본 Context이다. 다만 읽어야 하는 대부분의 논문이 영어로 되어 있고, 한글로 작성된 논문도 읽기 쉽지 않은 상황에서 다른 언어로 작성된 논문을 읽는 것은 영어를 잘하는 사람에게도 쉬운 일은 아니다.
EleutherAI is a non-profit AI research lab that focuses on interpretability and alignment of large models. EleutherAI는 대형 모델의 해석 가능성과 정렬에 중점을 둔 비영리 AI
대규모 언어 모델(Large Language Models, LLM)은 인공지능의 경계를 확장하고 있지만, 그 방대한 크기는 상당한 계산적 도전 과제를 안겨줍니다. 이러한 모델이 커질수록, 이를 현대 하드웨어에서 효율적으로 실행할 수 있게 하는 스마트한 최적화 기술의 필