Jeff Dean은 Stanford AI Club 강연에서, 오늘날의 대규모 AI 모델이 어떻게 만들어졌는지를 알고리즘·시스템·하드웨어 관점에서 정리했다. 이 강연은 “LLM이 갑자기 등장한 것이 아니라, 15년 이상 축적된 구조적 진화의 결과”라는 점을 명확히 보여준다.
Neural Network + Backpropagation은 50년 된 개념
성능 도약의 핵심은 아이디어 자체가 아니라 ‘스케일’
문제는 연산 자원 부족 → 병렬 학습 구조가 필수
2011년 Google Brain 출범
CPU 기반 환경에서 Data Parallel / Model Parallel 학습 실험
비동기 파라미터 업데이트(수학적으로는 “틀린 방식”)가 실제로는 잘 작동
결과:
YouTube 영상 프레임으로 라벨 없는 학습
모델 내부에서:
결론:
단어를 벡터 공간의 점으로 표현
의미적 거리와 방향이 실제 언어 규칙을 반영
king - man + woman ≈ queen언어 이해를 기호 처리 → 연속 공간 문제로 전환
Tensor Processing Unit
CPU로는 한계 도달
신경망 특성:
TPU v1 결과:
이후 TPU Pod → ML 슈퍼컴퓨터로 진화
Transformer
핵심 아이디어: Attention
순차 처리(LSTM) 제거
결과:
현재 모든 LLM의 중심 구조
Self-supervised Learning
데이터는 무한, 정답은 자동 생성
언어 모델 = 대규모 확률 예측기
모든 파라미터를 매번 쓰는 건 낭비
일부 전문가만 활성화
결과:
Gemini 계열 모델도 Sparse 구조
Chain-of-Thought Prompting
모델이 토큰을 통해 사고할 시간 확보
수학·논리 성능 대폭 향상
Gemini