Mechanistic-Interpretability

1.[기계적 해석 기초] A Mathematical Framework for Transformer Circuits 이해하기/논문리뷰

post-thumbnail

2.[기계적 해석 기초] In-context learning과 Induction heads 이해하기/논문리뷰

post-thumbnail

3.[기계적 해석 기초] Causal Scrubbing 이해하기/논문리뷰

post-thumbnail

4.Introduction to Mechanistic Interpretability (기계적 해석의 전반적인 설명)

post-thumbnail

5.[기계적 해석 기초] 다의성(Polysemanticity)과 Sparse Autoencoder 설명

post-thumbnail