
์ด๋ฏธ์ง ์ถ์ฒ: Sakana AI
Let an ultraintelligent machine be defined as a machine that can far surpass all the intellectual activities of any man, however clever. Since the design of machines is one of these intellectual activities, an ultraintelligent machine could design even better machines; there would then unquestionably be an โintelligence explosion,โ and the intelligence of man would be left far behind. Thus the first ultraintelligent machine is the last invention that man need ever make, provided that the machine is docile enough to tell us how to keep it under control.
- I. J. Good, 1965
ํ์ค๊ตญ์ด๋์ฌ์ ์ ๊ธฐ์ค์ผ๋ก ๋ฐ๋ช
์ด๋, ์์ง๊น์ง ์๋ ๊ธฐ์ ์ด๋ ๋ฌผ๊ฑด์ ์๋ก ์๊ฐํ์ฌ ๋ง๋ค์ด ๋ด๋ ๊ฒ์ ๋งํ๊ณ , ๋ฐ๊ฒฌ์ด๋, ๋ฏธ์ฒ ์ฐพ์๋ด์ง ๋ชปํ์๊ฑฐ๋ ์์ง ์๋ ค์ง์ง ์๋ํ ์ฌ๋ฌผ์ด๋ ํ์, ์ฌ์ค ๋ฐ์๋ฅผ ์ฐพ์๋ด๋ ๊ฒ์ ๋งํ๋ค.
์๋ํ ๋ฐ๋ช
๊ณผ ๋ฐ๊ฒฌ์ ์์๋ก ๊ฐ๊ฐ ์๋์จ์ ์ ๊ตฌ์ ์์ธ์ํ์ธ์ ์๋์ฑ์ด๋ก ์ด ์๋ค. ์ธ๊ฐ์ด ํธ๊ธฐ์ฌ์ ๊ฐ๊ณ , ๊ณต๋ถํด์ ์ต๋ํ ์ง์์ ๋ฐํ์ผ๋ก ์ด์ ๊ฐ์ ๋ฐ๋ช
๊ณผ ๋ฐ๋ช
์ ์ํํ๋ค.
๊ฒฐ๊ณผ์ ์ผ๋ก ์ค๋๋ ์ ํํ๋ AI๊ฐ ๊ฐ๋ฐ๋์๋ค. AI๋ ๊ณผ์ฐ ๋ฐ๋ช
๊ณผ ๋ฐ๊ฒฌ์ ํ ์ ์์๊น?
AGI, Artificial General Intelligence๋ ์ง์ญํ๋ฉด ์ธ๊ณต ์ผ๋ฐ ์ง๋ฅ์ผ๋ก, ์ธ๊ณต์ง๋ฅ์ด ์ธ๊ฐ๊ณผ ์ ์ฌํ ์ง์ ๋ฅ๋ ฅ์ ๊ฐ์ ธ ์ค์ค๋ก ํ์ตํ ์ ์๋ ์์ค๊น์ง ๋ฐ์ ์ํค๊ณ ์ ํ๋ ์ฐ๊ตฌ ๋ถ์ผ์ด๋ค. ์ด AGI์ ๋ํด์ OpenAI์์ ์ผํ๋ Leopold Aschenbrenner๊ฐ ์ด Situational Awareness๋ผ๋ ์๋ฆฌ์ฆ(์ฑ ์ธ๊ฐ?)๊ฐ ์๋๋ฐ, ์๋ ๊ทธ๋ฆผ์ ํด๋น ๊ธ์ ์๋ ์ง์ ์์ค์ ํญ๋ฐ์ ๋ํ ๊ทธ๋ฆผ์ด๋ค.

๊ทธ๋ฆผ์ ํตํด GPT-4์ ๋ฑ์ฅ์ ๊ธฐ์ ์ผ๋ก 2027๋
๊ฒฝ์๋ Automated AI Research๋ก ์ธํด ์ง์์ด ์ฑ์ฅํ ๊ฒ์ผ๋ก ์์ธกํ ์ ์๋ค.
๊ทธ๋ฐ๋ฐ GPT-4 ๋ฑ์ฅ ์ด์ ์ ์ดํ๋ก ๋ณด๋ ๊ฑด ์ข ํฐ ์์ฒ์ธ๋ฐ..?ใ
ใ
ํใ
ใ
ใ
Sakana AI๋ผ๋ ์ผ๋ณธ์ ํ ๋ฉ์์ ์ด์์ ์ธ AGI์ ํํ์ ๊ฐ์ฅ ์ ์ฌํ ์์
์ ์ํํ๋ ํ๋ก๊ทธ๋จ์ ๊ฐ๋ฐํ๋ค.
์ ์ฒด ๋
ผ๋ฌธ์ ํ์ธํ๋ฉด ๋ด์ฉ์ด ๋ ๋ง๊ฒ ์ง๋ง, ์์ง ๋
ผ๋ฌธ์ ์ฝ์ด๋ณด์ง ๋ชปํ๊ธฐ ๋๋ฌธ์ ๊ณต์ ํํ์ด์ง์ ๋ด์ฉ์ ๋ฐํ์ผ๋ก ๋ฆฌ๋ทฐํ๋ค.
๊ธฐ์กด ๋ชจ๋ธ๋ค์ ์ฌ๋์ ์์ ์ ๋๊ธฐ ์ํด ๊ฐ๋ฐ๋๊ณ ๋ฐ์ ํด์์ง๋ง, ์ด๋ฅผ ๋์ํ๊ฒ ํ๊ธฐ ์ํด์๋ ์ฌ์ ํ ์ธ๋ ฅ์ด ํ์ํ๊ณ , ํน์ task์ ํนํ๋๊ธฐ ์ํด์๋ ์ ๋ฌธ ์ง์ ๋ํ ํ์ํ๋ค๋ ๋จ์ ์ด ์๋ค. The AI Scientist๋ ๊ทธ๋ฌํ ๋จ์ ์ด ์ฌ๋ผ์ง๊ณ , ์๋์ ๊ฐ์ ์ผ๋ค์ ์ํํ ์ ์๋ค.
1. ์ ๋ฌธ๊ฐ์ ๋์ ์์ด ์ค์ค๋ก ์ฐ๊ตฌ ์ฃผ์ ๋ฅผ ํ๋ฆฝํด์ ์คํ ์ค๊ณ, ๊ฐ์ค ๊ฒ์ฆ, ๋ฆฌ๋ทฐ, ๋
ผ๋ฌธ ์์ฑ๊น์ง ์ฐ๊ตฌ ๋ผ์ดํ์ฌ์ดํด ์ ์ฒด๋ฅผ ์๋ํํ๋ค.
2. ์๋ํ๋ peer review ๊ณผ์ ์ ํตํด ์์ฑํ ๋
ผ๋ฌธ์ ๊ฒ์ฆํ๊ณ ํผ๋๋ฐฑ์ ์ฃผ๊ณ ๋ฐ์ผ๋ฉฐ ๊ฐ์ ํ๋ค. ์ด๋ ๊ฒ ์์ฑ๋ ๋
ผ๋ฌธ์ ์ธ๊ฐ๊ณผ ์ ์ฌํ ์์ค์ ์ ํ๋๋ฅผ ๋ณด์ธ๋ค.
3. ์ฐ๊ตฌ ๊ณผ์ ๊ณผ ๊ฒฐ๊ณผ์์ ์ต๋ํ ์ง์์ ๋ค์ ํ์ฉํด์ ๋ค์ ์ฐ๊ตฌ๋ฅผ ์ด์ด๊ฐ๋ค. ์ด๋ ์ธ๊ฐ์ ์ปค๋ฎค๋ํฐ ํ๋๊ณผ ์ ์ฌํ๋ค.
๊ทธ ๊ฒฐ๊ณผ๋ก ์ฌ๋ฌ ๋
ผ๋ฌธ์ ์์๋ก ์ฌ๋ ธ์ง๋ง, ๊ทธ ์ค ํ๋์ธ Dualscale Diffusion: Adaptive Feature Balancing for Low-Dimensional Generative Models์ Figure 1์ ์ดํด๋ณด์.

์ด ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ํด๋น ๋
ผ๋ฌธ์์ ๊ฐ๋ฐํ ๋ฐฉ์์ผ๋ก ์คํ์ ์ํํ ๊ฒฐ๊ณผ๊ฐ ์ฒจ๋ถ๋์ด ์๋ค. The AI Scientist๊ฐ ์์ฑํ ๋
ผ๋ฌธ์ LaTeX ํ์์ผ๋ก, ์ ๋
ผ๋ฌธ์ ๋ณด๋ฉด ์์ ๋ํ ํ์์ ๋ง์ถฐ ์ ์์ฑ๋์ด ์๋ ๊ฒ์ ํ์ธํ ์ ์๋ค.
๋ํ ํ ํธ์ ๋
ผ๋ฌธ์ ์์ฑํ๊ธฐ ์ํด ์์ ์ค๋ช
ํ ๋ชจ๋ ๊ณผ์ ์ด ๊ณ ์ 15$์ด๋ค.
The AI Scientist๊ฐ ์ฐ๊ตฌํ๋ ๊ณผ์ ์ ์๋์ ๊ฐ๋ค.

Idea Generation
์ํ๋ ์ฐ๊ตฌ ์ฃผ์ ์ ๊ด๋ จ๋ ๋ด์ฉ์ด ๋ด๊ธด starting template์ด ์ฃผ์ด์ง๋ฉด ๋ธ๋ ์ธ์คํ ๋ฐ์ ์์ํ๋ค. template์๋ ๋ฌธ์ ์์ฑ์ ์ํ LaTeX ํด๋๊ฐ ํฌํจ๋์ด ์๋ค. ์ฐ๊ตฌ ์ฃผ์ ํ๋ฆฝ์ ์ํด ์ฌ๋ฌ ์ฐ๊ตฌ๋ค์ ์ฐพ์๋ณด๋๋ฐ, ์ด๋ ๋ณธ ์ฐ๊ตฌ์์๋ ์์ด๋์ด์ ์ ๋ฌธ์ฑ์ ์ํด Semantic Scholar๋ฅผ ๊ฒ์์ ๋์์ผ๋ก ์ง์ ํ๋ค.
Experimental Iteration
Idea Generation ๋จ๊ณ์์ ๋ฐ์์จ ์์ด๋์ด์ template์ ์ฌ์ฉํด์ ์คํ์ ์ค๊ณํ๊ณ ์ํํ๋ค. ๊ฒฐ๊ณผ๋ฅผ ๋ฐํ์ผ๋ก ์๊ฐํ๋ฅผ ํ๋๋ฐ, ํด๋น plot์ ๋ํ ์ค๋ช
์ ์ ์ ๋ฟ๋ง ์๋๋ผ ํ์ํ ์ด๋ฏธ์ง๋ค์ ์ ์ฅํ๊ธฐ๋ ํ๋ค.
Paper Write-up
LaTeX ๋ฌธ๋ฒ์ ์ฌ์ฉํด์ ์งํํ ์ฐ๊ตฌ์ ๋ํ ๋
ผ๋ฌธ์ ์์ฑํ๋ฉฐ, Semantic Scholar๋ฅผ ์ฌ์ฉํด์ ๊ด๋ จ ์๋ ๋
ผ๋ฌธ๋ค์ citeํ๋ค.
Automated Paper Reviewing
์์ฑํ ๋
ผ๋ฌธ์ ๋ํด ์ธ๊ฐ๊ณผ ๋น์ทํ ์์ค์์ ํ๊ฐํ ์ ์๋ค. ํด๋น ๋
ผ๋ฌธ์ ๊ฐ์ ํ๊ธฐ ์ํ ๋ฆฌ๋ทฐ๋ฅผ ์์ฑํ ์๋ ์๊ณ , ์ดํ ์ฐ๊ตฌ์ ํ์ฉํ ์ ์๋ ๋ฆฌ๋ทฐ๋ฅผ ์์์ ์๋ ์๋ค. ์ดํ์ ํ์ฉํ ์ ์๋ ๋ฆฌ๋ทฐ๋ฅผ ํตํด ์ ๊ณผ์ ์ด ๋ฐ๋ณต์ ์ผ๋ก ์ํ๋๋ฉฐ, ๋์๋ ์ฐ๊ตฌ๋ฅผ ์ํํ ์ ์๊ฒ ๋๋ค.
์๋๋ Diffusion Modeling, Language Modeling, Grokking์ ๊ฐ๊ฐ ํ ํฝ์ผ๋ก ํด์ template์ผ๋ก ์ ๊ณตํ ์ ๋ณด๋ฅผ ๋ฐํ์ผ๋ก The AI Scientist๊ฐ ์ํํ ์ฐ๊ตฌ ๊ฒฐ๊ณผ์ด๋ค.
code๋ The AI Scientist์ GitHub ๋ ํฌ์งํ ๋ฆฌ์ ์ ์ฅ๋์ด ์๋ค. ์ฐ๊ตฌ๋ฅผ ์ํํ๊ธฐ ์ํด ์
๋ ฅํ template์ด ๋ฌด์์ธ์ง, The AI Scientist๊ฐ ์คํ์ ์ํด ์์ฑํ ์ฝ๋์ ์คํ ๊ฒฐ๊ณผ, ๋
ผ๋ฌธ ๋ฑ์ ํ์ธํ ์ ์๋ค.
Diffusion Modeling
Dualscale Diffusion: Adaptive Feature Balancing for Low-Dimensional Generative Models pdf, code
Language Modeling
Stylefusion: Adaptive Multi-Style Generation in Character-Level Language Models pdf, code
Adaptive Learning Rates for Transformers via Q-Learning pdf, code
Grokking
Unlocking Grokking: A Comparative Study of Weight Initialization Strategies in Transformer Models pdf, code
๋ ผ๋ฌธ์ ๋ณด๋ฉด ์ ์ ์๋ฏ์ด ํ์์ด ์ ๊ฐ์ถฐ์ ธ ์์ ๋ฟ๋ง ์๋๋ผ LaTeX ๋ฌธ๋ฒ์ ์ค์ํ๋ฉฐ, citation๊น์ง ๋ช ํํ ์จ๋์ ๊ฒ์ ์ ์ ์๋ค.
๋ณธ ์ฐ๊ตฌ์์๋ ์ด์ ๊ฐ์ ๋ฌธ์ ๋ค์ AI๊ฐ ๋ฐ์ ํจ์ ์์ด, multi-modal์ ์ฌ์ฉํ๊ฑฐ๋, The AI Scientist๋ฅผ ์ ๊ทธ๋ ์ด๋ํ๋ฉฐ ํด๊ฒฐ๋ ์ ์๋ค๊ณ ๋งํ๋ค.
์ฐ๊ตฌ๋ฅผ ์งํํจ์ ์์ด์ ์ค์ค๋ก ์คํ๋๋๋ก ์ฝ๋๋ฅผ ์ง๋ผ๊ณ ํ๋๋ ๋ฌดํ ๋ฃจํ์ ๊ฑธ๋ฆฌ๊ฑฐ๋, ๋ฐฐํฌ ํ ์คํ์ด ๋๋ฌด ์ค๋ ๊ฑธ๋ ค timeout์ด ๋ฐ์ํ๊ธฐ๋ ํ๋ค. ์คํ ์๋๋ฅผ ๋์ด๊ธฐ๋ณด๋ค ์ฝ๋ ์์ฒด๋ฅผ ์์ ํ๋ผ๊ณ ํ๋๋, timeout ์๊ฐ์ ๋๋ฆฌ๋ ์์ค๋ฐ์ ๋์ง ๋ชปํ๋ค๊ณ ํ๋ค. ์ถํ ๋ ผ์ํ๊ณ ์์ ํด์ผ ํ ์ฌํญ์ด๋ผ๊ณ ์ธ๊ธ๋๋ค.
์ฌ๋ ์๋ก์ด ๊ธฐ์ ์ด ๊ฐ๋ฐ๋ ๋์ ๊ฐ์ด ์๋ก์ด ์ด์๋ค์ ๋์ํด์ผ ํ๋ค.
Ethical Considerations
The AI Scientist๊ฐ ๋
ผ๋ฌธ์ ๋ฌด๋ถ๋ณํ๊ฒ ์์ฑํ์ฌ ํํ๋ ์ ๋์ ํฌ๊ณ ํ ๊ฒฝ์ฐ ๋ค์ํ ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ ์๋ค. ๋ฆฌ๋ทฐ์ด์ ๋ถ๋ด์ด ์ฆ๊ฐํ ์ ์์ผ๋ฉฐ, ๊ทธ ์์ด ๋ฐฉ๋ํด์ง์ ๋ฐ๋ผ ์ ๋ณ์ด ์ด๋ ค์์ ธ ๊ณผํ์ ์ง์์ ํ์ง์ด ์ข์ง ์์ ์ ์๋ค. ๋ํ Image Generation๊ณผ ๊ฐ์ด ์ ์๊ถ ๋ฌธ์ ๋, ๊ฐ์น ์ ํ์ ๊ฐ์ ์ด์๊ฐ ๋ฐ์ํ ์ ์๋ค.
Automated Reviewer๊ฐ ๋ฑ์ฅํ์ฌ ์จ๋ผ์ธ ์์ ๋ฐฐํฌ๋๋ฉด, ๋ฆฌ๋ทฐ์ ํ์ง ์ ํ๋ ๋ฌผ๋ก , ๋
ผ๋ฌธ์ ๋ํ ์๋๋์ง ์์ ํธํฅ์ด ์ถ๊ฐ๋ ์๋ ์๋ค. ๋ฐ๋ผ์ AI์ ๋ฆฌ๋ทฐ์๋ ํน์ ํ๊ธฐ๋ฅผ ํ๋ ๊ฒ์ด ์ ์๋๋ค.
๋ํ ๋ค๋ฅธ ์ฌ๋ ๊ธฐ์ ๋ค๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก ๋น์ค๋ฆฌ์ ์ผ๋ก ์ฌ์ฉ๋ ์ฌ์ง๊ฐ ์๋ค. ์ธ๊ฐ์ด ๋์น์ฑ์ง ๋ชปํ๋ ๋์ ์ค์ค๋ก ์ฐ๊ตฌ๋ฅผ ์งํํ๋ฉฐ ์ธ๊ฐ์๊ฒ ํด๋ก์ด ๋ฐ์ด๋ฌ์ค ๋๋ ์ปดํจํฐ ๋ฐ์ด๋ฌ์ค ๋ฑ์ ๊ฐ๋ฐํ ์๋ ์๋ ๊ฒ์ด๋ค.
Open Models
๋ณธ ํ๋ก์ ํธ๋ฅผ ์ํํ๊ธฐ ์ํด GPT-4o, Sonnet๊ณผ ๊ฐ์ ์ต์ฒจ๋จ LLM์ ์ฌ์ฉํ๋ค. ์ด ์ธ์๋ DeepSeek, Llama-3์ ๊ฐ์ ์คํ ๋ชจ๋ธ์ ์ฌ์ฉํด๋ดค์ง๋ง, ๋
ผ๋ฌธ ์์ฑ์ ์์ด์ Sonnet์ด ๊ฐ์ฅ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ๋ค. ๋ฐ๋ผ์ ๊ถ๊ทน์ ์ผ๋ก ํน์ ๋ชจ๋ธ ์ ๊ณต์์๊ฒ ๊ตญํ๋์ง ์๋ The AI Scientist๋ฅผ ๊ฐ๋ฐํ๋ ๊ฒ์ด ๋ชฉ์ ์ด๋ผ๊ณ ํ๋ค.
The Role of a Scientist
๊ถ๊ทน์ ์ผ๋ก The AI Scientist๊ฐ ์ฐ๊ตฌ์ ๋ผ์ดํ์ฌ์ดํด์ ์ ๋ถ ๋์ฒดํ ์ง๋ผ๋, ์ค์ ๊ณผํ์๋ค์ ์ญํ ์ ๋ค๋ฅธ ์์ญ์ผ๋ก ์ด์ ๋ ๋ฟ ์ฌ๋ผ์ง์ง ์์ ๊ฒ์ด๋ค.
ํ์ฌ๊น์ง ๋ฑ์ฅํ ์ต์ฒจ๋จ LLM๋ค ์ค ๊ฐ์ฅ ์ฑ๋ฅ์ด ์ข์ ๋ชจ๋ธ๋ค์ ์ฌ์ฉํด์ ์ฐ๊ตฌ ๋ผ์ดํ์ฌ์ดํด์ด๋ผ๋ task๋ฅผ ์ํํ ์ ์๋๋ก ๋ง๋ค์๊ธฐ ๋๋ฌธ์ ๋ชจ๋ธ ์์ฒด๋ฅผ ๊ฐ๋ฐํ๋ค๊ธฐ๋ณด๋ค AI ๋ถ์ผ์ ์๋ก์ด ์งํฅ์ ์ ๊ฐ์ฒํ๋ ํ์ ์ ๊ณตํ๋ค๊ณ ๋ณด๋ ๊ฒ์ด ๋ ์ ํฉํ ๊ฒ ๊ฐ๋ค. ํ์ง๋ง LLM์ ๋ฑ์ฅ ์ดํ ๋ค์ํ task์ ์ฌ์ฉ๋๋ฉฐ LLM์ ๋ชฉ์ ์ด ์ ๋งคํ๋ค๋ ์๊ธฐ๊ฐ ๋ง์๋ฐ, ์ด๋ฅผ ๋ถ๋ช
ํ ํ ์ ์๋ ๋ฐ๊ฑธ์์์ ํ์คํ๋ค.
ํ์๋ค๊ณผ ์๊ธฐํ ๊ฒฐ๊ณผ ์๋์ ๊ฐ์ ๋ฌธ์ ์ ์ด ๋ณด์๊ณ , ์ด๋ป๊ฒ ํด๊ฒฐ๋ ์ง ๊ถ๊ธํด์ก๋ค.
1. ํ์ฌ LLM์์ ๊ฐ์ฅ ํฐ ๋ฌธ์ ๋ผ๊ณ ์ง์ ๋ฐ๋ hallucination ๋ฌธ์ ์ ๋ํด์๋ ์ด๋ป๊ฒ ํด๊ฒฐํ ๊ฒ์ธ์ง?
2. ๊ธฐ์กด์ ์ฐ๊ตฌ๋ฅผ ๋ฐํ์ผ๋ก research๋ฅผ ์งํํ ๋ ๋ถ์ ํํ ๋ฐ์ดํฐ์ ์ฐ์๋ฅผ ๊ฐ๋ฆด ์ ์๋์ง?
3. ํ์ํ ์ง์์ด ๋ฌด์์ธ์ง ํ๋จํ ๋ ์ฌ๋ฌ ์ง์๋ค ๊ฐ์ ์ฐ์๋ฅผ ๊ฐ๋ฆด ์ ์๋์ง? ์๋ฅผ ๋ค์ด, ์์ธ์ํ์ธ์ ์๋์ฑ ์ด๋ก vs. ๋ดํด์ ๊ณ ์ ์ญํ
์ถ์ฒ, ์๋ฃ
AGI Situational Awareness
The AI Scientist ๊ณต์ ๋ฌธ์, ๋ ผ๋ฌธ
The AI Scientist Code GitHub