스탠포드 AI 인덱스 리포트 Top Takeaways Technical Performance 2024년 AI 성능 개요 전통적 벤치마크(MMLU, SQuAD 등) 대부분에서 인간 기준 초과 GPQA, MMMU 등 고난이도 벤치마크 성능도 빠르게 향상