논문을 분석하는 업무를 하다가 마주친 단어.
SOTA = State of the Art 는 현시점 최고의 기술을 의미한다.
예를 들어, 논문에서 이런 문장을 볼 수 있다.
“Our model achieves SOTA results on the Spider dataset.”
이건 "우리가 만든 모델이 Spider 데이터셋 기준으로 현재까지 제일 좋은 성능을 냈다!" 라는 뜻이다.
데이터셋마다 성능을 평가하는 지표가 있다.
Spider 같은 경우는 예를 들어:
이런 지표를 기준으로 여러 모델을 비교해 보고, 가장 성능 좋은 모델이 SOTA가 되는 것
사실 "좋다" 라는 말은 주관적이기 때문에 "무슨 데이터를 기준으로?" "어떤 지표로?" 라는 전제가 꼭 필요하다.
따라서 SOTA 는 어떠한 맥락에서 "가장 잘하는 모델"을 정의하는 기준이기 때문에 공신력이 있는 "기록"이다.
다만, SOTA는 고정된 게 아니라, 새로운 연구 성과가 나오면 계속 갱신된다.
앞으론 논문 볼 때 이 SOTA 가 보이면 아래처럼 생각해보기