MOS (Mean Opinion Score)

해질녘·2026년 2월 11일

Speech Processing

목록 보기
2/7

통신 공학 분야에서 시스템의 품질을 나타내기 위한 측정값이다. speech 및 audio 분야의 품질을 평가하기 위해서 쓰인다.

MOS 는 역사적으로 피험자들이 조용한 방에 앉아서 전화 통화 품질을 자기 인식에 따라 1에서 5점 사이의 점수로 주관적으로 평가하는 방법이다. 그리고 그 점수의 평균값임.

MOS 점수를 평가하기 위한 표준화된 프로토콜이 존재한다. (예: ITU-T P.800 가이드라인)

MOS 점수를 얻기 위해서는 사람을 고용해야 하므로 시간과 비용이 많이 소요된다. 반복적이고 자동적 평가를 위해 평가를 하는 퀄리티 모델을 개발하여 MOS 점수를 예측한다.

즉 사람이 일일히 평가하기에 비용이 많이 드니까 어느정도 모델을 이용하여 평가를 자동화한다는 것인데, 이 모델의 구현 방식에 대해서는 다양하게 존재. 이 모델을 썼을 때의 문제가, 점수가 3.6, 3.8 이렇게 나왔을 경우에 3.8이 더 좋은거냐? 라는 의문이 있음. 사람이 그 정도로 세밀하게 구분을 할 수 있냐는 거.

그리고 MOS 는 주관적인 점수이기 때문에 다른 측정 지표와 함께 사용되는 경우가 많다. 예를 들어서 TTS 의 경우에는 추론 속도 같은 측정된 지표를 같이 사용해서 평가할 수 있다.

reference

0개의 댓글