학습/테스트 데이터의 feature 또는 타겟값의 분포가 다른 상황을 말한다.

독립변수들 간의 공변량(covariate)의 분포가 변화하는 현상을 말한다. 표본의 대표성 문제와 관련되어있다고 생각해도 좋을 것 같다. 전체 데이터셋의 분포를 잘 반영하는 학습/테스트 셋이 아니기 때문에, 표본의 대표성이 떨어진다고 볼 수 있다고 생각한다. 크게 Sample Section Bias 또는 Non-stationary Environmetns 두 가지 원인이 있다
데이터 수집 과정에서 모집단의 분포처럼 균일하게 선택하지 못하여 발생하는 경우
학습 환경과 테스트 환경과 다른 경우. 시간/공간의 변화로 인해서 발생될 수 있다.
covariate shift가 x변수의 분포에 관한 것이라면, prior probability shfit는 y의 분포와 관련있다. y의 분포가 불균형이 있을때, 즉 unbalanced dataset인 경우가 대표적이다
입력 feature와 레이블의 관계가 변화한 경우로, 시간의 흐름에 의존적인 경우에 발생되기 쉽다. 변화 양상에 따라 gradual, sudden, recurrent 세 가지가 있다.

Gradual Concept Drift
시간에 따라 점진적으로 발생하는 concept drift로 경제적 변화가 대표적이다.
Sudden Concept Drift
Covid-19와 같이 큰 이벤트로 인해 전/후의 concept이 변하는 경우
Recurrent Concept Drift
주기적으로 발생하는 concept drift. 대표적으로 계절에 따라 어떤 성격이 주기적으로 변하는 경우가 되겠다.