주어진 데이터에서 사용하고자 하는 x(feature), 알고싶은 값 y(label)가 있을 때!

y=f(x)라는 함수를 통해서 x와 관계를 설명할 수 있다면 일상생활에서 아주 유용하게 사용할 수 있을 것이다.

이때 y와 x의 관계를 효과적으로 설명하는 f() 함수를 만드는 일을 모델링 이라고 한다.

데이터 모델링은 복잡한 데이터 관계를 정리하고 구조화하여 이해하기 쉽게 만드는 과정이다.
요구사항 분석부터 물리적 구현까지의 단계를 거쳐 데이터의 효율적이고 일관된 관리를 가능하게한다.


y값에 대한 모델링이름

  • y값이 존재하는 경우 : supervised learning
  • y값이 존재하지 않는 경우 : unsupervised learning
  • y값이 연속형인 경우 : regression task
  • y값이 categorical 값인 경우 : classification task

0개의 댓글