정의이미지 데이터(100*100) or 한 자동차의 특성 데이터처럼 여러 개의 행을 가진 데이터를 저차원의 데이터로 환원시키는 기법쓰는 이유다차원 데이터의 분포를 가장 잘 표현하는 성분들을 추려내기 위함 -> ?? 먼소리임 -> 예시를 들어보자 -> 100 X 100
데이터 사이언스는 데이터의 가치를 강조한 개념이다.데이터 사이언스는 통찰력을 찾아 문제를 해결하는데 초점을 맞춘다.데이터 사이언스는 크게 수집 - 분석 - 적용의 단계를 가진다.성공적인 데이터 분석을 위해서는분석 대상 도메인에 대한 전문 지식이 필요하다.해당 도메인의
규칙이 매우 복잡하게 구성되어 훈련 데이터는 잘 맞추지만,새로운 데이터는 잘 맞추지 못하는 모델을 과대적합 되었다고 한다.반면 규칙이 너무 단순한 모델은 과소적합 되었다고 한다.과소적합된 모델을 모든 데이터를 잘 맞추지 못한다.검정색 선은 잘 예측하고 있고, 초록색 선
https://aihub.or.kr/어마어마한 돈을 들여 만든 데이터들다양한 데이터들이 많다.https://www.data.go.kr/우리나라의 여러 공공데이터들을 모아둠데이터가 조금 빈약함 -> 딥러닝은 X, 머신러닝은 간당간당함.https: