상품화를 위한 머신러닝 모델은 모델 학습만?모델 개발 과정머신러닝 모델의 목적에 맞춰서 학습 데이터를 준비Data 수집, Data 유형에 따른 처리, Data Sampling, Labeling, Class Imbalance 고려데이터를 모델에 학습할 수 있는 형태로 E
정형, 반정형, 비정형 데이터 정형 데이터 구조화된 데이터로 '표' 형태로 표현되며 고정된 스키마를 갖음 데이터 베이스, 스프레드시트 및 CSV 파일과 같은 데이터 소스에서 얻음 예시: 고객 데이터 베이스(고객 이름, 주소, 전화번호, 이메일과 같은 고정된 필드), 주문 데이터 베이스(주문 번호, ID, 수량, 가격) 정형 데이터 특징 고정된 스키마: 정해...
Labeling 이란 라벨링 혹은 레이블링이라 불림 특정 객체에 의미를 부여하는 프로세스 Data Labeling 기계 학습 및 딥러닝 모델을 훈련하기 위해 필요한 데이터에 의미를 부여하는 과정 데이터에 주석 을 달거나 레이블 을 지정하여 의미를 부여하는 과정 이를 통해, 모델이나 컴퓨터가 데이터를 이해하고 원하는 작업을 수행할 수 있도록 돕는 중요한 단...
기계 학습과 분류 문제에서 발생하는 현상 중 하나, 클래스 간의 데이터 불균형을 나타내는 개념하나의 클래스가 다른 클래스에 비해 데이터 포인트 수가 현저히 적을 때 발예 희귀 질병을 감지하는 분류 모델에서 질병이 있는 경우 양성 클래스 데이터가 드물게 발생하는 경우현실
Ensembles 여러 개의 머신러닝 모델을 결합하여 개별 모델보다 더 강력한 성능을 달성하는 기법 모델 학습 과정에서만 최적화 가정 : 여러 모델의 예측을 결합함으로써 각 각의 모델이 가질 수 있는 특정 유형의 오류를 상쇄시킬 수 있다. 방법 : Bagging, Boosting, Stacking 배깅 Bagging Bootstrap Aggregatin...