
앞서 OT에서 말씀드렸듯이 anaconda와 visual studio build를 설치하셔야 됩니다. 자세한 안내사항은 책에 나와있습니다.아니면 충돌이 발생할 수 있음Anaconda 설치 참고 티스토리https://benn.tistory.com/26Anacon

넘파이는 파이썬에서 선형 대수 기반의 프로그램을 만들 수 있도록 지원하는 대표적인 패키지ndarry Numpy의 N차원 배열 객체 ndarray 데이터 타입ndarray 내의 데이터 타입은 특성상 같은 데이터 타입만 가능타입 변환은 astype() 메서드를 이용해 가능

지도 학습Estimator 클래스 분류(Classification)과 회귀(Regression)로 구성fit()과 predict( ) 내부 구현Evaluation 함수, 하이퍼파라미터 튜닝 클래스의 경우 이를 인자로 받음비지도 학습차원 축소, 클러스터링, 피처 추출(F

머신러닝 모델은 여러가지 방법으로 예측 성능을 평가할 수 있음. 성능 평가 지표는 일반적으로 모델이 분류나 회귀냐에 따라 여러 종류로 나뉨.분류의 성능 평가 지표🔹 정확도🔹 오차행렬🔹 정밀도🔹 재현율🔹 F1 스코어🔹 ROC AUC정확도는 실제 데이터에서 예측

분류 📊 분류는 학습데이터로 주어진 데이터의 피처와 레이블값(결정 값, 클래스 값)을 머신러닝 알고리즘으로 학습해 모델을 생성 > 분류 머신러닝 알고리즘 베이즈 통꼐와 생성 모델에 기반한 나이브 베이즈 독립변수와 종속변수의 선형 관계성에 기반한 로지스틱 회귀 데이터

05. GBM(Gradient Boosting Machine) 06. XGBoost(eXtra Gradient Boost) 07. GBM(LightGBM) 08. 베이지안 최적화 기반의 HyperOpt를 이용한 하이퍼 파라미터 튜닝

Santnadler Customer SatisfactionSantnadler Customer Satisfaction111개의 피처가 float형, 260개의 피처가 int 형으로 모든 피처가 숫자형이며, Null 값은 없다. 레이블 Target에서 대부분이 만족이며 불

회귀 데이터 값이 평균과 같은 일정한 값으로 돌아가려는 경향을 이용한 통계학 기법Y = W1\*X+W2\*X+W3\*X ... +Wn\*XY는 종속 변수, X는 독립 변수, W는 회귀 계수독립 변수는 피처, 종속변수는 결정값머신 러닝 회귀 예측의 핵심은 주어진 피처와

자전거 대여 시스템• 도시 전역의 키오스크 위치 네트워크를 통해 회원가입,대여 및 자전거 반환 프로세스가 자동화되는 자전거를 대여하는 수단• 전세계 500개 이상의 자전거 대여 프로그램이 있음=> 자전거 대여 시스템에서 생성된 데이터는 여행 기간, 출발 위치, 도착 위

01. 차원 축소(Dimension Reduction) 개요 차원 축소 매우 많은 피처로 구성된 다차원 데이터 세트의 차원을 축소해 새로운 차원의 데이터 세트를 생성하는 것 >(기존의 문제점) 차원이 클수록 데이터 포인트 간 거리가 기하급수적으로 멀어져 희소한 데이

군집화는 비지도 학습에 속한다.군집화비슷한 샘플을 하나의 클러스터로 모으는 것차원 축소를 이용하여 분석을 위한 충분한 정보를 가질 수 있음이상치 탐지 가능 !소프트 군집은 객체가 어느 군집에 속할지를 가중치(weight)나 확률(probability)로서 가능성 정도를

NLP는 머신이 인간의 언어를 이해하고 해석하는 데 더 중점을 두고 기술이 발전해 왔으며, 텍스트 마이닝이라고도 불리는 텍스트 분석은 비정형 텍스트에서 의미 있는 정보를 추출에 중점 맞춤NLP는 텍스트 분석을 향상하게 하는 기반 기술텍스트 분류 감성 분석텍스트 요약텍스

비슷한 텍스트 구성의 문서를 군집화 하는 것분석 흐름(1) 텍스트 전처리 (2) 벡터화 (3) 군집화 알고리즘 적용(4) cluster_centers(추출) 통해 군집별 핵심 단어 추출텍스트 전처리TF-IDF 기반 vectorization 적용 및 kmeans 군집화

주요 업체들은 추천 엔진의 고도화에 큰 비용과 노력을 들이고 있음. 추천 콘텐츠 대부분이 개인적 취향을 정확히 이해하고 추천. 이러한 추천시스템제를 접한 사용자는 해당 사이트를 더 강하게 신뢰하게 되어 더 많은 추천 콘텐츠를 선택하게 됨.<추천시스템 구성 예시>사