가장 주요한 기법 Funnel 분석acquisition (사용자 획득) : 사용자가 어떻게 서비스를 접하는가? activation (사용자 활설화) : 사용자가 처음 서비스를 이용했을 때 경험이 좋았는가?retention (사용자 유지) : 사용자가 우리 서비스를 계속
covlab 한글 폰트 설정테스트
텍스트 마이닝을 군집화하여 감성분류 또한 할 수 있다.BoW(Bag of Words) : 가장 기본적인 방법, 각 형태소의 개수를 countingDTM(Document-Term Matrix) : 단어의 수TF-IDF(Term Frequency-Inverse Docume
EDA(탐색적 데이터 분석)Binary Classification - Logistic RegressionClustering Classification - K-Means활용한 데이터 셋 - 포켓본 데이터 셋Feature DescriptionName : 포켓몬 이름Type
데이터를 분석하고 결과를 내는 과정에 있어서 지속적으로 해당 데이터에 대한 ‘탐색과 이해’를 기본으로 가져야 한다는 것을 의미한다.EDA를 잘하려면?raw data 의 description, dictionary 를 통해 데이터의 각 column들과 row의 의미를 이해
basic flow from sklearn.model_selection import train_test_splitx_train, x_valid, y_train, y_valid = train_test_split(trainfeature, trainlabel, test_si
시계열 분석이란? >시계열 분석이란, 어떤 현상에 대하여 과거에서부터 현재까지의 시간에 흐름에 따라 기록된 데이터를 바탕으로 미래의 변화에 대한 추세를 분석하는 방법입니다. 시간의 흐름을 고려한다는 점이 일반 분석과는 다르다고 할 수 있습니다. -