# Data Science

114개의 포스트
post-thumbnail

Must know about a Data Scientist

머신러닝은 어떤 문제를 해결하는가? 머신러닝은 주로 2가지 유형의 문제를 해결하고 있다. 소프트웨어 서비스의 경우 사람이 구현하기에 너무 복잡한 문제를 머신러닝으로 대신 로직을 만들 수 있고, 데이터 분석의 경우 사람이 유의미한 패턴과 통계적 의의를 찾기 어려울 때 머

약 18시간 전
·
0개의 댓글
·
post-thumbnail

Paper review #2 - "Progress and Analysis of Multimodal Knowledge Graphs"

그래프는 일반적으로 여러개의 entity node가 존재하고, 이 entity node들끼리 연결된 관계(relationship)을 갖는 형태로 정의된다. 이때 각 node는 node 자기 자신이나 다른 modal entity의 의미(semantic)나 node들 사이

2일 전
·
0개의 댓글
·

Missing Value 처리 방법 (Imputation)

Missing Value에 대한 개념, 종류, Imputation 방법들을 정리해 놓았습니다.

5일 전
·
0개의 댓글
·
post-thumbnail

부스트코스 코칭스터디 8기 모집(~10/19)

부스트코스 코칭스터디 8기 파이썬으로 시작하는 데이터 사이언스 스터디 참가자 모집

2022년 9월 26일
·
0개의 댓글
·
post-thumbnail

Python Datascience

. : 현재폴더.. : 상위 폴더Pandasread_csv 읽어내기reaname. 이름 바꾸기 이후 inplace = true 새로고침Pandas는 데이터프레임이나 Series의 데이터형식이 주로 이루어진다Slicing%whos > 선언된 변수를 확인하는 명령어

2022년 9월 26일
·
0개의 댓글
·

[Week2] (데이터 사이언스란?) 01. JD로 살펴보는 Data Science

💡 Data Science : 데이터를 통해 실제 현상을 이해하고 분석하는데, 통계학, 데이터 분석, 기계학습과 연관된 방법론을 통합하는 개념이다.Data를 이용하는 과학의 분야 중에 하나

2022년 8월 29일
·
0개의 댓글
·
post-thumbnail

Evaluation Metric - Classification

이상거래 탐지 관련 머신러닝을 공부하다가(Kaggle : Credit card fraud detection), 성능 지표에 대한 개념을 맞닥뜨려 본 게시물을 작성하게 되었다. 오늘 포스팅 하는 Classification Evaluation Metrics(분류 성능 지표

2022년 8월 29일
·
0개의 댓글
·

train_test_split

Credit card fraud detection 커널을 진행하다가, 해당 커널에 테스트 데이터셋이 분리되어 있지 않아 셀프로 데이터셋을 분리하며 알게된 정보를 공유하고자 한다머신러닝 모델에 Train 데이터를 전부 학습시킨 후 Test 데이터에 모델을 적용했을 때 성

2022년 8월 28일
·
0개의 댓글
·
post-thumbnail

건강검진 정보를 활용한 흡연 예측모델 개발 (Development of Smoking Prediction Model Using Health Examination Information)

모델 개발 개요(Overview) 2022-08-10 ~ 2022-08-12 기간동안 대한산업공학회에서 진행하는 Field Camp에 참여했다. 주제는 건강검진 정보를 활용하여 흡연예측 모델을 만드는 것이었다. 총 9명의 팀원들과 같이 활동을 했고 여기에서 내가 맡은

2022년 8월 15일
·
0개의 댓글
·
post-thumbnail

ADsP - Part 1 데이터 이해 / 3장 가치 창조를 위한 데이터 사이언스와 전략 인사이트

빅데이터 분석과 전략 인사이트 빅데이터 분석 'Big'이 핵심 아니다 빅데이터에 대한 관심 증대 데이터 기반의 통찰의 중요성에 대한 공감대 상승과 동시에 긍정적 효과를 기대 빅데이터 프로젝트에 거는 기대 기존 프로세스의 자동화를 우선 시행한 후 점차적으로 거시적이고, 전략적인 가치를 이끌어 낼 수 있을 것으로 기대 빅데이터 분석의 가치 데이터는...

2022년 8월 15일
·
0개의 댓글
·
post-thumbnail

Clustering - Spectral Clustering

Spectral clustering techniques make use of the spectrum (eigenvalues) of the similarity matrix of the data to perform dimensionality reduction before

2022년 8월 2일
·
0개의 댓글
·

Clustering - DBSCAN

Density-based spatial clustering of applications with noise (DBSCAN) is a density-based clustering non-parametric algorithm: given a set of points in

2022년 8월 2일
·
0개의 댓글
·
post-thumbnail

Clustering - Hierarchical Agglomerative Clustering (HCA)

Hierarchical Agglomerative Clustering (HCA) is a method of cluster analysis which seeks to build a hierarchy of clusters. Because this is 'Agglomerati

2022년 8월 2일
·
0개의 댓글
·
post-thumbnail

Clustering - K means

k-means clustering is a method of vector quantization, originally from signal processing, that aims to partition n observations into k clusters in whi

2022년 8월 2일
·
0개의 댓글
·
post-thumbnail

Regression - LightGBM

LightGBM is a gradient boosting framework that uses tree based learning algorithms.간단히, 기존 GBM들보다 훨씬 더 빠르게 학습이 되는 모델이다이미지 출처 : https://lightgbm.r

2022년 8월 2일
·
0개의 댓글
·
post-thumbnail

Regression - XGBoost

XGBoost, which stands for Extreme Gradient Boosting, is a scalable, distributed gradient-boosted decision tree (GBDT) machine learning library. It pro

2022년 8월 2일
·
0개의 댓글
·
post-thumbnail

Classification - Random Forest

Random forests is an ensemble learning method for classification, regression and other tasks that operates by constructing a multitude of decision tre

2022년 8월 1일
·
0개의 댓글
·
post-thumbnail

Classification - Decision Tree

Decision tree is a decision support tool that uses a tree-like model of decisions and their possible consequences, including chance event outcomes, re

2022년 8월 1일
·
0개의 댓글
·
post-thumbnail

Regression - Linear Regression

Linear regression is a linear approach for modelling the relationship between a scalar response and one or more explanatory variables (also known as

2022년 8월 1일
·
0개의 댓글
·
post-thumbnail

Classification - Logistic Regression

Logistic Regression is a statistical model that models the probability of one event taking place by having the log-odds (the logarithm of the odds) fo

2022년 8월 1일
·
0개의 댓글
·