# datascience

18개의 포스트
post-thumbnail

[Project-서울시 초미세먼지 예측]2. Feature engineering과 모델링을 위한 데이터 형태 변환

서울시 초미세먼지 예측 프로젝트. Feature Categorizing, Feature engineering, Re-scaling 과정

2021년 7월 17일
·
0개의 댓글
post-thumbnail

[Project-서울시 초미세먼지 예측]1. 데이터 탐색과 통합(pandas, JOIN)

서울시 초미세먼지 예측 프로젝트. 주어진 데이터들을 살펴보고 사용가능한 기간 범위 내에서 통합했다. Pandas, JOIN(pd.merge), concat을 활용했다.

2021년 7월 17일
·
0개의 댓글

[Pyhon] 용어 정리

참고자료object(객체)Any data with state (attributes or value) and defined behavior (methods). Also the ultimate base class of any new-style class.

2021년 5월 24일
·
0개의 댓글

Error Message(오류 사전)

파이썬에서 발생하는 오류를 정리한다.

2021년 5월 22일
·
0개의 댓글

[Python] 개요

파이썬의 특징 및 명명 규칙에 대해 설명한다.

2021년 5월 21일
·
0개의 댓글

[Python] Operator(연산자)

파이썬 연산자를 설명한다.

2021년 5월 18일
·
0개의 댓글

데이터 사이언스 시작하기

데이터사이언스를 시작하기 위한 컴퓨터 환경 설정 방법 및 Anaconda와 Jupyter Notebook 활용법을 설명하고, 참고할 수 있는 자료 등을 정리한다.

2021년 5월 17일
·
0개의 댓글
post-thumbnail

하고싶은&해야하는 것

금융공기업 준비 경영학빅데이터 분석학교직이수 마무리

2021년 4월 30일
·
0개의 댓글
post-thumbnail

생일 문제(Birthday Problem)

하버드에서 제공하는 Statistics 110: Probability 강의를 듣다 오랜만에 생일문제에 대한 이야기를 듣게 되었다.

2021년 1월 16일
·
0개의 댓글

10. 텍스트 분석

10.1 기초개념텍스트 분석의 목적은 텍스트의 의미를 알아내는 것이다.텍스트 자체는 대표적인 비정형 데이터다.텍스트에서 의미를 추출하려면 정형화된 정보를 먼저 얻어야 한다.따라서 글에서 특정 단어나 문장이 나타나면 이를 기호화하고 이의 찬성 또는 반대의 정도를 숫자로

2020년 4월 23일
·
0개의 댓글

09. 분류

분류(classification)이란 어떤 항목(item)이 어느 그룹에 속하는지를 판별하는 기능을 말한다.분류는 data analysis의 기본이며 응용 분야도 가장 넓다.9.1 기본 개념분류에서 가장 자주 사용되는 모델은 주어진 샘플 항목의 몇 가지 특성 변수를 보

2020년 4월 22일
·
0개의 댓글

08. Clustering

클러스터링은 주어진 항목들을 성격이 비슷한 것들끼리 모으는 작업을 말한다.

2020년 4월 21일
·
0개의 댓글

07. 데이터 분석 방법

들어가기 전에...이 기록은 순전히 글쓴이 본인을 위한 것이므로 생략이 많음.내용을 자세히 알고 싶으면 '데이터 사이언스 개론'(김화종 저)를 보세요.

2020년 4월 20일
·
0개의 댓글

06. 데이터 전처리

분석하기 좋게 데이터를 고치는 모든 작업을 데이터 전처리(preprocessing)라고 한다.실제로 데이터 사이언스 전 과정에서 분석 알고리즘 자체를 수행하는데 걸리는 시간보다 분석에 필요한 데이터를 수집하고 전처리하는 과정에 더 많은 시간이 걸린다.보통 80~90%의

2020년 4월 20일
·
0개의 댓글

Python - 데이터분석

.isnull().sum().dtypes.astype(int?,str?,float?).to_numeric(data, errors='coerce').describe().describe(include=np.object)해당 Feature를 가지고있는 모든 Records들을

2020년 3월 24일
·
0개의 댓글

Python - (Numpy)

Numerical Python = NumpyMatrix 와 Vector와 같은 Array 연산의 표준반복문 없이 Array나 List 데이터 처리를 해준다.선형대수 계산에 능하다.하나의 데이터타입만 Array에 만들 수 있다.

2020년 3월 19일
·
0개의 댓글