# pandas

50개의 포스트
post-thumbnail

로지스틱 관련 라이브러리

더 자세한 내용은 scipy 깃헙을 참고해보자.

어제
·
0개의 댓글

Pandas-Profiling을 통한 데이터 시각화

Kaggle에서 EDA(Exploratory Data Analysis) 연습을 하다가 pandas-profiling이라는 라이브러리를 발견할 수 있었다. 해당 라이브러리는 DataFrame인 데이터를 EDA를 할 수 있도록 여러방면으로 데이터를 나타내준다. Profil

2일 전
·
0개의 댓글
post-thumbnail

[TIL] ols : 변수명의 공백과 특수문자 해결하기

ols 모듈을 이용해 파이썬으로 회귀분석을 실습해 보았다.불러 온 파일은, 실습을 위해 임의로 만든 데이터...선호도를 종속변수로 회귀 분석을 하려 했다.그런데 웬걸! SyntaxError ㅠㅠ column명에 공백이 있어서 그런 모양..column 이름 자체를 변경

2020년 10월 6일
·
1개의 댓글
post-thumbnail

csv encoding 한글 문제

한글 데이터를 csv형식으로 저장할 때, 흔히들 encoding = 'utf-8' 로 값을 지정하라고 합니다. 그럼에도 한글 인코딩이 깨진다면'utf-8' 대신 'utf-8-sig'를 써보세요.

2020년 9월 26일
·
0개의 댓글
post-thumbnail

pandas 샘플링으로 매주 스터디의 진행자와 서기를 정하자

네이버 사다리타기 지겹다면..

2020년 9월 25일
·
0개의 댓글

데이터 분석 초보자를 위한 concat & merge

1. concat & merge, 그게 뭔데? seaborn, scikit-learn 등 파이썬의 패키지가 자체적으로 제공하는 데이터 파일이 아닌 이상 데이터 분석을 하기 위해 받은 파일을 열어보면 파일이 한 개가 아닌 경우가 많다. 예를 들어, 여러분이 어떤 도서관

2020년 9월 11일
·
0개의 댓글
post-thumbnail

[PYTHON] 5. MySQL to csv file

pymysql.cursors.DictCursor을 사용하여 value를 dictionary 형태로 리턴하여 column명을 명시

2020년 9월 2일
·
0개의 댓글
post-thumbnail

[Data Analysis] 17. 다중선형 회귀분석 (Multiple Linear Regression Analysis) (3)

귀무가설 : 회귀모형은 타당하지 않다.대립가설 : 회귀모형은 타당하다.F-statistic : 검정통계량 = 8426.Prob (F-statistic) : P-value = 3.14e-164유의확률이 0.000이므로 유의수준 0.05에서 회귀모형은 통계적으로 유의하게

2020년 8월 31일
·
0개의 댓글
post-thumbnail

[Data Analysis] 16. 단순선형 회귀분석 (Simple Linear Regression Analysis) (2)

귀무가설 : 회귀모형은 타당하지 않다.대립가설 : 회귀모형은 타당하다.F-statistic : 검정통계량 = 1334Prob (F-statistic) : P-value = 0.000유의확률이 0.000이므로 유의수준 0.05에서 회귀모형은 통계적으로 유의하게 타당한 것

2020년 8월 31일
·
0개의 댓글
post-thumbnail

[Data Analysis] 14. 상관분석 (Correlation Analysis)

1. 개요 두 양적 자료 간에 통계적으로 직선의 관계(선형의 관계)가 있는지 검정하는 방법 선형적으로 증가 혹은 감소하는지를 나타냄 두 변수간의 연관된 정도를 나타낼 뿐 인과관계를 설명하는 것이 아님 인과관계는 회귀분석을 통해 확인할 수 있음 2. 상관계수 행렬도

2020년 8월 26일
·
0개의 댓글

Pandas Overview

TIL 20200826

2020년 8월 26일
·
0개의 댓글
post-thumbnail

[Data Analysis] 13. 분산분석 (ANOVA; Analysis of Variance) (2)

2. ANOVA road map 3. 정규성 검정 귀무가설 : 정규분포를 따른다. 대립가설 : 정규분포를 따르지 않는다. >모든 표본 하나씩 다 확인해야 함 만약 하나의 표본이라도 귀무가설을 기각할 경우 분산 분석을 실시하지 못함 4. 등분산 검정 귀무가설

2020년 8월 25일
·
0개의 댓글

Pandas

위코드 3개월차 기업협업에 나가 자연어처리에 대해 공부하게 되어 먼저 파이썬 라이브러리인 pandas(판다스)에 대해 알아보고자 합니다.판다스는 파이썬에서 사용하는 데이터분석 라이브러리로 행과 열로 이러우진 데이터 객체를 만들어 다룰 수 있게 되며 보다 안정적으로 대용

2020년 8월 23일
·
0개의 댓글
post-thumbnail

[Data Analysis] 7. Sweetviz (Automated EDA)

EDA를 단 두 줄에 쉽게 할 수 있도록 하여 시각화 해주는 파이썬 오픈소스이다.pandas databframes을 사용하고 독립된 HTML로 생성한다.2 개의 데이터 비교 가능기타 데이터들과 특정 목표 값의 비교 가능

2020년 8월 23일
·
0개의 댓글
post-thumbnail

[Data Analysis] 6. EDA (Exploratory Data Analysis) (2)

두 개의 열 분석

2020년 8월 23일
·
0개의 댓글