# pandas

8개의 포스트

Python - Pandas

시리즈 데이터는 1차원 배열형태라 생각하면된다.행과 열이 임의로 정렬되어있는 표 데이터 구조로 행렬구조를 갖고있다.

2020년 3월 19일
·
0개의 댓글
post-thumbnail

[kaggle] 타이타닉 생존자 예측, python

캐글 입문, 머신 러닝 가이드로 사용되는 타이타닉 문제입니다. 하지만, 튜토리얼 이라고 하기에는 조금 어렵습니다. 예를 들어, 기본으로 주어진 gender_submission..csv(여자 생존, 남자 사망)를 그대로 제출하면 76.55의 점수를 받습니다. 이 점수는

2020년 3월 4일
·
0개의 댓글

Project1 - foodly store 페이지 크롤링 후 csv파일로 저장하기(pandas)

현재 진행중인 프로젝트인 foodly-store의 상품페이지를 크롤링해보자.(BeatifulSoup 라이브러리 사용법을 자세하게 설명하진 않는다.)상품에 해당하는 정보는 전체상품페이지, 상품하나를 클릭하고 들어가서 나오는 페이지에서 확인할 수 있다.여기서는 전체상품페이

2020년 2월 29일
·
0개의 댓글

Pandas(3)

그룹연산 class 열을 기준으로 분할 grouped = df.groupby(['class']) print(grouped) print('\n') 각 그룹의 최대값과 최소값의 차이를 계산하여 그룹별로 집계 aggminmax = grouped.agg(minmax)#grouped된 덩어리 단위로 min_max에 x 파라미터로 넘어가게된다 print(agg_...

2020년 1월 3일
·
0개의 댓글

Pandas Data 처리

**2019.12.26 Pandas Class Data 사전 처리 **이부분은 이해가 잘안된다면 외워서 데이터를 처리해주어야한다 누락 데이터 처리 isnull(), notnull() 을 처리할때 같은것이지만 어떤것이 더 빨리 데이터가 처리가 될지를 고민하여서 사용하여야 시간을 효율적으로 배분시킬수있다 deck열의 NaN 개수 계산하기 nandeck ...

2019년 12월 26일
·
0개의 댓글

Pandas(2)

**2019.12.23 Pandas Second Class Pandas Series 인덱스를 이용하여서 데이터를 나타낼수있다 리스트를 사용하여서 나타낼때에 image.png image.png 리스트를 이름으로 지정하여서 구분이 가능하다 DateFrame 행

2019년 12월 23일
·
0개의 댓글

Pandas(1)

#20191219 Pandas 시작 **아나콘다 설치 Pandas를 사용하기위해서는 아나콘다가 설치되어있어야한다. 아나콘다 설치할때에 *시스템환경변수를 사용하여서 설정 시켜주어야한다 Anaconda Path를 설정시켜주어야한다 user에 관한 사용자 변수는 사용자 한사람에 관해서 관환 환경변수이며 시스템 변수에 관한 변수는 컴퓨터 전체에 관한 환경변수이다...

2019년 12월 19일
·
0개의 댓글
post-thumbnail

Python meets Economics: 데이터 시각화

원래 파이썬을 즐겨 사용하는 편은 아니지만 이번 학기에 파이썬 관련 수업을 듣게 되면서 조금 흥미가 생겼다. 여전히 syntax는 쓸 데마다 헷갈리긴 하지만 간결하고 표현력 좋은 언어적 특성은 참 맘에 든다.

2018년 10월 24일
·
2개의 댓글