Pandas (1)

Tino-Kim·2022년 1월 3일
0
post-thumbnail

🥴 Pandas (1)

📌 Pandas

데이터 분석을 위한 패키지를 의미한다.

Pandas는 여러가지 기능을 수행할 수 있다.
예를 들면,

  • 크롤링
    함수 read_html("해당 주소")를 이용하여 웹에 있는 데이터를 끌어서 가져올 수 있다.
    이 함수를 이용하지 않고, BeautifulSoup을 이용해서 크롤링할 수도 있다.
  • Database Handling
    우리가 계속 사용하고 있는 부분이고, 어쩌면 최종 목표이기도 하다.

📌 Series

pd.Series(리스트)

📌 DataFrame

Series를 여러개 모아둔 것이 DataFrame이다. 여기서 한개의 칼럼을 가져와서 type을 확인해보면, Series가 나온다.

  1. 리스트를 이용해서 DataFrame 만들기.

    pd.DataFrame(리스트)
    여기는 따로 Column 이름이 없으니, 넣어주면 된다.

  • 변수.columns = [ 칼럼명을 차례대로 개수에 맞게 넣어준다. ]
    그렇게 해주면, DataFrame에 새로운 칼럼명이 생긴다.
  • 변수.index = 변수[ 원하는 인덱스 넣어주기. ]
    이렇게 해주면, 그 칼럼을 기준으로 DataFrame이 새롭게 만들어진다.
  1. 딕셔너리를 이용해서 DataFrame 만들기.

    pd.DataFrame(딕셔너리)
    Key와 Value를 이용해서 DataFrame을 제작하기 때문에, Key에는 Column 이름이 들어가고 Value에는 값이 들어가서 > 따로 Column 이름을 넣을 필요가 없다.

😀 마무리...

학기 중에 들은 이야기인데, Pandas에서 Series와 DataFrame을 자유자재로 다룰 수 있으면 데이터 분석 시에 굉장히 유리하다고 들었다. Pandas를 집중해서 공부하고 잘 익히자~!

profile
알고리즘과 데이터 과학과 웹 개발을 공부하는 대학생

0개의 댓글