판다스...?
그게 뭔데?....?
판다스(pandas)란?
파이썬을 이용하여 데이터를 분석하는 라이브러리를 말한다.
판다스는 Mysql DB프로그램보다는 좀 더 간편하고 빠르다라는 장점이 있다.
판다스의 기초
판다스
Series(시리즈)
시리즈란?
1차원 배열구조를 말함
ex) a=[1,2,3,4]--------> #그래서 리스트, 딕셔너리 같은 걸 이용할 수 있는건가?
#Series(시리즈)생성.
시리즈를 생성하기 위해서는 pd. Series 함수를 사용한다.
각 행을 지칭하는 값(index)
index는 안 적어도 0으로 생략이 되어 있는데 즉 index는 항상 0으로 시작된다.
index는 행의 위치 값으로 이것을 통해서 데이터의 쉽게 빠르게 이용할 수 있는 거네
pd.Series([2, 4, -5, 6], index=['a', 'b', 'c', 'd'])
코드 실행
a 2
b 4
c -5
d 6
dtype: int64
행의 순서를 이렇게 사용하겠다 이런 건가?
데이터프레임(Datafame)
원래 있는 형태에 열을 붙이는 거
예를 들면
표를 만드는 것.
Dataframe 생성
데이터프레임은 딕셔너리와 비슷한 느낌을 가지고 있다.