넘파이는 저수준api가 대부분이다. 판다스는 넘파이 기반으로 작성됐는데, 넘파이보다 훨씬 유연하고 편리하게 데이터 핸들링을 가능하게 해준다.
판다스는 파이썬의 리스트, 컬렉션, 넘파이 등의 내부 데이터와 csv등을 쉽게 DataFrame으로 변경해 쉽게 데이터의 가공/분석을 쉽게 만들어준다.
- Index
*Numpy Example
복잡한 로직을 처리하면서 새로운 변수를 만들 때
데이터를 조건별로 다르게 처리하고 싶을 때 apply와 lambda를 사용하면 독립적 case로 나눌 수 있다.
DataFrame에서 데이터 삭제는 drop()
ex)
a_drop_df = a_df.drop('someColumn', axis = 1)
(inplac=True로 설정하면 반환 값이 None이 됩니다.)
pandas의 read_csv()를 사용하면 된다.
pandas.read_csv('file_path')