해당 판다스 기초 강의는 엑셀투파이썬 유트브를 기본으로 정리하였음
https://www.youtube.com/watch?v=SVjKsvvhWlQ&list=PLrpXwtuxGqcIIf_SpCWg04MoHf1yJUCvi&index=1
판다스는 파이썬의 라이브러리 중 하나로, 2차원 데이터인 dataframe과 1차원 데이터인 series를 모두 다룰 수 있다

dataframe은 index와 columns, values로 구성되어 있으며, series는 index,values로 구성되어 있다

우리가 늘 평범하게 보는 엑셀 표 형식이라고 생각하면 된다. 그러면 대체 왜 판다스 라이브러리가 필요한것일까? 엑셀이나 넘파이로 그냥 작업해도 무방하지 않을까?

리스트와 딕셔너리 라는 자료형 구조를 통해 라벨링하는 것이 훨씬 더 유용할때가 많기 떄문이다 (추후에 공부하면서 알아보자)
1. 무적권 첫 셀은 판다스 불러오기

2. 엑셀파일을 주피터로 불러오기

- 본인은 경로에서 늘 막히기 때문에 %ls 명령어를 통해 주소를 복사 붙여넣기 해서 불러오는 편이다
역슬래시를 찾아서 써야하는 불편함도 덜어준다(~/d)
https://www.youtube.com/watch?v=xXVVKCLIie0&t=322s
해당 내용은 자세히 이 유트브에서 확인할 수 있음
+) 엑셀파일로 불러왔으나 인덱스를 변경해야 할때


- 인덱스가 0~5로 자동 지정되어 있는데, 인덱스를 숫자가 아닌 이름으로 하고 싶으면

- 주소 뒤에 .set_index("이름") 이라고 넣어주면 숫자는 사라지고 인덱스가 이름으로 바뀐것을 확인
3. 데이터 프레임과 시리즈를 직접 만들어 보기

잘 안보이니까 다시 적어보면,
pd.DataFrame(value 배열, index=[idx1...idx2] , columns=[col1...col2])
판다스의 함수중 하나가 DataFrame() 이므로 꼭 pd.DataFrame() << ()이어져 있음을 잊지 말것. [] 는 뒤에 각 값을 담을때 넣는것임. 헷갈리므로 주의할것.
- tab을 사용하면 데이터프레임 명령어를 바로 불러 올 수 있으며, value 값은 인자(=) 없이 사용하며 인덱스와 컬럼들은 인자를 사용해야 한다
- 각 값들을 꼭 저 순서대로 배열할 필요는 없으며, 중복으로 넣었을때는 syntaxerror가 뜬다.

- value 값만 넣은 dataframe 만들어 보기

- index, columns를 지정한 dataframe 만들기(꼭 ','로 연결해 줘야 함을 잊지 말것!)

시리즈 만들어 보기

- 인덱스를 넣지 않을 경우 임의로 0부터 시리즈 element 마지막 인덱스 번호까지 숫자를 자동적으로 할당해 준다. 여기서는 0, 1, 2로 (총 3개의 value 값이 있으므로) 할당해 줄것
dataframe과 series의 기술통계


- 해당 데이터 프레임을 df1에 할당하여 평균값을 구할 수 있으며, sum()을 사용시 합계도 나온다
