"파이썬"에 데이터를 "불러오는" 것부터 할 수 있어야 파이썬에서 판다스를 활용해서 데이터를 내가 원하는 방식으로 가공할 수 있을 것이다. 이 불러오기를 따로 정리를 해서 혹시나 나중에 내가 길을 잃으면 차분하게 시작해 볼 수 있도록 여기에 써보고자 한다.
원본 데이터셋에 따라서 때로는 행의 헤더 부분을 직접 입력 해야 할 수도 있고 내가 예상하는 형태가 아닌 데이터일 수 있어서 불러오기조차 안되는 경우도 있을 수 있다.
pandas.read_파일형식()의 함수를 통해 특정한 파일 형식으로 구성된 데이터셋을 불러올 수 있다. 자세한 사용법은 아래 링크를 참조!
pandas.read_csv()
CSV(comma-separated values)란 파일의 형식(포맷)의 한 종류이다. 몇 가지 필드를 쉼표(,)로 구분한 텍스트 데이터 및 텍스트 파일이다.
대중적으로 사용되는 비교적 단순한 파일 형식으로 호환되지 않는 포맷을 사용하는 프로그램 끼리 자료를 전달할 때 사용할 때 많이 쓰인다. 많은 프로그램들이 포맷을 내보내거나 가져올 때 조금 변형된 형태의 CSV을 지원하기 때문이다.
출처