데이터 얻기
- 구글링 또는 공공데이터 활용(csv, xlsx 파일 활용)
데이터 읽기
- 테이블 데이터는 대부분 pandas 모듈 활용
- 데이터 불러오기 : 코드명 = pd.read_csv(경로)
- 데이터 읽기 : 코드명.head(n(숫자)) 제일 첫 n줄(기본값 5)
코드명.tail(n(숫자)) 제일 끝 n줄(기본값 5)
*코드명은 파일명이 아닌 앞으로 호출할 변수명
- 데이터 오류 시 : 경로 내에 추가 [,encoding="utf-8")]
- 경로 앞 ..은 현재 폴더에서 상위 폴더로 이동하라는 명령어(소스코드 파일이 저장된 폴더 기준)
- 컬럼명 읽기 : 파일명.columns -> 컬럼명이 리스트 형태로 출력 *columns 뒤에 index 추가 시([n]) 해당 컬럼명만 출력
- 컬럼명 변경 : 파일명.rename(columns={파일명.columns[n] : "변경할컬럼명"})
- 이후 변경 사항 저장 시 뒤에 [, inplace=True)] 추가
- header 명령어 : read 명령문 의 경로명 뒤에 [, header=n)] 추가 시 n번째 인덱스부터 출력
- usecols 명령어 : read 명령문 의 경로명 뒤에 [, usecols="컬럼명")] 추가 시 해당 컬럼만 출력