항상,,, 까먹는거 정리
판다스에서 read_csv해서 csv파일을 불러올 때 원래있던 인덱스가 컬럼으로 들어가버린다. 그래서 실제 df에 csv파일 넣어서 출력해보면 인덱스열이 두개가 있는 것을 확인할 수 있다.
쓸데없는 컬럼을 생성하지 않기 위해서 처음 read_csv할 때 써주는 것이 있는데 그게 바로
index_col=0 이다.

df = pd.read_csv('train.csv',index_col=0)

이렇게 써주면 기존 인덱스가 컬럼으로 들어가지 않고 사라진다. 그래서 unnamed:0와 같은 컬럼생성이 되지 않는다.

그리고 항상 데이터 불러올 때 상대경로 복사해서 불러왔었는데 다른사람들은 그냥 그 csv파일이름으로 불러오는것을 보고 나도 그렇게 하고 싶었다. 근데 어떻게하는지 몰랐고, 물어볼 시간도 없어서 미루다가 드디어 어제 알아냈다. 그냥 내가 불러와서 코드 작성하는 그 파일과 동일선상에 csv파일이 위치하면 그냥 이름만 써도 된다는 것. 하위폴더 및 상위폴더에 위치하면 이게 이름으로 안된다.
해보니까 별거 아니었음. 디렉토리에 올려놓으면 된다. 가 이런 의미였다.

#디렉토리에 csv파일 올려놓고 불러올 때
df = pd.read_csv('train.csv',index_col=0)

#상대경로 복사에서 불러올 때
#원래는 더 길다.
df = pd.read_csv(r'데이터전처리csv\train.csv',index_col=0)
profile
청지기

0개의 댓글