전처리 과정 중에 필요없는 셀들이 존재한다.
얘네들을 살려두게 되면 나중에 모델링 하는데 방해가 되므로 미리 삭제하거나, 문자로 되어있어 따로 셀을 만들어 처리해서 기존 셀이 필요없어지는 경우가 있다.
바로 이전 글에서 설명한 날짜 데이터에서도 다른 셀로 정보들을 옮겨버리면 해당 셀은 필요없게 된다.
이런 셀들을 삭제하는 방법이다.
all_data2 = all_data.drop(columns = ['AnimalID', 'OutcomeType', 'OutcomeSubtype', 'ID', 'DateTime' ])
all_data2
.drop
를 이용하여 삭제할 수 있다.
뒤에는 반드시 인자로 columns
를 넣어 대괄호에 columns이름을 넣어줘야 한다.