DataFrame Manipulation

ParkJangSik·2021년 6월 9일
1

DataScientist의 길

목록 보기
2/5
post-thumbnail

🔥 목차

  • 데이터셋 불러오기

    • [DataFrame 행렬 transepose하기 + sheet별로 불러 + Dataframe csv파일 저장.]
    • [첫번째 row를 column name으로 설정하기]
    • [처음부터 숫자 형태로 불러오기] - thousands, names.
    • [여러개의 엑셀 데이터 한번에 불러와서 합치기] - Concat.
    • [Pandas 데이터 불러오기] - skiprows, sep='\t',replace
  • [데이터 dimension 확인하기]

  • [데이터의 결측치 확인하고, 0으로 대체 or 해당 행,열 제거]

  • [기존 DF에서 새로운 Feature 만들기]

  • [pandas에서 DataFrame 만들기]

  • [DataFrame내의 특정 자료 변환하기] - iloc, loc

  • [DataFrame내의 특정 자료 변환하기] - apply 함수

  • [DataFrame내의 특정 자료 변환하기] - 문자를 숫자로

  • [DataFrame내의 특정 자료 변환하기] - replace, 딕셔너리, Null 값 넣기

  • [DataFrame 합치기 및 특정 열 삭제] - concat, drop

  • [Mean imputation으로 결측치 채우기]

  • [데이터 합치기] - merge()

  • [특정 열에 속한 문자 지우기] - lambda 이용

  • 인덱스

    • [인덱스 설정하기] - set_index()
    • [인덱스 초기화하기] -reset_index()
  • tidy 형태 만들기 - melt()

  • column 명칭 변경하기 - rename()

  • [인덱스 숨기기] - style.hide_index()

  • [특정 column별로 평균내기] - groupby()

  • [각 열 조건에 맞는 index 찾아서 지우기]

  • [DF에서 랜덤하게 10개의 값 추출하기]

profile
취준생

0개의 댓글