WHAT IS KATA?

KATA는 기술과 기술 향상에 초점을 맞춘 코드 챌린지입니다.
일부는 프로그래밍 기본 사항을 교육하는 반면 다른 일부는 복잡한 문제 해결에 중점을 둡니다.

이 용어는 The Pragmatic Programmer 라는 책의 공동 저자인 Dave Thomas 가
무술에서 일본의 카타 개념을 인정하면서 처음 만들어졌습니다.
Dave의 개념 버전은 코드 카타를 프로그래머가
연습과 반복을 통해 기술을 연마하는 데 도움이 되는 프로그래밍 연습으로 정의합니다.


리트코드 - 판다스 30일 문제


- PYTHON


✔️ 문제 #1: Delete Duplicate Emails

✔️ 제출 코드

✔️ 코드 분석

import pandas as pd

def delete_duplicate_emails(person: pd.DataFrame) -> None:
    person.sort_values(by='id', inplace=True)
    person.drop_duplicates(subset='email', keep='first', inplace=True)

✔️ CHECK POINT

  • PANDAS

    • .sort_values() 활용하여 id 순 정렬하기

      # by = 'id' (아이디 기준 정렬), inplace = True (원본 데이터 대체)
      person.sort_values(by='id', inplace=True)
      
    • .drop_duplicates() 메서드로 중복 제거하기

      # subset = 'email' (email 컬럼의 중복 제거), 
      # keep = 'first' (중복된 값 중 처음으로 나온 값을 유지)
      person.drop_duplicates(subset='email', keep='first', inplace=True)


profile
커피 좋아하는 데이터 꿈나무

0개의 댓글

관련 채용 정보

Powered by GraphCDN, the GraphQL CDN