TIL(24.08.15.)

codataffee·2024년 8월 15일

TIL

목록 보기
129/135
post-thumbnail

#INTRO

광복절 !


#코드카타

  • KATA #110

  • PANDAS

    • merge() 메서드 사용하여 두 개의 데이터프레임 병합하기

      # Employee 테이블과 Department 테이블을 'departmentId'와 'id'를 기준으로 병합
      merged_df = pd.merge(employee, department, left_on='departmentId', right_on='id')
      
    • groupby()max() 사용하여 각 그룹별 최대 값 계산하기

      # 각 부서별 가장 높은 급여를 찾기 위해 'departmentId'로 그룹화, 그룹 내 'salary' 최대 값 계산
      max_salaries = merged_df.groupby('departmentId')['salary'].max().reset_index()
      
    • merge() 메서드 사용하여 조건에 맞는 데이터 필터링하기

      # 최대 급여를 가진 직원들을 찾기 위해 다시 병합, 
      # 'departmentId'와 'salary'가 일치하는 행만 병합 결과에 포함됨
      result_df = pd.merge(merged_df, max_salaries, on=['departmentId', 'salary'], how='inner')
      
    • 컬럼 지정하여 원하는 형식으로 데이터프레임 정리하기

      # 필요한 컬럼만 선택하고, 이름을 명확하게 지정하여 결과 정리
      result_df = result_df[['department', 'name', 'salary']]
      result_df.columns = ['Department', 'Employee', 'Salary']
      


#최종 프로젝트 진행


제품 이미지 크롤링 시도

  • 팀원이 정리해준 크롤링용 ARTICLES 파일의
    약 2400개 제품에 대한 이미지 링크 크롤링 시도

  • 혹시 모르니.. 500개 먼저

  • 성공!

  • 나머지 1900개 돌리고 자야지.



(10시간.. ㅋㅋㅋ)


결론 : 성공 !


#OUTRO

오늘의 한 줄.

언제 안 아파지는거야 ?

profile
커피 좋아하는 데이터 꿈나무

0개의 댓글