Pandas GPU 사용을 위한 cuDF

merong·2024년 1월 5일
0

⏰ GPU를 통해 Pandas 연산을 해보자! 그럼 시간 단축을 할 수 있겠지!

  • cudf

    pandas와 거의 비슷한 문법을 가지고 있음.

  • dask_cudf

    병렬 처리까지 같이 하고 싶다면? 이 라이브러리를 써라.

    그치만 연산할 때 compute()를 달아줘야 하는 등 굉장히 귀찮음…

    위의 그림처럼 cudf로 시리즈/프레임 가져온 다음, dask_cudf로 한번 더 감싸줘야 함.
    (cudf → dask_cudf)

    갑자기 boolean 연산하려는데 query() 같은 메소드를 쓰라고 하지 않나..

    조금 pandas랑 비슷한 듯…? 같지 않음..

    그래도 CPU 메모리 자원을 아끼고(?) GPU를 최대로 활용하고, 시간도 아끼고 싶다면 이 라이브러리를 최대한 써보세요~!!

    대용량 전처리할 때는 정말 필요하긴 할 듯🙂

profile
매일매일이 새로운 시작점

0개의 댓글