⏰ GPU를 통해 Pandas 연산을 해보자! 그럼 시간 단축을 할 수 있겠지!
cudf
pandas와 거의 비슷한 문법을 가지고 있음.
dask_cudf
병렬 처리
까지 같이 하고 싶다면? 이 라이브러리를 써라.
그치만 연산할 때 compute()
를 달아줘야 하는 등 굉장히 귀찮음…
위의 그림처럼 cudf
로 시리즈/프레임 가져온 다음, dask_cudf
로 한번 더 감싸줘야 함.
(cudf → dask_cudf
)
갑자기 boolean 연산하려는데 query()
같은 메소드를 쓰라고 하지 않나..
조금 pandas랑 비슷한 듯…? 같지 않음..
그래도 CPU 메모리 자원을 아끼고(?) GPU를 최대로 활용하고, 시간도 아끼고 싶다면 이 라이브러리를 최대한 써보세요~!!
대용량 전처리할 때는 정말 필요하긴 할 듯🙂