머신러닝 스터디 - 주요 패키지

KIM TAEHO·2021년 9월 25일
0

ml

목록 보기
3/9
post-custom-banner

머신러닝 패키지

  • 사이킷런(Scikit-Learn)

https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html

파이썬 머신러닝 라이브러리 중 가장 많이 사용되는 라이브러리이다. 파이썬 기반의 머신러닝은 곧 사이킷런으로 개발하는 것을 의미할 정도로 오랜 기간 파이썬 세계에서 인정받았으며, 사이킷런은 파이썬 기반의 머신러닝을 위한 가장 쉽고 효율적인 개발 라이브러리를 제공한다

행렬/선형대수/통계 패키지

  • 넘파이(Numpy)

    파이썬 대표적인 행렬과 선형대수를 다루는 패키지이다.
    사이킷런을 비롯 많은 머신러닝 패키지가 넘파이 기반이다.

  • 사이파이(SciPy)

    자연과학과 통계를 위한 다양한패키지를 가지고 있다.
    사이킷런 역시 사이파이 패키지의 도움을 받아 구축된 여러 패키지를 가지고 있다.

데이터 핸들링

  • 판다스(Pandas)

    파이썬 세계의 대표적인 데이터 처리 패키지
    2차원 데이터 저리에 특화 넘파이보다 훨씬 편리하게 데이터 처리 할 수 있고 많은 기능을 제공한다. 또한 맷플롯립(Matplotlib)을 호출해 쉽게 시각화 기능을 지원할 수도 있다.

시각화

  • 맷플롯립

    파이썬 대표적인 시각화 패키지.
    파이썬 기반의 다른 시각화 패키지에도 많은 영향을 끼치고 있다.
    단점으로 디자인투박, 단순시각화를 작성코드가 길어 효율이 떨어진다.
    이를 보완하기 위해 여러 시각화 패키지 출시되었고 대표적으로 시본(Seaborn)이 있다.

  • 시본(Seaborn)

    맷플로립 기반으로 만들었지만 판다스와의 쉬운 연동, 함축적인 API, 분석을 위한 다양한 유형의 그래프/차트 제공 등으로 파이썬 기반의 데이터 분석가/과학자에게 인기를 얻고 있다.
    하지만 여전히 세밀한 부분의 제어는 맷플로립의 API를 그대로 사용하고 있다.

profile
즐거운 개발공부
post-custom-banner

0개의 댓글