Anaconda
에 대해서 알아보고,
Numpy
, Pandas
, Matplotlib
에 대해 간단히 정리해보고자 한다.
Anaconda
아나콘다는,
수학, 과학 분야에서 사용되는 여러 패키지를 묶어 놓은 파이썬 배포판이다.
conda
, Python
과 같은 150
개가 넘는 과학 패키지와
그 종속성이 함께 제공된다.
Anaconda 구성요소
Jupyther
와 같은 IDE 개발도구,
Numpy
, SciPy
와 같은 과학 분석용 라이브러리,
Matplotlib
와 같은 데이터 시각화 라이브러리,
TensorFlow
와 같은 머신러닝 라이브러리 등을 포함하고 있다.
Anaconda 설치
해당 링크에 들어가면,
아나콘다 패키지가 쭉 나열되어 있다.
Autoindex
를 사용한 것으로 보여진다.
☑️ 최신 버전을 확인해서 링크를 복사한다.
현재의 최신 버전인
Anaconda3-2020.11-Linux-86_64.sh
의 링크를 복사했다.
Ubuntu
현재 Windows 10 WSL2 Ubuntu
환경에서 진행중이다.
Ubuntu
의 버전은 Ubuntu 20.04.1 LTS
이다.
☑️ 앞선 과정에서 복사해온 링크를 가져와서, wget
으로 받아온다.
wget https://repo.anaconda.com/archive/Anaconda3-2020.11-Linux-x86_64.sh
☑️ 데이터 무결성 확인을 위해, sha256sum
명령어를 사용한다.
sha256sum Anaconda3-2020.11-Linux-x86_64.sh
명령어를 입력하면 해시값이 나오게 된다.
이를 복사해놓고 다음의 링크에 들어가서 일치하는지 확인해 본다.
복사한 내용을 ctrl + f
로 찾으면 빠르다.
Hashes for all files - Anaconda documentation
cf.
🍎
sha256sum
SHA [ Secure Hash Algorithm ]
완전한 해시 알고리즘
sha256
는 해시의 결과가256bit
라는 것을 의미한다.
Ubuntu
☑️ 아나콘다 설치 스크립트를 실행해 설치를 시작한다.
sh Anaconda3-2020.11-Linux-x86_64.sh
맨 처음에 나오는 사용약관은 enter
로 넘겨주고
( enter
를 많이 눌러줘야하는데, ctrl + c
를 누르면 바로 다음으로 넘어간다. )
Do you acceptr the license terms?
에는 yes
+ enter
설치할 위치를 지정해달라는 문구가 나오게 되는데,
기본적인 설치위치를 원한다면 enter
( 원하는 경로가 따로 있다면, 직접 입력해서 지정해줄 수 있다. )
Do you wish the installer to initalize Anaconda3 by running conda init?
이 문구에서 yes
or no
를 선택하도록 되어있는데,
no
를 입력하면 쉘 스크립트를 수정하지 못한다고 한다.
yes
+ enter
를 눌러준다.
prompt
이 상태로는 conda
명령어가 작동되지 않는다.
☑️ ~/.bashrc
또는 ~/.zshrc
에 다음과 같은 명령어를 추가해준다.
export PATH=~/anaconda3/bin:~/anaconda3/condabin:$PATH
추가한 뒤 source
명령어를 입력해서 적용되게 한다.
(base)
가 앞에 붙은 아나콘다 프롬프트를 볼 수 있다고 한다.
( 나는 볼 수 없었다. 아마도 zsh theme 때문인 것 같다. )
버전확인으로 설치가 잘 되었는지 확인할 수 있다.
conda -V
터미널을 실행할 때마다,
아나콘다 프롬프트로 설정이 되어있을 것이라고 한다.
( 물론 나에게는 보이지 않지만. )
그것을 방지하기 위해서 다음과 같은 명령어를 주고, 터미널을 재시작한다.
conda config --set auto_activate_base False
앞으로 아나콘다 프롬프트를 실행할 때는,
conda activate
linux
인 경우는 source activate
를 입력해야하는 경우도 있다.
아나콘다 프롬프트를 끌 때는,
conda deactivate
위의 두 가지 명령어로 제어가 가능하다.
Numpy [ Numerical Python ]
넘파이는
C
언어로 구현된 파이썬 라이브러리로,
고성능의 수치계산을 위해 제작되었다.
벡터 및 행렬 연산에 매우 편리한 기능을 제공한다.
기본적으로 array
라는 단위로 데이터를 관리하며,
이에 대한 연산을 수행한다.
# using numpy
import numpy as np
위와 같이 import
해서 사용할 수 있다.
Pandas
판다스는
Python
에서 사용하는 데이터 분석 라이브러리로,
행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있다.
대용량의 데이터를 안정적으로 처리하기에 편리한 도구이다.
# using pandas
import pandas as pd
Matplotlib
매트플롯라이브러리는
다양한 데이터를 여러 방법으로 도식화해주는
파이썬 라이브러리이다.
# using matplotlib
import matplotlib as plt
새로운 시작을 하니,
기본적인 것들을 하는 것도 즐겁다.
오늘은 정말 기본적인 내용들을 정리했지만,
오늘이 큰 의미가 있는 날이 되었으면 좋겠다.
📚 Reference
Installing Anaconda on EC2 Instance
Installing an Anaconda Python distribution to use in PyCharm
[WSL2] wsl2 아나콘다 사용기
[우분투/Ubuntu 20.04] 우분투에 아나콘다 설치 / Install Anaconda on Ubuntu
sha256
numpy
pandas
matplotlib