(Windows) venv와 TensorFlow를 이용한 데이터과학 환경구성하기!

PBU·2021년 8월 22일
0
post-thumbnail

venv환경에 TensorFlow를 이용해 데이터과학을 할 수 있는 환경을 구성해보자.
먼저 venv는 Python3에서 지원하는 Python 가상환경을 구성할 수 있게 해주는 녀석이다.

나름의 이유!

왜 가상환경을 구성해야 할까? Python을 사용하다보면 여러 패키지들을 설치해서 사용하게 되는데 가끔 꼬인다. 그리고 TensorFlow 및 특정환경을 구성하기 위해서는 각 버전에 맞는 패키지를 설치해줘야 하는데 가상환경이 아닐 경우 곤란한 상황이 발생할 수 있다.

venv이외에도 Python 가상환경 구성을 지원하는 라이브러리들이 존재한다. 하지만 여기에서는 TensorFlow 사이트 권장 설치 방법 중 하나인 venv를 통해 환경구성을 시작해보도록 하자!

기본적으로 설치할 항목은 다음과 같다.

TensorFlow : 머신러닝, 딥러닝을 할 수 있는 구글에서 제작한 오픈소스 소프트웨어 라이브러리
Pandas : 데이터프레임등 데이터 조작에 관한 여러 편리한 기능들을 제공하는 Python라이브러리
Matplotlib : 데이터를 다양하게 도식화 할 수 있도록 도와주는 Python라이브러리
Jupyter Notebook : 라이브 코드, 등식, 시각화, 설명 등의 기능을 제공하는 웹애플리케이션

venv TensorFlow 환경을 구성할 컴퓨터정보

설치는 TensorFlow 공식사이트의 방법으로 진행! 먼저 TensorFlow의 설치 요구사항을 확인한다.
(링크) TensorFlow 설치 요구사항 <<

Visual Studio 2015, 2017 및 2019용 Microsoft Visual C++ 재배포 가능 패키지를 설치한다. 이미 설치가 되어 있으면 안해도 된다. 이 컴퓨터는 Visual Studio가 설치되어 있지 않은 깡통 환경이라서 직접 다운받아 설치했다.

링크를 타고 들어가 내 컴퓨터에 맞는 버전을 다운로드하여 설치한다.

Documents폴더에 python_venv라는 폴더를 생성해준다. 하나의 폴더에 venv환경을 몰아넣으면 나중에 관리하기 편하다.

python_venv 폴더로 이동해 경로를 복사한다.

Windows Key + r을 눌러 cmd를 실행하고 복사한 경로를 붙여넣기한다.

cd <경로>

여기에서는 가상환경 이름을 mytfe로 하였지만, 자신이 원하는 환경 이름을 넣으면 된다.

python -m venv <가상환경이름>

생성하는데 조금 시간이 걸린다. (20초 정도?) 성공적으로 생성하였으면 가상환경이름으로 지정한 폴더가 생긴다.

cd를 통해 생성한 폴더로 이동한다.

cd <가상환경이름>

dir를 통해 어떤 항목들이 있는지 확인한다. 궁금하면 해보고 안해도 된다.

dir

가상환경을 활성화 한다. (가장 중요!)
macOS에서는 activate가 bin에 존재한다. (이건 참고! 많이 알면 좋음!)

.\scripts\activate

환경이 활성화 되면 앞에 내 가상환경 이름이 아래 이미지 처럼 표시된다.

Python과 pip의 버전을 확인해보자.

python -V
pip -V

설치된 패키지를 pip list를 통해 확인할 수 있다.

pip list

경고가 표시되어도 당황하지 말자, 오류가 아닌이상 크게 신경쓸 필요가 없다. 아래 내용은 pip 버전이 최신 버전이 아니니 업그레이드를 해라! 라는 뜻으로 친절하게 WARNING에 표시된 업그레이드 문구를 복사하여 업그레이드 해주자!

python.exe -m pip install --upgrade pip

이제 본격적으로 TensorFlow를 설치해보자. 사실 이 한줄이면 끝난다.

pip install tensorflow

너무 쉽게 설치가 되었다.. 이제 Pandas를 설치해주자!

pip install pandas

Matplotlib도 설치해주자!

pip install matplotlib

Jupyter Notebook도 설치!

pip install notebook

(팁!) 각 항목 설치시 어떤 패키지가 설치되는지 궁금하면 중간 중간 pip list를 통해 확인하면 된다. 아래는 모든 항목 설치 완료 후 설치된 패키지 리스트 확인한 이미지

가상환경을 비활성화 하는 방법은 deactivate를 하면 된다.

deactivate

가상환경을 비활성화 했다가 다시 활성화 했다. (보여주려고..)

Jupyter Notebook을 실행해보자!

jupyter notebook

브라우저 선택창이 나오면 원하는 브라우저를 선택한다. (사실상 크롬 추천)

Jupyter Notebook 실행 후 이미지!

아래 과정을 따라할 필요없이 Python 노트북 생성후 사용해도 되지만, 깔끔한 정리를 위해서 폴더를 만들어 보자!

폴더 생성 후 해당 폴더를 체크하고 이름 변경!

편의상 Codes로 했다.

Codes 폴더로 이동 후 Python 노트북 생성

상단 Untitled를 클릭 하여 이름을 변경해주자!

아래 코드를 입력하여 설치된 TensorFlow의 버전을 확인!

import tensorflow as tf
tf.__version__

사실 나는 macOS와 Windows, Ubuntu, Linux등 여러 OS환경을 쪼끔! 잘안다. 정말 쪼~끔..

이번에 macOS M1 노트북을 사용하게 되었는데 여기에 구성한다고 조금 시간을 투자했다.. 설치를 하고 나서도 간단한 딥러닝을 하려고 하는데 데이터전처리에서.. isnull().sum()이 작동을 안했다. 물론 해결을 했지만 아직 macOS M1환경은 TensorFlow 버전 선택이라던지 제약이 있다. 이것도 시간이 되면 포스팅해서 공유할 수 있는 기회를 만들도록 하겠다.

끝.

0개의 댓글