[TIL] MySQL - Pandas 연동으로 python 환경에 데이터 받아오기

오수희·2020년 10월 27일
5

python

목록 보기
4/5
post-thumbnail

그간 학습하면서 SQL은 SQL대로 배우고,
python - pandas는 또 그것대로 배운 것 같아서
이 둘은 대체 어떻게 이어지는 걸까 궁금했는데
오늘 그 비밀이 풀렸다 !

1. 먼저 Python 환경에서 MySQL을 사용할 수 있도록 라이브러리를 설치한다.

pip install pymysql

참고로 colab에서는 참고로 pip 명령 앞에 !를 붙인다. (!pip install ~)

2. pandas와 pymysql을 import 한다.

import pandas as pd
import numpy as np
import pymysql

3. pymysql.connect 함수에 각각의 정보를 입력하여 연결을 실행한다.

이때 Host, User, Password가 필요하다. (코드 상으로는 port와 db 정보도 주어진다.) 아래 값들은 임의로 수정했다.

conn = pymysql.connect(host = 'match-stats.null.null2.rds.amazonaws.com',
                       port = 3306,
                       user = 'username',
                       password = 'password',
                       db = 'pubg-esports')

4. 이제 SQL 문법을 사용하여 자유롭게 데이터를 가지고 놀 수 있다.

sql_input = "SELECT * FROM tablename"
df_this_data = pd.read_sql_query(sql_input, conn)

위의 df_this_data가 SQL에서 FROM절에 위치하는 테이블이 된다.
이런 작업을 통해 쿼리로 가져온 데이터를 다양하게 분석하고 시각화할 수 있다.

thanks to OP.GG 데이터 분석가 정환님

profile
프로덕트 마케터인데 이제 데이터를 좀 곁들인.

0개의 댓글