[TIL] MySQL - Pandas 연동으로 python 환경에 데이터 받아오기

카오소이·2020년 10월 27일

python

목록 보기

4/5

그간 학습하면서 SQL은 SQL대로 배우고,
python - pandas는 또 그것대로 배운 것 같아서
이 둘은 대체 어떻게 이어지는 걸까 궁금했는데
오늘 그 비밀이 풀렸다 !

1. 먼저 Python 환경에서 MySQL을 사용할 수 있도록 라이브러리를 설치한다.

pip install pymysql

참고로 colab에서는 참고로 pip 명령 앞에 !를 붙인다. (!pip install ~)

2. pandas와 pymysql을 import 한다.

import pandas as pd
import numpy as np
import pymysql

3. pymysql.connect 함수에 각각의 정보를 입력하여 연결을 실행한다.

이때 Host, User, Password가 필요하다. (코드 상으로는 port와 db 정보도 주어진다.) 아래 값들은 임의로 수정했다.

conn = pymysql.connect(host = 'match-stats.null.null2.rds.amazonaws.com',
                       port = 3306,
                       user = 'username',
                       password = 'password',
                       db = 'pubg-esports')

4. 이제 SQL 문법을 사용하여 자유롭게 데이터를 가지고 놀 수 있다.

sql_input = "SELECT * FROM tablename"
df_this_data = pd.read_sql_query(sql_input, conn)

위의 df_this_data가 SQL에서 FROM절에 위치하는 테이블이 된다.
이런 작업을 통해 쿼리로 가져온 데이터를 다양하게 분석하고 시각화할 수 있다.

thanks to OP.GG 데이터 분석가 정환님

카오소이

두려우면 시작하지 말고, 시작했으면 두려워하지 말자.

이전 포스트

BeautifulSoup와 selenium 이용한 구글 검색화면 크롤링 실습

다음 포스트