그간 학습하면서 SQL은 SQL대로 배우고,
python - pandas는 또 그것대로 배운 것 같아서
이 둘은 대체 어떻게 이어지는 걸까 궁금했는데
오늘 그 비밀이 풀렸다 !
pip install pymysql
참고로 colab에서는 참고로 pip 명령 앞에 !를 붙인다. (!pip install ~)
import pandas as pd
import numpy as np
import pymysql
이때 Host, User, Password가 필요하다. (코드 상으로는 port와 db 정보도 주어진다.) 아래 값들은 임의로 수정했다.
conn = pymysql.connect(host = 'match-stats.null.null2.rds.amazonaws.com',
port = 3306,
user = 'username',
password = 'password',
db = 'pubg-esports')
sql_input = "SELECT * FROM tablename"
df_this_data = pd.read_sql_query(sql_input, conn)
위의 df_this_data가 SQL에서 FROM절에 위치하는 테이블이 된다.
이런 작업을 통해 쿼리로 가져온 데이터를 다양하게 분석하고 시각화할 수 있다.
thanks to OP.GG 데이터 분석가 정환님