📝20230113 이범재 강사님 SQL 수업내용 필기
📝20230116 박조은 강사님 수업내용 필기
📝20230117 박조은 강사님 수업내용 필기
📝20230118 박조은 강사님 수업내용 필기
select()
html.select('tr > td.subject > a')
find_all()
html.find_all('td',{'class':'subject'},)
a_link_no=[]
for val in a_list:
a_link_no.append(val['href'].split('/')[-1])
🔽
a_link_no = [a_list[i]['href'].split('/')[-1] for i in range(len(a_list))]
text.strip()
선택한 예외를 처리하는 프로그램
try :
# 오류가 나는지 볼 코드
except Exception:
# 에러가 나면 이렇게 할 것이다, 이렇게 반환할 것이다 코드
try:
...
except 발생오류1:
...
except 발생오류2:
...
set_index()
표에 인덱스를 지정하는 방법transpose()
== T
를 사용해서 전치행렬을 만드는 방법concat()
을 사용해서 데이터프레임을 합치는 방법axis = 0
이라면 세로로 붙여줌 컬럼값이 같아야함axis = 1
이라면 index 값 기준으로 컬럼(열)로 붙여주기 때문에 index값이 같아함ignore_index = True
: 그 인덱스 값을 무시하고 다시 순차적으로 부여하게 해줌. 기존인덱스 값을 사용하냐 안하냐의 차이df.info
df.describe()
기존 데이터와 병합하여 내용이 함께 수집된 것을 확인한다.
인덱스와 컬럼이 같을 땐 concat
그 외 병합 → merge
merge 는 컬럼. 혹은 인덱스 기준으로 병합한다.
join
도 비슷하지만 인덱스 기준으로 병합한다.
SQL과 데이터 수집 및 전처리까지 해보는 주였다.
새로운 내용의 SQL를 공부하는 건 매우 재밌었다.
기초였기 때문이였을까? 처음이라 쉬웠고 괜찮았다.
월요일부턴 데이터 수집에 막바지였다.
점차 심화된 내용으로 들어가서 어려웠고 따라가는데 벅참이 있었다.
오늘 WIL 정리하면서 복습하게 되어서 다시 머리에 집어 넣을 수 있었다.
특히 API 부분은 수업때도 간단하게 넘어갔는데
다시 공부해볼 필요가 있을 것 같다.