🐸 이번주 학습 내용
- 2월 6일 : 아파트 분양 가격 EDA
- 2월 7일 : KOSIS 소부재 수출입 현황 EDA
- 2월 8일 : 버거지수 EDA
🐸 자주하는 실수
- 파일 불러올 때
- from glob import glob 에서 import부터 적을 땐 glob.glob(”data\kosis*.csv”)
- file_name = glob(”data\kosis*.csv”)에서 data(파일이 들어있는 폴더) 입력 잊지 말기
.
- 컬럼 제거
- df.drop(columns=[”컬럼명”])에서 제거할 컬럼 지정할 때 대괄호[] 잊지 말기
.
- df에서 특정 문자열을 추출할 때
df.loc[df["상호명_대문자"].str.contains("KFC"), "상호명_대문자"]
: array. KFC를 포함하는 df[“상호명_대문자”] 컬럼의 데이터만 추출
df[df["상호명_대문자"].str.contains("KFC")]
: Dataframe. df[“상호명_대문자”] 컬럼에서 KRC를 포함하는 데이터만 포함된 df를 보여줌
df_b.loc[df_b["상호명_대문자"].str.contains("버거킹|BKR"), "브랜드"] = "버거킹”
: object. df_b를 확인하면 “브랜드”라는 새로운 컬럼이 생기고 해당 셀에 ‘버거킹’ 문자열이 추가됨
.
- 여러 개 문자 |로 연결할 때
- "버거킹|맥도날드|롯데리아|KFC” ⭕
- "버거킹"|"맥도날드"|"롯데리아"|"KFC” ❌
.
- 2개의 데이터프레임을 concat으로 합칠 때
- 대괄호[]로 싸야함
- eg. pd.concat([df_skorea, df_city_latlog], axis=1)
- cf. df_skorea.concat(df_city_latlog, axis=1) ❌ → Dataframe에는 concat 매서드 없음
🐸 아직도 헷갈리는 것
- 시리즈에서 문자열 슬라이싱
- df[”항목”].str[:2] : 컬럼에다 바로 .str[]
.
- 정규표현식
- df["항목"].str.replace(pat=r'[^\w]|액', repl=r' ', regex=True)
- [^\w] : 모든 영어, 한글, 숫자가 아닌 것 (영어만 포함하는 것이 아님!)
.
- concat(), merge(), join()의 차이 🌟🌟🌟🌟🌟 아직도 모르겠음~
🔸 concat() : index(axis=1일 때), columns(axis=0일 때) 값을 기준으로 병합
🔸 merge() : key column을 기준으로 병합 (parameter ’on’으로 지정)
🔸 join() : index or key column을 기준으로 병합
.
- .loc 로 조건에 해당하는 데이터만 추출하기
.
- 데이터 프레임에서 컬럼 기준으로 값을 정렬하고 싶을 때
- df.sort_values(”컬럼명”, ascending=True/False)
.
- 시도별 위경도값 가져오기
- pivot_table : df_b.pivot_table(index="시도명", values=["경도", "위도"])
- groupby : df_b.groupby("시도명").agg({"위도":"mean", "경도":"mean"})
.
- 서울시 구별 버거브랜드 매장수
- df_seoul_gu = df_dist_count.loc["서울특별시"]
- .loc[”서울특별시”] == 인덱스가 “서울특별시”인 행만 가져오기
🐸 칭찬
준비님의 특강을 듣고 공부방식을 바꾼 것.
.
메타인지 특강 중에
'노력 자체가 아니라 노력의 방법에 대한 의문이 드는 건 좋다.'
라는 말씀을 해주셨는데
이 말을 듣자마자 내 복습 방식의 비효율성이 떠올랐다.
지금까지 복습을 하고 나면 항상 시간은 오래 걸리는 것에 비해 머리에 남는 것은 별로 없다는 느낌이 들었다.
그래서 그날 밤, 바로 새로운 복습 방법을 만들었다.
.
이전에는 수업 내용의 흐름을 전체적으로 "정리"만 하는 느낌이라
수업 내용 그 자체를 꼼꼼히 복습하지 못하는 문제점이 있었다.
마치 수강생이 아니라 강의자료를 만드는 조교님의 느낌이랄까..
.
그래서 새로운 복습법은 직접 코드를 따라치는 방식으로 바꾸었다.
어제 밤부터 새로운 복습법으로 공부하고 있는데
훨씬 내 약점을 잘 발견할 수 있어서 효과적이었다.
역시 백문이 불여일타!!!
과감히 기존 공부 방식을 바꾼 나 자신을 칭찬해주고 싶다.
🐸 반성
시간을 밀도있게 사용하지 못한 것.
,
지금 하고 있는 게 너무 많아서 그런 것 같다.
수업 듣기, 스터디 2개, 영어공부 등등... 매일 정신이 없다.
준비님께서 특강에서도 말씀해주셨듯
선택과 집중을
이제는!
진짜로!
해야할 시기인 것 같다.
.
나는 어떤 준비를 하는 사람이고
지금 어떤 능력이 필요한 사람인지
정확히 정리하고 시간을 배분해야겠다.
준비님처럼 전략적으로 성장하는 사람이 되어야지!🥕
🐸 다음주 계획
🧐 지난 주 계획을 얼마나 지켰나?
피드백은 말만 하는 게 아니라 지키라고 있는 것.
지난 주, 조세연은 이런 목표를 세웠다. 👉 2월 첫째주 계획 바로가기
- 깃헙 계정 만들고 작동 방법 배우기
: ⭕ 드디어 2월 9일 새벽 깃헙 계정을 만들었고 유튜브를 보며 기본 작동법을 배웠다.
- 다음 주부터 seaborn 갤러리 예제 하나씩 깃헙으로 정리하기
: ⭕ seaborn tutorial 1일차를 완료했고, 앞으로 매일 하나씩 진행할 것이다.
- 취업용 노션 포트폴리오 양식 만들기
: ❌ 아직 못했다.
.
✨ 이번주 새로운 계획 3가지
- seaborn tutorial 스터디 목표 분량까지 완료하기
- 지금까지 정리한 수업필기 내용에 tag 정확히 입력하기
- 위대한 나의 발견, 강점혁명에 나오는 테스트 해보기
(취업 포폴은 일단 keep..)
🐸 나에게 한마디!
후회없이 잘 살고 있구나.
아무리 바빠도 부모님이랑 통화 많이 하자. 이 세상에서 나를 가장 많이 응원해주시는 분들이야.