크롤링? 스크래이핑?

개인적으로 토이프로젝트를 하면서 스크래이핑을 해봤다. 사실 크롤링과 스크래이핑이 정확히 어떻게 차이가 있는지 몰랐지만 내가 진행한 부분은 단순하게 html을 읽어와서 css selector를 찾고 그 부분의 내용을 저장하는 것이었다. 그리고 스크래이핑이라고 배워서 스크

2021년 10월 1일
·
0개의 댓글

Pymongo

로컬에서 MongoDB를 쓸수도 있지만 클라우드와 연결하여 쓸 수 있다.Update 부분에서 $lt, $set 등을 사용했는데, 이것들이 무엇인지 알아보자$lt : 미만$lte : 이하$gt : 초과$gte : 이상in은 특정 키 값이 해당되는 경우를 말한다db.col

2021년 9월 4일
·
0개의 댓글

파이썬 데코레이터

파이썬 데코레이터 만들기와 사용법에 대해 조금 정리해둔다.데코레이터?함수를 인자로 받는 함수다!원본 함수를 수정하지 않고 앞뒤로 새로운 로직을 추가한 새 함수를 만들 수 있다함수도 객체이기 때문에 함수 객체의 주소를 다른 함수에 파라미터로 넘길 수 있는 것이다. 리턴

2021년 7월 20일
·
0개의 댓글

[부트캠프 #4] Statistics (2) Chi-square

카이스퀘어

2021년 3월 15일
·
0개의 댓글
post-thumbnail

[부트캠프 #3] Statistics (1) T-test

학부 3학년 수업 중 영어데이터 분석이라는 수업을 통해 R을 이용한 통계분석을 배운적이 있다. 그때 당시 했던 내용들을 다시 하는 것이지만 무려 5년전 수업이기 때문에 대강만 기억나고 헷갈리는 부분이 많았다. 수업 들을때도 그랬는데, 귀무가설과 대안가설을 만드는 것

2021년 3월 12일
·
0개의 댓글
post-thumbnail

# [부트캠프 #2] Visualization

python의 다양한 시각화 라이브러리 중 seaborn을 사용해봤다기본적인 barplot, scatterplot, boxplot 등은 생략했다시각화를 잘하려면 많이보고 어떤 것들이 가능한지 많이 아는 것이 중요한 것 같다.seaborn example gallary를

2021년 3월 9일
·
0개의 댓글

[부트캠프 #1] Pandas basics

파이썬의 데이터프레임 라이브러리 pandas 사용법에 대해 정리애매하게 알고있던 것만 따로 정리한다.참고 영상동일한 그룹끼리 묶어서 연산해주는 연산자다df.groupby('label') --> 객체그룹별로 데이터를 집계, 요약하는 방법df의 'label'그룹을 모두 모

2021년 3월 8일
·
0개의 댓글