SQL 에서 LAG ,LEAD 함수의 경우 그룹별로 이전/이후의 행 값을 가져오고 싶을 때 주로 사용한다. 그런데 python 에서 사용하고 싶다면?
youtube api를 통해 각 영상별 조회수 증가폭을 보기위해서 매일 데이터를 받다보니.. 일별로 보다보면 그래프가 한눈에 안보인다.또한, 시계열 데이터를 그래프로 나타내려다 보면, 일별 뿐만 아니라, 주간, 월별로 데이터를 보고싶어질때가 있다. 대표적으로 주식??아
publishedAt에서 year 과 hour 컬럼을 따로 만들어 놓은 데이터프레임이 아래와 같을 때, 연도별(Year)로 업로드 시간(Hour)이 주로 언제 인지 알기위해서 pivot을 이용해야 했습니다! pyhton 에서 pivot을 이용하려면.. 간단하다!df.p
youtube 데이터를 받고, 영상길이에 따라 반응(조회수,좋아요,댓글)의 차이가 있는지 궁금했습니다. 하지만 api 에서 받은 영상의 길이 'duration' 컬럼의 경우 PT10M11S 와 같은 형태로 되어있었는데요. 통계적으로 차이가 있는지 확인하기 위해선 이를
league of legends 데이터를 전처리하면서 필요했던 코드들을 정리해 보려고합니다.🔥전처리 목표 " 우리팀이 죽은 로그만 가져오기" 메인 데이터는 여러개의 매치경기가 concat 된 dataframe 형태 였는데요!우리팀 포지션이 상대의 어떤 포지션에게 죽었
해당 소환사의 시야점수 지표를 보던중.. 유일하게 낮아지고 있는 지표임을 발견했는데요 해당 소환사가 시야점수가 부족해서 일어날 수 있는 상황은 대표적으로 적의 갱에 당하는 경우라고 할 수 있습니다. 그렇다면해당 소환사가 "라인전 동안 죽은경우 중"에서 와드를 박지 않
JUNGLE 의 이동 경로를 FuncAnimation, scatter, kdeplot 사용하여 시각화 해보았습니다