
공부를 하다 보니 뭘 내 직무로 삼아야 될 지 감이 안 온다. DA? 개발자? 보안? 하나를 진득하니 했어야 했는데, 최소한 누군가한테 기본기로 하루 정도는 설명할 수 있을 지식은 가지고 있어야 했다. 따라서 오늘부터 해보기로 했다. 뭘? 그냥 다! 알고리즘, 판다스,

각 행에서 3번째 NaN 값이 있는 컬럼을 찾아라isnull()은 isna()와 같다. isnull은 null 값에 익숙한 사람들을 위해 만든 alias 함수이다.df.isna().sum() - NaN의 총 개수는 구할 수 있는데 어떻게 3번째일 때를 조건절로 세울까?
row : animal, column : 방문횟수, 평균나이pivot_table로 table 확인하는데 원하지 않는 데이터가 많을 때, query 함수로 원하는 데이터만 조회할 수 있다.query('컬럼명 == 원하는 조건')활용 예시df.drop_duplicates(
[Shengye Wan, Cyrus Nikolaidis, Daniel Song, David Molnar, James Crnkovich, Jayson Grace, Manish Bhatt, Sahana Chennabasappa, Spencer Whitman, Stepha
DISTINCT를 안 붙여서 틀린 사람들이 많은 것 같다.중복되는 값들 생각합시다!MySQL에서 분산을 구하는 함수는 2개가 있다.VARIANCE(컬럼명), VAR_POP(컬럼명) : 데이터 세트의 모집단 분산(Population Variance)을 구한다.VAR_SA

실력을 기르는 데는 문제 푸는 게 가장 좋다. 힘들지만, 이제는 해야지. 빠르게 진행해보자. LLM, 구글링은 하지 말고 pandas 공식 문서로만 풀어보자. pandas.show_versions() : provide useful information, import
대학교에서 테니스를 시작하고 3년이라는 시간 동안 수많은 라켓들을 사고 팔며 사용해왔습니다. 문득 '사람들이 좋다고 하는 라켓들은 중고 가격도 잘 안 떨어질 것 같은데, 그렇다면 사람들이 관심이 없어하는 라켓(프린스, 테크니화이버, 뵐클)들 중에서 좋은 라켓들 또한 중
12개가 나와야 되는데 반환된 쿼리 결과가 7개다. 조건을 다시 한 번 살펴보자. HAVING 절에 furniture / cnt >= 0.4라고 했는데이렇게 하면 furniture의 카테고리 비율이 나오지 주문의 비율이 나오는 게 아니다.주문 수 26count(case
난이도 : 2 / 정답률 29.17%order_id가 중복되는 레코드들이 있다. 한 주문에 여러 가지 상품들이 포함될 수 있는 방식인 것 같다. 한 레코드에서는 주문 id와 상품 id가 일대일 대응 관계이다.
난이도 : 2방문자 수 중복하여 카운팅되지 않도록 DISTINCT를 사용하는 것이 포인트인 문제였다.
위도, 경도의 단위가 degree이므로 radian으로 변환RADIANS(lat), RADIANS(lng)updated_at가 자신보다 최근인 정류소 5개 이상LEFT JOIN으로 self join을 한 후에, 조건절에 s_near.updated_at > s.updat
edge가 친구의 관계를 나타낼 때, node의 위치가 다른 관계에서 값이 유일할 수도 중복될 수도 있다는 점을 고려해야 할 것 같다.쿼리 결과 = 0, 이를 통해서 a,b의 관계가 바뀌어도 중복되는 행은 없음을 알 수 있다. a에만 있는 행이 있을수도 있고, b에만
중앙값을 계산하는 방법홀수 : row_number가 겹치는 단 하나의 행 - CEIL(cnt / 2)짝수 : 중간에 있는 두 개의 행의 평균 row_number / 2계절별로 구별한 행과 pm10만 따로 추출하여 CTE 생성계절 별로 구별해야 하므로틀렸다. window
split 역할을 수행해주는 함수 SUBSTRING_INDEX를 사용하여 원하는 대로 문자열을 분할한다. 두 번째 띄어쓰기를 기준으로 분할한다고 했을 때, 그 이전 값들을 모두 출력하므로 결과값에 한 번 더 분할을 진행한다.
2018년 10월, 2019년 10월 한 달 동안 있었던 자전거 대여/반납의 차2018년 10월 대여 + 반납 건 수 - 2019년 10월 대여 + 반납 건 수bike_id, 대여 정류소 id, 반납 정류소 id가 한 행에 있을 때, 사건 수를 어떻게 세야 할까?bik
요일을 구하는 함수 weekday(date) : 월요일(0)부터 일요일(6) dayofweek(date) : 일요일(1)부터 토요일(7) 이걸 월화수목금토일 순으로 정렬하려면 어떻게 해야 될까?
평론가 평점, 사용자 평점이 null 값일 때, 레코드의 결측치를 같은 장르 게임의 평론가 평점의 평균, 사용자 평점의 평균으로 채우는 것이 문제의 요구사항이다. 장르 id로 그룹화를 한다고 했을 때, 그 게임의 id와 같은 값을 어떻게 표현해야 할까?한 장르 별로 평