profile
열심히 하면 재밌다
post-thumbnail

Data Engineering For Beginners : MAC - (1)

공부를 하다 보니 뭘 내 직무로 삼아야 될 지 감이 안 온다. DA? 개발자? 보안? 하나를 진득하니 했어야 했는데, 최소한 누군가한테 기본기로 하루 정도는 설명할 수 있을 지식은 가지고 있어야 했다. 따라서 오늘부터 해보기로 했다. 뭘? 그냥 다! 알고리즘, 판다스,

2026년 3월 26일
·
0개의 댓글
·
post-thumbnail

100 padas puzzles - No. 26~27(3)

각 행에서 3번째 NaN 값이 있는 컬럼을 찾아라isnull()은 isna()와 같다. isnull은 null 값에 익숙한 사람들을 위해 만든 alias 함수이다.df.isna().sum() - NaN의 총 개수는 구할 수 있는데 어떻게 3번째일 때를 조건절로 세울까?

2026년 3월 25일
·
0개의 댓글
·

100 pandas puzzles No.21 ~ 25 (2)

row : animal, column : 방문횟수, 평균나이pivot_table로 table 확인하는데 원하지 않는 데이터가 많을 때, query 함수로 원하는 데이터만 조회할 수 있다.query('컬럼명 == 원하는 조건')활용 예시df.drop_duplicates(

2026년 3월 23일
·
0개의 댓글
·

CyberSecEval 3: Advancing the Evaluation of Cybersecurity Risks and Capabilities in Large Language Models - meta

[Shengye Wan, Cyrus Nikolaidis, Daniel Song, David Molnar, James Crnkovich, Jayson Grace, Manish Bhatt, Sahana Chennabasappa, Spencer Whitman, Stepha

2026년 3월 23일
·
0개의 댓글
·

level.1 정답률 30% 부근 문제 - solvesql

DISTINCT를 안 붙여서 틀린 사람들이 많은 것 같다.중복되는 값들 생각합시다!MySQL에서 분산을 구하는 함수는 2개가 있다.VARIANCE(컬럼명), VAR_POP(컬럼명) : 데이터 세트의 모집단 분산(Population Variance)을 구한다.VAR_SA

2026년 3월 23일
·
0개의 댓글
·
post-thumbnail

100-pandas-puzzles(NO.01~20)

실력을 기르는 데는 문제 푸는 게 가장 좋다. 힘들지만, 이제는 해야지. 빠르게 진행해보자. LLM, 구글링은 하지 말고 pandas 공식 문서로만 풀어보자. pandas.show_versions() : provide useful information, import

2026년 3월 19일
·
0개의 댓글
·

[테니스 중고 시장 분석(1)] 라켓 중고가 방어율 분석 : 데이터로 '명기'를 찾을 수 있을까?

대학교에서 테니스를 시작하고 3년이라는 시간 동안 수많은 라켓들을 사고 팔며 사용해왔습니다. 문득 '사람들이 좋다고 하는 라켓들은 중고 가격도 잘 안 떨어질 것 같은데, 그렇다면 사람들이 관심이 없어하는 라켓(프린스, 테크니화이버, 뵐클)들 중에서 좋은 라켓들 또한 중

2026년 2월 2일
·
0개의 댓글
·

레스토랑 요일 별 구매금액 Top 3 영수증 : solvesql

난이도 : 4 / 정답률 65.93%

2026년 2월 2일
·
0개의 댓글
·

가구 판매의 비중이 높았던 날 찾기 : solvesql

12개가 나와야 되는데 반환된 쿼리 결과가 7개다. 조건을 다시 한 번 살펴보자. HAVING 절에 furniture / cnt >= 0.4라고 했는데이렇게 하면 furniture의 카테고리 비율이 나오지 주문의 비율이 나오는 게 아니다.주문 수 26count(case

2026년 2월 1일
·
0개의 댓글
·

우리 플랫폼에 정착한 판매자 2 : solvesql

난이도 : 2 / 정답률 29.17%order_id가 중복되는 레코드들이 있다. 한 주문에 여러 가지 상품들이 포함될 수 있는 방식인 것 같다. 한 레코드에서는 주문 id와 상품 id가 일대일 대응 관계이다.

2026년 1월 31일
·
0개의 댓글
·

일별 블로그 방문자 수 집계 : solvesql

난이도 : 2방문자 수 중복하여 카운팅되지 않도록 DISTINCT를 사용하는 것이 포인트인 문제였다.

2026년 1월 31일
·
0개의 댓글
·

레스토랑 웨이터의 팁 분석 : sovlesql

난이도 : 2

2026년 1월 31일
·
0개의 댓글
·

폐쇄할 따릉이 정류소 찾기 1 : solvesql

위도, 경도의 단위가 degree이므로 radian으로 변환RADIANS(lat), RADIANS(lng)updated_at가 자신보다 최근인 정류소 5개 이상LEFT JOIN으로 self join을 한 후에, 조건절에 s_near.updated_at > s.updat

2026년 1월 30일
·
0개의 댓글
·

친구 수 집계하기 : solvesql

edge가 친구의 관계를 나타낼 때, node의 위치가 다른 관계에서 값이 유일할 수도 중복될 수도 있다는 점을 고려해야 할 것 같다.쿼리 결과 = 0, 이를 통해서 a,b의 관계가 바뀌어도 중복되는 행은 없음을 알 수 있다. a에만 있는 행이 있을수도 있고, b에만

2026년 1월 30일
·
0개의 댓글
·

미세먼지 수치의 계절간 차이 : solvesql

중앙값을 계산하는 방법홀수 : row_number가 겹치는 단 하나의 행 - CEIL(cnt / 2)짝수 : 중간에 있는 두 개의 행의 평균 row_number / 2계절별로 구별한 행과 pm10만 따로 추출하여 CTE 생성계절 별로 구별해야 하므로틀렸다. window

2026년 1월 29일
·
0개의 댓글
·

전국 카페 주소 데이터 정제하기 : solvesql

split 역할을 수행해주는 함수 SUBSTRING_INDEX를 사용하여 원하는 대로 문자열을 분할한다. 두 번째 띄어쓰기를 기준으로 분할한다고 했을 때, 그 이전 값들을 모두 출력하므로 결과값에 한 번 더 분할을 진행한다.

2026년 1월 29일
·
0개의 댓글
·

멀티 플랫폼 게임 찾기 : solvesql

2026년 1월 28일
·
0개의 댓글
·

폐쇄할 따릉이 저장소 찾기 2 : solvesql

2018년 10월, 2019년 10월 한 달 동안 있었던 자전거 대여/반납의 차2018년 10월 대여 + 반납 건 수 - 2019년 10월 대여 + 반납 건 수bike_id, 대여 정류소 id, 반납 정류소 id가 한 행에 있을 때, 사건 수를 어떻게 세야 할까?bik

2026년 1월 28일
·
0개의 댓글
·

서울숲 요일별 대기오염도 계산하기 : solvesql

요일을 구하는 함수 weekday(date) : 월요일(0)부터 일요일(6) dayofweek(date) : 일요일(1)부터 토요일(7) 이걸 월화수목금토일 순으로 정렬하려면 어떻게 해야 될까?

2026년 1월 27일
·
0개의 댓글
·

게임 평점 예측하기 1 : solvesql

평론가 평점, 사용자 평점이 null 값일 때, 레코드의 결측치를 같은 장르 게임의 평론가 평점의 평균, 사용자 평점의 평균으로 채우는 것이 문제의 요구사항이다. 장르 id로 그룹화를 한다고 했을 때, 그 게임의 id와 같은 값을 어떻게 표현해야 할까?한 장르 별로 평

2026년 1월 27일
·
0개의 댓글
·