2025.04.18 본_캠프 42일차

민동·2025년 4월 18일
0

본캠프

목록 보기
41/74
post-thumbnail

126번: Find Users With Valid E-Mails

문제 설명

Users 테이블에서 이메일이 유효한 사용자만 찾아야 한다.

유효한 이메일의 조건:

  1. 도메인은 반드시 @leetcode.com 이어야 한다.
  2. @ 앞의 prefix는 다음과 같은 규칙을 따름:
    • 영문 대소문자(a-zA-Z)로 시작해야 한다.
    • 그 뒤에는 영문자, 숫자, 밑줄 _, 점 ., 대시 -가 올 수 있다.

참고

이메일의 유효성 검사를 위해 REGEXP (정규표현식) 을 사용한다.

  • ^ → 문자열의 시작
  • [a-zA-Z] → 영문 대소문자로 시작
  • [a-zA-Z0-9_.-]* → 그 뒤로는 문자, 숫자, _, ., - 중 0개 이상
  • @leetcode\.com$ → 정확히 @leetcode.com으로 끝나는지 확인
    ( 여기서 .을 문자 그대로 쓰기 위해 \\. 사용)

내 정답 쿼리

SELECT user_id, name, mail
FROM Users
WHERE mail REGEXP '^[a-zA-Z][a-zA-Z0-9_.-]*@leetcode\\.com$';

127번: American Cities Above 100000

문제 설명

CITY 테이블에서 미국 도시 중 인구가 100,000명 이상인 도시 정보를 모두 조회해야 한다.

  • 미국을 나타내는 CountryCode'USA'로 고정되어 있다.
  • 반환 형식은 모든 컬럼 조회 (SELECT *).

내 정답 쿼리

SELECT *
FROM CITY
WHERE POPULATION > 100000
  AND COUNTRYCODE = 'USA';

풀이 포인트

  • POPULATION > 100000: 인구 필터링
  • COUNTRYCODE = 'USA': 미국 도시만 대상
  • SELECT *: 테이블의 모든 칼럼 반환

신용 위험도 기반 고객 세분화 프로젝트

프로젝트 개요

  • 목표: 고객의 신용점수, 총 부채, 소득 등의 데이터를 바탕으로 잠재적인 신용 위험도를 분석하고,
    클러스터링 기법을 활용해 고객을 그룹화하여 인사이트를 도출하는 것
  • 활용 방안:
    • 금융 상품 설계 시 기준 데이터로 활용
    • 대출 심사 기준 보완 및 리스크 최소화
    • 신용 위험 관리 정책 수립의 참고 자료

주요 파생 변수

  • DTI (부채 대비 소득 비율): total_debt / yearly_income
  • 카드당 평균 한도: credit_limit / num_cards_issued

활용 변수

  • total_debt, yearly_income, per_capita_income
  • num_credit_cards, card_on_dark_web
  • credit_limit, num_cards_issued

분석 흐름

  1. 데이터 전처리

    • 이상치 처리 및 결측치 보완
    • 파생 변수 생성
  2. 클러스터링 분석

    • 클러스터링 기법 적용
    • 고객 군집 세분화
  3. 인사이트 도출

    • 각 군집의 재무적 특성 분석
    • 위험 요인 및 행동 패턴 도출
  4. 활용 제안

    • 금융사 입장에서의 맞춤형 리스크 관리 전략 제시
    • 세그먼트별 금융상품 설계 방향 도출
profile
아자아자

1개의 댓글

comment-user-thumbnail
2025년 4월 18일

봤는데?

답글 달기