
오늘 한 것 간략하게1\. 머신러닝 소프트 랜딩 세션 수강2\. 아티클스터디(A/B테스트 : p-value, 유의수준)3\. 스탠다드반(Transpose, pivot_table, melt, stack, unstack)4\. SQL window function, QCC
오늘 한 것 통계 기초 강의 5주차, 6주차 통계 라이브세션 2회차 ADSP 7,8,9 주차 통계 주요 개념 키워드 정리 주간 계획 세우기 통계 주요 개념 정리 데이터분석가는 데이터의 종류를 이해하고, 관련 분석을 어떤식으로 수행할 지 결정할 수 있어야 한다. 수
[통계]통계적실험, A/B TEST, 유의수준, 검정통계량, p-value >https://velog.io/@yeye1127/%ED%86%B5%EA%B3%84%ED%86%B5%EA%B3%84%EC%A0%81%EC%8B%A4%ED%97%98-AB-TEST-%EC%9C%A
XGBClassifier 기본 파라미터로 훈련성능지표:Accuracy: 0.65Confusion Matrix: \[\[33332 15831], \[73377 129092]]ROC-AUC: 0.7168클래스 0 (상환 실패)에 대한 재현율이 상대적으로 우수imblearn
0.175 가중치 설정이 가장 이상적인 균형점으로 보임.실패(0) 탐지를 최우선으로 고려한다면 0.2~0.175 사이가 추천.0.1은 실패 탐지는 극대화되지만, 성공 예측력이 급격히 떨어져 실전 적용에는 다소 무리일 수 있음.
주제: 불균형 데이터 처리 & 전처리 실무 흐름 재정립SMOTE, class_weight는 반드시 train 데이터에만 적용해야 한다.test/validation은 모델이 한 번도 보지 못한 상태여야 성능 평가가 의미 있다.모델링용 전처리는 반드시 train/test
주제명: 상환 여부 예측 모델의 윤리적 고려사항핵심 키워드: 공정성(Fairness), 개인정보 보호(Privacy)서론 및 문제 정의 : 프로젝트 배경, 연구 목적, 문제 정의데이터 및 예측 모델 개발 : 데이터 소개, 전처리, 모델 개발, 성능 평가윤리적 리스크 분
Lending Club 소개분석 목적대출 상환 여부 예측채무 불이행률 감소 및 손실 방지데이터셋: accepted_2007_to_2018Q4.csv데이터 크기: 약 2,260,710건, 151개 컬럼데이터 유형: 실수형(113), 범주형(38)주요 변수 19개 선정 이
심화프로젝트 발표회 완료LendingClub 대출 상환 예측 모델 발표 프로젝트 전체 흐름 정리 및 피드백 수렴 완료ADsP 강의 수강\-13주차 & 14주차 완강\-데이터 마이닝 기법 및 시계열 분석 개념 학습\-1~2주차 복습 & 문제풀이\-데이터 이해 및 탐색적
데이터 타입 분류명목형(Nominal), 순서형(Ordinal), 구간형(Interval), 비율형(Ratio)대표값과 산포도평균, 중앙값, 최빈값분산, 표준편차, 사분위수, 범위분포 이해왜도(Skewness), 첨도(Kurtosis)이상치 탐지박스플롯 기준: IQR
Purchase Amount (USD) 컬럼의 누적합을 계산하여Purchase Amount (USD)\_누적이라는 새로운 컬럼으로 추가하기.잘못된 코드:올바른 코드:답변:컬럼이 없으면 새로 생성이미 있으면 덮어쓰기df\['컬럼명'] = ... → 새로운 컬럼 생성 or
내용: 다변량 분석, 주성분 분석 복습느낀 점: 데이터 차원 축소의 필요성과 PCA의 해석 방법에 대해 이해도가 높아졌음내용: 시계열 분석의 기본 개념, 정상성과 추세, 계절성 파악느낀 점: 시계열 분석은 시각화와 분해 과정을 통해 데이터 흐름을 이해하는 데 유용하다는
Tableau 개요 이해 Tableau는 데이터를 시각화하여 인사이트를 도출할 수 있도록 도와주는 대표적인 BI(Business Intelligence) 도구임 드래그 앤 드롭 기반의 인터페이스를 통해 직관적인 분석과 대시보드 구성이 가능함기초 시각화 실습 선 그
프로젝트 주제: 게임 한 눈에 보는 게임 유저/매출 데이터주요 요구사항:유저/매출 데이터 기반의 인사이트 도출Tableau에서 필터 기능, 계산된 필드, 이중 축 그래프 포함2024년 미접속자 → 이탈 의심 유저 처리Key-Value Summary 구성 (총 유저 수,
VIP 유저 분석Pay Amount 기준 상위 20% 유저를 식별하기 위해 RANK_PERCENTILE() 함수로 백분위 계산상위 20%를 VIP, 나머지를 일반으로 구분하는 VIP 여부 필드 생성전체 결제금액 중 VIP의 기여도 (%) 시각화SUM(Pay Amount
Main Purchase Type, Main Purchase Category, Action Type을 기준으로 결제 데이터를 시각화Pay Amount를 기준으로 누적 막대그래프 생성누적 막대 내부에는 각 결제 방식별 세부 금액(₩) 표시각 막대의 전체 합계 결제금액을
✅ 오늘 배운 내용 요약배경 이미지를 대시보드에 고정하는 법이미지 객체를 대시보드에 추가하고 원하는 이미지 파일 선택"배경 이미지로 고정" 옵션 체크대시보드 크기를 이미지 해상도에 맞게 고정 (예: 1366x768)시트를 배경 이미지 위에 올리기 (플로팅)시트를 대시보
게임 데이터 메인 대시보드 구성총 유저 수, 평균 플레이 시간, 리뷰 점수, 서비스 국가 수 등 핵심 지표 배치결제 방식별/직업별/활동별 결제 금액 시각화 그래프 추가사용자 유형·성별·국가별 분포 파이 차트 및 맵 차트 구성플로팅 개념 학습 및 시트 배경 투명화 시도시