
이중차분법광고 캠페인, 가격 인하, 리브랜딩 등 특정 마케팅 개입이 실제로 매출이나 고객 행동에 어떤 영향을 미쳤는지 평가할 때 유용한 분석 기법마케팅에서 이중차분법이 필요한 이유단순히 캠페인 전후의 매출 변화만 보면, 시장 트렌드나 계절 요인 등의 외부 요인까지 포함
AB 테스트란?두 가지 버전(A와 B)을 비교하여 어떤 것이 더 효과적인지를 판단하는 실험 방법예를 들어, 기존 버전에서는 "지금 구매하세요!"라는 광고 문구를 넣고 실험 버전에서는 "오늘 한정 할인!"이라는 광고 문구를 삽입한다. 두 가지 버전 중 어떤 문구에서 클릭

PV, UVPV (Page View): 웹사이트의 특정 페이지가 사용자에게 열람된 횟수페이지별 관심도 측정사용자가 어떤 페이지에 머무는지 파악 가능UV (Unique Visitor): 웹사이트를 방문한 고유 사용자 수 같은 사용자가 여러 번 방문해도 1명으로 카운트실질
"ex4_member", "ex4_review" 라는 이름의 테이블에는 각각 회원에 대한 정보와, 회원이 남긴 리뷰에 대한 정보가 담겨있음ex4_member 테이블과 ex4_review 테이블을 사용하여 리뷰를 가장 많이 남긴 회원의 리뷰를 조회회원 이름, 리뷰 텍스트
고객 테이블 데이터 전체 조회 고객번호, 이름, 가입일자 조회 탈퇴하지 않고 2023년 이후 가입한 고객 정보 조회 가격 30,000원 이하이거나 등록일이 2023년 3월 1일 이후인 상품 조회 상태(status)가 판매중(On Sale), 품절(Out of Stock)인 상품 조회 (IN 사용) 상태(status)가 판매중, 품절이 아닌 상품 조...
Z-Score(표준점수): (관측값 - 데이터의 평균) / 표준편차 통계적으로 관측값이 평균에서 얼마나 떨어져 있는지를 표준편차 기준으로 나타내는 지표이를 통해 데이터의 상대적인 위치를 파악하고 이상값을 탐지할 수 있음 사기 거래 컬럼 (is_fraud)를 살펴봤을 때
✅ 코드 모듈화 & 패키징을 통한 데이터 전처리 효율화반복되는 전처리 코드를 매번 복사/붙여넣기 하지 말고,함수화하고 모듈화해서 필요할 때 불러오면 훨씬 효율적이고 깔끔함이를 위해 총 3개의 파일이 필요:func.py – 전처리 함수를 정의한 파일col_rename.p

분류 알고리즘 (Classification)설명변수를 바탕으로 목표 변수가 가질 수 있는 여러 범주 중 하나를 예측하는 지도학습의 대표적인 방법 핵심 개념: 주변의 '가까운' 데이터를 기준으로 분류방식:새로운 데이터 포인트가 들어왔을 때, 학습 데이터 중에서 가장 가까
선형회귀의 정의입력 변수(독립 변수)와 출력 변수(종속 변수) 사이의 선형적인 관계를 모델링하는 기법즉, 데이터를 가장 잘 설명하는 직선을 찾아내는 것광고비, 계절성, 요일 등의 데이터를 바탕으로 매출을 예측 / 수업 출석률, 과제 점수, 시험 점수를 이용해 최종 학점
데이터 정보 확인하기 데이터 클리닝 이상치 탐지 및 처리 (Outlier) 중복 데이터 처리 및 데이터 형태 반환처리 텍스트 처리

결측치, 이상치 처리 결측치가 있는 행을 출력할 수 있음 Years of Experience 컬럼에서 -1 이상치 발견 groupby(): 그룹화하여 집계, 변환, 필터링 가능 원-핫 인코딩: 범주형(categorical) 데이터를 수치형(numerical) 데이터로

데이터 병합: concat, merge, joinconcat(): 단순한 연결, 위아래로 합치기 (axis=0)merge(): 공통된 컬럼이나 인덱스를 기준으로 테이블 병합join(): 데이터프레임의 인덱스를 기준으로 병합 데이터 합칠 때 생길 수 있는 문제0번째 인덱
np.arange(): Numpy 라이브러리의 함수로 숫자 배열을 생성할 때 사용np.linspace(): 시작과 끝값 사이를 지정된 개수만큼 균등하게 나눈 값을 만듬np.arange(): 일정한 간격으로 나누고 싶을 때np.linspace(): 정확히 몇 개의 값이
클래스와 객체란? 클래스: 설계도 객체: 설계도를 바탕으로 만들어진 실체 속성: 클래스 안의 변수메소드: 클래스 안의 함수class Book: def init(self, title, author): self.title = title self
파이썬 자료형 숫자형 int, float //, %,** 복합대입연산자 문자형 이스케이프코드 len() 자료형의 종류: type 문자열 슬라이싱 List, Tuple, Set, Dictionary, Bool List 리스트명= Tuple 튜플명= del 불가 Set 집
Lambda 기본구조 매개변수와 인수 map() filter() reduce() 람다 표현식 만들 때 규칙 람다 표현식 안에서는 새 변수를 만들 수 x 변수에 할당된 람다 표현식은 괄호 생략 람다 표현식 바깥에 있는 변수를 참조하는 것은 가능 전역변수와 지역변수
모듈, 패키지, 라이브러리 비교모듈: 파이썬 코드가 들어가 있는 단일 파일 (.py파일)패키지: 여러 모듈을 폴더로 묶은 것 라이브러리: 모듈과 패키지를 포함한 전체적인 기능 집합포준모듈: 파이썬 내장 모듈1\. random 모듈: 난수 생성을 위한 함수 제공 impo
파이썬 오류 종류1\. 구문 오류 (Syntax Error)코드가 문법적으로 잘못됨. 따라서, 프로그램 실행 자체가 안 됨2\. 런타임 오류 (Runtime Error)문법적으로 문제는 없지만 프로그램 실행 중 발생하는 오류예외처리 ((Exceptional Handli

리스트✅ 1차원 리스트한 줄로 된 목록b = \[ 1, 2, 3, 4, 5, 6, 7, 8, 9 ]len(b) b2 b0 b1 \`\`\`✅ 3차원 리스트2차원 리스트가 리스트 안에 들어간 형태✅ 리스트 주요 함수min(): 리스트 함수에서 가장

Github를 사용하는 목적은? 협업 여러 사람이 같은 프로젝트를 동시에 작업할 때, 서로의 작업 내용을 공유하기에 용이 버전 관리 프로젝트의 내용을 업데이트 하기 쉬움 파일의 변경 히스토리를 확인하고, 이전 버전으로 되돌릴 수 있음 백업 로컬 컴퓨터 외에 클라우드 상에 저장하여 안전하게 보관 노트북이 고장나도 Github에 업로드된 파일은 그대로 유지 ...