# dataanalysis

SQL Fundamental2 (Join)
SQL의 기본 문법은 다음 글 참조. 글join은 관계형 DB에서 기본이자 가장 중요한 기능이다.두 개 이상의 테이블을 묶어 데이터를 추출하는 기능.관계형 DB에서 join을 이용하여 서로 다른 테이블 간의 원하는 정보를 얻을 수 있음.emp 테이블: 직원의 이름, 직

데이터 관계 분석 (수치형, 범주형)
이번 글에 있는 내용을 익힌 후 이 글의 라이브러리를 사용하면 편하게 데이터 관계를 분석할 수 있습니다.설치 - %pip install rock-pre-h$\\mu$ (뮤) = 모평균$\\sigma^2$ (시그마 제곱) = 모분산$X$ = 표본평균$s^2$ = 표본분산

요일,계절은 명목형일까? 순서형일까?:변수 및 척도의 종류
머신러닝의 모델링에서 사용할 '변수'를 선택할 때 각각의 변수마다 종류를 짚고 넘어가는 것은 중요하다. 변수의 종류에 따라 원핫인코딩 등 전처리 유무 및 방식이 달라지기 때문. 이번 포스팅을 통해 변수의 종류와 척도의 종류를 정리해보자! 변수의 종류 척도의 종류

코호트 분석
주요 퍼널에 대한 전환률 지표는 그 자체로 중요하지만, 전체 사용자를 대상으로 한 전환율을 살펴보는 것만으론은 인사이트가 제한적이며, 전환율을 개선하기 어렵다. 그렇기에, 전환율 지표는 전체보다 여러 그룹으로 쪼개서 볼 때 훨씬 더 강력한 의미를 지니게 된다.예를 들어

[Python] statsmodels를 이용한 모델링
통계모델을 추정하기 위해 smf.ols 함수를 사용 여기서 ols 란 Ordinary Least Squares(범용최소제곱법) 의 약자로 모집단의 분포가 정규분포임을 가정했을때 최대우도법의 결과는 최소제곱법의 결과와 일치 온도로 인한 맥주 판매량 추정 종속변수:

골프 데이터 분석01
# 변수 선택 알고리즘 # 분류 알고리즘 (CART, kNN, SVM, Logistic regression) # PCA를 통한 데이터 시각화 # 의사결정나무를 통한 스윙 교정 제안 # 최적화(Optimization) 기법을 활용한 스윙 교정 제안
데이터 이해 - 1
https://code-challenge.tistory.com/entry/ADP%ED%95%84%EA%B8%B0-1-%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%9D%98-%EC%9D%B4%ED%95%B4-%EC%9A%94%EC%95%BD-1?cat
데이터 분석 : 계획과 무계획
데이터를 처음 받고 분석을 시작하려 할 때 어떻게 시작하는 것이 가장 효율적일까? 계획 데이터셋에 대한 기본적인 정보를 알고 있고 어떤 분석을 진행할지 어느정도의 계획이 잡혀있을때 계획이 없을 때 데이터셋에 대한 기본적인 정보가 없고 어떤 분석을 진행할지에 대하여 계획이 없을때 데이터셋의 범위 및 분할여부 체크 데이터 불러오기 컬럼의 정의 및 각 ...