1. Decision Tree Decision Tree의 분할 기준 (Split Crieterion) 정보 엔트로피 개념 : 확률 분포의 무질서도나 불확실성을 수치적으로 묘사 $Entropy = \sumk^m -pi\log2pi$ $\Ri
유도 $Y= AX$$\\Rightarrow A^TAX = A^TY$$\\Rightarrow X = (A^TA)^{-1}A^TY$성능 $E =y-f(x)^2$실행import statsmodels.formula.api as smflm_model = smf.ols(formu
sklearn dataset 활용from sklearn.datasets import load_irisiris = load_iris()$\\Rightarrow$ data, feature_names, target, target_names 등을 key 값으로 갖는 dict
TABLEAU 시각화 강의 수강데이터 결합UNION결합 테이블의 구조가 같아야 함 : 필드 수, 필드 명, 데이터 유형 일치방법 Drag & Drop\* 마우스 우클릭 하여 편집 가능함 JOIN방법Logical Table 더블 클릭 -> Physical TableJoi
오늘 학습 계획 통계 : 자료분석 강의 수강 학습 내용 1. 범주형 자료분석(Chi Square) 예시 대선에서 각 정당의 연령대별 지지율이 지난 대선의 지지율과 동일한가? 성별에 따라서 선호하는 핸드폰 회사가 동일한가? 적합도 검정 관측된 값들이 추론
통계 : 가설 검정 강의 수강 가설 : 주어진 사실 또는 조사하려고 하는 사실에 대한 주장 또는 추측.통계학에서는 모수를 추정할때 모수가 어떠하다는 증명하고 싶은 추측이나 주장.가설의 종류 귀무 가설 $H_0$기존의 사실대립가설과 반대되는 가설대립 가설 $H_1$ 데
학습 내용 1. 추정 추정 : 표본으로 추출된 통계량을 모집단의 근사값으로 사용하는 것 추정량 : 표본 평균으로 모평균을 추정할 때 표본 평균을 모평군에 대한 추정량이라고 함. 추정 방법 점 추정 : 모수를 하나의 특정 값으로 추정 일치성 표본의
오늘 학습 계획 통계 : 모집단과 표본 강의 수강 학습 내용 1. 모집단과 표본 모집단 : 평균 $\mu$ / 분산 $\sigma ^2$ 표본 : 평균 $\bar X$ / 분산 $S^2$ 표본 추출(sampling) : 모집단으로부터 표본을 추출하는 것. 표본
DS School Week 9-3 통계 : 연속 확률 분포 오늘 학습 계획 통계 강의 수강 : 연속형 확률 분포 학습 내용 1. 연속 확률 분포 확률 밀도 함수(PDF) 정의 모든 X에 대해서 $f(x) \ge 0$ $P(X \in(-\infin
학습 계획 통계 : 데이터 강의 수강 학습 내용 1. 데이터 변수 : 조사 목적에 따라 관측된 자료값 질적 변수 : 데이터를 범주로 구분할 수 있는 것 양적 변수 : 이산형 변수(시험 점수 등) / 연속형 변수 (신장 등) EDA (Exploratory
오늘 학습 계획 Git : Log & Diff 강의수강 Git : Merge & Conflict 강의수강 Git : Tag 강의수강 Git : README 강의수강 학습내용 1.Log와 Diff Git Graph vscode의 extension Git Log
오늘 학습 내용 학습 내용 1. Git 이론 Git이란? 버전관리 시스템의 한 종류 버전관리(형상관리) 용어 Version Control Systems (VCS) Configuration Management Systems 특징 Sourc
SQL 강의 수강(KEY, Function, SUbqyery)PRIMARY KEY(기본키)특성테이블의 각 레코드 식별 중복값, NULL값 사용 불가테이블당 하나의 기본키 생성테이블 생성시CREATE TABLE tbname(colname dtype NOT NULL, co
SQL 강의 수강 (AWS RDS, SQL File, Python with MYSQL)초기 세팅 개정 개설 MySQL RDS 생성\-> 스토리지 자동 조정 활성화 해제 \-> 퍼블릭 엑세스 체크\-> 데이터 베이스 포트 확인\-> 자동 백업 해제 \-> 삭제 방지 활성
SQL 강의 수강 (UNION, JOIN, CONCAT) UNION : 여러개의 SQL문을 합쳐 하나의 SQL문으로 만들어줌 (칼럼의 개수는 동일해야 함) UNION : 중복값 제거 UNION ALL : 중복값 포함 JOIN : 두개 이상의 테이블을 결합하는 것 INN
오늘 학습 내용 SQL(databases, table) 강의 수강 학습 내용 1. MySQL 설치 및 실행 terminal 경로 간소화 방법 - terminal(간소화) 2. Databases 정의 Databases : 데이터의 집합체(excel, json
len(str) : 문자열의 길이를 반환content.find(str) : content내 특정 문자열의 위치 반환str.isdigit() : 숫자이면 True, 아니면 Falsestr.replace('strA', 'strB', n) : n개의 strA를 strB로 교
오늘 학습 계획 인구 분석 EDA 강의 수강 EDA 학습 과제 수행 학습 내용 1. EDA와 카르토그램 ※ 기타 Pandas 함수 NaN값 처리 : n값으로 NaN값을 채움 : 앞의 값으로 NaN값을 채워줌 : 뒤의 값으로 NaN값을 채워줌 stack
EDA : NaverAPI 강의 수강네이버 개발자 페이지 (https://developers.naver.com/main/) 오픈 API 이용 신청 \* 사용 API 선택Client ID 와 Client Secret 확인검색 결과 반환 코드 입력 (python)