제로베이스의 데이터 스쿨 15기가 시작되었다. 사실 지난 3달동엔 12기로 나름대로 시간을 쪼개가며 열심히 수강했다고는 했으나, 진도는 계속 뒤쳐지고.. 프로젝트에 들어갈때 쯤 도저히 하나의 과제를 수행해 낼 조건이 되질 않는다고 생각했다. 5월까지 바쁜 업무 일정도
파이썬 기초 ~8 강의 수강데이터 타입에 따른 메모리 크기를 결정하기 위해 자료형 구분 종류 정수형 int실수형 float정수형과 달리 17~18 번째에서 손실됨문자형 str숫자(정수/실수)나 논리형 자료를 따옴표로 묶으면 문자열로 인식함.논리형 bool자료형 관련
제목 : 조건식(삼항연산자)조건식이란, 어떤 조건에 따라 실행이 분기되는 식.A if 조건식 else B → 조건식의 결과가 True이면 A 실행, False 이면 B 실행.조건문조건문의 기본 코드블럭 & 들여쓰기if문 : 단일 조건 if~else문 : 양자 택일 i
파이썬 기초 문제풀이 1~5 datetime 모듈 datetime.datetime.today() = 년-월-일 시-분-초 datetime.datetime.today.year = 년 datetime.datetime.today.month = 년 content.find(s
파이썬 중급 1~6 수강함수의 종류 내장함수 : 파이썬에서 기본적으로 제공하는 함수 예) print(), input()사용자 함수 : 사용자가 직접 선언하는 함수 함수의 선언과 호출선언 호출인수와 매개변수 : 함수 호출시 함수에 데이터를 전달함. 인수 → 매개변수 인
파이썬 중급 ~9 강의 수강객체지향 프로그래밍 이란?객체를 이용한 프로그램으로 객체는 속성과 기능으로 구성됨.객체(Object) = 속성(Attribute) + 기능(Function)객체는 클래스를 통해 생성 (클래스는 객체를 만들기 위한 틀)객체 사용의 장점 : 코드
파이썬 중급 ~9 강의 수강 기본 함수 open() → read() or write() → close()file = open('경로/파일명.txt', 'mode')file.write('str') or file.read()file.close()쓰기 ※ file.writ
파이썬 중급 문제풀이 ~4 (클래스)재귀함수: 내가 나를 다시 호출하는 함수예) factorial 함수format(n1, n2)https://blockdmask.tistory.com/424수학 강의 수강
파이썬 중급 문제풀이 ~8아직도 Exception 클래스 개념이 정확히 숙지되지 못한것 같다. 다시 강의를 수강하거나, 유튜브 영상을 찾아봐야겠다. sleep(n) : 다음 코드 실행을 n초 미루는 함수 \* from time import sleep random.shu
자료구조 ~4 강의 수강 str 데이터형은 iterable한 데이터로, iterable데이터들을 사용할 수 있는 함수 및 기능을 활용할 수 있다. 예) len(str), enumerate(str)자료구조란? 컨테이너 자료형의 데이터 구조리스트 , 튜플 ( ), 딕셔너
자료구조 5~7 강의 수강자료구조 8~9 강의 수강 리스트와 비슷하지만 아이템 변경이 불가하다.선언 ( item1, item2, ... ) \* 괄호 생략 가능함 조회 리스트와 동일하게 자동으로 부여되는 번호표(인덱스)를 통해 조회아이템의 존재 유/무 반환 : it
자료구조 문제풀이 1~3 수강알고리즘 ~2 강의 수강dictionary 데이터형에서 dict.keys(), dict.values(), dict.items()등은 list 형태가 아니라 dict 형태가 된다. for key, vakye in dict.items() 로 반
오늘 학습 계획 알고리즘 강의수강 1~7 학습 내용 1. 검색 알고리즘 선형 검색 선형으로 나열되어 있는 데이터를 순차적으로 스캔하면서 원하는 값을 찾는다. 보초법 마지막 인덱스에 찾으려는 값을 추가해서 찾는 과정을 간략화 한다. 이진 검색 정렬되
자료구조 알고리즘 문제풀이파이썬 테스트data.isalpha() : 문자인지 판별하는 함수EDA CCTV
EDA 기초EDA 서울시 CCTV 현황 강의 수강 ENV 환경 설정 : 미니콘다(미니포지) 설치cd Downloads - bash Miniforge - home brew 설치ENV 실행 conda env list conda activate env_name
오늘 학습 계획 EDA 서울시 범죄 현황 분석 강의 수강 1. EDA와 Pandas : pivot table pivot table 기능 피봇 테이블이란? 선택한 index, column등을 기준으로 재정렬된 숫자 데이터의 계산 값을 구하는 함수. 기본 확
오늘 학습 계획 EDA 웹데이터 분석 강의 수강 학습 내용 1. EDA와 BeautifulSoup BeautifulSoup이란? (html) 태그로된 문서를 해석하는 기능을 가진 모듈 불러오기 파일 읽기 html 파일 웹 페이지 웹페이지 2
유가분석 강의 수강selenium이 필요할 때(Beautiful Soup만으로 해결할 수 없을 때)접근할 웹 주소를 알 수 없을 때자바스크립트를 사용하는 웹페이지웹 브라우저로 접근하지 않으면 안될때selenium이란웹 브라우저를 원격 조작하는 도구 스크롤, 문자의 입력
EDA : NaverAPI 강의 수강네이버 개발자 페이지 (https://developers.naver.com/main/) 오픈 API 이용 신청 \* 사용 API 선택Client ID 와 Client Secret 확인검색 결과 반환 코드 입력 (python)
오늘 학습 계획 인구 분석 EDA 강의 수강 EDA 학습 과제 수행 학습 내용 1. EDA와 카르토그램 ※ 기타 Pandas 함수 NaN값 처리 : n값으로 NaN값을 채움 : 앞의 값으로 NaN값을 채워줌 : 뒤의 값으로 NaN값을 채워줌 stack
len(str) : 문자열의 길이를 반환content.find(str) : content내 특정 문자열의 위치 반환str.isdigit() : 숫자이면 True, 아니면 Falsestr.replace('strA', 'strB', n) : n개의 strA를 strB로 교
오늘 학습 내용 SQL(databases, table) 강의 수강 학습 내용 1. MySQL 설치 및 실행 terminal 경로 간소화 방법 - terminal(간소화) 2. Databases 정의 Databases : 데이터의 집합체(excel, json
SQL 강의 수강 (UNION, JOIN, CONCAT) UNION : 여러개의 SQL문을 합쳐 하나의 SQL문으로 만들어줌 (칼럼의 개수는 동일해야 함) UNION : 중복값 제거 UNION ALL : 중복값 포함 JOIN : 두개 이상의 테이블을 결합하는 것 INN
SQL 강의 수강 (AWS RDS, SQL File, Python with MYSQL)초기 세팅 개정 개설 MySQL RDS 생성\-> 스토리지 자동 조정 활성화 해제 \-> 퍼블릭 엑세스 체크\-> 데이터 베이스 포트 확인\-> 자동 백업 해제 \-> 삭제 방지 활성
SQL 강의 수강(KEY, Function, SUbqyery)PRIMARY KEY(기본키)특성테이블의 각 레코드 식별 중복값, NULL값 사용 불가테이블당 하나의 기본키 생성테이블 생성시CREATE TABLE tbname(colname dtype NOT NULL, co
오늘 학습 내용 학습 내용 1. Git 이론 Git이란? 버전관리 시스템의 한 종류 버전관리(형상관리) 용어 Version Control Systems (VCS) Configuration Management Systems 특징 Sourc
오늘 학습 계획 Git : Log & Diff 강의수강 Git : Merge & Conflict 강의수강 Git : Tag 강의수강 Git : README 강의수강 학습내용 1.Log와 Diff Git Graph vscode의 extension Git Log
학습 계획 통계 : 데이터 강의 수강 학습 내용 1. 데이터 변수 : 조사 목적에 따라 관측된 자료값 질적 변수 : 데이터를 범주로 구분할 수 있는 것 양적 변수 : 이산형 변수(시험 점수 등) / 연속형 변수 (신장 등) EDA (Exploratory
DS School Week 9-3 통계 : 연속 확률 분포 오늘 학습 계획 통계 강의 수강 : 연속형 확률 분포 학습 내용 1. 연속 확률 분포 확률 밀도 함수(PDF) 정의 모든 X에 대해서 $f(x) \ge 0$ $P(X \in(-\infin
오늘 학습 계획 통계 : 모집단과 표본 강의 수강 학습 내용 1. 모집단과 표본 모집단 : 평균 $\mu$ / 분산 $\sigma ^2$ 표본 : 평균 $\bar X$ / 분산 $S^2$ 표본 추출(sampling) : 모집단으로부터 표본을 추출하는 것. 표본
학습 내용 1. 추정 추정 : 표본으로 추출된 통계량을 모집단의 근사값으로 사용하는 것 추정량 : 표본 평균으로 모평균을 추정할 때 표본 평균을 모평군에 대한 추정량이라고 함. 추정 방법 점 추정 : 모수를 하나의 특정 값으로 추정 일치성 표본의
통계 : 가설 검정 강의 수강 가설 : 주어진 사실 또는 조사하려고 하는 사실에 대한 주장 또는 추측.통계학에서는 모수를 추정할때 모수가 어떠하다는 증명하고 싶은 추측이나 주장.가설의 종류 귀무 가설 $H_0$기존의 사실대립가설과 반대되는 가설대립 가설 $H_1$ 데
오늘 학습 계획 통계 : 자료분석 강의 수강 학습 내용 1. 범주형 자료분석(Chi Square) 예시 대선에서 각 정당의 연령대별 지지율이 지난 대선의 지지율과 동일한가? 성별에 따라서 선호하는 핸드폰 회사가 동일한가? 적합도 검정 관측된 값들이 추론
8. 머신러닝 알고리즘
TABLEAU 시각화 강의 수강데이터 결합UNION결합 테이블의 구조가 같아야 함 : 필드 수, 필드 명, 데이터 유형 일치방법 Drag & Drop\* 마우스 우클릭 하여 편집 가능함 JOIN방법Logical Table 더블 클릭 -> Physical TableJoi
sklearn dataset 활용from sklearn.datasets import load_irisiris = load_iris()$\\Rightarrow$ data, feature_names, target, target_names 등을 key 값으로 갖는 dict
유도 $Y= AX$$\\Rightarrow A^TAX = A^TY$$\\Rightarrow X = (A^TA)^{-1}A^TY$성능 $E =y-f(x)^2$실행import statsmodels.formula.api as smflm_model = smf.ols(formu
1. Decision Tree Decision Tree의 분할 기준 (Split Crieterion) 정보 엔트로피 개념 : 확률 분포의 무질서도나 불확실성을 수치적으로 묘사 $Entropy = \sumk^m -pi\log2pi$ $\Ri