Basic of Regression 지도학습1 - 분류(Classification) -> 출력이 0 혹은 1 지도학습2 - 회귀(Regression) -> 출력이 연속된 값(continuous value)임 비지도학습1 - 군집 비지도학습2 - 차원 축소 회귀 : e
모델평가의 개념 회귀모델은 실제 값과의 에러치를 가지고 계산해서 평가 가능 분류모델의 평가 항목이 조금 다양함(정확도, 오차행렬, 정밀도, 재현율, ..) 이진 분류모델(0,1을 맞힘)의 평가는 4가지(TP, FN, TN, FP) > TP (True Positive)
label_encoder(문자->숫자로 변환) 데이터 만들기 label encoder란 대상이 되는 문자로 된 데이터를 숫자-카테고리컬한 데이터로 변환해줌 -> array(['a', 'b', 'c'], dtype=object) -> 'a'-0, 'b'-1, 'c
머신러닝(Machine Learning)이란 명시적으로 프로그래밍하지 않고도 컴퓨터에 학습할 수 있는 능력을 부여하는 학문 (과거 데이터로부터 얻은) 경험이 쌓여감에 따라 주어진 task의 성능이 점점 좋아질 때, 컴퓨터 프로그램은 경험으로부터 학습한다고 할 수 있음
퀵 테이블 계산 누계 : 이전까지 값들의 누적 차이 : 이전 값과의 차이 구성 비율 : 합해서 100%가 됨 (합 100%의 기준은 '테이블 계산 편집'에서 가능) 순위 : 각각의 순위를 매김 비율 차이 : 이전 값과의 퍼센트 차이 또는 성장률 전년 대비 성장률 : 같
기본 차트 테이블 : 색상으로 시각화 막대차트 : 색상과 레이블 사용 라인차트 : 시간별 추세 확인, 미래 값 예측 가능 파이차트 : 원 안에서 점유율, 비중을 표시할 때 사용 (비중을 표시하고자 하는 것을 '각도'지정) 트리맵차트 : 전체에서의 점유율, 비중 표시.
Digital Transformation 데이터 시각화 : 데이터에 색상과 모양, 사람들의 시선을 끌 수 있는 요소를 배치해 데이터를 효과적이고 직관적으로 표현하는 것 효과적인 시각화 : 전달하고자 하는 메시지를 정하고 불필요한 부분은 생략 태블로는 시각화에 있어서 중
가설검정 가설 검정 = 가설(Hypothesis) + 검정(Testing) 가설(hypothesis) : 주어진 사실 또는 조사하려고 하는 사실에 대한 주장 또는 추측을 가설이라고 함 통계학에서는 특히 모수를 추정할 때, 모수가 어떠하다는 증명하고 싶은 추측이나 주장을
모집단과 표본 모집단(Population) : 모평균, 모분산 표본(Sample) : 표본평균, 표본분산 표본추출(Sampling) : 모집단으로부터 표본을 추출하는 것을 의미. 표본으로부터 그 특성을 찾아내고 모집단의 특성을 추론하고자 함. 모집단에서 표본을 추출하
Introduce 통계학(statistics) : 산술적 방법을 기초로 하여, 주로 다량의 데이터를 관찰하고 정리 및 분석하는 방법을 연구하는 수학의 한 분야 기술통계학(descriptive statistics) : 데이터를 수집하고, 수집된 데이터를 쉽게 이해하고 설
Git Graph : Repository의 버전과 Branch 등을 비주얼적으로 보여줌 Cat 명령어 -> 해당 파일의 내용을 읽어줌 -> 해당 파일이 존재한다면 아래 내용을 덮어써주고(수정), 존재하지 않는다면 파일을 새로 만들고 아래 내용을 입력해 줌 ->
버전관리 버전관리 시스템(형상관리) -> Configuration Management Systems / Version Control Systems 버전관리의 필요성 -> Source Data + History(이력)을 기반으로 -> 협업, 작업추적, 복구 등이 가능
Aggregate Functions (집계함수) 여러 칼럼 혹은 테이블 전체 칼럼으로부터 하나의 결과값을 반환하는 함수 > COUNT : 총 개수 계산 SUM : 합계 계산 AVG : 평균 계산 MIN : 최솟값 MAX : 최댓값 FIRST : 첫 번째 결과값 LAS
Python with MySQL jupyter notebook이나 vscode로 실행, ds_study 환경에서 작업 jupyter notebook, mysql 모두 sql_ws 폴더에서 시작 AWS RDS로 생성한 database-1을 모두 사용 Python에서 M
AWS RDS (Amazon Relational Database Service) AWS에서 제공하는 관계형 데이터베이스 서비스 AWS - 서비스 - 데이터베이스 - RDS (경로) AWS RDS 외부 접속 (cmd로) 무료 사용 기간 750시간을 알뜰히 쓰기 위해,
셀프 주유소가 정말 저렴한지 알아보기https://www.opinet.co.kr/searRgSelect.do사이트 구조 확인목표 데이터: 주유소 이름, 주소, 브랜드(상호명),휘발유 가격, 경유 가격,셀프 여부, 세차장 여부, 충전소 여부, 경정비 여부, 편의
Union 여러 개의 SQL문을 합쳐서 하나의 SQL문으로 만들어주는 방법 (주의- 칼럼의 개수가 같아야 함) UNION : 중복된 값을 제거하여 알려줌 UNION ALL : 중복된 값도 모두 보여줌 -> 중복값 상관없이 그대로 합쳐서 보여줌 -> 중복값을 제거하여
Comparison Operators (비교 연산자) A B : A가 B보다 작거나 크다 (같지 않다) A != B : A와 B가 같지 않다 논리연산자 AND : 조건을 모두 만족하는 경우 TRUE OR : 조건을 하나라도 만족하는 경우 TRUE NOT : 조건을
스타벅스 매장 정보 가져오기\-> .class 밑에 li 밑에 a를 지정from bs4 import BeautifulSouphtml = driver.page_sourcedom = BeautifulSoup(html, 'html.parser')seoul_list = dom
Table 생성zerobase 라는 이름의 데이터베이스 생성CREATE TABLE tablename( columnname datatype, columnname datatype, ...)CREATE TABLE mytable(id int, name varchar