머신러닝 이상치(outlier) 탐지 및 제거 통계적 기법 : 데이터가 정규분포를 따른다고 가정하고 평균에서 ±3σ(표준편차) 범위를 벗어나는 값을 이상치로 간주 -> 직관적이고 간단하나,정규성 가정이 틀릴수 있음. 박스플롯(boxplot) : 사분위수를 이용
머신러닝이란?컴퓨터가 인간의 개입없이(또는 최소한) 데이터를 학습하여 패턴을 찾아내고, 새로운 데이터에 대해 예측이나 분류를 수행.머신러닝의 3대요소1) 데이터(양과 질 모두 중요)2) 알고리즘(=모델)3) 컴퓨팅 파워머신러닝,AI,딥러닝의 관계인공지능(AI) : 사람
📊통계 신뢰구간과 가설검정 가설검정 새로운 약물이 기존 약물보다 효과가 있는지 검정 이 때 새로운 약물은 기존 약물과 큰 차이가 없다는 것이 귀무가설 대립가설 은 새로운 약물이 기존 약물과 대비해 교과가 있다는 것 T검정 두 집단간의 평균 차이가 통계적으로 유의
통계 라이브세션 4회차 상관관계와 선형회귀 상관과 회귀 상관관계 : 두 연속형 변수 사이에 함께 중가/감소 하는 패턴이 있는지를 수치로 표현한것. -1상관관계 는 인과관계 가 아니다. 상관관계 확인방법 -시각화 산점도 : 두 연속형 변수의 관계를 시각적으로 확인하는
모집단과 표본 모집단 : 관심의 대상이 되는 전체집단 EX) 한 국가의 모든 성인 표본 : 모집단에서 추출한 일부 EX) 그 국가의 성인 중 일부를 조사 표본을 사용하는 이유 1) 현실적인 제약 : 비용과 시간, 접근성 2) 대표성 : 잘 설계된 표본은
통계 라이브세션 3회차 3강 : 다양한 가설검정 방법 T검정 1개 또는 2개의 집단평균(정규기반 추정량) 비교할때 사용하는 대표적인 모수 검정법 T검정의 전제 -모수 검정에 속함 보통 정규분포에서 나온 데이터라는 전제를 가짐 -> 정규성 -독립된 두 집단의 평균을
통계 라이브세션 2회차 2강 : 신뢰구간과 가설검정 추정 빈도주의 : 반복했을때 평균적으로 어떤 결과가 나올지 생각 베이지안 : 주어진 정보에서 얼마나 확신할수 있는지를 표현 모집단과 표본 평균 μ(뮤), 표준편차 σ(시그마) 표본오차 : 표본 평균과 모집단 평
통계 라이브세션 1회차 상관관계가 있다고 해서 인과관계가 있는건 아니다. 🔥가장 중요한 2가지🔥 1) AB테스트 2) X에 영향을 주는건 무엇일까?(인과관계, 무엇이 무엇에게 영향을 얼만큼 주고 있는가?) 통계 기초 통계 : 통할 통, 셀 계 수많은 데이터
통계 1️⃣ 기술통계와 추론통계 기술통계 : 평균, 중앙값,분산,표준편차 등을 사용함(데이터를 특정 대표값으로 요약) -분산 : 데이터 값들이 평균으로부터 얼마나 떨어져 있는지 나타내는 척도로 데이터의 흠터짐 정도 측정 -표준편차 : 평균에서 얼마나 떨어져 있는지
서울시 공공데이터를 바탕으로 페르소나별 추천 매물을 만드는 작업을 하고 있음. 나는 서울연구원 등 서울시 자료를 수집하고, 시각화 자료를 만들고 있다.
페르소나 \- 3인 가구 \- 세대원 수 : 3인(아이 나이 : 초등학생) \- 평수 : 34평 \- 종류 : 아파트(신/구축) \- 예산 : 10억 ~ 20억 \- 목적 : 실거주 \-
팀 역할 분담 (데이터 분석, 시각화, PPT 제작, 코드 정리, 발표 준비) <span style="background:- 주제 정하기데이터셋 구조 확인주제별 가이드라인 정독 후 분석 방향 아이디어 브레인스토밍 🚛 미국 교통부 물류 데이터(FAF5.7.1)
데이터 전처리 라이브세션 1. 파이썬 데이터 결합 Merge : 판다스의 함수 중 하나로, 공통컬럼을 기준으로 테이블을 병합하여 sql 구문의 join과 가장 유사함. 주요옵션(파라미터 라고도 부름) on : 조건 컬럼이 한개인지 여러개인지 how : 어떤 조인
데이터 전처리 라이브세션 1️⃣ python 언어적 특성 이해 | 구분 | 🟥 SQL | 🟦 Python | |------|-------------|----------------| | 언어 | 절차지향 언어 | 객체지향 언어 | | 역사 | 개발: 1970년표준
프로그래머스 문제 1. USER_INFO 테이블에서 2021년에 가입한 회원 중 나이가 20세 이상 29세 이하인 회원이 몇 명인지 출력하는 SQL문을 작성해주세요. > ▶ 정답쿼리 : > ▶ 피드백 : 만약 내가 처음 쓴대로 case when 문을 사용하고
파이썬 라이브세션 > ### 표준 라이브러리 외장, 외부 라이브러리(pip install pandas) : 파이썬을 설치할때 자동으로 설치되는 라이브러리 > > import 가져올 라이브러리 이름 ex. import random import d
파이썬 라이브세션(컴프리헨션 & 예외처리) > #### 1 컴프리헨션(comprehension) 리스트 컴프리헨션 [표현식 for qustn in 반복대상 if 조건문] ※주의사항 : 식 자체가 너무 복잡하면 사용하면 안됨 딕셔너리 컴프리헨션 {키
파이썬 복습 > 1) 가상환경 셋팅 : python -m venu venu(가상환경 이름) 활성화 : venu\script\activate ->윈도우 버전 비활성화 : deactivate > 2) 자료형 숫자형 : 정수형(int), 실수(float)