profile
데이터 분석을 공부하는 🌱
post-thumbnail

SQL 정규표현식

정규표현식은 검색할 패턴을 명시하는 방법임.출처: https://dev.mysql.com/doc/refman/8.0/en/regexp.html정규표현식 튜토리얼: https://regexone.com/lesson/introduction_abcs정규표현

2021년 9월 11일
·
0개의 댓글
·
post-thumbnail

[혼자 공부하는 머신러닝 딥러닝] 훈련 세트와 테스트 세트

: 입력과 정답 데이터를 사용하는 학습 알고리즘.: 정답 없이 입력 데이터만 사용하는 학습 알고리즘. : 학습에 사용되는 데이터 : 평가에 사용되는 데이터numpy.array(리스트 이름)로 리스트를 numpy 배열로 변환할 수 있다. 코드결과numpy.random.s

2021년 8월 31일
·
0개의 댓글
·
post-thumbnail

[혼자 공부하는 머신러닝 딥러닝] 마켓과 머신러닝

도미 35마리와 빙어 14마리의 길이와 무게 데이터를 준비한다. 각 길이와 무게에 대해 도미인지, 빙어인지 정답 데이터를 준비한다. 사이킷런에서 KNeighborsClassifier 클래스의 객체를 생성한다. fit() 메소드로 훈련한다.score() 메소드로 정확도를

2021년 8월 30일
·
0개의 댓글
·
post-thumbnail

[통계 이론] z-검정(z-test)

필요성: 측정하는 단위가 달라서 원점수별 비교가 어려운 문제가 있음. 원점수(raw score)를 표준점수(standard score)로 변환함. $z = \\frac{x – μ}{σ}$

2021년 8월 28일
·
0개의 댓글
·
post-thumbnail

[Python 통계 실습] 일원 분산 분석(one-way ANOVA)

데이터 셋: 캐글 경매 데이터https://www.kaggle.com/onlineauctions/online-auctions-dataset코드결과auction.shape: (10681, 9)auction.head(3):auction.tail(3):Leven's

2021년 8월 23일
·
0개의 댓글
·
post-thumbnail

[프로그래머스] SQL 고득점 Kit - JOIN

ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는

2021년 8월 21일
·
1개의 댓글
·
post-thumbnail

SQL 집계 함수 문제 풀이

문제Query a count of the number of cities in CITY having a Population larger than 100,000.풀이출처: https://www.hackerrank.com/challenges/revising-aggr

2021년 8월 18일
·
0개의 댓글
·
post-thumbnail

SQL 집계 함수 개념 정리

특정한 기준을 충족하는 rows의 수 리턴함.NULL 값은 세지 않음. 코드<예시>Table: Customers코드코드 결과5코드결과5코드결과3<예제>문제Query a count of the number of cities in CITY having a Pop

2021년 8월 18일
·
0개의 댓글
·
post-thumbnail

[Python 통계 실습] t-검정(t-test)

0. 데이터 준비 데이터 셋: 캐글 중고차 데이터 https://www.kaggle.com/austinreese/craigslist-carstrucks-data 1. 독립표본 t 검정(t-test) | | T | dof

2021년 8월 17일
·
0개의 댓글
·
post-thumbnail

SQL JOIN 문제 풀이

<예제> Hackerrank - Symmetric Pairs문제You are given a table, Functions, containing two columns: X and Y.Two pairs (X1, Y1) and (X2, Y2) are said to be

2021년 8월 15일
·
0개의 댓글
·
post-thumbnail

SQL JOIN 개념 정리

두개 이상 테이블에서 테이블 사이 연관된 colum을 바탕으로 rows를 결합할 때 사용함. 두 테이블에 모두 매치되는 값을 가진 rows를 리턴함.코드왼쪽 테이블의 모든 rows를 리턴하고, 오른쪽 테이블에서는 왼쪽 테이블에 매치되는 rows를 리턴함.코드오른쪽 테이

2021년 8월 15일
·
0개의 댓글
·
post-thumbnail

[통계 이론] 통계적 가설 검정

귀무가설(the null hypothesis): 가설 검정의 직접적인 대상이 되는 가설. 기각하고자 하는 가설. 예) 대립가설(the alternative hypothesis): 귀무가설이 기각될 때 받아들여지는 가설. 직접적으로 검정의 대상이 되지 않음. 예)⚠️ 주

2021년 8월 13일
·
0개의 댓글
·
post-thumbnail

[통계 이론] 표집분포와 중심극한정리

표집: 모집단에서 표본을 추출모집단에서 각 사례가 동일한 확률로 추출됨. 모집단의 모든 사례를 같은 확률로 추출함. 예)모집단 사례 모두에게 번호를 부여하고 표본의 수만큼 번호를 무작위로 뽑아서 표본을 추출함. 첫번재 사례를 무작위로 추출한 뒤, 매번 k번째 사례를 추

2021년 8월 12일
·
0개의 댓글
·
post-thumbnail

[통계 이론] 모집단과 표본

➡️ 대부분의 경우 집단 전체에 대한 전수조사가 가능하지 않으므로 표본을 통해 모집단에 대해 추론함. ⚠️ 주의: 표본의 모수, 모집단의 통계량으로 표현하지 않도록 하기. 표집: 모집단에서 표본을 추출모집단에서 각 사례가 동일한 확률로 추출됨. 모집단의 모든 사례를 같

2021년 8월 12일
·
0개의 댓글
·
post-thumbnail

[프로그래머스] SQL 고득점 Kit - IS NULL

NULL VALUE값이 없음을 의미함. ⚠️ 주의: 값이 0이 아님. 값이 비어 있는 것. IS NULL, IS NOT NULL NULL VALUE인지 확인하기 위해 IS NULL 혹은 IS NOT NULL을 사용함. ⚠️ 주의: 컬럼명 = NULL 형태로 쓰지 않음.

2021년 8월 11일
·
0개의 댓글
·
post-thumbnail

[Python 통계 실습] 기술 통계

1) 평균vehicles.price.mean()2) 중앙값3) 최빈값

2021년 8월 11일
·
0개의 댓글
·
post-thumbnail

[통계 이론] 기술 통계

기술 통계(descriptive statistics): 자료를 요약(summarize)하고, 정리(organize)하여 이해하기 쉽게 제시 1. 중심경향값(central tendency) 1) 평균(mean): 자료의 모든 숫자를 더한 뒤 값의 개수로 나눈 값 분포에

2021년 7월 22일
·
0개의 댓글
·
post-thumbnail

SQL 쿼리 작성 / 실행 순서

1) SELECT2) FROM3) WHERE4) GROUP BY5) HAVING6) ORDER BY7) LIMIT참고: https://mode.com/sql-tutorial/sql-having/

2021년 7월 5일
·
0개의 댓글
·
post-thumbnail

[프로그래머스] SQL 고득점 Kit - GROUP BY

ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는

2021년 6월 21일
·
0개의 댓글
·
post-thumbnail

[프로그래머스] SQL 고득점 Kit - SUM, MAX, MIN

ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는

2021년 6월 20일
·
0개의 댓글
·