정규표현식은 검색할 패턴을 명시하는 방법임.출처: https://dev.mysql.com/doc/refman/8.0/en/regexp.html정규표현식 튜토리얼: https://regexone.com/lesson/introduction_abcs정규표현
: 입력과 정답 데이터를 사용하는 학습 알고리즘.: 정답 없이 입력 데이터만 사용하는 학습 알고리즘. : 학습에 사용되는 데이터 : 평가에 사용되는 데이터numpy.array(리스트 이름)로 리스트를 numpy 배열로 변환할 수 있다. 코드결과numpy.random.s
도미 35마리와 빙어 14마리의 길이와 무게 데이터를 준비한다. 각 길이와 무게에 대해 도미인지, 빙어인지 정답 데이터를 준비한다. 사이킷런에서 KNeighborsClassifier 클래스의 객체를 생성한다. fit() 메소드로 훈련한다.score() 메소드로 정확도를
필요성: 측정하는 단위가 달라서 원점수별 비교가 어려운 문제가 있음. 원점수(raw score)를 표준점수(standard score)로 변환함. $z = \\frac{x – μ}{σ}$
데이터 셋: 캐글 경매 데이터https://www.kaggle.com/onlineauctions/online-auctions-dataset코드결과auction.shape: (10681, 9)auction.head(3):auction.tail(3):Leven's
ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는
문제Query a count of the number of cities in CITY having a Population larger than 100,000.풀이출처: https://www.hackerrank.com/challenges/revising-aggr
특정한 기준을 충족하는 rows의 수 리턴함.NULL 값은 세지 않음. 코드<예시>Table: Customers코드코드 결과5코드결과5코드결과3<예제>문제Query a count of the number of cities in CITY having a Pop
0. 데이터 준비 데이터 셋: 캐글 중고차 데이터 https://www.kaggle.com/austinreese/craigslist-carstrucks-data 1. 독립표본 t 검정(t-test) | | T | dof
<예제> Hackerrank - Symmetric Pairs문제You are given a table, Functions, containing two columns: X and Y.Two pairs (X1, Y1) and (X2, Y2) are said to be
두개 이상 테이블에서 테이블 사이 연관된 colum을 바탕으로 rows를 결합할 때 사용함. 두 테이블에 모두 매치되는 값을 가진 rows를 리턴함.코드왼쪽 테이블의 모든 rows를 리턴하고, 오른쪽 테이블에서는 왼쪽 테이블에 매치되는 rows를 리턴함.코드오른쪽 테이
귀무가설(the null hypothesis): 가설 검정의 직접적인 대상이 되는 가설. 기각하고자 하는 가설. 예) 대립가설(the alternative hypothesis): 귀무가설이 기각될 때 받아들여지는 가설. 직접적으로 검정의 대상이 되지 않음. 예)⚠️ 주
표집: 모집단에서 표본을 추출모집단에서 각 사례가 동일한 확률로 추출됨. 모집단의 모든 사례를 같은 확률로 추출함. 예)모집단 사례 모두에게 번호를 부여하고 표본의 수만큼 번호를 무작위로 뽑아서 표본을 추출함. 첫번재 사례를 무작위로 추출한 뒤, 매번 k번째 사례를 추
➡️ 대부분의 경우 집단 전체에 대한 전수조사가 가능하지 않으므로 표본을 통해 모집단에 대해 추론함. ⚠️ 주의: 표본의 모수, 모집단의 통계량으로 표현하지 않도록 하기. 표집: 모집단에서 표본을 추출모집단에서 각 사례가 동일한 확률로 추출됨. 모집단의 모든 사례를 같
NULL VALUE값이 없음을 의미함. ⚠️ 주의: 값이 0이 아님. 값이 비어 있는 것. IS NULL, IS NOT NULL NULL VALUE인지 확인하기 위해 IS NULL 혹은 IS NOT NULL을 사용함. ⚠️ 주의: 컬럼명 = NULL 형태로 쓰지 않음.
기술 통계(descriptive statistics): 자료를 요약(summarize)하고, 정리(organize)하여 이해하기 쉽게 제시 1. 중심경향값(central tendency) 1) 평균(mean): 자료의 모든 숫자를 더한 뒤 값의 개수로 나눈 값 분포에
1) SELECT2) FROM3) WHERE4) GROUP BY5) HAVING6) ORDER BY7) LIMIT참고: https://mode.com/sql-tutorial/sql-having/
ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는
ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는