2학년 수료 후 겨울 방학때 들었던 데이터 분석 강의 및 실습, 프로젝트가 너무 재미있었고, 데이터 사이언티스트 및 데이터 엔지니어링 분야로 공부를 심도 있게 하고 싶다는 생각이 있었다. 하지만 3학년을 다니게 되면서 학교 커리에 치여 데이터쪽 공부를 아예 못하고 있었
데이터가 저장되어 있는 큰 폴더데이터베이스 안에는 '테이블'이라는 파일이 있다고 생각하면 됨!테이블 like 엑셀파일 \-> 각 열을 '컬럼', '필드' 라고 부름 SQL은 '코드'가 아니라 데이터베이스에 요청을 하기 위한 '언어'기본적인 명령어예시모든 컬럼 말고 특정
합계 : SUM(컬럼)평균 : AVG(컬럼)예시전체 데이터 개수 구하기 : COUNT(컬럼) <컬럼명 대신 1 혹은 \* 사용 가능>예시최솟값: MIN(컬럼)최댓값: MAX(컬럼)예시문제 : 주문 금액이 30,000원 이상인 주문건의 갯수 구하기답문제 : 한국 음
SUBQUERY 필요한 경우여러 번의 연산을 수행해야 할 때 ex) 수수료를 부과할 수 있는 시간을 구하고→ 구해진 시간에 주문 금액별로 가중치를 주고→ 가중치를 적용한 결과로 최종 예상 배달비를 계산할 때조건문에 연산 결과를 사용해야 할 때 ex) 음식 타입별 평균
없는 값 제외시켜버리기<> IS NOT NULL다른 값 대신 사용하기다른 값이 있을 때 조건문 이용하기 : if(rating>=1, rating, 대체값)null 값일 때 : coalesce(age, 대체값)15세 미만, 80세 초과를 각각 15세, 80세로 지정
🫵🏻 데이터 베이스 : 데이터가 저장되어 있는 큰 폴더SQL : SQL은 '코드'가 아니라 데이터베이스에 요청을 하기 위한 '언어'SQL 이용하여 데이터베이스에 요청하는 질의를 QUERY라고 함SELECT : 데이터를 가져오는 기본 명령어FROM : 데이터를 가져올
파이썬에서 새 변수를 만들 때는 변수이름 = 값 의 형태로출력할 때는 print예시a = 7b = 2a+b a-b ab a/ba+3b (a+3)\*b \`\`\`a//b a%b a\*\*b \`\`\`BOOL 자료형 (True
IF : 조건을 만족했을 때만 특정 코드를 실행하도록 하는 문법Elif, ELSE : 조건을 만족하지 않을 때 다른 코드를 실행하고 싶을 때 쓰는 문법✋🏻 다양한 조건을 판단 할 때는 Elif 사용!FOR 이용예시 : 나이가 20보다 큰 사람만 출력하기ENUMERAT
변수이름 = 값으로 선언 숫자형a//b a%b a\*\*b \`\`\`Bool형a = 4 > 2 not a a and b a or b \`\`\`'글'을 표현하는 데이터문자열 연산print(len("abcde")) pri
정의데이터를 읽는 능력데이터를 이해하는 능력데이터를 비판적으로 분석하는 능력결과를 의사소통에 활용할 수 있는 능력👊🏻정리하자면, 데이터 수집과 데이터 원천을 이해하고, 주어진 데이터에 대한 다양한 활용법을 이해하고 데이터를 통한 핵심 지표를 이해하는 것!\-> 데이
Library 호출하기 import pandas as pd 의 해석= pandas 라는 라이브러리(모듈)를 호출(import) 하고 그 이름을 pd 로 줄여서 명명하겠다즉, pandas 라는 라이브러리 내 모든 함수를 불러오게 됨. 하지만 가끔씩 우리는 from 으
데이터를 이해하고 해석하는 데 중요한 역할데이터를 요약하고 패턴 발견추론을 통해 결론 도출에 도움🍀 정리: 통계를 이용하여 데이터 기반의 의사결정을 내릴 수 있음!\-> 통계를 활용한 데이터 분석은 필수임 데이터를 요약하고 설명하는 통계 방법주로 평균, 중앙값, 분산
3.6 제 1종 오류와 제 2종 오류
가장 대표적으로 많이 사용하는 상관계수!(왼쪽 그래프)두 연속형 변수 간의 선형 관계를 측정하는 지표\-1에서 1 사이의 값을 가지며1은 완전한 양의 선형 관계\-1은 완전한 음의 선형 관계0은 선형 관계가 없음을 의미🫡 선형적인 관계가 예상 될 때 사용(비선형적일