* 데이터 분석이란? > : 유용한 정보를 발굴하고 결론 내용을 알리며 의사결정을 지원하는 것을 목표로 데이터를 정리, 변환, 모델링하는 과정 > : 비즈니스 부문) 의사 결정을 더 과학적으로 만들어주고 비즈니스를 더 효율적으로 운영할 수 있도록 도와주는 역할 >
값(Value)텍스트 : 문자 데이터(계산X)숫자 : 숫자 데이터(계산X)수식(Formula)계산식 : 사칙연산/논리연산 등함수 : 데이터를 입력하면 특정 결과를 출력수식의 결과값이 텍스트 이면 '왼쪽 정렬', 숫자면 '오른쪽 정렬'서식(Format)글꼴 서식 : 글꼴
: 기존의 통계학이 정보의 추출에서 가설 검정 등에 치우쳐 자료 본연의 의미를 찾는 데 어려움이 있어 이를 보완하고자 주어진 자료만을 가지고도 충분한 정보를 찾을 수 있도록 하는 여러가지 탐색적 자료 분석 방법중요성데이터의 분포 파악분석에 필요한 데이터 전처리 수행 가
: 관심의 대상이 되는 모집단의 특성을 파악하기 위해 모집단으로부터 표본을 수집, 정리, 요약 분석하여 표본의 특성을 파악하고 이를 이용하여 모집단의 특정에 대해 추론하는 원리와 방법을 배우는 학문: 자료에 근거한 합리적인 의사결정🌲 기술 통계학 : 요약 통계량, 그
: 경험과 학습을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구이며 인공지능의 한 분야: 컴퓨터가 어떤 작업(T, task)을 하는데 있어서 경험(E, experience)으로부터 학습하여 성능(P, Performance)을 향상시키는 학문🪄 인공지능 ⊃ 머신러닝 ⊃
: 데이터를 통합하여 관리하는 데이터의 집합: 데이터베이스를 관리하는 미들웨어 시스템: 데이터 테이블 사이의 키 값으로 관계를 가지고 있는 데이터베이스: 데이터 사이의 관계 설정으로 최적화된 스키마를 설계 가능🧷Oracle, Mysql, Postgresql, Sqli
: 데이터에 구조화된 질문을 하는 언어: SQL로 쓰인 데이터베이스에 명령을 내리는 문장: 컴퓨터가 처리할 수 있는 문자, 숫자, 소리, 그림 따위의 형태로 된 정보🌲정수형 : 소수점이 없는 숫자 데이터 🧷TININT, SMALLINT, MEDIUMINT, INT,
🧷 함수명(함수를 적용할 값 또는 컬럼명)🧷 결과 값을 새로운 컬럼으로 변환🧷 LOCATE("A", "ABC") : "ABC"에서 "A"는 몇번째 위치에 있는지 검색해 위치 반환❗문자가 여러 개라면 가장 먼저 찾은 문자의 위치를 가져옴, 찾는 문자가 없다면 0🧷
: 여러 개의 테이블의 데이터를 한 테이블에 합쳐서 보여줄 때 사용하는 키워드: 의미가 같은 컬럼값을 기준으로 설정📌INNER JOIN, LEFT JOINM RIGHT JOIN, OUTER JOIN, CROSS JOIN, SELF JOIN🔸(INNER) JOIN:
: 가상의 테이블로 특정한 쿼리를 실행한 결과 데이터를 보여주는 역할: 실제 데이터를 저장하지는 않음: 추가, 수정, 삭제, 인덱스 생성 불가능➡️ 쿼리를 단순화하기때문에 가독성 좋아지는 효과🧷 CREATE VIEW 뷰 이름 AS 뷰 생성할 쿼리: 특정 테이블
🌲a : 현재 클릭된 셀 위에 새로운 셀 생성🌲b : 현재 클릭된 셀 아래에 새로운 셀 생성🌲dd : 현재 클릭된 셀 삭제🌲셀 복사 붙이기 : 셀 클릭 후 Ctrl + C, Ctrl + V🌲셀 병합 : 셀 클릭 후 Shift + ↓ (방향키)
: 데이터 혹은 사용자가 설정한 조건에 따라 코드의 작동 및 프로그램이 제어 되도록 하는 구문📌판별문, 조건문, 분기문 : if ~ elif ~ else📌반복문, 무한 반복문 : for, while📌예외처리 : break, continue, try ~ except
: 수리적 파이썬 활용을 위한 파이썬 패키지: np.arrary 다차원 배열을 사용하여 벡터의 산술 연산 가능: 브로드캐스팅을 활용하여 shape이 다른 데이터의 현산 가능🧷import numpy as np🌲스칼라(Scalar): 실수 혹은 정수: +, -, \*,
: 테이블 형태로 데이터를 다를 수 있게 해주는 패키지(python용 엑샐): 기존 데이터처리 라이브러리인 numpy 대신 주로 사용🧷import pd❗데이터를 다룰 때 한번의 모든 조건 설정으로 최종 결과를 얻기보다는 하나하나 조건에 대한 결과를 확인하고 필요한 데
: 데이터를 살펴보고 분석함에 따라 다양한 분석 가능성을 보여줌: 유용한 시각화를 위한 데이터 전처리 작업 매우 중요: 시각화를 통한 레포트화📌 파이썬 시각화 패키지 : Matplotlib, Seaborn: 파이썬의 대표적인 시각화 패키지: 기본적인 형태의 다양한 시
: 자동화된 방법으로 웹을 탐색하는 컴퓨터 프로그램: 웹 서비스 내 정보를 수집하는 일❗requests가 잘 되었는지, 데이터를 잘 가져왔는지 확인🔸웹 크롤링 방법1️⃣정보를 가져오고자 하는 url 정의🧷url = ''2️⃣url을 requests로 정보 요청🧷r
🌈 태블로 : 데이터 시각화 프로그램 : 엑셀과 다르게 데이터 원본 변경 불가 🔹데이터 해석기 : 태블로가 알아서 데이터를 정제해줌 : 결측치 제거, 셀 병합 등 🔹데이터 연결 🌲라이브 : 데이터 원본과 태블로가 직접적으로 바라보고 있는 상태 : 실시간 연동 🌲추출 : 둘 사이의 관계를 끊은 별도의 데이터 파일을 만듦 : 원본의 스캔본 : 라...