Data Analyst 데이터 직군은 크게 수평적, 수직적 분석으로 구분 수평적분석 : 직업에 대한 전문적 지식 수직적분석 : 프로그래밍 언어(R, Python등)를 이용한 기술적인 역량이 필요한 영역 > * 기업에서도 수평적 분석가를 채용할까? *
직관적으로 알 수 없는 정보를 어떠한 프로세스를 통하여 추가로 발견하는 분야\* 유능한 데이터 전문가 : 논리적으로 근거를 찾는 사람.기존 IT분야에서만 사용되는 것이 아닌, 타 산업군과 연계하여 활용수요 증가에 따라 데이터 사이언스 내 용어정의 또한 변화카드사 : 대
막상 서술하다보니 어려운 부분이네요.. 크게 정리해봤습니다.데이터 분석에 대한 전체적 프로세스로 문제설정 > 데이터 수집 > 분석 및 시각화 > 보고서의 과정으로 진행된다고 말해진다. 어렸을 때부터 OA(Office Automation) 를 손에서 놓지 않았기 때문에,
채용공고를 강조하는 이유일반화하는 문서 X업무의 범위와 기술 스택이 정형화되지 않음IT 분야의 발전속도가 빨라 금방 낡은 정보가 됨자격요건 : 필수우대사항 : 옵션도구 : SQL, Python, R 등 프로그래밍 언어분석 : 회사의 서비스, 도메인 영역, 중요도에 따라
Portfolio : 보여주고 싶은 것들의 모음 = Project : 특정 목적을 가지고 진행하는 작업포트폴리오 없어도 구직은 가능포트폴리오에 작성될 내용담당 프로젝트세세히 작성하는 것 X, 간략히 소개 목적, 내용, 담당역할, 결과개인 프로젝트(Personal
객관적, 쉬운난이도빠른 처리속도다양한 라이브러리 지원pandas기초통계 및 계산, 시각화 지원SeabornVisualization, 3-dimension 가능Scikit-learn다양한 ML Model 지원Tensorflow구글 제공 딥러닝 라이브러리Mysqlclien
관심사 차이협업 : 같은 종류의 생산, 같은 종류의 작업을 여러 사람이 협력하여 공동으로 하는 일직업별 관심사개발의 어려움데이터 증가 및 시스템 복잡화 ▶ 쌓이는 데이터와 서비스의 디지털 전환으로 인한 트래픽량 증가모바일로 서비스를 이용하면서 기존 데스크탑을 통해 서비
데이터 파이프라인 구축개발 유지 보수KPI 설계분석보고서 작성 및 대시보드 제공데이터 분석데이터를 가지고 활용할 수 있는 프로덕트를 만듬Q. 데이터분석가와 데이터사이언티스트의 차이데이터 분석가에서 데이터 사이언티스트 전환 (충분히) 가능고도화된 통계적 지식, 개발분야
연구, 개발모델 활용회사 비즈니스 가치에 이바지함니즈 발굴 / 모델을 통하여 해결하려 노력데이터 프로덕트 생산 > 공통 니즈 우선해결커뮤니케이션 우선기존 사람의 인사이트를 빅데이터와 ML로 기계가 지원할 수 있도록 해보자.CVR클릭 반응성 변화에 강건결제 예측 모델각
약 10일간 Mission을 수행하였던 것들을 요약하자면 다음과 같다.데이터 직군데이터 직군별 업무데이터 직군별 차이점협업프로그래밍 언어(C/Python) 알아보기포트폴리오프로그램 사용Velog를 기술노트로 사용하기 위해 Markdown을 다루는 능력을 향상시킬 필요가
인턴을 지내며 모든 사업의 파이프라인을 살펴보며 빅데이터가 어떻게 활용되어지는지 관심을 가지게 되었습니다. 전체적으로 정형/비정형 데이터를 다루는 것이 '일의 시작'이라는 것으로 받아들여졌고, 말만이 아닌 논리적 근거로 제시함으로써 상대방을 설득시키는 것이 엄청 매력적
무한정수 처리가능쉬운 문법구조다양하고 뛰어난 모듈컴파일러: 작성한 코드를 기계어로 변환 번역(C, Java)소스파일 > 클래스 파일 > 기계어 변환인터프리터: 실행파일을 만들지 않고, 필요할 때 기계어로 변환 동시통역(Python)소스파일 > 실시간 해석 > 기계어 변
Python 기초 - 변수(Variable), 자료형(Data Type)
Python 기초 - 데이터 입/출력, 산술 연산자, Operator 모듈
Python 기초 - 조건문, 반복문
Python 기초 문제풀이
Python 기초 - 중첩 조건문
입과계기재학 및 인턴경험을 하며, 말로만 아닌 직접적으로 다룰 수 있는 '실무능력'을 장착해야한다고 생각하였고, 데이터를 정제하며, 분석을 통하여 활용할 수 있는 결과를 도출해내는 것에 관심을 가지게 되었다.이와 관련되어 알아보던 중 분석 직무에 대해 알아보게 되었고,
Python 기초 - 함수, 인수, 매개변수
Summarization 전역변수 name에는 모듈 이름이 저장된다. 실행파일인 경우, main__ 이 저장된다. 패키지를 이용하면 관련 있는 모듈을 그룹으로 관리할 수 있다. site-packages의 경우, 어디서나 사용할 수 있는 범용 모듈화 기능을 제공한다.
Python 중급 - 객체(Object), 클래스(Class), 복사(Copy)
Summarization Contents 최대공약수(gcd)/최소공배수(lcm) 최대공약수 : 공통된 약수 중에서 가장 큰 수 최소공배수 : 공통된 배수 중 가장 작은 수 진법 : 특정 숫자 몇 개를 사용하여 수를 표시하는 방법 대표적으로 2진법, 8진법,
개요 주제 : 채용공고 분석을 통한 데이터 분야 탐색 일정 : 총 4회 진행 (2/4) 참조 : 잡코리아, 원티드 직군 세분화 및 희망 직군 Data 직군 세분화 > 공통사항 프로그래밍 언어(Python, SQL 등) 능숙 경력자 우대(최소 2년~) 프로젝트 경험
Summarization Summation Permutation & Combination Probability Contents 시그마 : 수열의 합을 나타낸 기호. $n$항까지의 합을 구할 때 사용 $$ Sn = \sum{i}^{n} a_i $$ 팩토리얼(Fact
클래스 상속을 통해 다른 클래스의 기능을 활용할 수 있으며, 개발시간 단축의 효과가 있다.
Python 중급 - 추상(abstract) 클래스, 예외(Exception)
Summarization Python 기초수학 문제풀이 진행 기초수학 Equation 복습 Contents 진법 : 진법 관련 함수를 이용해서 진법 변환을 쉽게 할 수 있다. 방법 1 방법 2 등차수열 : 연속하는 두 수의 차이가 모두 일정한 수열
Python 중급 - Text File
Python 중급 문제풀이 함수, 모듈 문제풀이 진행
Python 중급 문제풀이 클래스, 예외처리, 텍스트파일 문제풀이 진행
자료구조는 컨테이너 자료형의 데이터 구조를 말하는 것으로, 각각의 컨테이너 자료형에 따라 차이가 있으며, 대표적인 컨테이너 자료형으로는 리스트(List), 튜플(Tuple), 딕셔너리(Dic), 세트(Set)가 있다.
🔑Summarization 튜플(Tuple)은 리스트(List)와 비슷하지만 아이템 변경 불가하며, 추가하려고 해 보면 에러(Error)가 발생한다. 튜플(Tuple)은 소괄호 ()를 이용해 선언하고, 데이터 구분은 콤마,를 이용한다. 선언시 괄호 생략이 가능하다.
딕셔너리(Dictionary)는 키(key)와 값(value)를 이용해서 자료를 관리하며, 중괄호 {}를 이용하여 선언하며, 키:값 의 형태로 아이템을 정의한다.키(key)와 값(value)를 이용해서 자료를 관리※ 딕셔너리(Dictionary)는 인덱스(index)가
알고리즘어떠한 문제를 해결하기 위한 일련의 절차나 방법선형 검색선형으로 나열되어 있는 데이터를 순차적으로 스캔하면서 원하는 값을 찾음※ 보초법 : 마지막 인덱스에 찾으려는 값을 추가해서 찾는 과정을 간략화이진 검색 : 가운데 데이터(중앙값) 이용. 검색 범위를 좁혀나가
주제 : 채용공고 분석을 통한 데이터 분야 탐색일정 : 총 4회 진행 (3/4)참조 : 잡코리아, 원티드본인이 지원하고자 하는 관심 산업/기업 채용공고 스크랩주요업무국내외 주가지수 데이터 분석을 통한 트레이딩 알고리즘 개발국내외 주요 펀드 수익율 데이터 분석을 통한 전
가상환경 생성 소프트웨어 설치 Matplotlib 한글 설정 Homebrew Visual Studio Code Vscode Python 환경설정
- 재귀(Recursive) 알고리즘 - 하노이의 탑 - 병합정렬, 퀵 정렬
📗 Python package - Matplotlib Basic
📗Python package - Seaborn basic
PivotTable
개요 주제 : 채용공고 분석을 통한 데이터 분야 탐색 일정 : 총 4회 진행 (4/4) 참조 : 잡코리아, 원티드 Week 4: 직무분석 작성하기 > 해당 직군의 고객은 누구인지_1차/2차고객을 분류 1차 고객 : 분석 결과를 기반으로 비즈니스 의사결정을 내리는
📗 Python package - folium Basic
📗Package - beautifulSoup
📗EDA Test 1 : 서울 인구데이터 분석
자료구조 문제풀이
자기소개
📗 알고리즘 문제풀이
📗beautifulSoup Example
실제로 데이터 분석을 활용한 경험을 말씀해 주시고 사용된 기술에 대해서 설명해 주세요 데이터를 활용하여 효과적인 의사소통을 하기 위해서는 어떤 프로세스로 진행이 되어야 해야할까요? 만약 지원자님이 저희 회사에서 일하게 된다면 어떤 사명감을 가지고 데이터 분석에 임
🔑Summarization 📗Contents
📗Package - Selenium
Package - PivotTable
SQL - DataBase
SQL - User
zerobase 이름 데이터베이스 생성실제 데이터가 저장되는 형태행(Row)과 열(Column)로 구성된 데이터 모음테이블 생성 포맷Ex) id(int)와 name(varcher(16)) 칼럼을 가지는 mytable 이라는 이름의 테이블 생성Table 확인Table 정
기존 데이터 테이블 celeb 사용테스트용 테이블 생성테스트 데이터 추가데이터 확인여러 개의 SQL문을 합쳐서 하나의 SQL 문으로 만들어주는 방법 ※ Column의 갯수가 같아야 함UNION : 중복된 값을 제거하여 알려줌UNION ALL : 중복된 값도 모두 보여
Ex) 나이가 29세인 데이터 검색Ex) 나이가 29세가 아닌 데이터 검색Ex) 나이가 29세보다 큰 데이터 검색Ex) 나이가 29세보다 작은 데이터 검색Ex) 나이가 29세보다 크거나 같은 데이터 검색Ex) 나이가 29세보다 작거나 같은 데이터 검색Ex) 나이가 29
실습환경 만들기
기존 데이터 테이블 celeb 사용테스트용 테이블 생성테스트 데이터 추가데이터 확인여러 개의 SQL문을 합쳐서 하나의 SQL 문으로 만들어주는 방법※ Column의 갯수가 같아야 함 UNION : 중복된 값을 제거하여 알려줌UNION ALL : 중복된 값도 모두 보여
celeb Table 사용
(SQL) Concat, ALIAS, DISTINCT, LIMIT
요약인구대비 상대적으로 CCTV가 적은 구를 찾는 것진행 순서Python, Pandas서울시 구별 CCTV 현황 데이터 확보인구 현황 데이터 확보CCTV 데이터와 인구 현황 데이터 합치기데이터 정리/정렬Matplotlib그래프 그릴 수 있는 능력Regression us
요약서울시 인구수에 따른 범죄별 연관성 확인서울시 범죄현황 발생 장소 분석범죄별 연관성 확인ModuleLoadCrime in SeoulDataLoad숫자값들이 콤마(,)를 사용하고 있어 문자로 인식될 수 있다.천 단위 구분(thousands = ',')이라고 알려주면
5대 범죄 중 강도, 살인, 폭력 간 관계를 확인CCTV 설치 갯수 및 인구수와 범죄(살인, 강도) 간 연관성 확인CCTV 설치 갯수 및 인구수와 범죄(폭력, 살인) 검거율 간 연관성 확인구별 범죄 검거율 시각화구별 평균 범죄 발생 건수 시각화LoadPath서울특별시
시간에 흐름에 대해 특정 패턴과 같은 정보를 가지고 있는 경우※ 안될 시fbprohet이 update되면서 키워드가 변경됨.가장 기초적인 모양의 def 정의이름(test_df)과 입력 인자(a, b)를 정해준다출력(return)을 작성global 변수를 def 내에서
EDIYA Coffee는 실제로 Starbucks Coffee 매장 근처에 있는지 분석스타벅스 매장 찾기 홈페이지 접속하여 화면 최대화 설정매장별 정보 가져오기매장 정보를 추출하기 위해 임의의 행을 선택하여 확인데이터 프레임 생성부산 지역 4개 지점이 같이 수집되어,
Goal서울시 주유소를 대상으로 셀프 주유소가 저렴한지 확인Data오피넷 : https://www.opinet.co.kr/user/main/mainView.do대한민국 주유 가격을 알아보는 사이트목표 데이터브랜드, 가격, 셀프 주유 여부, 위치싼 주유소 찾기
■ 관련 내용 : (EDA) 유가 분석
휘발유와 경유 가격이 셀프 주유소에서 정말 저렴한지 확인Module Load 및 웹 페이지 이동
■ 관련 내용 : (EDA) HW 02. 주유소 데이터 분석
Terminal 실행Documents 폴더 이동sql_ws 폴더 생성sql_ws 폴더로 이동VSCode 실행SQL 쿼리를 모아놓은 파일파일 실행 방법로그인 이후 파일 실행외부에서 바로 실행sql 파일 생성 후 테이블 생성경찰서 정보를 테이블로 만듬VSCode의 장점터미
SQL File로 Database 백업 가능특정 Database Backup모든 Database Backup데이터베이스를 백업한 SQL File을 실행하여 그 시점으로 복구하거나 이전할 수 있다.SQL File을 실행하는 방법과 동일Table 단위로도 백업 가능Tabl
ModuleLoad Data블로그 일일 방문자 수를 csv로 저장전체 데이터 그려보기trend 분석을 시각화하기 위한 x축 값을 만들기에러(RMSE)를 계산할 함수추세선 그리기60일에 해당하는 데이터 예측예측 결과는 상한/하한의 범위 포함 X
목표 : 시카고 샌드위치 맛집 소개 페이지 분석
DataTarget Data(CSV): 역대(1976-2008) 하계 올림픽 메달리스트에 대한 정보Source: Kagglehttps://www.kaggle.com/datasets/divyansh22/summer-olympics-medalsDownLoad: a
Python으로 MySQL 접속 후 사용하는 방법MySQL Driver 설치설치 확인Local Database 연결AWS RDS (database-1) 연결close() 구문 사용Local database 접속Query를 실행하기 위한 코드Ex 테이블 생성Ex 테이블
CSV에 있는 데이터를 Python으로 INSERTcursor 만들기읽어올 양이 많은 경우 cursor 생성 시 buffer 설정sql문 만들기commit() : Database에 적용하기 위한 명령결과 확인검색결과를 Pandas로 읽기csv 한글이 깨지는 경우, en