국비지원으로 PM 부트캠프를 듣고 다소 아쉬운 경험과 결과가 초래되었습니다. 수료 후 취업 지원이 원활하게 이루어지지 않을 뿐더러 포폴 첨삭 또한 지체되어 피드백을 받지 못하게 되었습니다. 데이터 분야에 관심을 가지게 되면서 부트캠프를 찾던 도중 취업 준비가 탄탄하다는
무한 정수를 처리할 수 있다.문법 구조가 쉽다.다양하고 뛰어난 묘듈이 많다 (묘듈 = 기능, 라이브러리)파이썬 IDLE (통합 개발 환경) \- 프로그램 개발에 필요한 코드 작성과 디버깅, 실행 등을 위한 툴 (=코딩 툴)간단한 코드 작성에 사용코드 편집기 사용 법
조건식과 조건문 조건식 어떤 조건에 따라 실행이 분기 되는 식 A if 조건식 else B : 조건식의 결과가 Ture이면 A 실행, 그렇지 않으면 B 실행 조건문 특정 조건에 따라 프로그램을 분기한다. (Ture / False) 코드블럭, 들여쓰기로 작성 if 문
함수 함수란 함수 : 파이썬의 함수는 수학의 함수와 동일하다.(= 기능이라 생각하기) 내장함수 : 기본으로 제공함 (기초에 배운 print) 사용자 함수 : 사용자가 직접 선언함 (def + 함수명:) 함수를 사용하는 이유 : 특정 기능을 재사용하기 위해서 사용한
모듈 : 이미 만들어진 훌륭한 기능으로 사용자가 쉽게 사용할 수 있다. ex) 계산 모듈, 난수 모듈, 날짜/ 시간 모듈파이썬 모듈 ⇒ 내부 모듈, 외부 모듈, 사용자 모듈로 구분 가능 \- 내부모듈 : 파이썬 설치 시 기본적으로 사용할 수 있는 모듈 \- 외부

객체지향 프로그래밍 객체지향 프로그래밍 : 객체를 이용한 프로그램으로, 객체는 속성과 기능으로 구성된다. >객체 (object) = 속성(attribute) + 기능(function) 객체 만들기 (생성) : 객체는 클래스(class)에서 생성된다. >객체 사용의 장
약수와 소수 약수 : 어떤 수를 나누어 떨어지게 하는 수 소수 : 1과 자신 만을 약수로 가지는 수 (단, 1은 제외) 소인수분해 소인수 : 약수(인수) 중에 소수인 숫자를 소인수 = 약수이면서 소수인 숫자 소인수 분해 : 1보다 큰 정수를 소인수의 곱으로 나타낸
수열 : 규칙성을 가지고 나열되어 있는 수들 (an= 2n / n의 정의역 자연수)항들의 합과 항의 관계 : 특정 항은 특정 항까지의 합에서 특정 항 이전의 항까지의 합과 같다.수열의 합 an =Sn - S(n-1)등차 수열 : 연속된 두 항의 차이가 일정한 수열 ⇒
“이 글은 제로베이스 데이터 취업 스쿨의 강의 자료 일부를 발췌하여 작성되었습니다.”

자료구조 : 여러 개의 데이터가 묶여있는 자료형을 컨테이너 자료형이라고함 (컨테이너 자료형의 데이터 구조)각각의 컨테이너 자료형에 따라서 차이가 있다.대표적 컨테이너 자료형리스트list - 데이터 변경 가능튜플(tuple) - 데이터 변경 불가능딕셔너리{dict} -

튜플 : 리스트와 비슷하지만 아이템 변경(수정, 삭제등)이 불가능/ () 소괄호 사용선언 : ‘() ‘사용해 선언구분 : ‘,’로 데이터 구분튜플에 또 다른 튜플 선언 가능문자열, 숫자, 논리형 등 기본 데이터를 같이 저장 가능아이템 조회 가능 : 튜플도 아이템에 자동

키 (key)와 값(value)를 이용해서 자료를 관리한다.key에 lmmutable 값은 가능, mutable 값 불가능key에는 변경이 불가능한 값만 가능선언 : ‘{} ‘사용해 선언구분 : ‘,’로 데이터 구분아이템 정의 : ‘키:값’의 형태문자열, 숫자, 논리형

선형 검색 : 선형으로 나열되어 있는 데이터를 순차적으로 스캔하면서 원하는 값을 찾는다. ⇒ 인덱스 0~끝까지 순차적으로 검색 ⇒ 검색 성공 or 실패보초법 : 마지막 인덱스에 찾으려는 값을 추가해서 찾는 과정을 간략화한다. ⇒ 인덱스 0~끝까지 순차적으로 검색

근삿값 : 특정 값(참값)에 가장 가까운 값abs 함수 사용해서 구하기평균 : 여러 수나 양의 중간값을 갖는 수 for문을 사용해서 구하기재귀 : 나 자신을 다시 호출하는 것 recusion() 함수 쓰기 하노이의 탑 : 퍼즐 게임의 일종으로 세 개의 기둥을 이용

서울시 CCTV 현황 분석 프로젝트 데이터 읽기 pandas로 cvs, 엑셀 파일 읽기 파이썬에서 r 만큼의 강력한 데이터 핸들링 성능을 제공하는 모듈 단일 프로세스에서는 최대 효율 코딩 가능하고 응용 가능한 엑셀로 받아들여도 됨 누군가는

서울시 CCTV 현황 분석 프로젝트 상관관계 데이터의 관계를 찾을 때, 최소한의 근거가 있어야 해당 데이터를 비교하는 의미가 존재 상관계수를 조사해서 0.2 이상의 데이터를 비교하는 것은 의미가 있다. 상관계수 corr() (correlation) : 상관계수가 0

“이 글은 제로베이스 데이터 취업 스쿨의 강의 자료 일부를 발췌하여 작성되었습니다.”

서울시 범죄 현황 데이터 분석 프로젝트 python 반복문 iterrows() pandas에 잠 맞춰진 반복문 용 명령 pandas 데이터 프레임은 대부분 2차원 이럴땐 for문을 사용하면 n번째라는 지정을 반복해서 가독률이 떨어짐 pandas 데이터 프레임으로 반복

seaborn은 matplotlib과 함께 실행seaborn에는 실습용 데이터가 몇 개 내장되어 있다boxplot을 그려볼 수 있다. (컬럼을 지정해서 그릴 수 있다.)palette option : 색상 지정 \- palette="Set1" (set1~3)hue :

설치 방법 : !pip install foliumlocation : tuple or list, default NoneLatitude and Longitude of map (Northing, Easting)지도 시각화의 기본 기능 zoom_start : 0 ~ 18 ht

1. BeautifulSoup for web data BeautifulSoup BeautifulSoup 텍스트형태의 html인 데이터를 request.text를 이용해 가져오고, 데이터에 원하는 html 태그를 추출할 수 있도록 도와준다. => 사이트 정보 추출 “

시카고 매거진총 50개 페이지에서 각 가게의 정보를 가져온다. 가게이름 대표 메뉴 대표 메뉴의 가격 가게 주소 4) 반환 값리스트로 하나씩 컬럼을 만들고, DateFram으로 합치기 가격주소 가져오기 tadm : for문이 사용시 작동이 끝날때까지 작동하는 지 알 수
Sleenium Documentation접근할 웹 주소를 알 수 없을 때자바 스크립트를 사용하는 웹페이지의 경우웹브라우저로 접근하지 않으면 안될때웹 브라우저를 원격 조작하는 도구자동으로 url을 열고 클릭 등이 가능스크롤, 문자의 입력, 화면 캡처 등등find_elem

오피넷브랜드 가격 셀프 주유 여부 위치 해당 url로 한 번에 접근이 안됨메인페이지로 접속이 안되고, 팝업창이 하나 나옴glob : 파일 목록 한번에 가져오기 concat : 형식이 동인하고 연달아 붙이기만 하면 될 때 사용 import warnings : 오류 문구

date_range를 이용해 DataFrame 만들기 예측한 값 저장 후 시각화하기 웹 데이터 가져오기 전체 데이터 그리기 트렌드 분석을 시각화하기 위한 x축 만들기 에러를 계산할 함수 60일에 해당하는 데이터 에측 예측 결과는 상환/화한의 범위를 포함해서 얻어진다.
네이버 개발자 센터네이버 api 사용하기 위해 어플리케이션 등록, 클라이언트 id/pw 발급하기네이버 api 파이썬 코드(https://developers.naver.com/docs/serviceapi/search/blog/blog.md- urllib : ht

목표인구 소멸 위기 지역 파악인구 소멸 위기 지역의 지도 표현지도 표현에 대한 카르토그램 표현dfNaN 값에 0으로 채우기NaN 값 위에 값으로 채우기Nan 값 뒤에 값으로 채우기 axis 사용 가능NaN 값 채우기 업로드중..컬럼 이름 변경 소계 제거 항목 컬럼 바꾸

데이터프레임 재구조화하기 칼럼 이름 바꾸기 y ~ X까지 NaN 값차집합을 이용해 곂치는 데이터 정리하기 색상을 만들 때, 최솟값을 흰색blockedMap : 인구현황(pop)targetData : 그리고 싶은 컬럼사용할 데이터프레임인구수합계에 따른 지도 시각화소멸위기

데이터베이스 : 여러 사람이 공유하여 사용할 목적으로 체계화해 통합, 관리하는 데이터의 집합체DBMS : 사용자와 데이터베이스 사이에서 사용자의 요구에 따라 정보를 생성해주고 데이터베이스를 관리해주는 소프트웨어관계형 데이터베이스(RDB) : 서로간에 관계가 있는 데이터

order by (정렬) : select 문에서 데이터를 특정 컬럼을 기준으로 오름차순 혹은 내림차순 정렬하여 조회asc : 오름차순 (기본 값) / desc : 내림차순where 절에 사용where 절에 사용"이 글은 제로베이스 데이터 취업 스쿨의 강의 자료 일부를

UNION 여러 개의 SQL문을 합쳐서 하나의 SQL 문으로 만들어주는 방법 칼럼의 개수가 같아야함 UNION : 중복된 값을 제거하여 알려준다. UNION ALL : 중복된 값도 포함하여 모두 보여준다. 사용할 테이블 UNION UNION ALL JOIN

여러 문자열을 하나로 합치거나 연결 SELECT CONCAT(’string1’, ’string2’,…)칼럼이나 테이블 이름 별칭 생성as 생략 가능 COLUMN SELECT column as alias FROM tablename; TABLE SELECT

AWS RDS : AWS에서 제공하는 관계형 데이터베이스 서비스 외부 RDS 접속SQL File : SQL 쿼리를 모아놓은 파일 DATABASE RESTORE : 데이터베이스를 백업한 SQL File을 실행하여 그 시점으로 복구하거나 이전 할 수 있다.TABLE RES

여러 칼럼 혹은 테이블 전체 칼럼으로부터 하나의 결과값을 반환하는 함수사용한 테이블 총 갯수를 계산하는 함수문법숫자 칼럼의 합계를 계산해주는 함수문법숫자 칼럼의 평균을 계산해주는 함수숫자 칼럼 중 가장 작은 값을 찾아주는 함수숫자 칼럼 중 가장 큰 값을 찾아주는 함수그

입력값을 기분으로 단일 값을 반환하는 함수영문을 대문자로 변환하는 함수영문을 소문자로 변환하는 함수문자열 부분을 변환하는 함수문자열 길이를 변환하는 함수지정한 자리에서 숫자를 반올림하는 함수현재 날짜 및 시간을 반환하는 함수숫자를 천단위 콤마가 있는 형식으로 반환하는

데이터 시각화 : 데이터에 색상과 모양 그리고 사람들의 시선을 끌 수 있는 요소를 배치해 데이터를 효과적이고 직관적으로 표현하는 것효과적인 시각화 : 전달하고자 하는 메세지를 정하고 불필요한 부분은 생략데이터를 분석 및 시각화 하는 BI 솔루션, 데이터를 사용해 문제를

tableau - 퀵 테이블 계산누계, 차이, 비율 차이구성 비율, 순위비율 차이 YoY 성장률, 백분위수, 이동 평균YTD 총계, 연평균 성장률 (CAGR)tableau - 계산된 필드(연산, 함수, 매개변수)필드 - 데이터 원본에 존재하는 필드를 활용해 새로운 필드
버전 관리 시스템 (형상관리)configuration management systemsversion control systems버전 관리 source data + history협업, 작업 추적, 복구 등이 가능버전 관리 시스템의 종류 CVCSCVS : 1980년대 만들

user, email CRLF 서버에서 가져올 때 LF → CRLF로 변경하고 서버에 보낼 때는 CRLF → LF로 변경editor 전체 설정 확인 항목별 설정 확인 Local Repository는 Git 이 관리하는 3가지 단계로 구성되어 있음Working Direc

branch 별 변경이력을 볼 수 있음git configuration 파일 열기GIT DIFF 설정 추가GIR DIFF 비교하기 git configuration 열기git merge 설정 추가get merge : 현재 위치한 branch에 다른 branch를 병합 me

특정 버전(commit)에 tag를 달아놓을 필요가 있을 때 사용 1\. git tag 생성 현재 버전에 tag 달기특정 버전에 tag 달기tag를 remote repository에 pushgit tag 목록 보기3\. git tag 상세 정보 git tag 삭제 l

통계 기초 통계학 산술적 방법을 기초하여, 주로 다랴의 데이터를 관찰하고 정리 및 분석하는 방법을 연구하는 수학의 한 분야이다. 데이터 → 통계적 분석 → 예측 및 의사 결정 기술통계학 : 데이터를 수집하고 수집된 데이터를 쉽게 이해하고 설명할 수 있도록 정리 요약 설

명시적으로 프로그래밍하지 않고도 컴퓨터에 학습할 수 있는 능력을 부여하는 학문경험이 쌓여 감에 따라 주어진 태스크의 성능이 점점 좋아질 때 컴퓨터 프로그램은 경험으로 학습한다고 할 수 있음iris 데이터 활용하기데이터프레임 만들기 칼럼에 품종 정보 추가하기boxplot

타이타닉 데이터 출처autopct='%1.1f%%':소수점 첫째자리까지 ax=ax0 : 순서 0 : 사망 / 1 : 생존 crosstab : 교차표 만들기'\\,\\s\\w+(\\s\\w+)?.' : 정규 표현식 패턴 (\\ : 역슬레쉬)\\, : 쉼표 ,와 일치\\s

문자를 숫자로 변환 array('a', 'b', 'c', dtype=object)array(0, 1, 2, 0, 1)fit과 transform 한 번에 변환하기 array(0, 1, 2, 0, 1)역변환하기 array('a', 'b', 'c', 'a', 'b', dty

단순히 Iris, Wine 데이터를 받아서 사용했을 뿐인데 직접 공부하면서 코드를 하나씩 실행해보면 혼돈이 크다는 것을 알 수 있다.Jupyter Notebook 상황에서 데이터의 전처리와 여러 알고리즘의 반복 실행, 하이퍼 파라미터의 튜닝 과정을 번갈아 하다 보면 코