길었던 추석연휴가 끝나고 본격적으로 데이터직군 취업을 위한 6개월의 여정이 시작됐다.그동안 고민만 하다가 흘려보낸 시간이 꽤 됐기 때문에 결연한 각오로 참석하게 됐다.언론과 영상을 전공하면서, 두 분야 모두 정답보다는 주관적인 면이 존재하는 학문이라는 걸 느꼈다.공부할
다른 언어와는 달리, 내 pc에 장착된 메모리가 허용하는 한 어마어마한 정수를 처리할 수 있다.과학분야에서 뛰어난 성능을 발휘한다.예) 123134135151......친숙하게 학습이 가능하다.다른 사람이 만들어 놓은 모듈을 가져와 프로그램을 쉽게 만들 수 있다. \-
숫자: 10, 20문자: 'a', '가' 음원, 영상, 이미지 등데이터를 저장하는 곳pc에서 실행 후 화면에 출력하는 역할복붙 단축키 = ctrl + D문자 데이터 출력시, "를 써도 되고, '를 써도 되는데, 일반적으로 ' 를 사용한다.변수 = 데이터를 저장하는 공간
1) print() 함수를 사용해서 문구를 명시할 수 있다.2) input() 함수 안에 입력가이드 문구를 명시할 수 있다.input()함수를 이용해 입력한 모든 데이터는 문자열로 처리된다.형변환함수를 이용하기 print()를 사용하면 자동개행이 되는데, 이를 막기 위
숫자(정수, 실수)를 이용한 곱셈문자(열)을 이용한 곱셈특이사항 위주로 학습하기! 곱한 횟수만큼 반복해서 나열한다.0을 나눗셈 하는 경우 = 결과는 항상 00으로 나누는 경우 = 0으로 나눌 수 없다% = 나눗셈 결과 중 나머지만 구하는 것// = 나눗셈 결과 중 몫만
' > ' 크다' < ' 작다' >= ' 크거나 같다' <= ' 작거나 같다' == ' 같다' != ' 같지 않다연산 결과는 bool이다 = True, False그 때마다 '아스키코드' 검색해서 보고 사용하면 된다\\' 은 일단 이 기능을 상실시키는데, 출력할 때
- 조건식 - 어떠한 조건에 따라 실행이 분기 되는 식 - A if 조건식 else B : 조건식의 결과가 True이면 A실행, 그렇지 않으면 B실행 실습) 적설량을 입력하고 적설량이 30mm이상이면 대설경보를 발령하고, 그렇지 않으면 대설경보를 해제하는 코드를 작성
여러 가지 조건에 대해 하나를 선택하는 조건문else문은 생략가능다중선택을 할 때는 위에서부터 적용되기 때문에논리연산자로 왼쪽과 오른쪽이 모두 True여야 실행되도록
대량메일 또는 문자 발송(회원 n명에게 발송)인사말 반복(하루에 정해진 시간에 n회 반복한다)mp3 반복 재생(음원 n개를 n번 반복한다)반복문for문(횟수에 의한 반복 = 직관적임)while문(조건에 의한 반복문) for ~ in 키워드가 나와야 하고,range(n)
귀도 반 로섬(네덜란드, 1991, 개인사용목적 -> 구글)(1) 문법구조가 쉬워 비전공자도 쉽게 배울 수 있다.V (2) 언어는 뛰어나지만 모듈(라이브러리)이 거의 없어 개발시간이 오래 걸린다.\-> 모듈(누가 만들어놓은 기능)이 많아 시간단축가능(3) 무한정수를 처
의사코드(우리가 쓰는 자연어로 만든 코드): 19세 이하 또는 65세 이상이면 출생연도 끝자리에 따른 접종 그렇지 않으면 하반기 일정 확인
과목별 점수를 입력하면 총점, 평균, 편차를 출력한다.평균은 다음과 같다.(국어: 85, 영어:82, 수학: 89, 과학: 75, 국사: 94)각종 편자 데이터는 막대그래프로 시각화한다.미세먼지 측정수치가 150이하면 차량 5부제 실시미세먼지 측정수치가 150을 초과하
버스 A, B(공배수로 계산)오전 6시 첫차, 오후 23시 운행종료버스 A: 15분 간격 운행버스 B: 13분 간격 운행 버스 C 오전 6시 20분 첫차, 오후 22시 운행종료버스 C: 8분 간격 운행
함수 함수는 '기능'이라고 생각하자 - 함수란? - 파이썬의 함수는 수학의 함수와 동일하다. Input(데이터) -> 함수(특정기능을 갖고 있음. 덧셈, 뺄셈 등의 연산의 기능을 함) -> Output(수행결과 출력) 예) 1, 2 -> x + y -> 3 - 내장함수
함수 내에서만 사용할 수 있는 변수가 있다.\--함수 안 변수 'num_out'형태는 똑같지만 아예 다른 것. 동명이인느낌= 새로운 변수를 새로 만든거고, 함수 안에서만 유효한 지역변수함수 밖에서 num_in을 호출하면 지역변수이기 떄문에 뜨지 않는다.= 함수 내부에서
import, from, as 키워드를 이용한다.import = 모듈 실행 키워드as = 닉네임처럼 별칭을 지어줄 수 있다.전부 다 가져오고자 하면 ' \* ' 를 쓰면 된다\--전역변수 \_ name \_ 을 이용한 실행파일 지정프로젝트 파일(파이썬)을 여러개 만들
기본적으로 알아두면 좋은 모듈\--객체를 이용한 프로그램으로, 객체는 속성과 기능으로 구성된다.현존하는 모든 프로그래밍 언어는 객체지향일상의 계산기\-속성: 숫자\-기능: 덧셈, 뺄셈 ...즉, 가상의 계산기를 프로그래밍할 때도 속성과 기능을 생각해야한다.자동차\-속성
메모리와 객체에 대한 이해객체는 class로부터 생성자를 호출해서 생성되고, 메모리에 생성된다.= 어떤 클래스가 하나 있을 때 생성자를 호출하면, 메모리에 객체가 생성된다.생성한 객체를 사용하기 위해서는, 변수를 만들어서 객체를 할당해 사용된다.= \*객체는 변수에 객
029. 예외처리 예외를 별도 처리함으로써 프로그램 실행에 문제가 없도록 함 - 예외처리 - 예상하지 못한 예외가 프로그램 전체 실행에 영향이 없도록 처리함 예) 프로그램 실행 1 프로그램 실행 2 프로그램 실행 3 -> 예외발생 -> 중단 프로그램 실행 4 프로그
예외 클래스를 직접 만들어보자실무에서 상황에 맞춰 클래스를 만들어서 많이 쓴다.텍스트 파일을 파이썬으로 다뤄보자텍스트 파일 - 파일열기 - 읽기 또는 쓰기 - 파일 닫기외부자원에 대한 디렉토리를 결정해야함파일을 오픈할 때 매개변수(인수) 2개를 작성해야한다.1) 어느
함수 - 함수를 이용한 프로그래밍 1. 다음과 같이 출력될 수 있도록 산술연산 계산기를 함수를 이용해서 만들어보자 2. 다음과 같이 출력될 수 있도록 이동거리와 이동시간을 반환하는 함수를 만들어보자
모듈모듈모듈8P3 7P5순열 = 순서에 맞춰 경우의 수 나타내는 것모듈순서는 상관 없음모듈모듈
모듈모듈도서정보(도서명, 가격, isbn)도서저장소(도서컨테이너, 도서등록, 도서삭제, 전체 도서 정보 출력, 도서 정보 출력)모듈모듈모듈carracingexmp3Playerex
calculatorexprime_moduleexcalculatorPurchaseexmemexbankex
diaryex수입, 지출 이력관리 텍스트파일잔액관리 텍스트 파일money.txt 에 0을 넣어놔야한다는 걸 몰라서 오랜시간 헤맸다
22 / 1 = 22 / 2 = 133 / 3 = 33 / 3 = 188 / 1 = 88 / 2 = 48 / 4 = 28 / 8 = 199 / 1 = 99 / 3 = 39 / 9 = 11515 / 1 = 1515 / 3 = 515 / 5 = 315 / 15 = 1222
수열의 합: 모든 항을 더한 것 = Sn공식: an = a1 + (n-1)d = 일반항 (an-1 + an+1) / 2 = an = 등차중항an = {2, 5, 8, 11, 14, ... }\-> a1, d, n 입력또는또는
an = a1 r(n-1) = 일반항an-1 \* an+1 = an^2 = 등비중항sn = a1(1 - r^(n)) / (1-r) = 수열의 합an = {2, 4, 8, 16, 32, 64, ... }또는an = {5, 15, 45, 135, 405, ...}또는
k에 1부터 n항까지 대입하면서 합을 구하는 것
8P3, 7P5nPr = n(n-1)(n-2)..(n-r+1) = n!/(n-r)!공식: n!/n or (n-1)!{1, 2, 3, 4}5C2 = 5! / 2! (5-2)! = 5x4x3x2 / 2x 3x2 = 10개8C3, 7C5동전 모든 사건: 앞, 뒤 -> 2가지
데이터를 묶어서 관리하자!파이썬의 다양한 자료구조를 이해하자!student1 = '홍길동'student2 = '박찬호'student3 = '이용규'student4 = '박승철'student5 = '김지은'\-> '홍길동', '박찬호', '이용규', '박승철', '김지은
리스트에 아이템을 추가하자!\--추가하면 리스트의 마지막에 추가됨
파이썬이라고 뭉뚱그리긴 하지만 배울 게 많음 데이터사이언스는 하나하나 배우면서 따라가는게 아니라 실습하면서 하는 것프로젝트를 완성해 가는 형태로 진행프로젝트가 진행되는 과정을 중시이론: 결과, 흐름 위주 / 실습: 문제는 효율성. Python, Pandas1\. 서울시
데이터 과학 = 마케팅, 딥러닝, 시각화 등 범위가 많이 넓음오늘은 데이터를 모아서 현상, 인식, 가정을 확인하려는 도구로 사용할 것\-강남 3구가 범죄로부터 안전한가?\-GoogleMaps, Folium, Seaborn, Pandas의 Pivot_table 등을 익히
html 태그는 웹페이지를 표현head 태그는 눈에 보이진 않지만 문서에 필요한 헤더 정보를 보관body 태그에는 눈에 보이는 정보를 보관파일로 저장된 html파일을 읽을 때open: 파일명과 함께 읽기(r) / 쓰기(w) 속성을 지정html.parser : Beaut
= soup이라는 변수로 beautifulsoup기능을 이용하겠다 = find(또는 select) 매서드를 통해, class에 할당된 이름을 가진 테그의 위치를 가져오고, 데이터를 뿌리겠다 바뀌기 전 후 코드(selenium) 동적페이지 크롤링 도구: 셀레니움 웹
시계열 데이터: 시간의 흐름에 대해 특정 패턴과 같은 정보를 가지고 있는 경우 Seasonal Time Series: 그 중 주기성을 갖고 있는 데이터를 다루는 경우 가장 기초적인 모양의 def 정의 : 이름(test_def)선언, 입력해야할 인자가 있으면 잡아주고
예) pop(3): index3에 해당하는 데이터가 없어짐콕 찝어서 삭제 가능
014. 리스트 연결 - 리스트 연결(확장) - extend()함수를 이용하면 리스트에 또 다른 리스트를 연결(확장)할 수 있다. 1번 리스트 - extend() - 2번 리스트 -> 1번 리스트가 확장되는 개념 - 덧셈 연산자를 이용해서 리스트를 연결할 수도 있다.
리스트도 곱셈 연산이 가능하다!특정 아이템의 인덱스를 찾자!= 리스트를 몇개 더 늘리는가특정 아이템의 개수를 알아내자!필요없는 아이템은 삭제하자!students = ('홍길동', '강호동', '박찬호')'박찬호' = 아이템(요소)숫자, 문자(열), 논리형 등 모든 기본
Database 사용하기 Database 정의 Database란 여러 사람이 공유해 사용할 목적으로 체계화해 통합, 관리하는 데이터의 집합체 예) 데이터가 저장된 파일들도 포함 - 엑셀, json DBMS(Database Management System) 사용자와 데
Database 사용하기 Database 정의 Database란 여러 사람이 공유해 사용할 목적으로 체계화해 통합, 관리하는 데이터의 집합체 예) 데이터가 저장된 파일들도 포함 - 엑셀, json DBMS(Database Management System) 사용자와 데
INSERT INTO tablename(column1, column2, ...)VALUES(value1, value2, ...)예)INSERT INTO tablename(id, name, age, sex)VALUES(1, '이효리', 43, 'F')select \* f
INSERT INTO tablename(column1, column2, ...)VALUES(value1, value2, ...)예)INSERT INTO tablename(id, name, age, sex)VALUES(1, '이효리', 43, 'F')select \* f
A = B A와 B가 같은A > B A가 B보다 큰 (초과)A < B A가 B보다 작은 (미만)A >= B A가 B보다 크거나 같은 (이상)A <= B A가 B보다 작거나 같은 (이하)A <> B A가 B보다 크거나 작은 (같지 않은)A != B A와
CREATE TABLE test1( no int);CREATE TABLE test2( no int);INSERT INTO test1 VALUES(1);INSERT INTO test1 VALUES(2);INSERT INTO test1 VALUES(3);INSERT INT
두개의 테이블에서 공통된 요소들을 통해 결합하는 조인방식SELECT column1, column2, ...FROM table AINNER JOIN table BON tableA.column = tableB.column 기준을 주고, 같을 때만WHERE conditio
여러 문자열을 하나로 합치거나 연결해주는 함수SECELT CONCAT('string1', 'string2', ...);예) SELECT CONCAT('concat', ' ', 'test');= concat test 가 출력됨예) SELECT CONCAT('이름:', n
Cloud 상에 Database를 구축해봅시다로그인 - 데이터베이스 생성윈도우의 경우, 환경변수에 Path 등록을 하신 후에 cmd창에서 mysql 명령어를 사용하실 수 있습니다. \- 참고: https://hoho325.tistory.com/163입력:my
- Workspace 생성 - sql_ws 폴더를 만들고 그 하위에서 실습 Document % mkdir sql_ws Document % cd sql_ws sql_ws % - SQL File 생성방법 - sql_ws 폴더 하위에서 다음을 실행(현재 폴더를 VSCode
VSCode 통해 실행, ds_study 환경에서 작업 모두 sql_ws폴더에서 시작 AWS RDS로 생성한 database_1을 모두 사용 AWS RDS zerobase의 police_station 테이블의 데이터를 모두 삭제 delete from police_sta
예) 하나의 컬럼을 기본키로 설정하는 경우예) 여러개의 컬럼을 기본키로 설정하는 경우테이블당 하나만 있기 때문에 별도로 이름 안 줘도 삭제됨예) 하나의 칼럼이 기본키로 설정된 경우예) 여러개의 칼럼이 기본키로 설정된 경우(삭제하는 방법은 동일)예) 하나의 칼럼을 기본키
- Aggregate Functions(집계함수) - 여러 칼럼 혹은 테이블 전체 칼럼으로부터 하나의 결과값을 반환하는 함수 Function | Description 1) COUNT : 총 갯수를 계산해주는 함수 2) SUM : 합계를 계산해주는 함수 3) AVG :
Function | Description: UCASE = 영문을 대문자로 변환하는 함수: LCASE = 영문을 소문자로 변환하는 함수: MID = 문자열 부분을 반환하는 함수: LENGTH = 문자열의 길이를 반환하는 함수: ROUND = 지정한 자리에서 숫자를 반올림
- SQL Subquery - About Subquery - 하나의 SQL문(메인쿼리)안에 들어있는 또 다른 SQL문(서브쿼리)을 말한다. - 메인쿼리가 서브쿼리를 포함하는 종속적인 관계다. 서브쿼리는 메인쿼리의 칼럼 사용 가능 메인쿼리는 서브쿼리의 칼럼 사용 불가 -
버전관리 시스템(=형상관리) 중 하나Configuration Management SystemsVersion Control Systems(VCS)버전관리Source Data + History프로그램을 짜면 소스데이터가 나옴(.py 파일들).작업하는 동안 늘어나고 수정되는
working directory(작업공간) - 실제 소스파일, 생성한 파일들이 존재우리가 보는 폴더. git이 관리하지는 않는데 add하면 스테이지로 올라가면서 관리가 시작됨.index(stage) - standing area(준비영역) 의 역할. git add한 파일
- Remote Repository 생성 참고 - README File 프로젝트에 대한 설명, 사용방법, 라이센스, 설치방법 등에 대한 내용을 기술하는 파일 나, 직장동료, 프로그램 사용자를 위해 존재 참고 - .gitignore git버전 관리에서 제외할 파일목록
\*\* 참고cat 파일이름(예 hello.py)= 파일에 있는 내용을 보여줌cat > 파일이름= 파일이 존재하면? 내용을 덮어쓰게 해줌= 존재하지 않으면? 파일을 만들고, 내용을 입력할 수 있게 해줌cat >> 파일이름= 파일이 존재하면? 내용 뒤에 붙여넣기를 해줌R
실습환경 만들기 remote repository 생성 : merge_project local에 clone : git_ws로 이동 = glt clone 주소(이름:토큰) 실습환경 체크 메인 - 서브 파일 추가 후 저장 = cd merge_project = cat > t
실습환경 만들기 remote repository 생성 : tag_project local에 clone : git_ws로 이동 = glt clone 주소(이름:토큰) 파일 생성후 commit 3개 만들기 : hello.txt : commit1 = Hello, world
DATA LITERACY - 데이터를 보고 활용할 수 있느 능력. 탐색을 통해 이해하고, 통찰하는 능력. 구성원들이 데이터에 쉽게 접근할 수 있도록 데이터 시각화 : 데이터에 색상, 모양, 사람들의 시선을 끌 수 있는 요소를 배치해 데이터를 효과적이고 직관적으로 표현
기본차트만들기 집계값에 대한 비중을 알아보는 차트 만들기 - 파이 차트 = 셉터로 구분된 원 형태의 차트. = 원 안에서 상대적 비중을 표시하기에 유리함. 예) 시장 내 점유율 표시 실습) '매출', '고객세그먼트'를 '마크'에 넣음. -> '파이차트'로 변경, 상
실습) 좌측 '시도' 우클릭 - '만들기-그룹' - '경기도, 서울특별시, 인천광역시 - 그룹("수도권") - 기타포함 클릭'\-> '매출' 더블클릭 - '주문일자' 드래그 해서 '열'에 올려놓기 - '분기(주문일자) 선택= 분기별로 매출값이 나오고 있음시도 그룹별
머신러닝은 명시적으로 프로그래밍하지 않고도 컴퓨터에 학습할 수 있는 능력을 부여하는 학문= 머신이, 명시적인 프로그램에 의해서가 아니라, 주어진 데이터를 통해 규칙을 찾는 것(과거 데이터로부터 얻은) 경험이 쌓여감에 따라 주어진 태스크의 성능이 점점 좋아질 때 컴퓨터
= 2007년 구글 썸머코드에서 처음 구현= 현재 파이썬에서 가장 유명한 기계학습 오픈소스 라이브러리from sklearn.tree import DecisionTreeClassifieriris_tree = DecisionTreeClassifier()iris.datair
예) 각 월별 매출, 누적 매출 함께볼 것\-> '매출' 더블클릭, '주문일자' 열선반으로 놓을 때(연속형 월선택)\-> 행에 있는 '매출' ctrl 눌러서 복사 - 차트가 두개 됨\-> 두번째 합계(매출) - 우클릭 - '퀵테이블계산-누계', - 우클릭 - '이중축'
RUNNING_SUM= 첫번째행에서 현재행까지 주어진 식의 누계합계를 반환하는 함수= 퀵테이블 계산으로 간단하게 만든걸 함수로 써서 만들 수 있음예)\-> 새시트 - '계산된시트만들기' - RUNNING_SUM - RUNNING SUM(SUM(매출))\-> 더블클릭 -
- 성별에 따른 생존률 - 경제력 대비 생존률 - 선실등급별 성별 - 나이별 승객현황 - 나이에 따른 등실별 생존률
글자를 숫자로, 숫자를 글자로 바꿔줌label_encoder 불러오고fit - transforminverse - transform x' = x - min(x) / max(x) - min(x)min = 0이면, x / max(x)가 된다. max = 100으로 나누면 1
\- 와인 맛에 대한 분류 : 이진분류
Motivation & Direction 많은 부분에서 Transformer라는 모듈을 다루는데 --> GPT & Bert 등장 = positional Encoding, Multi Self-Attention + a = 기계어 번역에서는 좋은 성능을 보이는데, 자연어에서
\*\* 가장 핵심적인 아이디어파란박스 = 입력방법: position encoding : 기존의 RNN에서는 가능했던 순서처리가 안 되는 Transformer: 단순한 병렬처리가 되기 때문에 -> 성능이 좋아짐 -> 속도가 빨라져서 한꺼번에 여러개할 수 있음: 단점 -
문제 1. AWS RDS (MySQL) 에 프로젝트 관련 Database 를 생성하고, 접근 가능한 사용자 계정을 생성하세요. Database Name : onedayUser Name / Password : oneday / 1234제출 1.Database 생성문 조회