post-thumbnail

카뱅 데사 커리어톡

![](https://velog.velcdn.

7일 전
·
0개의 댓글
post-thumbnail

Section3. N321 Python

==와 is의 차이==는 오브젝트의 값이 같으면 True. 오브젝트 종류 상관X.is는 값이 같아도 같은 오브젝트여야만 True. 오브젝트 종류 상관O인수는 실제값, 매개변수는 자리Raw string : Escape에 영향받지 않고 그대로 표시False으로 표시되는 것

2022년 6월 8일
·
0개의 댓글

Section3. N314 DB API

DB를 파이썬 창으로 다루기비용과 공간의 문제로 클라우드 DB를 사용할 수 있음.예를 들면, ElephantSQLconn = psycopg2.connect( host="서버 호스트 주소", database="데이터베이스 이름", user="유저 이름",

2022년 6월 7일
·
0개의 댓글
post-thumbnail

Section3. N313 SQL2

데이터베이스를 변경하는 일련의 작업들에 대한 연속처리단위commit을 해서 확정신호를 보내서 변경된 사항을 반영시킴.rollback은 모두 취소원자성(Atomicity) : 전부 성공 or 전부 실패일관성(Consistency) : DB의 제약이나 규칙이 일관됨고립성(

2022년 6월 2일
·
0개의 댓글
post-thumbnail

Section3. N312 SQL1

table = entities = 관계column = field = attributerow == 속성값 == 레코드 == 튜플 == 인스턴스An Entity Relationship Diagram (ERD)는 시스템의 엔티티들이 무엇이 있는지 어떤 관계가 있는지를 나타내

2022년 5월 31일
·
0개의 댓글
post-thumbnail

Section3. N311 환경설정

CD \[이동할 경로]커맨드창 위치이동ls폴더나 파일의 목록을 출력하는 명령어ls -a숨겨진 파일이나 디렉토리 모두 보여주는 명령어ls -l자세한 내용(퍼미션, 소유자, 그룹 등)을 출력하는 명령어ls -all과 a 옵션을 같이 적용한다.(l, a 순서는 상관이 없다)

2022년 5월 30일
·
0개의 댓글
post-thumbnail

Section2. N214 로지스틱 회귀

성능 확인큰 데이터 : 2-way holdout작은 데이터 : k-fold cross-validation모델 선택큰 데이터 : 3-way holdout훈련데이터 : 모델을 fit 하는 데 사용검증데이터 : 예측 모델을 선택하기 위해서 예측의 오류를 측정할 때 사용테스트

2022년 5월 26일
·
0개의 댓글
post-thumbnail

[커리어톡]PWC컨설팅 DS 차호준님

명확한 정의는 없으니, 스스로를 잘 브랜딩 하자. 특성 기술을 할 줄 아는 사람으로 인지되는 걸 지양하자. 요새는 너무 많음.스토리가 필요하다. 과거의 직무.기승전결 중 기와 결이 중요. 어떤 데이터를 분석했는지는 필요 없음.어떤 문제를 가졌고, 어떤 문제를 풀었고 어

2022년 5월 26일
·
2개의 댓글
post-thumbnail

다항회귀(Polynominal Regression)

항이 여러 개인 가설 함수로 결과를 예측하는 회귀 분석 방법이다.다항 회귀를 활용하는 한 가지 방법은 서로 다른 두 Feature 를 하나의 feature로 만들어서 해당 feature를 입력으로 2차 이상의 함수를 예측하는 것이다.ex) 부동산에서 집값 예측 시 땅의

2022년 5월 26일
·
0개의 댓글
post-thumbnail

Section2. N213 릿지 회귀

범주형 자료는 명목형(norminal)과 순서형(ordinal)로 나뉜다.명목형은 onehot encoding으로, 순서형은 ordinal encoding으로 처리 해주면 된다. 다만, onehot 인코딩을 해주면 high cardinality가 될 수 있기 때문에 유

2022년 5월 26일
·
0개의 댓글
post-thumbnail

Section2. N212다중선형회귀

train과 test 데이터셋은 분리해야한다. 단순선형회귀와 크게 다를 것은 없고, feature 지정해 줄 때 피쳐를 여러개 넣어주면 된다.r2 score가 -1에 가까울수록 쓰레기, 1에 가까울수록 보물MAE는 단위 유닛이 같으므로 보다 해석이 용이하고, MSE는

2022년 5월 26일
·
0개의 댓글
post-thumbnail

Section2. N211단순선형회귀

피쳐가 하나인 예측 모델의 경우 사용할 수 있다. 주로, 예측값과 실제값의 잔차의 제곱합을 최소화하는 OLS로 도출된다. 선형회귀는 보간(interpolate)과 외삽(extrapolate)을 예측하는 데도 도움이 된다. 이 때, 종속변수(y)는 반응변수, 레이블, 타

2022년 5월 26일
·
0개의 댓글
post-thumbnail

[핸즈온 머신러닝]1장 한 눈에 보는 머신러닝

지도 학습훈련데이터에 레이블(즉, 답)이 포함되며, 이것에 기반해 모델이 학습한다.이 때, feature를 가지고 target을 예측한다. 분류(classification), 회귀(regression)가 대표적인 경우이다. ex) k-최근접 이웃(k-Nearest Ne

2022년 5월 26일
·
0개의 댓글
post-thumbnail

ML import

from sklearn.linear_model import LogisticRegressionfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.ensemble import RandomForestClassifierf

2022년 5월 16일
·
1개의 댓글
post-thumbnail

머신러닝의 기본적인 스텝

처음 배우는 사람이고, 정확하지 않겠지만, 과제를 수행하고 스스로 kaggle에 도전하기 위해 (즉, 내가 보려고) 기본적인 스텝을 한 번 정리해보겠다.<지도학습의 분류문제의 경우>⭕⭕⭕null값, 이상치, 정보 누수, 범주형/수치형 데이터 처리, 로그 변환 등의

2022년 5월 16일
·
0개의 댓글
post-thumbnail

[ML]호텔 예약 취소 예측하기①

AI 부트캠프를 진행하면서 내가 스스로 결정해서 하는 프로젝트가 시작되었다. Section1에서 하던 것도 물론 재밌었지만, 스스로 예측한다는 느낌보다는 주어진 데이터를 가지고 분석하고 "아마도 잘 팔릴걸요....?"하는 느낌이어서 재미가 없었다. 따라서 이번에 시작

2022년 5월 12일
·
0개의 댓글
post-thumbnail

파이썬으로 데이터 수집

요런것도 있네.... 잼따 크롤링.....(출처)https://book.coalastudy.com/data_crawling/week3/stage2

2022년 4월 25일
·
0개의 댓글