TIL은 Today I Learned의 약자로, 그날그날 공부하거나 읽은 것을 정리하는 것이다.예전에 여러 블로그들을 통해 TIL을 접하긴 했지만, 직접 작성해보는 것은 처음이라서 어떤 말로 서두를 띄워야 할지 모르겠다🤣멋쟁이 사자처럼 AI 스쿨이 진행되는 5개월동안
TIL 첫 작성이다. 이전에 공부한 내용들부터 적을까 했는데 그건 조금 더 생각해보기로 하고 오늘자 TIL부터 정리해보려고 한다.팀별 주간 키워드 복습 자료 만들기우리의 키워드 : EDA(Exploratory Data Analysis)구글독스와 구글 슬라이드를 사용해
이전에 원노트에 정리해놓았던 TIL이다. 아무래도 한곳에 모아두고 보는 것이 편할 것 같으니 정리해두려고 한다.파이썬 기초 및 흐름제어판다스 실습 조금PEP8 : 파이썬 스타일 가이드 \- 파이썬 공식 문서에 들여쓰기는 4칸으로 권장함 \- 한 줄 당 최대 79자로 제
파이썬 기술통계아나콘다 : 세계에서 가장 인기있는 Python 배포 플랫폼가상환경 설정을 쉽게 만들어줌주피터 : 파이썬 편집 도구.코드를 블록 단위로 실행한 결과를 확인할 수 있고, 문서화도 함께 할 수 있음라이브러리를 사용하면 대용량 데이터에 사용하기 어렵고, 놓칠
웹 크롤러 실습(주식 종목 - 네이버 금융뉴스)finacedatareader : 한국 주식 가격, 미국주식 가격, 지수, 환율, 암호화폐 가격, 종목 리스팅 등 금융 데이터 수집 라이브러리FinanceData/FinanceDataReader: Financial data
주간 키워드 리뷰 (requests)DOCS Requests: HTTP for Humans™ - Requests 2.28.1 documentation Requests is an elegant and simple HTTP library for Python, bui
미니 프로젝트(유튜브 특정 한 채널 영상들의 요약 정보 (video_id, 영상 제목, 조회수, 좋아요 수, 댓글 수, 댓글 크롤링)프로젝트 트러블 슈팅유튜브 api를 활용해 지정 영상들의 댓글 크롤링하기 - (이강인 활약상 영상 반응 수집)유튜브 api 생성구글 계정
서울 120 데이터 수집리버스 엔지니어링 : 객체를 복제하거나 향상시키기 위해 어떻게 작동하는 것인지 살펴보는 과정. 즉, 사람이 인공적으로 만들어 낸 것에서 지식이나 디자인 정보를 추출하고 이 정보를 바탕으로 어떤 것을 다시 생산하는 과정데이터 수집 전에 웹페이지의
서울 120(다산콜센터) 데이터 수집 마무리주식 종목 수익률 비교(FinanceDataReader)map(), apply(), applymap() 차이점세 함수 모두 일괄 적용하고자 할 때 사용함map은 Series 데이터만 처리 apply는 Series와 데이터프레임
plotly 실습 이어서코로나 19 데이터 EDA언제, 어떤 데이터에 어떤 그래프를 그릴 것인지 이해하기scatter : 두 변수의 상관관계를 보고자 할 때 많이 사용boxnotched 파라미터로 노치형으로 그릴 수 있음points 파라미터는 선택한 데이터 분포를 점으
special lecture : 통계데이터 분석가 -> 의사결정권자가 이해할 수 있는 수준까지의 통계 역량이 있으면 됨통계 분석을 통해서 할 수 있는 일들대상의 특성을 수치로 표현하기대상을 관찰할 수 있는 특성은 무엇이든 수치화 가능(양적, 질적 다)수치가 객관적이지
SQL 중급 수강RDB(Relational Database) : 데이터들을 쭉 쌓는게 아니라, 테이블 간의 관계를 정의해서 연결함테이블 간의 연결을 위해 조인 필요cartesian product(카테시안 곱) : From절에 2개 이상의 Table이 있을때 두 Tab
코로나 eda 실습 이어서koreanize_matplotlib : 한글폰트 이용기존에는 운영체제에 따라 다르게 폰트를 적용했어야 하는데, 이 라이브러리를 사용해 통합됨str.replace()시리즈에만 사용 가능일부 일치하는 텍스트 대체정규표현식 사용 가능replace(
서울 아파트 분양가 실습 이어서kosis 실습(국가 및 권역별 전산업·소재부품장비산업별 수출·수입)주피터 노트북 껐다 켰을 때 restart & clear output해서 보기 권장분양가격의 NA => 신규 분양이 없음으로 해석 가능이런 식으로 결측치에 대한 해석을 해
의약품 처방정보 분석kosis 복습matplotlib 계열은 한글 시각화를 지원하지 않음. koreanize_matplotlib 라이브러리로 한글폰트 사용하기파일 불러올 때 glob 사용해서 변수에 지정해서 사용 권장df.drop()how='any' : 디폴트. 결측치
미니 프로젝트\_2 : 대중교통 및 따릉이 이용자 분석
의약품처방 EDA 복습downcast 실습parquet 실습왜 로컬 서버를 사용하지 않고 클라우드 환경을 사용하는가?삼성SDS 아티클https://www.samsungsds.com/kr/insights/cloud_210226.html투자 비용 절감과 개발 환경
github 실습streamlit 실습로컬 서버를 사용하지 않고 데이터센터나 클라우드 서버를 사용하는 이유?(왜 대시보드를 로컬에 띄우지 않고 서버에 띄우는지)안정적인 전력공급, 환경 제공윈도우 환경 -> git bash 추천git과 github의 차이git : git
미니 프로젝트 진행중 !🔥🔥중간 상황 공유 및 정리
미드 프로젝트 진행중 !🔥🔥깃헙 사용법 정리
미드 프로젝트 마무리 !🔥🔥
미드 프로젝트 발표발표 피드백Streamlit 에서 folium 렌더링 속도 개선하기💡 개선점
머신러닝 개요머신러닝 모델 학습과 예측 과정tree 계열 알고리즘머신러닝 : 인공지능 분야의 범주이미지 : 숫자의 배열 -> 숫자를 병렬처리함분류 : label이 있는 데이터의 범주를 나눔e.g. 이미지 분류, 구매 예측, 약품 분류, 텍스트 분류, 이상 유저 분류 등
피처 엔지니어링 이어서랜덤 포레스트하이퍼파라미터 튜닝은 원래 가장 마지막 단계에 함결측치가 많은데 0으로 처리하면 제대로된 분석이 불가능수치형 변수를 범주형으로 인코딩할 수 있음label이 없는 데이터들은 사람이 직접 label을 수작업으로 넣기도 함자동화가 되어 있는
weekly 키워드 정리6주차 titanic 과제노션 페이지https://www.notion.so/likelion-aischool/11-095bdd21d5334182bdf48e1568bcab9c머신 러닝의 한 분야로, 데이터에서 반복적으로 학습하는 알고리즘을
tableau 강의데이터 리터러시 : 데이터를 보고, 활용할 수 있는 능력\-> 데이터 탐색을 통해 본인이 이해하고 이를 다른 사람과 대화와 협업을 통해 찾은 통찰을 공유하는 일련의 능력데이터 시각적 분석 : 데이터 시각화를 기본으로, 인사이트를 구하고 스토리텔링을 추
유튜브 출처https://www.youtube.com/watch?v=b98H87BIrbo&t=140s문제(경진대회) 이해배경, 목적, 유형 등어떤 데이터를 활용해서 어떤 값을 예측해야 하는지?회귀인지, 분류인지?주어진 데이터가 무엇인지?어떻게 접근해서 문제를
🦁🦁의사결정나무(회귀) 이어서파라미터 튜닝회귀에서 Accuracy를 사용하지 않는 이유? -> 예측하는 변수가 연속형이기 때문에 소수점 끝자리까지 정확하게 예측하기 어려워서MAE(Mean Absolute Error) : 오차에 대한 절댓값 평균오차에 대한 직관적인
캐글 타이타닉 경진대회 실습경진대회 데이터셋은 train.csv , test.csv 형태로 제공되는 경우가 많아서 폴더로 관리타이타닉 데이터는 당뇨병 데이터에 비해 결측치도 많고, object type이 섞여있고, 데이터 크기도 조금 더 크기 때문에 더 난이도 있는 데
👉 오늘 한 일 CoC(Code of Conduct). 행동 강령 리마인드 캐글 타이타닉 경진대회 실습 이어서 CoC(Code of Conduct) > 스포카 크리에이터 행동 강령 소개 https://spoqa.github.io/2018/06/28/code-of
🦁🦁✏주간 키워드 정리2010년에 만들어진 “예측 모델 분석 대회 플랫폼”으로서 데이터 과학 및 머신러닝 경진대회를 주최하는 온라인 커뮤니티입니다. 기업과 단체에서 데이터와 해결과제 및 상금을 등록하면 개인 및 팀 단위의 데이터 과학을 연구하는 학생 및 과학자들이
태블로 특강미니 프로젝트 진행중🔥🔥매출 비율 차이 : (ZN(SUM(\[매출])) - LOOKUP(ZN(SUM(\[매출])), -1)) / ABS(LOOKUP(ZN(SUM(\[매출])), -1))ZN : zeronull. null값을 0으로 바꿔줌복잡하고 큰 데이터
타이타닉 앙상블 모델bike sharing demand 경진대회 실습랜덤포레스트 안에 트리의 개수가 100개가 기본값이라면 그 내부에서도 트리를 100개를 만들기 때문에 디시전트리를 사용할 때보다 속도가 더 걸림hold-out-validation 을 사용했을 때 중요한
bike sharing demand 이어서🤔피처 중요도는 높지만 성능 자체가 떨어졌다면?피처 중요도란 어느 데이터 요소가 확률값 계산에 중요하게 작용을 했느냐 하는 정도를 나타내는 것임. 중요도가 높다고 점수에 좋은 영향을 미친다는 것은 아님.피처 중요도는 해당 모델
house price 이어서변수 스케일링피처의 범위를 조정해 정규화하는 것일반적으로 분산과 표준편차를 조정해 정규분포 형태를 띄게 하는 것이 목표피처의 범위가 다르면 서로 비교하기 힘들고 일부 모델에서는 제대로 작동하지 않음Normalization - standardi
위클리 키워드 정리8주차 과제 : diamonds EDA 연습1\. 아웃라이어에 강건해진다.RMSLE는 아웃라이어에 강건(Robust)하다.예를 들어, 예측값 = 67, 78, 91, 실제값 = 60, 80, 90일 때, RMSE = 4.242, RMSLE = 0.64
태블로 특강1) 매출 대시보드매개변수 이용해서 당월 구하기이렇게 만들어진 당월 필드를 필터에 '참' 조건으로 넣기당월 매출 구하기당월 매출 계산 필드를 텍스트 마크로 보내기전월 구하기마찬가지로 이렇게 만들어진 전월 필드를 필터에 '참' 조건으로 넣기매출 대시보드http
house price 피처 엔지니어링 이어서💡Review기술통계(describe())를 볼 때결측치가 있는지이상치가 있는지표준편차는 어떤지전체 피처에 대해 특이점이 없는지 확인이상치 탐색 시이상치를 평균이나 중앙값 등으로 대체하면 데이터에 왜곡이 될 수 있으니 주의희
house price 제출 이어서💡왜도Positive Skewness는 오른쪽 꼬리가 왼쪽보다 더 길 때를 의미하고 평균(Mean)과 중위수(Median)가 최빈값(Mode)보다 크는 것을 의미Negative Skewness 왼쪽 꼬리가 오른쪽보다 더 길 때를 의미하
벤츠 경진대회 이어서💡Reviewpd.concat() : 인덱스 값을 기준으로 합침sklearn.OneHotEncoder()를 사용하면 반환값이 np.array 형태이기 때문에 인덱스 정보도 없고 데이터프레임으로 별도의 변환이 필요함. concat으로 합치기 위해 인
위클리 키워드 정리CatBoost는 2017년 Yandex 에서 개발한 범주형 데이터 처리에 특화된 오픈 소스 소프트웨어 라이브러리CatBoost는 GBM의 가장 치명적인 한계점이었던 과적합 문제를 해결함과 동시에 기존 GBM 계열 알고리즘인 XGBoost, Light
🦁🦁K-MOOC(실습으로 배우는 머신러닝) 수강과거의 AI(Traditional AI) : Knowledge Engineering지식을 잘 조직해서 우리가 유용한 함수로 만들어줌머신러닝에서 학습하는 함수를 사람이 직접 코딩을 함최근의 AI(State of the A
질문 정리Cross Validation은 무엇이고 어떻게 해야하나요?ML 교차검증 (Cross Validation, CV) 이란?https://velog.io/@moonstar/ML-%EA%B5%90%EC%B0%A8%EA%B2%80%EC%A6%9D-Cross-
벤츠 경진대회 - 부스팅 계열 모델 이어서💡부스팅 계열 모델 - XGBoost, LightGBM, CatBoostxgboost는 GBT에서 병렬 학습을 지원하여 학습 속도가 빨라진 모델임기본 GBT에 비해 더 효율적이고, 다양한 종류의 데이터에 대응할 수 있으며 이식
위클리 키워드 정리어느 모델이든 간에 발전을 위한 feedback은 현재 모델의 performance를 올바르게 평가하는 것에서부터 시작한다. 모델을 평가하는 요소는 결국, 모델이 내놓은 답과 실제 정답의 관계로써 정의를 내릴 수 있다. 💡 오차행렬(confusion
코딩테스트 연습코드 스니펫판다스, 넘파이 cheat sheet 준비
SMOTE 이어서🤔정확도로 제대로 된 모델의 성능을 측정을 하기 어려운 사례?클래스가 불균형한 데이터일 때e.g. 금융 => 은행 대출 사기, 신용카드 사기, 상장폐지종목 여부제조업 => 양불(양품, 불량품) 여부헬스케어 => 희귀질병(암 진단여부)IT관련 => 게
딥러닝 이어서🤔28x28 픽셀 이미지로 학습을 하는데 왜 입력에 784개가 들어갈까?Fully Connected Network 에는 1차원 형태로만 주입이 가능하기 때문에 2차원 배열을 1차원 형태로 만들어서 네트워크에 데이터를 넣어주기 위해. 28x28 = 784개
pima 데이터셋 실습 이어서tensorflow 회귀 튜토리얼dropout은 바로 전 layer에만 적용됨🤔loss, metric 의 차이는 무엇인가요?loss 는 모델 훈련 시 W, b 값을 업데이트 해주기 위해 사용함metric 은 모델 검증 시 모델의 성능을 평
위클리 키워드 정리위의 그림은 일반적인 통계학적 모델의 형태로 입력 값이 들어오면 모델을 통해 예측 값을 산출되는 방식이다. 이 그림에서 예측 값이 실제 값과 얼마나 유사한지 판단하는 기준이 필요한데 그것이 바로 손실 함수(Loss Funstion)이다. 💡 손실함
미니 프로젝트 마무리https://dacon.io/competitions/official/235713/overview/description배경목적신용카드 사용자 데이터를 보고 사용자의 대금 연체 정도를 예측하는 알고리즘 개발 평가지표loglossPrivate
DNN 복습사이킷런의 train_test_split() 으로 데이터셋을 나눌 수도 있지만 pd.sample() 로도 나눌 수 있음🤔출력층에 activation function을 지정하지 않았을 때 회귀 혹은 분류 모델이라는 것을 모델이 어떻게 알 수 있을까?loss
CNN 이어서💡Pooling도 stride를 조정할 수 있음🤔softmax 는 어떻게 결과를 처리할까?출력값이 n개의 확률로 나오고, n개의 확률값의 합이 1 🤔sigmoid 는 어떻게 결과를 처리할까?0~1 사이의 확률값을 반환하며 임계값(보통은 0.5)을 기준
CNN 실습 이어서🤔스트라이드를 통해 여러 칸을 이동하면 결과가 어떻게 될까?용량이 줄어들고 학습 속도가 빨라짐. 하지만 자세히 학습하지 못 하기 때문에 언더피팅이 될 수 있음.💡이미지 증강을 할 때 주의해야 할 사항1) 크롭이나 확대 => 노이즈를 확대하거나 크롭
코드 스니펫 정리코테 문제풀이append : 리스트 끝에 원소를 추가extend : 리스트 끝에 모든 원소 추가clear : 리스트 안의 원소 모두 삭제count(a) : 리스트 안에 원소 a의 개수 반환index : 리스트 값의 위치를 반환insert (a,b): 리
Q1. Convolution의 원리는 무엇인가요?Q2. Convolution층에서 padding의 역할을 설명해주세요Q3. CNN의 여러 모델에 대해서 설명해주세요(AlexNet, LeNet, ResNet 등등)
CNN 이어서(1004~)🤔이미지 데이터를 읽어오면 다차원 형태의 구조로 되어있는데 np.array 형태로 되어있음에도 왜 다시 np.array 로 만들어주었을까?리스트 안에는 np.array 로 되어있더라도 여러 장의 이미지를 하나로 만들 때 파이썬 리스트에 작성해
RNN 이어서(1101)💡TF(단어빈도, Term Frequency)TF(단어 빈도, term frequency)는 특정한 단어가 문서 내에 얼마나 자주 등장하는지를 나타내는 값으로, 이 값이 높을수록 문서에서 중요하다고 생각할 수 있음.💡DF(문서 빈도, docu
RNN 이어서 (1106~)RNN layer의 구성💡 ml, dl의 텍스트 데이터 인코딩 방식머신러닝에서는 BOW, TF-IDF 인코딩 방식을 주로 사용하고 딥러닝에서도 사용하기도 함RNN에서는 순차적으로 데이터를 인코딩해주는 시퀀스 인코딩 방식을 사용하면 좀 더
🦁🦁RNN - 시계열(1107 ~ )💡 시계열 데이터기존에는 데이터를 나눌 때 섞어서 나눴는데 시계열 데이터에서는 섞어서 나누지 않고 순서를 고려해서 나눔자연어 텍스트를 시퀀스 인코딩 했던 것처럼 언어도 맥락이 있기 때문에 섞으면 원래 의미를 잃어버릴 수 있음.
비즈니스 데이터 분석 (1201 ~ )🤔pandas.style.background_gradient() 와 seaborn.heatmap()의 차이?pandas 의 background_gradient() => 변수마다 성질이 다를 때, 각 변수별로 스케일값을 표현.s
RFM 분석 (1202)군집화 (1203)RFM은 일정기간 동안에 발생된 고객의 구매 패턴을 이용하여 고객을 분류할 수 있는 분석방법 (고객 세그멘테이션)고객의 가치를 다음의 세 가지 기준에 의해 계산Recency - 거래의 최근성 : 고객이 얼마나 최근에 구입했는가?
파이널 프로젝트 진행중🔥주제 : KoGPT-trinity 모델을 활용한 3행시 생성 모델 구축 및 배포현업자들은 매일 최신 기술을 보기 때문에, GPT나 허깅 페이스 사용 여부에 놀라지 않는다. 대신에 시간을 들여야만 알수 있는것들을 알때 감탄한다. 하나하나를 쓸때
파이널 프로젝트 진행중🔥가설: 의미 없는 영어들이 많을 것이다, 불용어가 많을 것이다영문 가사가 25% 정도라고 가정했을 때 ..발라드의 불용어가 높다문장 유사도 확인 중 → 힙합이 더 높다면, 오히려 유리할 수도. 장르 특성이 강해짐인디 장르에서 ‘안 되는 이유 포
파이널 프로젝트 중간발표저작권 이슈✅ 확인 완료 학습 데이터의 raw data를 깃허브에 명시적 게재하지 않을 것🚨확인 필요 학습 목적으로는 사용 가능한 것으로 확인\-> but 근거 자료 필요전처리 이슈 - (1)✅ 확인 완료 모델별로 인풋 문장의 최대 길이가 상이
프로그래머스 문제풀이(level 0)양꼬치각도기다른 사람 풀이(숏코딩 힙스터..)점의 위치 구하기다른 사람 풀이리스트 내 튜플과 True / False 성질을 잘 이용함배열 원소의 길이아이스 아메리카노배열 뒤집기
프로그래머스 문제풀이(level 0)피자 나눠 먹기 (1)다른 사람 풀이(모듈 사용 x)짝수 홀수 개수다른 사람 풀이문자 반복 출력하기최댓값 만들기(1)삼각형의 완성조건 (1)배열 자르기짝수는 싫어요배열 두 배 만들기편지캐릭터의 좌표
프로그래머스 문제풀이(level 0)중앙값 구하기배열의 유사도
프로그래머스 문제풀이(level 0)암호 해독대문자와 소문자다른 사람 풀이문자열의 대소문자를 바꿔주는 str.swapcase 라는 function이 있다!직각삼각형 출력하기주사위의 개수
프로그래머스 문제풀이(level 0)유한소수 판별하기 📌2시간을 고민했으나 풀지 못했다.. level 0에서 막히는건 처음이다 😥 최대공약수를 구해 기약분수를 구현하는 데까지는 성공했으나, 소인수 판별에서 막혀 결국 다른 사람의 풀이를 참고해서 풀어보았다.이 사람은
프로그래머스 문제풀이(level 0)피자 나눠 먹기 (2)최대공약수를 이용해 최소공배수를 구하는 식을 통해 풀었음인덱스 바꾸기리스트로 치환해 인덱스를 바꾸고 다시 합치기약수 구하기
프로그래머스 문제풀이(level 0)분수의 덧셈최소공배수를 이용해 분수의 덧셈을 구한 후 기약분수가 아니면 최대공약수로 나눠주기
프로그래머스 문제풀이(level 0)숫자 찾기 (85%)\-1인 경우를 제외하고 자리수를 return 하도록 함369게임 (85%)
프로그래머스 문제풀이(level 0)안전지대 📌\[프로그래머스] Lv.0 안전지대정답률 53%, try 3정확성 63 (테케 1,4,5,7 오답)board와 같은 크기의 0 배열을 생성한 후 매핑하는 형태로 풀려고 했으나 테스트 케이스에서 막혔다..다른 사람 풀이정석
프로그래머스 문제풀이(level 0)중복된 문자 제거 📌\[프로그래머스] Lv.0 중복된 문자 제거정답률 83%, try 3set으로 중복을 제거하는 것은 순서 보장이 안되고 dict.fromkeys()는 dict가 순서를 보장하기 때문에 이것을 사용dict의 함수들
프로그래머스 문제풀이(level 0)팩토리얼정답률 83%while문을 사용해 구현. n이 !i 보다 크거나 같아야 하므로 result에서 1을 빼줌다른 사람 풀이math 모듈 활용. 제한사항에 n 값이 제한되어 있었으므로 n의 최대값보다 작은 팩토리얼 중 가장 큰 팩토
프로그래머스 문제풀이(level 0)프로그래머스 SQL 문제풀이(level 1)숨어있는 숫자의 덧셈 (2)정답률 80%연속된 수를 하나의 수로 보기 위해 문자열을 .으로 대체한 뒤 split 하고, 리스트를 순회하며 숫자를 더해줌다른 사람의 풀이연속된 수를 하나의 수로
프로그래머스 문제풀이(level 0)소인수분해 📌정답률 79%, try 2처음 시도한 코드 : 1, 7, 16, 23, 24 실패(정확성 79.2)n이 1보다 클때만 반복. 2부터 시작해서 i로 나누어 떨어지면 리스트에 추가n //= i 해준 뒤 for문을 멈춰주지
프로그래머스 문제풀이(level 0)책 집필 스터디정답률 78%문자열을 돌면서 숫자에 해당하는 문자가 완성되면 딕셔너리에서 해당 수를 가져옴다른 사람 풀이딕셔너리의 키를 돌면서 replace 해주면 내 코드보다 훨씬 깔끔하게 구현할 수 있다!정답률 78%문자열의 길이를
프로그래머스 문제풀이(level 0)컨트롤 제트정답률 77%문자열을 공백으로 나눠서 리스트로 변경한 후에 수를 더해주는데 Z가 들어가면 바로 앞의 수를 빼주기다른 사람 풀이풀이 로직은 같으나 코드 라인 수를 줄였음
프로그래머스 문제풀이(level 0)책 집필 스터디삼각형의 완성조건 (2)정답률 75%가장 긴 변이 sides에 있는 경우와 sides에 없는 나머지 한 변이 가장 긴 변인 경우를 나누어 개수를 센 뒤 더해줌다른 사람 풀이정렬해서 슬라이싱 하는게 시간효율 상 더 빠를
프로그래머스 문제풀이(level 1)정답률 86%제곱근을 씌우면 float 형태가 되버림. 따라서, 제곱근을 씌운 뒤 올림해서 다시 제곱근을 씌운 값과 같은지 비교다른 사람 풀이제곱근을 씌운 수를 1로 나누어서 정수인지 판단함..! math 모듈을 불러오지 않아도 이렇
프로그래머스 SQL(level 1, 2)lv 1카테고리 SUM, MIN, MAXlv 2카테고리 SUM, MIN, MAXmax(price)로는 가장 높은 가격의 id, name, cd, category를 뽑아올 수 없음프로그래머스 lv 2. 진료과별 총 예약 횟수 출력하
프로그래머스 SQL(level 1, 2)프로그래머스 lv 2. 자동차 종류 별 특정 옵션이 포함된 자동차 수 구하기lv 2, 카테고리 group by처음 시도 : OPTIONS IN()~IN연산자는 주어진 값과 데이터의 내용이 일치해야 하기 때문에 안됨. 여러 문자열이
프로그래머스 문제풀이(level 1)lv 1, 정답률 83%만약 signs 이 false라면 absolutes에서 같은 인덱스의 숫자를 마이너스로 바꾸고 더해줌 다른 사람 풀이zip을 활용하면 두 리스트를 비교할 수 있음프로그래머스 lv 1, 제일 작은 수 제거하기(h
데이터 분석 책 집필지난 주 목요일(16일) 스터디에서 목차와 파트분배에 대한 최종 논의가 끝나고, 본격적으로 집필을 시작해 여러 레퍼런스들을 참고해보고 있다.내가 맡은 파트는 기타(부록) 파트. 주피터 같은 IDE 소프트웨어 등 개발 환경에 대한 소개와 깃, 캐글,
프로그래머스 문제풀이(level 1)lv 1, 정답률 82%문자열 슬라이싱 활용다른 사람 풀이if문을 쓰지 않아도 구현 가능함lv 1, 정답률 82%n이 짝수면 "수박"을 n // 2 회만큼 반복해야 하고, 홀수면 n // 2회만큼 반복한 후에 "수"를 붙여주면 됨lv
프로그래머스 문제풀이(level 1)lv 1, 정답률 79%str.isnumeric 은 문자열 형태로 된 숫자를 받아도 True를 반환함다른 사람 풀이isdigit 을 사용할 수도 있음. in 을 활용하면 or 을 쓰는 것보다 편리하게 조건을 찾을 수 있음프로그래머스
급성충수염으로 인해 수술을 마치고 이제 퇴원을 마쳤다.. 다행히 회복 속도가 빨라 책 집필이나 예정되었던 일정들에 영향을 미치지는 않을 것 같다!원티드 프리온보딩 데이터 챌린지 세션프리온보딩 챌린지 ? : 원티드에서 주관하는 데이터 챌린지 세션으로 원티드의 데이터 분석
프로그래머스 SQL 문제풀이💡 목표나만의 컨벤션 지키기(간단하게). 습관을 들이기 위해컬럼명, 테이블명은 모두 소문자로명령어, 함수는 모두 대문자로컬럼명은 Snake case 이용(but, 문제에 있는 컬럼명을 따를 것이라 예외가 있을 수 있음)컬럼명 뒤에 콤마 사용
프로그래머스 SQL 문제풀이lv 1, IS NULL나이 정보가 없는 회원을 WHERE절에 걸고 countlv 1, IS NULLIFNULL을 사용해 NULL 값을 모두 N으로 바꿔줌lv 1, string & dateLIKE문을 사용해 "네비게이션"이 포함된 행 찾기
프로그래머스 SQL 문제풀이lv 2, string & dateAVERAGE가 왜인지 작동하지 않아서 SUM / COUNT로 평균을 직접 구했음. start_date가 대여일을 포함하고 있으므로 +1 해줌 lv 2, string & date상품 코드인 앞 두자리를 추출하
프로그래머스 SQL 문제풀이lv 3, string & date중첩 if문과 DATEDIFF로 출고일이 5월 1일 이전인지 확인하고, NULL일 경우 출고미정으로 출력
프로그래머스 SQL 문제풀이lv 3, String & DateCONCAT 을 통해 문자열을 합침. MID 를 통해 시작 인덱스부터 원하는 글자수를 꺼내올 수 있음
프로그래머스 SQL 문제풀이책 편집lv 4, SELECT두 테이블을 조인한 후 주소가 서울인 것(서울특별시, 서울시 두 가지 형태로 적혀있기 때문에 앞에서 2글자만 따옴)을 필터링 하고, 식당id로 그룹화 한 후 평균 리뷰 점수를 구한 뒤 소수점 셋째자리에서 반올림.지
프로그래머스 SQL 문제풀이책 편집프로그래머스 lv 4, 년, 월, 성별 별 상품 구매 회원 수 구하기lv 4, GROUP BYRFM 표를 만들듯이 풀이. gender를 행단위로 끌고오기 위해 if문 사용. 성별 정보가 없는 것을 먼저 제외시킨 뒤 연, 월, 성별로 그
프로그래머스 SQL 문제풀이책 편집lv 4, JOIN리뷰를 가장 많이 작성한 회원 아이디를 간단하게 조회할 방법이 떠오르지 않아 서브쿼리를 남발했다.. 정답이긴 하지만 좋지 않은 풀이인듯 하다다른 사람의 풀이 중 가장 깔끔한 풀이를 참고해봤다.기본적인 틀은 내 풀이와
프로그래머스 SQL 문제풀이책 편집 & 편집 툴 적용lv 4, JOIN7월 판매 데이터에서 맛별로 주문량을 합쳐준 derived 테이블 생성, 상반기 주문량 테이블과 JOIN해서 7월 총판매량 + 상반기 총판매량을 구한 뒤 상위 3개만 추출. 맛(flavor) 컬럼만
프로그래머스 SQL 문제풀이책 편집 & 편집 툴 적용프로그래머스 lv 4, 특정 기간동안 대여 가능한 자동차들의 대여비용 구하기lv 4, JOIN처음 생각한 답안. 총 2개 행이 출력되어야 하는데 4개 행이 출력됨. 날짜 조건을 잘 걸어주는게 핵심이다. 내가 푼 방법은
프로그래머스 SQL 문제풀이책 집필 - 편집 툴 적용프로그래머스 SQL
프로그래머스 SQL 문제풀이책 집필 - 편집 툴 적용프로그래머스 lv 4, 자동차 대여 기록 별 대여 금액 구하기lv 4, String & Date가장 먼저 대여 기록 테이블에서 대여일과 대여일에 따른 대여기간 종류를 담은 필드 생성. 7일 미만이면 NULL로 처리.
프로그래머스 SQL 문제풀이책 집필 - 편집 툴 적용lv 5, JOIN가입일이 2021년인 고객을 전부 세서 서브쿼리로 활용. 메인쿼리에서는 두 테이블을 조인한 후 가입일이 2021년인 고객을 필터링해서 판매년도(YEAR(sales_date)), 판매월(MONTH(sa
책 집필 - 편집 툴 적용해커랭크 SQLmedium, Basic Joinhttps://www.hackerrank.com/challenges/full-score/problem?isFullScreen=true네 테이블을 조인하는 문제. 어떤 컬럼으로 조인하느냐에
책 집필 - 편집 툴 적용해커랭크 SQLmedium, advanced selecthttps://www.hackerrank.com/challenges/occupations/problem?isFullScreen=true생각한 풀이여기까지 생각해봤으나 더 이상의 진
책 집필 - 편집 툴 적용해커랭크 SQLmedium, basic joinhttps://www.hackerrank.com/challenges/contest-leaderboard/problem?isFullScreen=true먼저, 각 hacker별로 challen
책 집필 - 편집 툴 적용해커랭크 SQL
책 집필 - 편집 툴 적용해커랭크 SQLmedium, Advanced Joinhttps://www.hackerrank.com/challenges/sql-projects/problem?isFullScreen=trueStart_Date 중 End_Date에는 없는
리트코드 SQL 문제 풀이Easyhttps://leetcode.com/problems/combine-two-tables/person 테이블에 있는 컬럼인 성(firstname)과 이름(lastname)을 모두 불러오고 address에는 정보가 없는 데이터들을
리트코드 SQL 문제 풀이easyhttps://leetcode.com/problems/duplicate-emails/중복된 메일을 찾기 위해 email로 그룹화한 후 갯수가 2개 이상인 것을 추출
리트코드 SQL 문제 풀이easyhttps://leetcode.com/problems/customers-who-never-order/customers 테이블에는 있지만 orders 테이블에는 없는 고객 id(c.id, o.customer_id)를 찾기 위해 o
리트코드 SQL 문제 풀이easyhttps://leetcode.com/problems/delete-duplicate-emails/DELETE 구문 활용하기. delete 문을 사용하기 위해 셀프 조인을 활용. 이메일을 키값으로 사용하고 이메일이 중복일 경우 i
리트코드 SQL 문제 풀이easyhttps://leetcode.com/problems/game-play-analysis-i/플레이어별 최초 로그인 데이터를 추출하기 위해 player_id로 GROUP BY한 후 로그인 날짜에 해당하는 event_date의 최솟
리트코드 SQL 문제 풀이easyhttps://leetcode.com/problems/sales-person/RED와 관련 있는 사원 번호(sales_id)를 구해 서브쿼리로 활용. 메인 쿼리의 WHERE 절에서 사원 번호가 이에 해당하지 않는 것만 추출함
리트코드 SQL 문제 풀이책 집필 - 가격 책정 및 출판사 선정easyhttps://leetcode.com/problems/recyclable-and-low-fat-products/저지방(low_fats) 여부가 "Y"인 것과 재활용 가능 여부(recyclab
언어 : PythonIDE : Jupyter notebookSeason : 계절. 1,2,3,4로 Ordinal Encoding(순서가 있는 값)이 되어있음weather : 1이면 맑은 날, 2는 흐린날, 3은 눈,비 오는 날, 4는 폭우, 폭설, 우박 내리는 날tes
리트코드 SQL 문제 풀이easyhttps://leetcode.com/problems/top-travellers/두 테이블을 조인하는데 users 테이블의 모든 이름을 추출해야 하므로 LEFT JOIN 사용.user_id로 그룹화하고 거리(distance)를
리트코드 SQL 문제 풀이easy, 51%https://leetcode.com/problems/find-users-with-valid-e-mails/정규표현식으로 조건에 맞는 이메일을 매칭시켜야 함.가장 처음에는 알파벳만 올 수 있으므로(prefix name)
리트코드 SQL 문제 풀이Easy, 48%https://leetcode.com/problems/user-activity-for-the-past-30-days-i/유저 활동 날짜(activity_date)가 2019년 7월 27일에 끝나면서 그로부터 30일 이내
리트코드 SQL 문제 풀이easy, 50%https://leetcode.com/problems/calculate-special-bonus/서브쿼리로 보너스를 받을 사원id(employee_id)를 추출한 뒤 메인 쿼리의 IF 절에서 비교. 봉급의 100%이므로