
자주 쓸 것 같은 함수 복습 replace 이전에 사용하던 오래된 데이터 값을 다른 문자로 전체 수정해야 할 때 substr 데이터에서 특정 값만 뽑아서 추출하고 싶을때 concat 추출하고 싶은 결과 값이 원래의 데이터와는 전혀 다른 포맷일 때특정 문자열을 다른 문

IF문 (참/거짓) 음식 타입을 'Korean' 일 때는 '한식', 아닌 경우에는 '기타'로 지정 결과값 CASE WHEN 조건을 두 개 이상 지정하는 경우 (= if 문을 여러번 쓴 효과) 음식 타입을 'Korean'일 때는 '한식', 'Japanese' 혹은

프로그래머스_SQL문제 / 동명 동물 수 찾기 이름이 두개 이상인 애들을 이름으로 묶어서 카운트하는데에서 막혔다. group by name 으로 묶는건 알겠는데 이름이 두개 이상인걸 어떻게 거르지? 찾아보니 having count 로 쓰면 되는 거였다. count(

프로그래머스_SQL문제 / 흉부외과 또는 일반외과 의사 목록 출력하기 여기서 막혔던 곳은 date_format 함수로 날짜 포맷을 바꿔주는 것 order by 에서 숫자로 지정하니까 정답이 아니었었다. > date_format Date_format 구분기호

문법을 대충 알면 생기는 일..


pandas 라이브러리 사용 선언 데이터 정제 작업 공백 수 확인 공백 데이터 제거 데이터 분석 작업 상관계수 구하기 상관계수란? 상관관계 분석했을 때 나오는 -1~1사이의 숫자 변수들 사이 통계적인 관계를 표현하기 위해 특정한 상관 관계의 정도를 수치적으로 나

이전 분석 결과 '나이'와 생존율의 관계가 미미한 수치로 나왔는데, 이번에는 나이대별로 생존율과의 관계를 더 깊이 알아가보자. 라이브러리 불러오기 numpy란? 데이터 연산을 빠르고 쉽게 할 수 있게 도와주는 라이브러리 seaborn 이란? matplotlib으로

조건에 맞는 사용자와 총 거래 금액 조회하기 이렇게 작성했는데 오류가 뜬다. 찾아보니 는 사실을 알았다‼️ 집계함수(AVG, SUM, COUNT 등등)은 group by와 묶어서 씀 where 대신 having 에서 집계함수 쓸 것 가격대 별 상품 개수 구하기

식품분류별 가장 비싼 식품의 정보 조회하기 where 절 서브쿼리에 카테고리 별 최댓값을 찾고 and로 필요한 카테고리만 선별한다. 전체 데이터를 조회해서 보면 제일 비싼 과자는 맛있는 허니버터칩이다 오답의 결과를 보면 max(price)와 product_name 이 매칭되지 않아 정답이 아니다. 5월 식품들의 총매출 조회하기

시간 데이터 전처리 시간 데이터가 timestamp형식으로 되어있으면 python을 활용해서 다양한 정보를 뽑아낼 수 있다. ex) 시간대별, 월별, 요일별, 윤년 여부까지 데이터 종류 확인 to_datetime() : str -> timestamp 요일별 시간별 컬럼 추가 추가 함수들 [출처 블로그](https://m.bl

막대그래프 색 변경하기 막대그래프 테두리 변경하기 그래프 너비 변경하기 그래프 데이터 계열 나타내기 가로 그래프 자동차 대여 기록에서 대여중/대여 가능 여부 구분하기 car_id 별 최신 값은 max 함수로 뽑자! 년, 월, 성별 별 상품 구매 회원 수 구하기 이 문제는 혼자 생각해보려고 했으나, 전혀 모르겠어서 다른사람이 푼 정답을 확인해봤...

헤비 유저가 소유한 장소 다른 사람들의 풀이를 보던 중 with로 푼 사람이 있어서 with 문에 대해서 찾아봤다. > WITH 문이란? 이름을 가진 서브쿼리를 정의한 후 사용하는 구문 쿼리의 전체적인 가독성을 높이고, 재사용할 수 있는 장점이 있음 대부분의 DBMS에서 지원함 계층형 쿼리를 구현할 수 있음 문법은 다음과 같다 출처 with 절에...

주문량이 많은 아이스크림 조회하기 order by 절에 집계함수를 사용할 수 있는지 처음 알게되었다. 미니프로젝트를 위한 새로운 조가 생기고, 캐글 등에서 데이터 분석을 위한 데이터를 다운 받고 sql을 사용해보려고 했는데 오류만 백만번 떠서 화가 많이 났다 ^^.. 후 이걸로만 한시간 넘게 소요됐다. mysql workbench도 오류나고 뭐가 문젠지...

프로젝트 주제 기획 목표 : 2024년도 봄 시즌 매출증대를 위한 프로모션 상품 도출하기 데이터셋 : 캐글_Consumer Behavior and Shopping Habits Dataset 오늘 한 것 프로젝트 회의(2시, 8시) 헤비고객에 대한 정의 및 헤비고객의 구매정보 파악 진행 과정 헤비고객 분류하기 헤비고객을 나누기 위한 기준을 세워보려고 ...

오늘 한 것 프로젝트_ 헤비유저 정의 구체화, 당위성 찾아가기 SQL 코드카타 3문제 프로젝트 진행과정 헤비유저와 일반유저는 어제 나눴고, 그 두 집단의 매출액을 비교해봤는데, 일반유저의 매출액이 훨씬 많았다. 그렇게 되면 우리 프로젝트의 첫번째 목적이었던 큰 대전제가 무너지는 거라고 생각해서 좀더 깊게 파봤다. 현재 프로젝트에서 쓰고있는 데이터에는 유저...

오늘 한일 미니 프로젝트 마무리 단계 SQL 코드카타 3문제 csv vsc에 넣어보려고 시도했으나 처참히 실패 데이터분석 5주차 복습 진행과정 프로젝트를 위한 데이터는 어제 대부분 정리를 마쳤기 때문에, 마지막으로 발표를 위한 정제과정을 가졌다. 개인적으로 나 자신에게 아쉬웠던 점을 꼽자면, 판다스를 활용해서 데이터 분석을 하기가 아직은 어렵다고 느꼈다. ...

오늘 한 일 vsc에 주피터노트북 설치 각 조 프로젝트 발표회 참석 진행과정 3일간의 시도끝에 vsc에 주피터 노트북을 설치할 수 있었다. 코랩을 썼을 때는 넘파이, 판다스를 따로 설치해줄 필요가 없었으나, 리서치를 해보니 vsc에서 활용하기 위해선 따로 인스톨(터미널을 통해!)을 해야했었다. 설치하는데 도움이 되었던 자료 링크를 걸어둔다. yunny.w...

특정 기간동안 대여 가능한 자동차들의 대여비용 구하기 문제는 점점 어려워지고,, 난 다른 사람의 풀이마저 이해하지 못하는 상황에 이르렀다. 정답 코드가 점점 길어지고 있는데 사람들은 이 복잡한 과정을 어떻게 풀이해나가는지 너무 궁금하다. 30일간의 대여금액 계산하기 (FEE) FEE의 범위 where 절에 지정하기 2022-11-01~2022-11-3...

자동차 대여 기록 별 대여 금액 구하기 어제부터 풀던 문제인데 죽어도 이해가 안가서 튜터님께 내가 쓴 코드 확인을 부탁드렸다 ㅠ case when절의 조건값이 모두 똑같은 경우 case when을 쓸 필요가 없음 from절 서브쿼리만 따로 실행해보면, "일수" 와 duration_type이 매칭되지 않음 "일수" 와 duration_type이 일치되도...

자동차 대여 기록 별 대여 금액 구하기 맞는줄 알았는데 오답이었다. 여기서 COALESCE는 > COALESCE 함수 NULL이 아닌 첫번째 값 가져옴 NULL이 있을 시 디폴트값이 필요할 때 대체하기위해 사용 ex. coalesce( [컬럼명], 0 ) : [컬럼명] 안에 NULL이 있으면 0으로 대체함 FEE 값을 구하...

Rising Temperature datediff 함수로 각자 다른 컬럼에서의 시간차는 구해봤지만, 한 컬럼에 있는 데이터들을 어떻게 분리하지? 에서 잠깐 막혔었다. 그러다 self join을 해서 recordDate를 두개를 만들어 놓고 비교하는게 생각났다. 직

Average Time of Process per Machine 또 다른 self join 문제였다. 조인을 할때 조건이 이번엔 3가지다. machine_id 가 일치할 것 process_id 가 일치할 것 (b.timestamp에서 a.timestamp를 빼니) a.activitytype = 'start' and b.activitytype = 'end...

문제7. "주별 매출 순위 및 평균 매출 목표 달성 여부 확인" 내가 쓴 쿼리 튜터님 쿼리 내가 보기엔 두 쿼리 답안이 거의 비슷한 것 같은데..(정확하게 비교는 안해봤지만) rank 대신 rownumber를 써도 되는지 물었을때 rownum은 정렬해서 순서를 나열하는 거이기 때문에 rank랑은 다르다고 답변을 받았다.🥲 그렇담 이문제는 틀린 걸까...

개인 과제 풀기위해 관련 자료를 찾다가 새로운 문법을 발견해서 기록 남겨본다. > List Comprehension 리스트를 쉽고 짧게 한줄로 만들 수 있는 파이썬 문법 중 하나 문법 살펴보기 예시 if문 예시 이 뿐만이 아니라 다른 자료 구조로의 확장까지

코드카타 1934. Confirmation Rate Confirmations 테이블에서 confirmed된 건들의 confirmation_rate을 구하는 문제이다. 처음으로 혼자서 with문을 써봤다. 여태까지 남의 코드 보고 with문을 따라 써보기만해서 이제 뭔가 0.5단계 성장한 기분 🙂 아무튼 엄청 고민하면서 길게 쿼리를 작성했는데... ...

Confirmation Rate에서 의문이었던 점 AVG(Case when) 으로 sum/count 와 같은 결과를 낼 수 있다? signups 테이블에는 있지만 confirmations 테이블에는 없는 id=6이 어떻게 null값이 안나올 수 있는지 튜터님이 excel로 직접 case when을 만들어서 예제를 만들어주신 덕분에, avg(case w...

코드카타 알고리즘 문제 풀다 처음 보는 함수가 있어서 찾아봤다. 자연수 뒤집어 배열로 만들기 문제 설명 자연수 n을 뒤집어 각 자리 숫자를 원소로 가지는 배열 형태로 리턴해주세요. 예를들어 n이 12345이면 [5,4,3,2,1]을 리턴합니다. 제한 조건 n은 10,000,000,000 이하인 자연수 입출력 예 | n | return | | ---...

JOIN 함수 > JOIN '문자형' iterable 한 자료 구조에 특정 구분자를 추가하여 문자열로 반환한다. 예시 출처 [프로그래머스] 정수 내림차순으로 배치하기 문제 설명 함수 solution은 정수 n을 매개변수로 입력받습니다. n의 각 자릿수를 큰것부터 작은 순으로 정렬한 새로운 정수를 리턴해주세요. 예를들어 n이 118372면 87...

힘내쟈

오늘 한일 웹 스크래핑 라이브세션 참석 역할분담을 사다리타기로 결정했다. 나는 PPT로.. 가설 설정 및 인사이트 도출 가설에 응하는 데이터 분석하기 디비버, workbench 모두 데이터 가져오는 과정에서 데이터타입 변경하는데 실패 입실하자 마자 들은 웹 스크래핑
오늘 한 일 늦잠자서 새벽 수영 강습을 놓치다! 회의,, 유의미한 데이터 자료 분석하기,, 회의 ,, 결론 도출해보기 PPT 만들기 시작 앞으로 할 일 결론 마무리 짓기 지표에 대한 고민 PPT 끝장나게 만들기

오늘 한 것

오늘한 일 내일할 일

오늘 한 것 코드카타 풀기 1, 2채널 프로젝트 발표영상 시청 통계학 수강하기 ☠️☠️ python 개인과제 피드백을 보고 회고하기 평균을 망치는 왜도와 이상치 왜도 Skewness 왜도는 특정한 방향으로 데이터가 쏠려있는 것. 왜도가 있으면 평균이 전체 데이터를 대표하지 못함 출처 이상치 Outlier 다른 관측치와 유의하게 다른 데이터 유의하다는...

오늘 한 것 코드카타 문제 풀이 (sql / python) 통계 수강 ☠️☠️☠️ 전처리 수강 1주차 트랜젝션 sql 쿼리 작성하기 새로운 조 편성 통계수업은 지금 거의 동태눈깔로 수강하고 있다. 이거 5회독 이상은 해야할 것 같다. 데이터 분석 강의 보다 더한놈을 만났다. 전처리/시각화 강의 첫시간에 데이터 분석가 유형에 대해 배웠다. 비즈니스 분석가,...

코드카타 (sql/python)판다스 10분 타이핑통계 데이터셋 실습초보자를 위한 파이썬 300제통계...Aㅏ.... 말을 아끼겠습니다.드디어 기다리던 기초 프로젝트 서면 피드백을 받았다. 즉석에서 받는 피드백보다 튜터님들이 녹화본을 보고 서면으로 알려주는 것이다 보니
판다스 10분 타이핑코드카타 (sql)전처리/시각화 강의 시청t-test, 아노바 관련 질문개인과제 풀기

통계 데이터실습2 블로그 정리전처리 강의 완강하기전처리 2주차, 3주차 HW 풀기 및 블로그 정리파이썬 300제 31~40과제 제출하기통계 데이터실습 3 블로그 정리코드카타 모르는 문제 정리판다스 10분 타이핑

10분 판다스Git 특강통계 데이터실습 3 블로그 정리과제 제출하기코드카타 \- Sql \- python파이썬 300제 51~60

오늘 한 것 10분 판다스 코드카타(python) 2개 블로그 정리 -가운데 숫자 가져오기 [수박수박수박수박수박수?](https://velog.io/@jellda/Python-%EC%88%98%EB%B0%95%EC%88%98%EB%B0%95%EC%88%98%EB%B0%95%EC%88%98%EB%B0%95%EC%88%98%EB%B0%95%EC%88...

오늘 한 것 파이썬 300제 71~90 코드카타 2문제 머신러닝 강의 듣기 강의 내용 정리

오늘 한 것 파이썬 300제 91~120 코드카타 python 2 문제 머신러닝 심화 강의 1-3~1-12

파이썬 300제 121~130머신러닝 심화 강의머신러닝 개인과제 머신러닝 개인과제 문제에는 day_of_week 가 있다는데 내가 가지고 있는 csv는 데이터는 그런 컬럼이 없어서 의아하다. 분명 같은 링크를 통해 다운받았을텐데,,, import 경로에 씌여진 파일 이

태블로 강의 시청태블로 대시보드 실습혼자서 어찌어찌 만들어봤는데, 넘 어렵다.그래도 대충 어떻게 만들어야하는지 감 잡은 것 같다! 튜터님 자료 따라 만든 대시보드이렇게 나란히 두니 너무 비교되는 내가 만든 대시보드..😑심화 프로젝트 녹화본 시청머신러닝 주차때 너무 스

태블로 개인 과제 제출공정운영최적화 EDA 분석 -> 다른 dataset 찾기태블로는 쉬운듯 어려운듯 쉬운듯 어렵다..도넛차트는 해보려고 며칠을 시도했으나 그냥 포기하고 맘 편히 과제해설 영상으로 확인하련다..ㅎㅎㅎ.ㅎ...앞단 문제들을 다시 풀려고 해보니 그래프가 똑

AB test 공부소프로젝트 디벨롭 위해선? \- 날짜 데이터 추가해보기 (유의미한 결과 안나올 확률이 높음) \- 딥러닝AB test

실전프로젝트 주제 선정프로젝트 EDA 확인 가격 컬럼 새로 생성RFM 개념 공부

오늘 한 것 태블로 신병과제 2,3일차 스파크 강의 듣기 (1-1, 1-2) 실전 프로젝트 정리

오늘 한 것 태블로 5일차 과제 제출 스파크 실습 ( 하차 ㅎㅎ...) pycaret 써보기 태블로 신병훈련소에서 새로운 것을 배웠다. 바로 태블로 엑셀러레이터_공식문서 태블로 탬플릿 태블로 엑셀러레이터란 미리 작성된 샘플 대시보드로 특정 산업 및 엔터프라이즈

챌린지 A반 학습가상환경 세팅ROC curve, PR curve 차이PR curve 구하기새로운 모듈을 설치할때마다 호환성 문제로 오류가 나면 어찌할 줄 모르겠다. 그래서 새롭게 해보려고 한게 가상환경 세팅인데.다른 블로그들 보면서 수십번을 따라 해봤지만 내 컴퓨터에서
클러스터링 시각화 태블로 작업옵튜나 해보기아직도 돌아가는데,, 언제까지 돌아가려나 ㅎㅎㅎ...API 예습하기왜 안가져와질까요.... 해결방법을 찾으면 블로그에 정리해 올려놓을 예정이다.🥲
회의회의회의데이터셋 찾아보기EDA 조금 현석 튜터님의 피와 살이 되는 피드백..🙇🏻♀️❤️🩹어제부터 챌린지반에서 내려온 크롤링 숙제를 해보려곤 했는데내가 작성한 코드는 아무것도 가져오질 못했다. 제목만이라도 불러와보자 하고 오늘도 시도를 해봤는데 여전히 안된다

SQL 코드카타크롤링 2차 시도자료 수집 (레퍼런스 자료, 뉴스 스크랩)주제 구체화 현재 보여지는 Medium 일단 이렇게 제목 하나는 불러왔다. 그런데 이걸 for문으로 6개를 불러오는게 오전까지 잘 안됐었다.😢그런데!방금 다시 시도했더니 해결해서 해결한 과정을

카테고리 관련 EDA \- 브랜드/카테고리/제품 별 매출액 순위 및 전체 매출 기여도 확인 \- 매출 top 5 카테고리의 연도별 매출액 추이 챌린지반 숙제 : GCP mysql 연결하기 -> 실패사장의 시각에서 데이터를 어떻게 바라봐야하는지 고민하기 data 어떻
멀게만 느껴졌던 수료날이다.그동안의 과정을 돌이켜보면 좋았던 일, 힘들었던 일 등 여러가지가 있었는데 어찌돼었건 한가지 분명한 점은 내배캠 부트캠프를 신청하길 잘했다 이다.특히나 데이터분석 트랙의 경우 우리가 1기였어서, 다른 기수 혹은 다른 부트캠프에 비해 얻을 수

지난 이틀간 팀원들과 최종 프로젝트 회고하면서 우리의 프로젝트 결과물을 재점검했다. 최종 피드백 내용이 좋은 내용은 아니었어서, 우선 여행중에 있는 승현님을 제외한 세명은 디벨롭하는데 동의했고, 다시 분석해 나가기로 했다.프로젝트 배경에 마케팅적 요소는 과감히 배제하고