
나는 어떤 히스토리를 가지고 데이터 분석트랙에 참여하게 되었나요?데이터사이언스를 복수전공으로 2년 공부한 후 학부 졸업을 했습니다. 대학원 진학을 고려하고 있었지만 계획대로 진행되지 않았고, 앞으로 무얼 하면 좋을지 고민을 하다 일단 뭐라도 해보자 하는 마음으로 내일배
내가 데이터 분석 트랙에 참여한 계기는 무엇인가요?학부에서 데이터사이언스를 복수전공하면서 이 분야가 얼마나 무궁무진한지 알 수 있었습니다. 나는 데이터사이언스 에서도 어떤 분야에 더 관심을 두어야 할까 고민하다 여러 다른 분야 중 가장 익숙하면서도 관심이 가는 데이터
아티클 '데이터 분석이란 무엇일까요?'아티클 '데이터 분석가는 어떤 일을 하나요?'원문 링크데이터란?데이터 분석이란?데이터 분석은 왜 중요할까?데이터 분석 프로세스데이터 분석에 필요한 기술은?데이터 분석가: 데이터 수집, 수정, 조사, 분석, 인사이트 도출, 지식 내재
걷기반 SQL 문법 연습SQL 문법 연습 1-5예시:ORDER BY에서 DESC 생략 시 오름차순 정렬예시:예시:: id가 1인 학생의 age 값을 24로 수정예시:기본 키 Primary Key: 테이블에서 각 행을 고유하게 식별하는 열(또는 열의 조합)외래 키 For
아티클 스터디 2건엑셀보다 쉽고 빠른 SQL 1주차엑셀보다 쉽고 빠른 SQL 2주차사전캠프 걷기반 SQL 파트를 마무리하려다가 제공되는 강의를 먼저 들어보는 게 좋을 것 같아 '엑셀보다 쉽고 빠른 SQL' 강의 수강을 시작했다. 어제 공부한 내용과 겹치는 부분은 생략하
아티클 스터디 2건엑셀보다 쉽고 빠른 SQL 3주차엑셀보다 쉽고 빠른 SQL 4주차REPLACE(바꿀 칼럼, '현재 값', '바꿀 값')SUBSTR(조회할 칼럼, 시작위치, 글자 수)끝까지 가져오고 싶을 때는 세 번째 파라미터 생략CONCAT(붙이고 싶은 값1, 붙이고

아티클 스터디 2개엑셀보다 쉽고 빠른 SQL 5주차avg_rating의 경우 'Not given'값을 0으로 처리null_rating의 경우 'Not given'인 값을 null값 처리하여 제외함1) IF문 활용IF(rating >= 1, rating, 대체값)2)
아티클 스터디 3개파이썬 문법 뽀개기 1-15파이썬 기초가 있으므로 1-15 강의를 들으면서 정리해두면 좋을 부분만 추려 기록하도록 하겠다.행의 개수가 매우 많은 데이터를 다룰 때, enumerate 함수를 통해 인덱스에 쉽게 접근할 수 있음전체 데이터에 대해 코드를
파이썬 문법 뽀개기 16-18결과result1: people을 순회하면서 하나하나 check_adult 함수에 넣어라. 그 값을 list로 출력.result2: people을 돌면서 person에 넣고, person을 ('성인' ...)으로 리턴해라. list로 출력.

데이터사이언티스트 직무 분석사전캠프 달리기반 Lv.1-5빅데이터에서 목적에 따라 유용한 정보를 추려 제품 또는 서비스를 개선하는 업무를 맡는 전문가데이터 분석, 통계, 머신러닝, 예측 모델링, 데이터 시각화 등의 기술을 활용하여 데이터 기반의 문제 해결분석 뿐만 아니라

1. 아티클 스터디 1개 > 2. 사전캠프 달리기반 파이썬 과제 1-3 > 3. SQL 세션 random 모듈 항상 헷갈리는 랜덤 모듈 .. 불러오기 (import) random() 0과 1 사이의 난수 반환 randrange(a, b) \[a, b) 범위의 무작

아티클 스터디 1개SQL/알고리즘 코드카타SQL 세션 복습'--'나 '\`\`\`\-- 전체 사용자 데이터를 조회SELECT \*FROM users;/ 특정 사용자 데이터를 조회SELECT user_name, emailFROM usersWHERE user_id = 1;

SQL/알고리즘 코드카타SQL 세션 및 복습zip(iterable)iretable한 각 요소를 같은 인덱스끼리 잘라서 리스트로 반환행렬의 덧셈은 행과 열의 크기가 같은 두 행렬의 같은 행, 같은 열의 값을 서로 더한 결과가 됩니다. 2개의 행렬 arr1과 arr2를 입
직무 분석 발표 준비SQL/알고리즘 코드카타\[python/알고리즘] 프로그래머스 삼진법 뒤집기\[python/알고리즘] itertools 라이브러리 combinations로 모든 조합 찾기\[SQL] window 함수 RANK() | GROUP BY와 MAX 함께 쓰
SQL 코드카타기초 분석 과제 팀플SQL 세션\[SQL] GROUP_CONCAT원래 계획은 코드카타 많이 풀고 SQL 세션 복습까지 하는 것이었다. 지난 주처럼 여유가 있을 줄 알았는데 새로운 기초 분석 팀프로젝트가 시작되고 팀 회의에 시간을 많이 쓰게 되면서 오늘 계
\[SQL] JOIN | key | UNION\[SQL] 서브쿼리\[python/알고리즘] 뒤에서부터 인덱스 찾기 | rfind | rindex\[SQL] window function 윈도우 함수회고
아티클 스터디 1건SQL 코드카타SQL 세션 복습팀 과제 쿼리 정리\[SQL] WITH 절오늘 팀 과제를 하면서 팀원 분과 각자 짠 쿼리 및 결과를 비교해 보다가 GROUP_CONCAT() 함수가 실행될 때에는 기존 열의 순서에 무관하게 CONCAT이 일어날 수 있다는
참고자료 - [MySQL] 데이터(값)가 없는 날짜도 출력하여 채우기
SQL 코드카타알고리즘 코드카타\[python/알고리즘] 프로그래머스 | 2016년 | 주어진 날짜의 요일 구하기첫 팀 과제가 끝났다. 오늘 아침까지 피피티 수정하고 스크립트 완성해야 했던 쉽지 않은 일정이었다. 그래도 무사히 마칠 수 있어서 다행이다. 협업과 커뮤니케
SQL/알고리즘 코드카타데이터 분석 파이썬 종합반 1-3주차\[python/알고리즘] 아스키 코드 변환\[SQL] 문자열 길이 세기\[python/알고리즘] 날짜 및 시간 다루기 | datetime | dateutil새로운 챕터가 시작되었다. 들을 강의들이 새로 올라와
SQL/알고리즘 코드카타아티클 스터디데이터 분석 python 종합반 4주차백준 문제 풀기\[python/알고리즘] 백준 10809번 | 알파벳 찾기 | ord()와 딕셔너리 이용하기오늘 아티클 스터디를 통해 어렴풋이 들어보기만 했던 데이터 웨어하우스, 데이터 레이크,
SQL/알고리즘 코드카타백준\[SQL] JOIN 절에 조건 추가하기 | leetcode - average selling price\[python/알고리즘] 프로그래머스 햄버거 만들기 | stack 이용하여 풀기\[python/알고리즘] 백준 2231 - 분해합이제 SQ
아티클 스터디데이터 분석 파이썬 기초 완강파이썬 세션 과제 6문제SQL 코드카타\[python] 파일 불러오기 및 저장하기\[python] glob 사용하기\[python] os 사용하기\[SQL] 조건에 맞는 값만 SUM/COUNT 하기\[SQL] WHERE절 'IN
QCC 1회차SQL/알고리즘 코드카타백준\[SQL] SELECT TOP | 행 개수 지정해서 조회하기\[알고리즘] 분할정복 알고리즘과 정렬첫 QCC가 진행되었다. 조금 긴장했는데 첫 QCC라 그런지 어렵지는 않았다. 최근 leetcode에서 SQL 코드카타를 풀면서 배
SQL/알고리즘 코드카타데이터 리터러시 2강데이터 전처리&시각화 1강\[알고리즘] 퀵 정렬 quick sort\[python/알고리즘] 파이썬 입력 받기 | sys.stdin.readline()\[python/알고리즘] 계수 정렬 | 백준 10989 수 정렬하기3오늘은
아티클 스터디SQL/알고리즘 코드카타데이터 리터러시 3강데이터 전처리&시각화 2강\[python] 2진수, 8진수, 16진수 반환 내장함수 | bin(), oct(), hex()\[python/알고리즘] 두 가지 방법으로 피보나치 수열 구현하기\[Pandas] 판다스
데이터 리터러시 완강데이터 전처리&시각화 3강\[Pandas] 판다스 데이터 선택 | loc | iloc\[Pandas] 판다스 불리언 인덱싱 | 데이터 추가하기\[Pandas] 판다스 데이터 병합\[Pandas] 판다스 데이터 집계 | group by | pivot
아티클 스터디데이터 전처리&시각화 완강SQL 코드카타오늘은 데이터 전처리&시각화 강의를 끝내는 데에 총력을 다했다. 내용이 적지 않고 아직 matplotlib이 손에 작 익지 않아서 다시 벨로그에 정리하는 데 시간이 오래 걸렸다. 세션 실습 타임에 튜터님 따라서 코드를
QCC알고리즘 코드카타세션 수강\[SQL] DELETE로 중복행 제거하기\[Pandas] 판다스 데이터프레임 함수 처리 | 기초 통계 | 판다스로 날짜 다루기오늘 QCC는 아쉬움이 많이 남는다. 꼼꼼하지 못했던 것과, 문제가 요구하는 조건을 충족시키기 위해 한 번 더
pandas 과제 제출SQL/알고리즘 코드카타\[python/알고리즘] 정규표현식오늘은 파이썬 판다스 개인 과제를 완성하고 제출했다. 한 번에 쉽게 풀리지 않는 문제도 있었지만 스스로 구글링을 하면서 문제를 해결하는 과정이 재미있었다. 코드카타 문제에서 정규표현식을 이
아티클 스터디SQL/알고리즘 코드카타\[python/알고리즘] 유클리드 호제법으로 최대공약수, 최소공배수 구하기\[python/알고리즘] collections 모듈 Counter오늘은 코드카타 문제를 풀 수 있었다. 알고리즘 코드카타는 여전히 쉽지 않았다. 특히 멀리뛰
아티클 스터디팀 프로젝트 준비 코드카타...새로운 기초 프로젝트가 시작했다. 오전에 바로 발제를 듣고 팀원들과 무한 회의에 매몰된 하루였다. TIL 작성도 잊어버렸다.. 우리 조는 EPL 데이터를 선정하였고, 어떤 흐름으로 어떤 분석을 할지를 개괄적으로 정하였다. 시간
코드카타팀 프로젝트 준비추후 따로 정리할 예정 ..오늘은 오전에 빠르게 코드카타 7문제를 풀고 나머지 시간은 팀 프로젝트 준비에 집중하였다. 내가 좋아하고 관심있는 주제로 진행하니까 재미도 있고 집중도 잘 되어서 즐거웠다. 내가 담당한 파트 이외에도 해볼만한 분석을 추
통계 라이브 세션통계학 기초 강의 듣기SQL/알고리즘 코드카타\[SQL] MySQL 제곱과 제곱근 | POW, SQRT\[Numpy] 자주 쓰는 함수\[통계] 통계학 기초 1주차 실습팀 프로젝트를 무사히 끝내고 새로운 주제로 새로운 팀원들을 만났다. 통계..는 내가 재
SQL 코드카타통계 라이브 세션 복습통계학 기초 2주차 (1-5) 듣기\[통계] 다양한 분포 | 베르누이 분포 | 이항 분포 | 균등 분포 | 정규 분포 | 표준 정규 분포\[통계] Scipy 모듈\[통계] 통계학 기초 2주차 (1) 모집단과 표본\[통계] 통계학 기초
통계학 기초 3주차통계학 기초 4주차 1-2강\[통계] 통계학 기초 2주차 (6) 카이제곱 분포\[통계] 통계학 기초 2주차 (7) 이항 분포\[통계] 통계학 기초 2주차 (8) 푸아송 분포\[통계] 통계학 기초 3주차 (1) A/B 검정\[통계] 통계학 기초 3주차
통계학 기초 4주차통계 라이브 세션 복습\[통계] 통계학 기초 4주차 (3) 범주형 변수\[통계] 통계학 기초 4주차 (4) 다항회귀, 스플라인 회귀\[통계] 통계적 추론 | 가설검정 | 중심극한정리\[통계] t 분포 | 이표본 t 검정\[통계] 신뢰구간 | scipy
QCCQCC 복습통계학 기초 강의 완강\[SQL] QCC 3회차\[통계] 통계학 기초 5주차 (1) 피어슨 상관계수\[통계] 통계학 기초 5주차 (2) 비모수 상관계수\[통계] 통계학 기초 5주차 (3) 상호정보 상관계수\[통계] 통계학 기초 6주차 가설 검정의 주의점
발제코드카타머신러닝 VOD 강의 수강\[ML] 머신러닝이란?공부하기 싫을 때 딴짓 안 하고 프로그래머스 0단계 풀었다..조금 더 집중하기 ..계획한 목표 달성을 위해 성실히 강의 듣기sklearn 라이브러리에서 LinearRegression 모델을 불러와 학습시키는 법
아티클 스터디머신러닝 기초 수강\[ML] 선형회귀\[통계] 통계 검정 | 검정과 오류 | 2표본 검정 절차\[통계] 범주형 변수 분석 : one-way , two_way라이브 세션 복습 완료나름 집중해서 잘 한 것 같다.나름 집중해서 잘 한 것 같은데 계획한 일들이 조
머신러닝 기초 완강머신러닝 심화 시작\[ML] 분류 분석 | 로지스틱 회귀분석\[ML] 데이터 수집\[ML] 탐색적 데이터 분석 EDA\[ML] 데이터 전처리 | 이상치, 결측치 처리머신러닝 기초 강의 끝냈다..조금 더 집중하기계획한 일 다 끝내기 위해 조금 더 노력하
QCC통계 과제QCC통계 과제 풀기QCC 세 문제 다 맞았다.통계 과제 다 풀었다.일정이 많은 날 자투리 시간에 집중력이 많이 떨어진다. 버리는 시간 없도록 효율적으로 공부하기.과제를 하며 plt.subplots() 활용법을 익혔다.표준 오차에 대해 알아보았다. 그런데
QCC 복습통계 과제 마무리 및 제출어제자 라이브 복습챌린지반 라이브 수강\[SQL] QCC 4회차\[통계] statsmodel로 선형회귀 모델링\[통계] 여러가지 분석/검정 총정리 ⭐️\[통계] 연구의 종류\[통계] 통계 과제 풀이\[matplotlib] subplo
챌린지반 수강머신러닝 심화\[ML] 데이터 전처리 | 범주형 데이터 인코딩\[ML] 데이터 전처리 | 수치형 데이터 스케일링\[ML] 데이터 분리 | 과적합\[ML] 타이타닉 데이터로 실습\[ML] 교차검증 Cross validation | k-fold | GridSe
아티클 스터디머신러닝 심화 군집화까지 수강 완료머신러닝 특강 - 분류\[ML] 의사결정 나무 Decision Tree\[ML] 랜덤 포레스트 Random Forest\[ML] knn | k nearest neighbor\[ML] 부스팅 알고리즘 | 전체 실습\[ML]
챌린지반 2회차 복습 + 숙제챌린지반 3회차 수강머신러닝 심화 완강머신러닝 특강 2회차ML 과제\[ML] RFM 고객 세그먼테이션 실습2회차 챌린지반 복습했다 .. 숙제도 했다 ..집중력 나쁘지 않았다.할 게 많은데 우선순위 잘 세워서 착착 할 일 하기집중 더 잘 하기
아티클 스터디머신러닝 심화 딥러닝 파트 정리머신러닝 과제 제출머신러닝 라이브 특강 수강\[DL] 딥러닝 맛보기\[ML] 통계 + ML 과제 풀이집중해서 해야 할 일을 차근차근 했다.과제 잘 풀어서 부지런히 제출했다.계획한 일을 다 하지는 못했다.군집 라이브 특강을 통해
프로젝트 발제 이후 데이터 살펴보고 주제 선정챌린지반 라이브 세션 수강데이터를 다방면으로 살펴보고자 노력하였다.팀 프로젝트 토의에 적극적으로 참여하려고 하였다.라이브 세션 중간에 놓치지 말고 더 집중해서 듣기 ..모델 학습 뿐만 아니라 전처리를 할 때에도 학습 데이터와

프로젝트 진행에 집중했다.컬럼별 히스토그램+박스플랏 or 카운트플랏 시각화하였다.우선순위를 잘 정해서 시간 배분 잘 하기automl, autogluon 등의 툴을 이용해 모델 학습을 테스트해볼 수 있다.SMOTE는 단순히 기존의 마이너 데이터를 복사하는 것이 아니라 알

결측치, 중복값 없음 확인pairplot 확인기타 컬럼별 분포(countplot/scatter plot) 확인오랜만에 여유가 생겨 프로그래머스 코딩 기초 연습문제 풀었다.별 거 안 했는데 연휴 1일차가 지났다. 내일은 친척들 만나고 식사 마무리되면 프로젝트 더 해보기.
Best Hyperparameters: {'learning_rate': 0.06268984733977456, 'n_estimators': 350, 'max_depth': 5, 'subsample': 0.9960160633298945, 'colsample_bytree':

새로운 매개변수 추가해서 모델(LightGBM, XGBoost) 학습시키기Optuna를 이용해서 하이퍼 파라미터 튜닝하기분류 threshold를 조절하면서 recall-precision 확인하기최종 결과물 비교맡은 일을 성실히 수행하였다.적극적으로 팀플에 임하였다.코드

새로운 데이터로 모델 학습 재진행모델이 이탈할 것이라고/이탈하지 않을 것이라고 예상한 고객 대상 군집화1\. 이상치 제거2\. 스케일링 (표준화, 정규화)3\. 원핫 인코딩4\. 상관관계 확인을 통해 높은 상관관계를 가지는 컬럼 제거하기5\. PCA를 통한 차원 축소6
베이스 모델 평가를 다시 진행하여 모델 선택 결과 부분 내용 보강하기우리의 마케팅 전략으로 기대되는 효과와 목표치 설정을 위한 고민..제한된 데이터를 가지고 모델을 깎는 작업보다 결과물을 가지고 인사이트를 도출하고 마케팅 전략을 세우는 것이 더 까다롭다..이하동문 ..
피피티, 스크립트 최종 정리녹화 영상 촬영프로젝트 마무리 잘 했다!오늘은 딱히 .. 이번 프로젝트에서 각자의 역량이 훌륭한 분들과 팀원이 되어서 여러모로 배울 점이 많았다 ~

프로젝트 내용 정리하였다.프로젝트 내용 정리 미루지 않고 다 하였다.다른 팀의 발표를 들으면서 배울 점을 찾았다.ADsP 강의 더이상 미룰 수 없다.. 내일부터는 꼭 듣기코드카타도 더이상 미룰 수 없다... 내일부터는 꼭 풀기우리 팀은 SMOTE만으로 오버샘플링을 시도
태블로 강의 1-2주차 수강태블로 강의 조금이지만 들었다.팔자주름 팀원들과 아쉬운 이별 ~.~붕 뜨는 마음은 오늘까지! 다음 주부터는 다시 집중해서 공부하기오랜만에 태블로를 다시 공부하며 기억을 되짚을 수 있었다.
아티클 스터디태블로 VOD 강의 완강 + 실습태블로 라이브 세션 복습태블로 VOD 강의 완강하고 실습까지 다 해보았다.라이브 세션도 잊지 않고 복습하였다.오전 시간에 더 집중하기더 집중하기..LOD(FIXED, INCLUDE, EXCLUDE)식을 통해 계산의 차원을 정

태블로 과제 완료라이브 세션 2회차 복습오늘 만든 대시보드!라이브 세션에서 완성하지 못한 대시보드들을 따라 만들었다.태블로 과제 도전 문제까지 풀어서 제출 완료하였다.마케팅 분야에 관심이 없다보니 고객 데이터로 대시보드를 만드는 데에 크게 흥미를 못 느끼겠다.. 내가

오늘 만든 대시보드 with 매개변수를 필터로 활용하기ADsP 강의 들었다.목표한 부분까지 강의 다 들으려고 노력했다.ADsP 공부 방식이 너무 비효율적인 것 같다. 재미도 없는 내용을 통으로 듣고 정리하려니까 집중도 안 되고 흥미도 떨어지고 시간이 너무 오래 소요된다
라이브 세션 복습태블로 시각화 과제 복습ADsP 1, 2과목 집중 공부ADsP 1, 2과목 공부에 시간을 투자하였다.가만히 앉아서 강의만 듣기 힘들다. 내용도 재미 없어서 .. 집중 더 잘 하기.... 딱히 없다.
주제 선정시각화를 통한 데이터 분포 확인 .. 했는데 파일이 날아갔다.데이터 분석을 열심히 해보았다. 컬럼의 분포와 상관관계를 시각화하여 확인하였다.프로젝트 진행에 적극적으로 참여하였다.파일 저장을 잘 하자.. 저장을 생활화 하자.. cmd+s를 생활화 하자..딱히

인게임 요소들에 관한 내용을 분석하고 시각화 해보았다.주어진 일을 열심히 했다 ADsP 공부하기 대시보드에는 계속 추적할 가치가 있는 정보, 활용 가능한 정보가 들어가야 한다.
메인 대시보드에 들어갈 지표들을 선정하여 정리하였다.맡은 바를 성실히 수행하였다.ADsP 공부 짬 날 때마다 하기 ...이탈자를 이탈 기간에 따라 나눌 수 있다.(ex. 온보딩에 실패하여 유입 7일 이내 이탈한 유저/장기 이용하다가 이탈한 유저 등)
대시보드에 넣을 워크시트 추가 제작피피티 정리 시작해야 할 일 잘 했다..ADsP 공부는 언제 하려고..?코호트 분석표가 어떤 내용을 보여주는 것인지 이해하게 되었다.
워크시트 추가로 정리하기대시보드 배치 및 피드백피피티 준비 및 썸네일 만들기할 일 열심히 했다.ADsP 공부는 언제?(2)딱히 없다 ... 그냥 열심히 할 일 했다 ...
피피티 만들기피드백 받고 대시보드 구성 고치기조퇴하고 저녁에 다시 들어오기 싫었지만 ,,, 다시 접속해서 피드백 주고받았다더 집중하기고객생애가치 LTV가 무엇인지 알게 되었다.대시보드를 구성할 때는 목적성이 뚜렷해야 한다는 점을 알게 되었다.

피그마로 대시보드 디자인 만들기디자인 이미지 불러와서 최종 대시보드 완성하기피피티 수정하기맡은 일을 잘 했다.\-피그마로 대시보드 레이아웃을 디자인 하는 방법을 알게 되었다. 10분 20분 짧게 공부하고 바로 디자인을 할 수 있어서 재미있었다.
발표 진행피드백 정리오늘 특별히 한 것은 없다\-오늘 우리 팀 발표 피드백잘한 점: 데이터 탐색을 깊이 진행한 것 같음유저/인게임/매출 지표로 나눈 것 좋음시기별로 필터 적용한 것 좋음아쉬운 점: 데이터가 2017-2020년도에 가입한 사람들만 있다면 해당 시기에 가입
없다 ... 대학원 알아보고 지원 준비 ...최종 프로젝트 고민 ...\-공부하기 ..집중하기 ..튜터님들과의 라떼톡에서 많은 조언을 들을 수 있었다.
\[SQL] Ollivanders Inventory | Hackerrank오랜만에 SQL 코드카타를 풀었다.더 집중하기SQLd 공부하기한동안 SQL 문제를 안 풀어서 많이 잊어버린 것 같다.CTE와 window function 없이 동일한 값이 있는 여러 행 중 최소값
QCC\[SQL] QCC 5회차\\QCC 잘 풀고 정리했다.입시 서류 정리하느라 공부를 거의 못 했다. 다음 주부터는 더 집중해서 공부에 시간 투자하기LEAD() 윈도우 함수에서 ORDER BY 구문을 빼놓지 않는 것이 중요하다.
SQLd 1과목 공부컨디션이 안 좋음에도 공부하려고 노력했다더 집중해서 할 일 밀리지 않고 잘 하기특별히 없다 .. SQLd 공부를 하면서 학부 때 데베개 공부하던 것이 생각났다.
데이터 병합중복값 처리결측치 확인이상치 처리상관계수 히트맵 확인기존 중복값 처리에 문제가 있음을 발견하고 처리함계획한 일을 다 하지 못함더 집중하면서 시간 보내야 함duplicated()로 중복값을 찾기에는 한계가 있으니 조금 더 들여다보기
데이터 전처리, EDA 마무리multiclass logistic regression 학습로지스틱 회귀 기본 모델 학습을 진행했다.코드카타, 자소서 작성도 시간 내서 하기 ..BCS의 경우 명목형 범주이므로 회귀보다는 분류 태스크에 가깝다
knn, DT, RF, GBM, LGBM, XGB, CatBoost 베이스 모델 학습베이스 모델 학습을 완료하였다자소서는 언제 쓰지XGBoost로 multiclass clasification을 할 때 y 레이블은 0부터 시작하는 연속된 정수여야 한다.(2, 3, 4,

feature importance를 구해서 베이스 모델에 학습 진행하여 성능 비교Feature selection 없이 모든 컬럼을 다 사용했을 때보다 성능 약간 향상RF, LGBM, CatBoost로 하이퍼파라미터 진행 예정SQL 코드카타 한 문제 풀었다계획한 내용 (

Optuna로 random forest, LightGBM, CatBoost 모델 하이퍼파라미터 튜닝결과: 베이스 모델과의 차이가 크지 않았음. 정확도가 가장 높으 LightGBM 모델을 최종 모델로 선정Confusion MatrixQCC 바로 정리했다 \[QCC] 6회
오버피팅을 방지하기 위해 더 단순한 모델로 학습 진행 -> 성능 향상 XPCA 진행 -> 성능 향상 X반려견 신체 사이즈 관련된 변수들로만 학습 진행 -> 성능 향상 X이미지 처리 딥러닝 시도 -> 대용량 이미지, 부족한 GPU 사양, 기대 정확도 낮음 등의 이유로 진
BCS 대체 지표 선정을 위한 회귀 분석 but 성능 매우 나쁨새로운 지표를 찾고 모델을 학습시키는 것보다 기획한 서비스의 목적이 무엇인지 한 번 더 생각하고 그에 맞는 서비스 기획이 중요할 것으로 판단뭐라도 했다 ..버리는 시간 없게 집중력 높이기R2 square 값
저체중/정상체중/과체중 분류 모델 베이스모델링, feature selection, OPTUNA를 이용한 하이퍼파라미터 튜닝 완료저체중/정상체중/과체중 분류 모델을 완성하였다.발표 자료 준비 + 디자인 시작하기 ..\-..
튜터님과의 미팅모델 완성 및 exportPPT 작업 시작모델링 작업 마무리했다입시 준비 + 코드카타도 짬 내서 하기 ..\-..
PPT 작성QCC 잘 치렀다. 정리는 PPT 정리 끝나면 ...집중이 잘 않 되 ,,,QCC 내가 어렵게 푼 문제를 RANK 윈도우 함수로 쉽게 푸는 법을 알게되었다.
중간 발표 PPT 완성중간 발표 PPT를 완성하여 제시간에 제출했다.\-PPT 좀 잘 만들자
대시보드 레이아웃 정리하고 태블로 작업 시도해보았는데 생각보다 그래프가 예쁘게 나오지 않아 기각 위기지난 주 QCC 정리했다.프로젝트 뭐라도 했다.할 일 빠르게 끝내고 자소서 + 필요한 공부 하기\-
중간 발표 피드백 정리앱 디자인 시작뭐라도 했다.집중하기중간 발표 피드백

어플 예시 화면 제작하였다.어플 실행 예시 화면 완성하였다.이제 자소서 쓰자 ...\-
피피티 수정streamlit 보완사항 전달보완 사항 전달다음 주는 입시 준비에 올인 ..\-