profile
데이터분석 뽀개기

ai-school 파이널 프로젝트 6일차 TIL 겸 에러 기록

역시 말은 함부로 하는 게 아니라고진짜로 1일차가 될 위기에 처해있다.OpenCV 코드를 짜면서 머리 좀 쥐어 뜯다가 다른 대외활동 수료식에 가서 상 받고 맛있게 밥먹고 왔는데 이럴 수가.어제와 다른 멘토님과 미팅하며 진행 상황을 공유했는데 ocr도 tts도 api를

2022년 12월 28일
·
0개의 댓글
·
post-thumbnail

ai-school 파이널 프로젝트 5일차 TIL 겸 에러 기록

부제 : 5일차이지만 1일차입니다easyocr 모델을 돌렸다는 기쁨도 잠시, 새로운 과제가 찾아오는데?AttributeError: module 'torchvision.models.vgg' has no attribute 'model_urls'=> 새로운 이미지를 넣어 돌

2022년 12월 27일
·
0개의 댓글
·
post-thumbnail

ai-school 파이널 프로젝트 4일차 TIL 겸 에러 기록

드디어! ocr 모델을 돌렸다!!!pre-trained model(korean.g2를 사용했다)인데도 성능이 썩 좋지는 않다. 그래도 결과물이 나왔다! 사진처럼 특수문자와 숫자가 함께 있는 텍스트는 인식을 잘 못 한다. 인식해야될 글자가 많아서 성능이 더 떨어지는 건가

2022년 12월 26일
·
0개의 댓글
·

ai-school 파이널 프로젝트 3일차 TIL 겸 에러 기록

어제 trdg로 이미지 생성을 할 때 한글 이미지는 생성이 안됐는데 그냥 일단 영어는 됐으니까 모델을 끝까지 한 번 돌려보고 찾으려고 했다. 포기했다는 뜻이다. 그런데 다시 생각해보니 시간이 넉넉한 것도 아닌데 무슨 소린가 싶어서 어떻게든 해결하기로 마음을 먹었다. 그

2022년 12월 25일
·
0개의 댓글
·

ai-school 파이널 프로젝트 2일차 TIL 겸 에러 기록

토요일이지만 성실하게 프로젝트를 하고 있다.당연함어제 아무것도 못하고 끝남어제뿐만이 아니지만ㅋㅋ그래도 오늘은 드디어! 코드를 좀 실행할 수 있었다.no module 에러도 해결했고trdg 이미지 생성 코드도 돌렸고input/output path도 지정했다.no modu

2022년 12월 24일
·
0개의 댓글
·
post-thumbnail

CNN 모델의 Convolution Layer 정리

CNN의 핵심적인 요소 중 하나로 입력 데이터의 특징을 추출하여 특징의 패턴을 파악하는 층합성곱층의 뉴런은 수용 영역(receptive field)의 픽셀에 연결하여 이미지의 공간 정보를 보유함→ 이미지의 공간 정보를 유지하며 특징을 인식함입력 데이터를 필터가 순회하며

2022년 12월 8일
·
0개의 댓글
·
post-thumbnail

binary_crossentropy 정리

분류 손실함수 중 하나로 이진 분류 모델에 사용True / False, 양성 / 음성 등 2개의 클래스를 분류할 수 있는 모델이진 분류 모델의 예측값은 0과 1 사이의 확률값예측값이 0에 가깝다면 False(혹은 True), 예측값이 1에 가깝다면 True(혹은 Fal

2022년 12월 1일
·
0개의 댓글
·
post-thumbnail

분류 성능 평가 지표 : F1 Score, F-Beta Score, Macro-F1 정리

분류 성능 평가 지표 중 F1 Score는 Precision과 Recall의 조화평균을 의미한다. F1 Score는 0.0~ 1.0 사이의 값을 가지고, 1에 가까울수록 좋은 모델이다. 정밀도와 재현율을 균형 있게 반영하기 위해 산술평균이 아닌 조화평균을 사용한다. 데

2022년 11월 24일
·
0개의 댓글
·

머신러닝 K-MOOC 복습 TIL

머신러닝 모델은 Loss 를 최적화하는 관점에서 크게 두 가지로 나뉨Methods assuming the spatial properties(Huristic)The models are mathematically formulated and optimized(Numerica

2022년 11월 22일
·
0개의 댓글
·
post-thumbnail

머신러닝 K-MOOC 복습 TIL

강의 : http://www.kmooc.kr/courses/course-v1:SSUk+SSMOOC20K+2022_T1/aboutSupervised Learning : 지도학습Classification\-> y의 대표적인 아웃풋이 범주(Class)인 경우Regr

2022년 11월 21일
·
0개의 댓글
·

Extra Trees 정리

극도로 무작위화(Extremely Randomized)된 기계 학습 방법데이터 샘플 수와 특성 설정까지 랜덤랜덤 포레스트와 동일한 원리를 이용하기 때문에 많은 특성을 공유함랜덤 포레스트에 비해 속도가 빠르고 성능도 미세하게 높음Bootstrap 샘플링을 사용하지 않고

2022년 11월 17일
·
0개의 댓글
·
post-thumbnail

머신러닝 이산화(Discretisation) 정리

이산화란 Numerical Feature를 일정 기준으로 나누어 그룹화하는 것으로 사용하는 방식에 따라 다르지만 변수 값을 간격으로 정렬한다는 공통점이 있다.예를들어, 그룹 구성원이 많다면 개별 나이를 기준으로 분류하기 어렵다. 이 경우 10대, 20대, 30대와 같이

2022년 11월 10일
·
0개의 댓글
·

하이퍼파라미터 개념 정리

파라미터파라미터(매개변수)는 모델 내부에서 데이터에 의해 결정되는 변수로 다음과 같은 특성을 가지고 있다. They are required by the model when making predictions.They values define the skill of the

2022년 11월 3일
·
0개의 댓글
·
post-thumbnail

파이썬 데이터분석 프로젝트 : 교통사고를 많이 내는 특정한 연령이 있을까?

ai 스쿨 5주차미드 프로젝트가 5일간 진행되었다! 기간이 긴 건지 짧은 건지 몰랐는데 짧은 편이라고 한다.어쩐지 시간이 너무 부족하더라;;이번에는 교통사고분석시스템 TAAS의 데이터를 활용해서 분석을 진행했다. 사고유형/발생 시기/차종/도로형태/연령/법규위반 별로 나

2022년 10월 27일
·
0개의 댓글
·
post-thumbnail

파이썬 데이터분석 프로젝트 : 이혼 사유 별 발생 건수는 어떻게 변화했을까?

비대면인 데다 코딩 특성 상 학교에서 경험했던 그런 팀 프로젝트는 아니었다. 화면 공유한 상태로 다 같이 PPT 만들기나 다함께 밤새서 기업분석 보고서 쓰기 같은 거. 그러나! 확실히 팀으로 진행하니까 진행이 잘 된다. 기한 안에 못 끝내면 미팅 때 아무런 결과물도

2022년 10월 16일
·
0개의 댓글
·

캐글 자전거 수요 예측 데이터(Bike Sharing Demand)를 활용한 파이썬 시각화

멋사 ai스쿨 2번째 자기주도 학습 시간~.~ 뭘 하면 좋을지 고민하다가 캐글 데이터로 시각화를 해보기로 결정했다.plot 수업 시간에 코드 받아쓰기만 했던 슬픈 기억.....시각화에 사용할 데이터를 다운받고 업로드한 다음(colab을 이용했기 때문에 파일로 업로드 했

2022년 9월 29일
·
0개의 댓글
·
post-thumbnail

Serise와 DataFrame 그림으로 정리하기

판다스의 대표적인 데이터 타입인 시리즈와 데이터프레임은 비슷하면서도 다르다.시리즈가 여러 개 모인 것을 데이터프레임으로, 데이터프레임을 하나로 쪼갠 것을 시리즈로 볼 수도 있다.이전의 사진에서 확인했듯 시리즈는 1차원 벡터구조인 반면 데이터프레임은 2차원 행렬구조를 가

2022년 9월 22일
·
0개의 댓글
·

loc와 iloc 정리

loc = location데이터프레임의 행이나 열에 label, boolean array(True, False)로 데이터에 접근사람이 읽기 편한 라벨로 특정 값을 추출loc 사용법df.loc행 인덱싱 값, 열 인덱싱 값iloc = inter location데이터프레임의

2022년 9월 22일
·
0개의 댓글
·