한국 주식 가격, 미국주식 가격, 지수, 환율, 암호화폐 가격, 종목 리스팅 등 금융 데이터 수집 라이브러리(https://github.com/financedata-org/FinanceDataReader)(https://financedata.githu
Dictionary age_code = """ 10대 : AGE_001 20대 : AGE_002 30대 : AGE_003 40대 : AGE_004 50대 : AGE_005 60대 : AGE_006 70대 : AGE_007 기타 : AG
네이버 주식 시세 데이터 시각화 전체 상장종목에서 종목코드와 종목명 출력 시가총액 상위 10개 종목 기아 주식 2022년 종가 목록 여러 종목 종가 수집 하나의 데이터프레임 합체 종목 시각화 2축 그래프 전체 데이터프레임 값에 대한 수익률 계산 전체 종목의
: 인터렉피브 시각화 도구
서울 코로나 확진 데이터분석 데이터 합치기 중복 제거 인덱스 값 설정 데이터 요약 날짜 데이터 타입 변경 파생변수 연, 월, 일, 요일 연도-월 요일 수치 변수 히스토그램 시각화 빈도수 (value_counts) 연도월 시각화 ![](https:/
전국 아파트 분양가격 분석 형태가 다른 두 개의 데이터 전처리 후 병합 수치형 데이터와 범주형 데이터 처리 데이터 형식에 따른 시각화 차이 library 호출 최신 데이터 로드 이전 데이터 로드
국가 & 권역별 전산업 소재부품 장비 산업별 수출, 수입 라이브러리 import 파일 불러오기 결측치 melt() 이용한 Tidy data 텍스트 전처리 정규표현식 컬럼명 변경 기술통계 국가권역 시각화 ![](https://
Pima Indians Diabetes Database 라이브러리 로드 데이터셋 로드 학습과 예측 과정 학습과 예측 데이터셋 나누기 학습, 예측에 사용 컬럼 정답값이자 예측해야 될 값 학습, 예측 데이터셋 만들기 X : feature, 독립변수 -> 시험문
데이터 구성 데이터셋 로드 Outcome별 Insulin 학습, 예측해야 할 값 학습, 예측에 사용할 컬럼 학습, 예측 데이터셋 만들기 머신러닝 알고리즘 학습 cross validation 학습 세트의 오차 측정 crossvalpredict 함수 예시
데이터 로드 전처리 학습, 예측 데이터셋 정답값이자 예측할 값 학습, 예측에 사용할 컬럼 문제(feature)와 답안(label) 나누기 학습, 예측 데이터셋 만들기 머신러닝 모델 하이퍼파라미터 튜닝 하이퍼파라미터 : 머신러닝 모델을 생성할 때 사용자가 직접 설정하는
Kaggle - titanic
cross validation
ensemble
RMSLE
log1p
feature engineering
수치형 변수 집값과 상관계수 높은 데이터 보기 파생변수 만들기 결측치 채우기 0 or None 으로 채우기 최빈값으로 채우기 mode() 데이터 타입 바꾸기 수치데이터의 nunique 구해서 어떤 값이 one-hot-encoding 하면 좋을지 찾아보기 수치
optimizer
https://www.tensorflow.org/tutorials/keras/classification: 이진분류문제(출력층) : 은닉층에 주로 사용: 다중 클래스 분류 문제 (출력층)첫 번째 Dense 층은 128개의 노드를 가진다.마지막층은 출력층 \-
https://www.tensorflow.org/tutorials/keras/regression손실함수 회귀 : MSE, MAEepoch 마다 훈련 상태 점검을 위해 EarlyStopping callback 사용함지정된 epoch 횟수 동안 성능 향상이 없으면
: Convolutional Neural Network, CNNConv2DMaxPooling2D합성곱 신경망 (= 피쳐 자동 추출기)➡️ 어떻게 피쳐를 자동으로 추출할까?필터 (filter)를 랜덤하게 여러 장 만든다. 각 필터의 사이즈는 kernel_size로 칭한다
https://www.kaggle.com/datasets/iarunava/cell-images-for-detecting-malaria주제 : 말라리아 혈액도말 이미지 분류 실습목적 : TF공식 문서의 이미지 분류를 다른 이미지를 사용해서 응용이미지 데이터 불러
Introduction: 한 문제에 대해 학습된 피쳐를 구성하고, 새롭고 유사한 문제에 활용하는 것으로 구성된다. 예를 들면, 호랑이를 식별하는 방법을 배운 모델의 기능은 고양이를 식별하기 위한 모델을 시작하는 데 유용하다. ✅ transfer learning은 일반적
: 실시간 컴퓨터 비전을 목적으로 한 프로그래밍 라이브러리.실시간 이미지 프로세싱에 중점을 둔 라이브러리이미지의 기하학적 변환 : 변동, 이동 등형태 변형, 이미지 그라디언트, Edge Detection, 이미지 혼합, 윤곽선 찾기이미지 변환 : 푸리에 변환, 코사인
CNN - Weather dataset Kaggle
자연어의 의미를 분석하여 컴퓨터가 처리할 수 있도록 하는 일자연어? 우리가 일상 생활에서 사용하는 언어기계에게 인간의 언어를 이해시키는 인공지능의 한 분야✅ 할 수 있는 일음성인식, 내용요약, 번역사용자의 감성 분석텍스트 분류 작업 (스팸메일 분류, 뉴스 기사 카테고리
자연어 처리 전반적인 과정 실습예제 문서 만들기정답 데이터 만들기텍스트 데이터 수치형태 변경DTM문제와 정답 만들기데이터셋 나누기머신러닝 모델 로딩학습예측평가트리 알고리즘 분석코로나가 들어가면 '보건' 그 외는 '교통'으로 레이블링Accuracy 측정의사결정나무 시각화
https://dacon.io/competitions/official/235747/overview/descriptionhttps://klue-benchmark.com실제 토픽명을 볼 수 있도록 topic_inx를 키 값으로 mergetrain 에서 제
데이콘 대회https://dacon.io/competitions/official/235747/overview/descriptiontqdm 으로 전처리 진행 상태 표시HannanumKkmaKomoranMecabOkt📌 형태소(morpheme) : 뜻을 가진 가
데이터에 출현하는 모든 단어의 개수를 세고 빈도 수 기준으로 정렬하여 num_words 에 지정된 만큼만 숫자로 변환하고 나머지는 0으로 반환num_words : 단어 빈도에 따라 유지할 최대 단어의 수 (num_words - 1 의 단어만 유지)filters : 각
: Recurrent Neural NetworkRNN이 기존 신경망과의 차이점 : 결과값을 출력층 방향으로 보내면서, 다시 은닉층 노드의 다음 계산의 입력으로 보내는 특징다양한 길이의 입력 시퀀스를 처리할 수 있는 인공신경망텍스트 분류나 기계 번역과 같은 다양한 자연어
https://www.tensorflow.org/tutorials/structured_data/time_series📍 실습 순서1\. 데이터 로드2\. x, y 데이터셋 나누기3\. 정규화 (Min-Max Scaling)4\. 윈도우 방식으로 x, y값 만들
AARRR