12. 사이킷런으로 구현해 보는 머신러닝

분류(Classification) : 예측해야할 데이터가 범주형(categorical) 변수일때 분류 라고 함회귀(Regression) : 예측해야할 데이터가 연속적인 값 일때 회귀 라고 함예측(Forecasting) : 과거 및 현재 데이터를 기반으로 미래를 예측하는

2022년 5월 20일
·
0개의 댓글
·

30. 컴퓨터 파워 UP

하나의 processor가 여러 가지 task를 동시에 수행하는 개념다른 task를 수행할 수 있는 시간에는 task를 전환해서 효율적으로 여러 개의 task를 동시에 수행하는 것처럼 보임유사한 task를 여러 processor가 동시에 수행하는 것동기 : 어떤 일이

2022년 2월 23일
·
0개의 댓글
·

29. 사이킷런을 활용한 추천 시스템 입문

사용자(user)에게 관련된 아이템(item)을 추천해 주는 것ex) 영화추천<간단한 추천 로직>1\. 범주형, 이산적인 데이터를 숫자 벡터로 변환2\. 계산한 숫자 벡터의 유사도를 계산해서 유사도가 가까운 (혹은 높은) 제품을 추천해줌유사도를 계산하는 방법 중

2022년 2월 22일
·
0개의 댓글
·

28. 정보이론 톺아보기

정보이론 : 추상적인 '정보'라는 개념을 정량화하고 정보의 저장과 통신을 연구하는 분야일어날 가능성이 높은 사건은 정보량이 낮고, 반드시 일어나는 사건에는 정보가 없는 것이나 마찬가지이다.일어날 가능성이 낮은 사건은 정보량이 높다.두 개의 독립적인 사건이 있을 때, 전

2022년 2월 18일
·
0개의 댓글
·

25. Regularization

데이터의 형태를 좀 더 의미 있게, 혹은 트레이닝에 적합하게 전처리하는 과정데이터를 z-score로 바꾸거나 minmax scaler를 사용하여 0과 1사이의 값으로 분포를 조정하는 것들이 해당모든 피처의 범위 분포를 동일하게 하여 모델이 풀어야 하는 문제를 좀 더 간

2022년 2월 11일
·
0개의 댓글
·

24. 딥러닝 레이어의 이해(2)

분포 가설과 분산 표현 1. 희소 표현(Sparse Representation) 벡터의 특정 차원에 단어 혹은 의미를 직접 매핑하는 방식 2. 분포 가설 유사한 맥락에서 나타나는 단어는 그 의미도 비슷하다 3. 분산 표현 유사한 맥락에 나타난 단어들끼리는 두 단어

2022년 2월 9일
·
0개의 댓글
·

23. 딥러닝 레이어의 이해(1)

Red 채널, Green 채널, 그리고 Blue 채널까지 총 3개의 채널을 가짐표기 방법 : Channel, Width, Height의 이니셜로 (C, W, H), (W, H, C)하나의 물체가 여러 개의 논리적인 객체들로 구성되어 있는 경우, 이러한 각각의 객체를 하

2022년 2월 9일
·
0개의 댓글
·

21. TF2 API

입력 1가지, 출력 1가지 방식 -> 입출력이 여러 개인 경우 적합하지 않은 모델keras.Model을 사용입력과 출력을 규정함으로써 모델 전체를 규정 -> 더 자유로운 모델링 진행 가능다중 입력, 출력을 가지는 모델을 구성keras.Model을 상속받은 모델 클래스

2022년 1월 28일
·
0개의 댓글
·

20. 비지도학습

지도학습과 다르게 training data로 정답(label)이 없는 데이터가 주어지는 학습방법주어진 데이터가 어떻게 구성되어 있는지 스스로 알아내는 방법아무도 정답을 알려주지 않은 채 오로지 데이터셋의 특징이나 패턴을 기반으로 모델 스스로가 판단군집화(clusteri

2022년 1월 26일
·
0개의 댓글
·

19. 선형 회귀와 로지스틱 회귀

관찰된 여러 데이터를 각 연속형 변수 간의 관계를 모델링하고 이에 대한 적합도를 측정하는 분석 방법부모와 자식의 키 관계부동산 가격 예측1인당 국민 총소득과 배기가스 배출량 사이의 관계 예측(1) 선형성 : 예측하고자 하는 종속변수 y와 독립변수 x간에 선형성을 만족하

2022년 1월 24일
·
0개의 댓글
·

10. 데이터 전처리

결측값을 제거결측값을 다른 값으로 대체(새로운 범주내 특정값, 최빈값, 예측값,... ) 행별로 값이 유일해야 한다면 중복된 데이터를 제거대부분 값의 범위에서 벗어나 극단적으로 크거나 작은 값이상치 삭제이상치를 다른 값으로 대체(최댓값, 최솟값, ...)예측값 활용수치

2022년 1월 5일
·
0개의 댓글
·

11. Visualization

Seaborn의 load_dataset() 메서드를 이용결측값 확인수치형, 범주형 데이터인지 확인주로 막대그래프Pandas와 Matplotlib를 활용Seaborn과 Matplotlib을 활용산점도선 그래프히스토그램데이터와 현상을 수치에 따라 색상으로 나타냄2차원으로

2022년 1월 5일
·
0개의 댓글
·

9. 배열(array)과 표(table)

1. NumPy 주요 기능 ndarray만들기 ndarray 객체는 arange()와 array([])로 만들 수 있습니다. 크기 (size, shape, ndim) ndarray.size :행렬 내 원소의 개수 ndarray.shape : 행렬의 모양 ndarr

2021년 12월 31일
·
0개의 댓글
·