딥러닝

Soyoung Park·2022년 9월 19일
0

TIL deep learning

목록 보기
1/22

딥러닝 intro

딥러닝 < 머신러닝 < 인공지능

머신러닝은 프로그램되는 것이 아니라 훈련training 되는 것이다 !

딥러닝: 단계별로 추출해서 사용함


c'est quoi?

1) 구글 코랩
2) 캐글 노트북


순서

코랩에서 GPU 로 설정해 사용해주기

1) 명확한 문제 정의 한다.
2) 모델 선택 전, 데이터를 자세히 들여다보기. ex)캐글
3) 데이터에 관한 고민은 끊임없이 하기. ex) 데이터를 통해 어떤 것을 뽑아낼 수 있을까?
4) 논문 찾기. 왜냐면, 이미 SOTA(state-of-the-art;최고의 성능) 모델이 나와있다.
--이미지 처리? VGG, ResNet, Inception etc.
--자연어 처리? ELMO, BERT, GPT etc.
5) 모델을 가져와 튜닝하기. 하이퍼파라미터를 조정하기.
6) 추론 및 평가


용어

클래스 불균형(Class Imbalance) -> 이상 탐지(Anomaly Detection)
과소표집(UnderSampling) 과 과대표집(OverSampling)

데이터 가지고 뭘 할 수 있을까

1) 회귀(Regression)
--여러 개의 특징을 통해 연속적인 숫자로 이루어진 정답을 예측
--햄버거 가격, 영화 관객 수, 축구 선수 연봉, 주식 가격 등
--0과 1을 예측하는 로지스틱 회귀(Logistic Regression)
2) 분류(Classification)
--미리 정의된 여러 클래스 중 하나를 예측
--햄버거 종류, 숫자 판별, 얼굴인식 또는 종류 구분 등
--이진분류(Binary Classification) : 둘 중 하나
--다중분류(Multi-class Classification) : 여러개 중에 하나
--다중 레이블 분류(Multi-label Classification) :여러개 중에 여러개

교차 검증 (cross-validation)

!! 테스트 데이터는 최종 평가 이전에는 절대로 사용하면 안됨 !!
학습 데이터셋 7 : 테스트 데이터셋 3 의 비율로 나눠서 traning 시켜 test 해보기.

학습하기

1) 하이퍼파라미터(Hyperparameter)
2) 배치와 배치크기(Batch&Catch Size)

100번 돌려보고 200번 해보고 300번했는데 정확도가 떨어졌다면 컴퓨터가 학습이 아니라 암기를 하고 있다는 것이므로 멈춰야 한다.

3) 지도 학습(Superised Learning) : 학습 데이터에 정답이 포함된 것
--대표적으로 회귀와 분류가 해당됨
4) 비지도 학습(UnSupervised Learning) : 학습 데이터에 정답이 포함되어 있지 않은 것
5) 생성 모델(Generative Model): 그림 그려주는 것
6) 강화 학습(Reinforcement Learning): 당근 채찍 기법으로 강화되는 것

0개의 댓글