Deep_Learning 1

AIginner·2023년 10월 17일
1

Deep_Learning 1

-목 차
1. 인공지능 이란?
2. 머신러닝의 세가지 유형
3. Paired Data
3-1. Paired Data로 이미지 분류
4. Unpaired Data
5. Reinforcement (강화학습)
6. 의미 없는 데이터를 의미있게 만들기=


1. 인공지능 이란?

  • 아랙 그림과 같이 데이터를 입력 받아 출력하기 위한 함수(알고리즘)을 만드는 과학 분야

  • Input(입력) > function (함수,모델) > Output(출력)

2. 머신러닝의 3가지 유형

1) Superviesed (지도 학습) : 정답(target, label)을 가지고 있는 학습 방법
2) Unsuperviesd (비지도 학습) : 정답은 없지만 정답 그룹을 갖고 있는 학승 방법 (부정 방정식 (x-1)(y-1)=1, 조건: x,y는 자연수)
3) Reinforcement (강화 학습) : state, action, reward(보상) 세 과정을 반복시키는 학습
(정답의 방향성을 잡아주고 학습 시킨다)


3. Paired Data

  • 정답이 주어져 있고 입력값과 출력값(정답)으로 과정(funcition)을 만들어가는 기법에 사용되는 데이터

3-1. Image Classifier (이미지 분류)

  • object detection/tracking : 이미지 안에서 객체를 추적하는 기법
  • image segmentation : 이미지를 사각형이 아닌 비정형의 도형으로 객체를 찾는 기법
  • pose estimation : 사람의 동작을 스켈레톤 정보를 인식해서 추정하는 기법
  • Paired data의 활용 예 : Just Point It (추적 기법으로 손가락으로 가르키는 단어를 사전 찾기)

4. Unpaired Data

  • 정답이 주어져 있지 않지만 정답 그룹이 있는 데이터 형태 (얼룩말, 딥페이크 예제)
    (Paired data를 만드려면 똑같은 형태의 이미지가 있어야 하지만 구하기가 어렵다)
  • 인공지능 모델을 통해 Unpaired Data > Paired Data화 할 수 있다

5. Reinforcement (강화학습)

  • 정답 데이터, 정답 그룹 데이터도 없을 때는 강화학습을 진행
  • state > action > reward 과정을 반복 학습하여 Agent를 생성 (예. 자율주행, 아기 걸음마)
    (Agent는 인공지능 분야에서 자동화된 행동을 수행하는 프로그램)
  • 단점 : 무한의 가까운 state를 제공할 수 없기 때문에 사람의 목숨이 관여된 경우는 활용되지 않는게 좋다 (듣도 못한 state가 나올 경우 action을 잘 못 취할 수도 있다.)

6. 의미 없는 데이터를 의미있게 만들기

  • white noise : 모든 주파수 성분을 가지고 있는 noise (어떤 정류의 이미지든 generator를 통해 만들 수 있는 이미지)

  • generator : white noise를 학습시키면서 fake image를 만들어 내는 알고리즘

  • discriminator : 사진을 진위를 판별하는 알고리즘 (generator의 fake image가 뚫어야할 장벽)

  • gan
    : GAN은 실제에 가까운 이미지나 사람이 쓴 것과 같은 글 등 여러 가짜 데이터들을 생성하는 모델입니다. “적대적 생성 신경망” 이라는 이름에서 알 수 있듯 GAN은 서로 다른 두 개의 네트워크를 적대적으로(adversarial) 학습시키며 실제 데이터와 비슷한 데이터를 생성(generative)해내는 모델이며 이렇게 생성된 데이터에 정해진 label값이 없기 때문에 Un-supervised learning 기반 생성모델로 분류

  • Language model : 문장의 단어를 마스크로 씌어 위치를 움직여가면서 학습 시키는 언어 모델, 앞뒤로 어떤 단어가 있을 때 가운데 어떤 단어가 올지 맞추는 방식

예제 (Everybody Dance Now)

  • 춤을 못추는 사람의 영상(row data)에서 Supervised(지도학습)으로 Pose estimation을 해서 뼈다귀 정보를 만들고, generator를 통해 뼈다귀 정보로 사람의 영상을 만든다. (y > x1 > G(x1))
    진짜 댄서가 추는 정보를 뼈다귀 정보(x2 data)로 바꿔서 G(x)에 다시 대입시켜 실제 출력 이미지에 대입한다. 일반 데이터가 결국 faired data 를 가지고 있던게 된다.
profile
비전공자지만 밑바닥부터 공격적으로 공부중입니다! 공부 해온 것들 정리해보고 있습니다. 잘못 된 부분 있으면 알려주세요~ 서로 공유 하고 싶습니다

0개의 댓글