스터디 게시글은 공부한 내용 중 핵심이라고 생각되는 부분에 대한 요약과 약간의 개인적인 TMI를 작성할 예정😇
아직 초심자인 입장에서 주저리주저리 적는게 현업자인 분들이 많은 벨로그에서 조금 부끄럽긴 하지만 딱 지금 내 수준에서 느껴지고 떠오르는 부분들을 기록하는것도 거시적으로 봤을 때는 꼭 필요할 것 같다는 생각! 뭐 나에게도 다른 사람에게도.
구글 ML GDE 박해선님이 만드신 <Do it! 딥러닝 입문>
책과 저자분이 진행하시는 강의를 병행한다.
딥러닝 공부를 하려고 서치해본 사람들이라면 한번쯤은 꼭 스쳐라도 봤을만한 책과 강의인듯 하다.
강의는 인프런과 유튜브에서 무료로 제공됨👍🏻
인프런 주소
https://www.inflearn.com/course/%EB%94%A5%EB%9F%AC%EB%8B%9D-%EC%9E%85%EB%AC%B8#curriculum
인공지능 > 머신러닝 > 딥러닝
머신러닝 그러니까 기계학습의 종류에는 로지스틱 회귀, 선형 회귀, 인공신경망(딥러닝) 등이 있다.
딥러닝과 인공신경망은 엄밀히 따지면 다르지만, 많은 사람들이 동의어로 사용한다고.
머신러닝의 학습 방법에는 3가지가 있다.
1. 지도학습 (supervised learning, 감독학습)
2. 비지도학습 (unsupervised learning, 비감독학습)
3. 강화학습 (reinforcement learning)
해당 강의에서는 1.지도학습만 다룸
입력(특성)과 타깃(출력,정답) 으로 이루어진 데이터를 이용해서 모델을 훈련하고
새로운 데이터, 그러니까 입력이 들어왔을 때 예측하는 방식
실전에서는 데이터 자체를 수집하는데에 많은 노력이 필요함
이번 프로젝트에서 사용하려는 주 데이터에는 음성데이터(입력)와 환자군(타깃)이 존재한다. 그래서 우리는 지도학습을 이용한 알고리즘을 짜기로 결정. 얄팍한 자료조사로 어찌저찌 골랐지만 다행히 맞는 길을 고른 것 같네옹😗
비지도학습은 지도학습의 반대
비지도학습은 타겟이 없는 데이터를 사용하기 때문에 '예측'하는 모델을 만들 수는 없음
대표적인 비지도 학습 방법: 군집(Cluetering)
군집 방법은 무작위의 데이터를 유사한 것들끼리 묶어 군집을 만들게 됨
처음 프로젝트의 컨셉 설정이 한창일 때, 기술을 사용하기 위해서 기능을 추가하자는 아주 위험한 생각을 한 적이 있는데, 그 때 사용해보자 팀 내에서 얘기가 나온 기술이 바로 비지도 학습의 GAN 알고리즘이었다. 프로젝트 기획의 목적을 되짚고 되짚으며 결국 안하기로 결정된 아이디어 이지만 여기서 보니 반가운걸 ㅎㅎ 그래도 다시 한번 명심하자,, 기술을 위한 기능이 아닌 기능을 위한 기술을 사용해야한다는거
강화학습은 주어진 환경으로부터 피드백을 받아 훈련한다.
상태, 보상, 에이전트(모델), 행동(위치 이동), 환경(컴퓨터 시뮬레이션)으로 이루어짐
보상이 있기 때문에 지도학습이라고 생각할 수도 있지만
지도학습에서 사용된 데이터처럼 미리 준비된 훈련 데이터가 아니고, 보상을 얻기 위해서는 여러번의 행동이 수반될 수도 있기 때문에 '강화학습'으로 구분되어있음
알파고, 바둑 등의 여러가지 온라인 게임들과
클릭률을 높여야하는 온라인 광고들에서 강화학습이 사용됨
규칙을 수학적으로 표현하면 y=ax+b 꼴의 일차방정식으로 표현되는데,
이 때의 a=기울기=계수=가중치 이고 b=절편=편향 이다.
그리고 y=타깃=예측 이며 x=입력값이다.
인공신경망은 머신러닝의 수학적 모델 방법 중 하나.
결정트리나 앙상블, k-최근법 등등 모델들 처럼 수학적으로 표현이 안되는 모델들도 존재함
하여튼! 가중치와 절편을 '모델 파라미터'라고 명명한다.
이 책에서는 수학적 모델로 표현이 가능한 모델들만 배우게 된다.
손실함수(loss function, cost function, 비용함수)
타깃과 예측의 차이를 계산하는 역할을 함
최적화 알고리즘을 사용해 손실 함수를 최소화 하는것이 목적이다.
뉴런은 자극을 받아들이고, 전달해 다음으로 자극을 전달하는 역할을 한다.
너무 단순한 연상이라 머쓱하지만 데이터 스트림 절차의 각 단계를 필터 컴포넌트로 캡슐화하여 파이프를 통해서 데이터를 전송하는 파이프-필터 패턴이 떠올랐음. 써놓고 보니 더 단순한 연상이군^^ㅋ
인공신경망은 이런 뉴런에서 영감을 받아 만들어졌음
딥러닝은 머신러닝이 처리하기 어려운 데이터를 더 잘 처리한다.
머신러닝에 잘 맞는 데이터: 데이터베이스, 레코드 파일, 엑셀/CSV 등에 담긴 정형 데이터
딥러닝에 잘 맞는 데이터: 이미지/영상, 음성/소리, 텍스트/번역 등의 비정형데이터