긴 여정을 앞둔 첫 번째 Week 인 만큼, 앞으로 닥쳐올 5개의 Course 동안 어떠한 것들을 배워나갈지 설명해주는 Syllabus 를 소개하는 정도로 수업을 진행하셨다. 그러니, 모르는 단어나 생소한 개념이 불쑥 등장하더라도, 크게 당황해하지 말자.
1~5개의 캡션이 말 그대로 Course 1~5의 가장 큰 테마가 된다.
수업을 끝까지 다 들은 입장으로서, 조심스럽게 그리고 간략하게 설명을 덧붙이자면,
Course 1: 말 그대로, Neural Network 와 Deep Learning 에 대해서 배운다. Andrew Ng 님이 정말 기초부터 가르쳐 주기 때문에, 기존에 관련된 개념을 아예 접하지 않아도 충분히 이해할 수 있다! ( 다만, 행렬이나 미분 같은 수학적인 계산들은 할 수 있어야 한다.. 같이 Summary 하면서 차근차근 알아봅시다! )
Course 2: Course 1을 모두 수강하면, Neural Network 라는 것이 대충 어떻게 생겨먹은지 감이 오는데, Course 2 에서는 기본적인 Neural Network 모델을 가지고, 모델의 성능에 영향을 미치는 여러가지 변수들을 만지작 거리면서, 어떤 조건과 기능을 추가했을 때 모델이 더 좋은 성능을 나타내는지 이론적인 탐구를 하는 과정이다.
Course 3: 결국 우리가 모델을 완성했을 때, 맞닥뜨릴 수 있는 여러가지 상황에 대해서 가정하고, 탐구하는 시간이다. 전체적인 내용으로는 모델 학습에 사용할 데이터를 어떻게 가공할지, 또 train set 과 dev/test set 을 어떻게 구성할지에 대한 전반적인 내용을 알려주는 과정이다.
Course 4: Course 1~3 동안 우리가 배운 Neural Network를 Basic Neural Network 라고 생각했을 때, 'Convolution' 이라는 개념을 도입하여 어떻게 보면 커스텀(?)한 Convolution Neural Network(CNN) 를 배우는데, 이 CNN은 주로 실제로 컴퓨터 비전과 같은 이미지를 데이터로 사용하는 모델을 구축하는 데에 대부분 많이 사용된다. ( Basic NN 에서 CNN 으로 넘어갈 수 밖에 없었던 이유는 수업을 진행하면서 매끄럽게 이야기를 풀기로 하자. )
+사용 예시 : 자율 주행 자동차 (Tesla)
Course 5: 마찬가지로, Basic Neural Network 에서 'Recurrent' 라는 개념을 도입하여, 모델을 커스텀한 것이다. Recurrent Neural Network (RNN) 은 주로 자연어 저리에 사용되며, 데이터가 순서를 가지고 있을 때 모델을 RNN으로 구축한다.
+사용 예시 : 언어 번역 (Google)
대충 이런식으로 생겼다. 아까 말했 듯이, 처음 보고 이해가 안되어도 괜찮다. 모르는게 당연하다.
이 부분에서는 Supervised Learning vs Unsupervised Learning 에 대한 얘기를 해보려고 한다. Supervised Learning 은 인간이 Model 을 학습시킬 때 Data를 줄 때 정답도 함께 알려주면서 학습시키는 것이고, 반대로 Unsupervised Learning 은 정답도 안 알려주고, 스스로 학습하도록 내버려두는 것이다. 여기까지만 들어도 알겠지만, Unsupervised Learning 이 요구하는 기술이 훨씬 복잡하고 현재까지 우리 인류는 아직 Unsupervised Learning 을 사용할 만큼 발전하지 않았다고 한다.. 그러니 Course 1~5 까지는 모두 Supervised Learning 을 할테니까 크게 걱정하지 말자.
아, 위의 그림에 대해서 궁금해 할 수 있을 것 같아서 준비했다.
While structured (quantitative) data gives a “birds-eye view” of customers, unstructured (qualitative) data provides a deeper understanding of customer behavior and intent. Let’s explore some of the key areas of difference and their implications:
한 마디로, Structured Data 는 Price 와 Click 수와 같이 조금 더 간단하고, 보통 수치적으로 존재하는 것을 의미한다면 Unstructured Data 는 컴퓨터가 아닌 인간이 보고 이해할 수 있는 정도로 조금 더 고차원 적인 데이터를 의미한다고 말할 수 있을 것 같다.
Course 1 - Week 1 끝!