작년 한 해 동안 Django를 이용한 백엔드 개발과 iOS 앱 개발 등 진로 탐색을 위해 열중했지만, 기록의 필요성을 알지 못해 기억이 빠르게 휘발되는 것을 느꼈다. 늦었다고 생각했을 때가 가장 빠르다는 생각으로 지금부터 배우는 것들은 확실하게 내 것으로 만들고자 Velog를 시작하게 되었다.
AI와 딥러닝이라는 키워드는 이제 더 이상 미래의 이야기가 아닌 현재의 이야기가 되었다. 특히, OpenAI 사의 ChatGPT 3.5 공개를 기점으로 LLM의 상용화가 급속도로 이루어지면서 사람들의 삶의 방식이 많이 달라진 것을 체감할 수 있다. 이러한 배경에서 미래에 무슨 일을 하던 간에 AI가 무엇인지 정확히 이해하고 잘 사용할 줄 알아야만 한다는 필요성을 느끼게 되었고, 이에 따라 기계학습심화 과목을 수강신청하여 수강하게 되었다. 한 학기 동안 수강하며 알게 된 것들을 정리하며 복습하고자 한다.
AI(Artificial Intelligence), ML(Machine Learning), CV(Computer Vision), DL(Deep Learing) 등의 용어들은 지난 방학 동안 무료 강의들을 통해 데이터분석을 학습하며 한 번씩은 들어봤던 것들이다. 하지만, 각각의 뜻과 서로 무엇이 다른지 정확히 설명하라고 하면 자신이 없었다.

AI(Artificial Intelligence)는 말 그대로 사람의 지능을 모방하는 모든 것을 통칭한다. CV(Computer Vision)는 사람의 눈을 모방하고자 만든 것으로, 이미지 인식 등에 사용된다. ML(Machine Learning)은 AI를 구현하는 방법론이다. 이때 AI 구현 방법은 데이터를 통한 학습으로 이루어진다. DL(Deep Learing)은 ML에 속하면서 CV와도 겹치는 것으로, ML의 일부이다. 이 강의에서는 DL 중 CV와의 교집합에 포함되는 영역 즉, '딥러닝을 활용해서 컴퓨터비전 문제를 푸는 것'에 대해 주로 다룬다.
이 강의에서 다루는 분야의 활용 분야에 대해 알아보자. 자율주행, 공장 자동화, 얼굴 인식, 생체 인식 시스템, 문서 인식, 문자 인식, 사물 인식, 의료 진단, 언어 모델(ex. ChatGPT) 등 이미 셀 수 없이 많은 분야에서 사용되고 있다.

컴퓨터 입장에서 데이터는 숫자의 모음일 뿐이다. 이미지 데이터는 픽셀의 RGB 값이다. 위의 그림에서처럼, 인간의 눈을 통해 2D 이미지로 인식되는 저것은 컴퓨터에게는 단지 픽셀의 RGB 값들의 집합일 뿐이다.

논리 구조에 따라 선택되는 Rule-based 방식과는 다르게, ML/DL 방식은 데이터를 이용한 학습을 통해 정립된 함수 계산을 통해 결과를 도출한다. 위의 도식을 보면, 머신러닝 과정에는 조건식에 따른 분기가 없는 것을 확인할 수 있다. ML/DL의 복잡한 결과 도출 과정은 아래 그림을 통해 이해할 수 있다.
