AI 가이드북 튜토리얼

성율·2024년 7월 19일

AIGuideBook

목록 보기
1/5

"진실은 이 모든 것도, 너도, 아무 의미 없다는 것이란다."
-<Why fish don't exist> by Lulu Miller

이 글은 앞으로 써나갈 Category : AI가이드북 에 관한 설명글입니다.

목차

  1. 개요
  2. AI, ML, DL
  3. 인공지능 개발자와 인공지능 사용자
  1. 개요

2022년 LLaMA와 Chat-GPT를 시발점으로 인공지능에 관한 관심이 높아지고, LLM과 생성형 인공지능에 대한 많은 연구와 산업화가 이루어지고 있습니다. 사람들이 자연어로 요구사항을 전달할 수 있게 되면서 인공지능은 개발하는 사람과 사용하는 사람 사이에 간극이 커지고 있습니다. 인공지능을 본인이 필요한 곳에 사용하는 것만으로도 몇 배의 효율을 낼 수 있는 상황이기에, 너도나도 인공지능을 배우겠다고 하는 것이죠.

그러나 대부분의 사람들이 알아야 하는 것은 Transformer의 구조나 인코더 디코더 같은 구조적인 내용이 아니라, 실질적으로 사용할 수 있는 AI 프로그램과 사용법, 적용 분야 등입니다. 저에게 인공지능에 대해서 묻는 많은 사람들과, 앞으로 여러가지 분야에서 본인의 업무에 인공지능을 적용하여 자동화하여, 혹은 효율적으로 업무를 하고자 하는 분들을 위해 Category: AI가이드북 을 바칩니다.

AI가이드북은 인공지능 사용자를 위한 AI가이드북-U와 인공지능 개발자를 위한 AI가이드북-D로 분류될 예정이며, U에서는 타 분야에서 인공지능을 활용하는 방법을, D에서는 인공지능 개발에 관한 내용을 다룰 것입니다.

필요하시다면 아래 수단을 통하여 연락해주시면 감사하겠습니다.
mail: devyulbae@gmail.com
linked-in

  1. AI, ML, DL

인공지능에 대해서 알기 위해서는 먼저 AI, ML, DL의 개념과 그 포함관계에 대해서 이해하고 있어야 합니다.

AI : Artificial Intelligence

AI는 인간이 가진 지적 능력을 컴퓨터로 구현하는 기술 자체를 말합니다. 구체적인 예시로는 학습, 추론, 지각, 언어이해, 결정 등이 있으며 ML과 DL은 모두 AI라는 거대한 카테고리 안에 속해 있습니다.

ML : Machine Learning

머신러닝은 AI의 하위 분야 로, 학습, 추론, 결정에 특화되어 있는 학문입니다.
머신러닝은 데이터를 통해 학습하고 예측하거나 결정을 내리는 능력을 갖추게 하는 기술입니다. 또한, 다양한 알고리즘과 모델을 사용하여 데이터에서 패턴을 찾고 이를 바탕으로 새로운 데이터를 분석하는 데 사용됩니다.
머신러닝 기법은 크게 지도학습, 비지도학습, 강화학습으로 분류할 수 있으며, 주요 개념은 아래와 같습니다.
1. 데이터 전처리: 결측치 처리, 정규화, 인코딩 등을 적용
2. 특성 공학: 여기서 특성(Feature)는 통계학에서의 독립변수를 지칭합니다. 즉, 결과에 영향을 주는 원인을 규정하고 분석하는 과정입니다.
3. 모델 평가: 교차 검증, 혼동 행렬, ROC 곡선, 분류 성능 평가 지표 등을 적용
4. 하이퍼파라미터 조정: 그리드 서치, 랜덤 서치, 베이지안 튜닝 등을 적용

DL : Deep Learning

딥러닝은 머신러닝의 하위 분야 로, 인공신경망(Artificial Neural Networks)을 사용하여 데이터를 학습하는 기술입니다. 딥러닝은 특히 대량의 데이터를 처리하고 복잡한 패턴을 학습하는 데 뛰어난 성능을 발휘합니다. 딥러닝의 주요 개념은 아래와 같습니다.
1. 인공신경망: 인간의 신경망을 모방한 것으로, 입력층, 은닉층, 출력층으로 구성됩니다.
2. 퍼셉트론: 인공신경망의 가장 하위 구조로 하나의 뉴런이며, 일차 함수(y=Wx+b)를 기준으로 이진 분류를 수행합니다.
3. 다층 퍼셉트론:여러 개의 퍼셉트론을 쌓아서 층을 만드는 구조입니다.
4. 활성화 함수: 인간의 신경망을 모방하기 위한 중요한 요소입니다. 비선형적인 함수가 주로 사용되며 대표적으로 사용되는 함수로는 Sigmoid, Relu, Mish 등이 있습니다. 활성화 함수로 인해서 복잡한 현실의 데이터를 이해할 수 있으며, 다층 퍼셉트론이 패턴을 학습할 수 있게 됩니다.

ML vs DL

ML은 데이터 전처리와 특성 공학을 통해서 문제를 해결하는 반면, DL은 Raw Data를 인공신경망에 그대로 학습시켜서 결과값을 출력합니다.

ML은 주로 정형 데이터를, DL은 주로 비정형 데이터를 다룹니다.

ML은 결과에 대한 명확한 이유와 원인을 알 수 있지만, DL은 인공신경망이 내부에서 작동하는 방식을 완전히 파악할 수 없기 때문에 내부작업의 이해 없이 입/출력만 가능하여 BlackBox System이라고 부르기도 합니다. 다만 최근에는 XAI(Explainable AI)라는 학문 분야에서 LLM의 내부 동작을 분석해내는 것에 성공하는 등 유의미한 학문적 발전을 이루어 나가고 있습니다.

  1. 인공지능 개발자와 인공지능 사용자

위에서 언급했던 인공지능 개발자와 인공지능 사용자의 차이에 대해서 정리해보겠습니다.

인공지능 개발자는 위에서 언급했던 ML, DL 기법을 이용하여 인간의 지적 능력을 대체할 수 있는 기능을 제작하는 개발자입니다. 이들은 통계학, 일반수리학, 선형대수학 등의 깊은 수학적 이론을 기반으로 목적에 맞는 모델을 선정하고 학습시킵니다. 인공지능 개발자는 주로 Python의 Tensorflow, Pytorch 라이브러리를 사용합니다.

인공지능 사용자는 인공지능 개발자들이 만들어놓은 결과물을 사용하는 사람입니다. 이들은 python이나 수학적 이론을 알아야 할 필요는 없지만, 어떤 API가 사용 가능한지 혹은 어떤 AI Tool이 있는지 파악하고, 필요한 용도에 맞게 적용할 줄 알아야 합니다. 또한 AI사용자로서 AI가 윤리성과 저작권을 파괴할 수 있음을 인지하고, AI 윤리에 대한 기본적인 지식을 갖추어야 합니다.

Next step

AI가이드북 [1] AI 윤리

profile
Interested In: Data, Statistics, AI(NLP, LLM, LMM)

0개의 댓글