Chat-GPT: 대화형 기술 혁신 간단히 알아보기

AID·2024년 5월 1일

-chat gpt 검색량 -인공지능 검색량

위에 그래프를 보면 인공지능에 대한 검색량이 2022년 후반부터 증가하는것을 볼 수 있습니다. 그래프를 보면 거대 언어 모델 chat gpt의 대한 검색량이 증가하는 시점부터 인공지능 검색량이 급격히 증가하는 시점이 일치하는것을 볼 수 있습니다.최근 불어오는 인공지능 붐이 불어오는데 핵심 역할을 한 Chat-GPT를 어떻게 만들어졌고 어떻게 작동하는지를 알려드리겠습니다.

최근 몇 년간 인공지능 기술은 비약적인 발전을 거듭해 왔습니다. 특히, 자연어 처리(Natural Language Processing) 분야에서의 진보는 사람들 사이의 커뮤니케이션 방식뿐만 아니라, 기계와의 상호작용 방식에도 혁신적인 변화를 가져왔습니다. 이 중심에는 OpenAI의 Chat-GPT와 같은 대화형 AI 모델이 자리 잡고 있습니다. 이 칼럼을 통해, Chat-GPT의 기술적 원리를 탐구해보고자 합니다.

GPT 언어 모델의 학습 과정: 트랜스포머 아키텍처와 Self-Attention 메커니즘

GPT 시리즈와 같은 대규모 언어 모델은 트랜스포머(Transformer) 아키텍처를 기반으로 합니다. 이 아키텍처는 주로 Self-Attention 메커니즘을 사용하여 언어 데이터를 처리합니다. Self-Attention 매커니즘이란 입력된 텍스트의 모든 단어 사이의 관계를 동시에 평가하여, 각 단어가 문장에서 어떤 역할을 하는지 파악하는 과정입니다.

Self-Attention 작동 원리

Self-Attention은 각 단어에 대해 '쿼리(query)', '키(key)', '값(value)'의 세 가지 요소로 분해하여 처리합니다. 각 단어에 대한 쿼리는 문장 내 다른 모든 키와 비교되어, 얼마나 관련이 있는지 점수를 매깁니다. 이 점수는 '어텐션 스코어(attention score)'라고 하며, 높은 점수를 가진 키(즉, 가장 관련 높은 단어)의 값이 더 큰 가중치를 받게 됩니다. 이 과정을 통해 모델은 각 단어가 전체 문맥 중 어디에 중점을 두어야 하는지를 학습하며, 이 정보를 사용해 다음 단어를 예측합니다.

문맥 파악과 문장 생성

트랜스포머는 이러한 어텐션 메커니즘을 여러 층(layer)에 걸쳐 적용합니다. 각 층에서 모델은 더 깊은 문맥적 이해를 개발하며, 복잡한 언어 구조를 더 잘 파악할 수 있습니다. 예를 들어, 문법적 뉘앙스, 의미론적 관계, 대화의 흐름 등을 포착하여 더 자연스럽고 정확한 문장을 생성할 수 있습니다.

사전 훈련과 파인 튜닝

GPT와 같은 모델은 초대규모의 데이터셋에서 사전 훈련을 거치며, 이 데이터셋은 다양한 주제와 문체를 포함한 텍스트로 구성됩니다. 사전 훈련 과정에서 모델은 텍스트를 하나의 긴 연속된 데이터 스트림으로 처리하며, 각 시점에서 다음에 올 단어를 예측하는 방식으로 학습합니다. 이를 통해 모델은 광범위한 언어 패턴과 지식을 축적합니다.

파인 튜닝 단계에서는 특정 작업이나 도메인에 맞게 모델을 조정할 수 있습니다. 이때, 특정 목표에 부합하는 텍스트를 사용하여 모델의 성능을 최적화합니다. 예를 들어, 법률적 문서나 의학적 텍스트 처리를 위해 모델을 특화시키는 작업 등이 이에 해당됩니다.

이처럼 GPT 모델은 트랜스포머 아키텍처를 통해 깊이 있는 언어 이해 능력을 개발하고, 사전 훈련과 파인 튜닝을 통해 다양한 언어 작업에 효과적으로 적용될 수 있습니다.

그러나 위의 매커니즘을 통해서 나온 머신은 인간이 보기에는 다소 자연스럽지 않을 수 있습니다. 이를 해결하기 위해 GPT 시리즈는 RLHF를 병행하여 사용하게 됩니다. 이는 실제 사용자와의 상호작용에서 얻은 피드백을 기반으로 모델을 학습시키게 됩니다. 모델은 초기에 사전 훈련된 능력을 바탕으로 사용자의 질문을 대답하고 사용자는 대답에 대한 피드백을 제공하게 됩니다. 이러한 과정에서 여러가지 항목, 정확성, 관련성, 자연스러움 등에 점수를 얻고 이는 모델을 조정하는 보상함수로 적용되게 됩니다. 이를 통해 인간이 무엇을 요구하는지 의도를 정확하게 파악하게 되며 문체에도 변화가 생겨 GPT는 딱딱한 기계가 아닌 인간적인 무언가가 될 수 있습니다.

<끝맽음>

GPT를 개발하는 OpenAI는 인공지능 기술의 안전하고 폭넓은 이익을 추구하며, 이를 통해 인류에 긍정적인 영향을 주고자 하는 목표를 가지고 있습니다. 현재까지의 개발 진행 상황을 보면, 자연어 처리, 컴퓨터 비전, 로봇공학 등 여러 방면에서 혁신적인 성과를 이루어냈으며, 이는 GPT-4와 같은 고도의 언어 모델을 포함합니다. 뿐만아니라 휴머로이드의 지식을 담당하는 중추가 되기도 합니다. OpenAI는 지속적인 연구와 협력을 통해 인공지능의 발전을 이끌어 나가고 있으며, 이 과정에서 인류에 도움이 되는 기술을 개발하는 것을 최우선으로 하고 있습니다.

-사람이 배고프다는 말을 하자 사과를 갖다주는 로봇

작성자:5기 조현성

AID

부산대학교 인공지능 동아리

이전 포스트

양자 컴퓨팅 기초

다음 포스트