AI 기반 채팅 서비스 비교와 단상

Juyong Shin·2023년 3월 27일
1

아무이야기

목록 보기
1/1
post-thumbnail

ChatGPT? AI 기반 채팅 서비스란?

최근 가장 핫한 기술은 단연코 ChatGPT라 할 수 있을 것입니다. 이 AI 기술은 컴퓨터 공학과 학생이나 개발자가 아니더라도 수많은 뉴스와 기사를 통해 알려졌고, 출시한 지 몇 달이 채 지나지 않아 활성 사용자 수가 1억 명을 넘는 인기를 얻고 있습니다[1][2].
이미 대부분은 알고 있겠지만 ChatGPT에 대해 먼저 소개하자면 (정확히는 자기 소개를 시켜보자면) “GPT-3.5 아키텍처에 기반한 OpenAI에 의해 학습된 대형 언어 모델“이라고 합니다.

이게 대체 무슨 소리일까요? 하나씩 뜯어보자면 GPT-3.5에서 GPT는 Generative(생성형) Pre-trained(사전 학습) Transformer(전이 학습) 모델이라는 뜻입니다. 조금 더 풀어보자면 수많은 데이터를 사용해 “사전 학습”한 모델이 있고, 이 모델을 기반으로 특정 분야의 데이터를 추가적으로 사용해 “전이 학습”을 한 모델을 사용해 결과물을 “생성”합니다[3][4]. 이를 OpenAI에서 연구하여 개발한 모델 중 하나인 GPT-3.5는 자연어나 소스코드를 이해하고 생성하는 데 초점을 맞추어 발전시킨 모델이고요[5]. (사전 학습, 전이 학습에 대한 자세한 정보는 딥러닝 전문가 분들을 찾아갑시다…😂)
대형 언어 모델이라고 했는데 어느 정도 대형이냐 하면 GPT-3의 경우 무려 1,750억 개의 파라미터가 학습에 사용이 되었으며, ChatGPT에서는 빠른 동작을 위해 모델의 크기를 줄였다고는 하지만 여전히 200억 개의 파라미터가 사용되었다고 합니다[6].

이렇게 연구, 개발되어 세상으로 나온 ChatGPT를 처음 사용했을 때는 마냥 신기했습니다. 구글의 헤드쿼터가 긴급 회의에 들어갔다는 기사도 나오면서 이제는 정말로 대단한 인공지능이 출현한 것 같았고, 코딩할 때 여러 블로그를 찾아보지 않아도 되니 검색에 드는 시간을 훨씬 줄일 수 있지 않을까 싶었습니다. 하지만 기우였을까요, 제 모든 기대를 깨트리는 사건(?)이 발생했습니다.

이 글을 시작하게 된 계기

깃허브 블로그로 글을 옮겼습니다!

profile
도움이 되고 싶은 개발자, 신주용입니다.

0개의 댓글