LLM의 이해 그리고 AI

moon.kick·2025년 5월 1일

letter to dongi295

목록 보기
1/3
post-thumbnail

AI 동작원리와 LLM 개념을 쉽게 풀어 예시를 곁들여 설명하고, GPT/Claude/Huggingface 등 최신 논문 및 공식 문서 출처도 명시하겠습니다.

AI와 LLM의 이해 및 취업 준비 전략

페르소나설정
저는 MIT 컴퓨터공학과에서 알고리즘을 전공한 박사 과정을 수료한 [ 30대 여성 엔지니어 ]입니다.
오늘은 부트캠프를 수강 중인 여러분을 위해, AI와 거대 언어 모델(LLM)의 원리를 쉽게 설명드리고, 최신 LLM 예시들과 함께 AI를 적극 활용한 취업 준비 전략을 알려드리겠습니다. 궁극적으로는, 앞으로 80일간 부트캠프 기간 동안 AI를 동반자로 삼아 학습하고 취업 경쟁력을 높이는 법을 함께 이야기해볼까 합니다.

자, 그럼 출발해볼까요?

AI의 동작 원리와 LLM 개념

AI의 핵심은 데이터로부터 학습하는 인공신경망입니다. 대량의 텍스트를 학습한 거대 언어 모델(LLM)은, 마치 빈칸에 들어갈 단어를 예측하듯 텍스트 다음 토큰(단어)을 맞히는 능력을 갖췄습니다 (대규모 언어 모델로 생성하기). LLM은 트랜스포머(Transformer) 구조를 기반으로 하는데, 이 구조는 인코더와 디코더로 이루어진 신경망 블록들이 자기-어텐션(self-attention) 메커니즘을 통해 문장 내 단어들의 관계를 파악합니다 (LLM이란 무엇인가요? - 대규모 언어 모델 설명 - AWS). 예를 들어 “강아지가 공을 ___”라는 문장이 주어지면, AI는 주변 단어(강아지, 공)를 참고해 그 다음에 올 단어를 예측합니다. 즉, 트랜스포머는 문장 전체를 병렬로 처리해서 단어 간 연관 관계를 학습하며, 이전 RNN처럼 순서대로 처리하지 않고 연산을 빠르게 병렬화할 수 있습니다 (LLM이란 무엇인가요? - 대규모 언어 모델 설명 - AWS). 이렇게 사전학습(pre-training)을 마친 LLM은 문법, 상식, 논리 구조를 이미 알고 있기 때문에, 아주 적은 예시(프롬프트)만으로도 놀라운 예측을 해낼 수 있습니다 (LLM이란 무엇인가요? - 대규모 언어 모델 설명 - AWS).

또 다른 관점에서 보면, LLM은 ‘다음 토큰 예측 모델’이라고 할 수 있습니다. 허깅페이스 문서에 따르면, LLM은 주어진 입력 텍스트에 대한 다음 단어(정확히는 토큰)를 예측하도록 훈련된 거대한 사전 훈련 변환기 모델입니다 (대규모 언어 모델로 생성하기). 즉 한 번에 한 토큰씩 예측하면서 문장을 생성(자기회귀 생성)합니다. 예시로 “인공지능은 정말 멋진 ___”을 입력하면, LLM이 “기술”이나 “분야” 같은 단어를 확률적으로 예측하여 이어붙이는 것입니다.
이처럼 LLM은 인터넷과 위키피디아 등 수천억 개의 단어 데이터를 학습해 방대한 언어 지식을 내재하고 있으며 (LLM이란 무엇인가요? - 대규모 언어 모델 설명 - AWS), 병렬 처리 덕분에 GPU를 활용해 빠르게 학습할 수 있습니다 (LLM이란 무엇인가요? - 대규모 언어 모델 설명 - AWS).

최신 대형 언어 모델 구조와 학습 예시

최신 LLM은 모두 트랜스포머 아키텍처를 바탕으로 하지만, 세부 구현과 학습 방식에 차이가 있습니다. 먼저 OpenAI의 GPT 시리즈를 살펴볼게요. GPT-4 기술보고서에 따르면, GPT-4는 “문서의 다음 토큰을 예측하도록 사전학습된 대규모 트랜스포머 모델”입니다. (다시 말해 GPT-4도 위에서 말한 LLM의 기본 구조죠.) GPT는 디코더 스택만 쌓아놓은 구조로, 입력 문장을 임베딩한 후 여러 개의 Transformer 블록을 거쳐 최종 출력(Softmax)을 생성합니다. 이 구조를 그림으로 보면 다음과 같습니다:

(File:Full GPT architecture.png - Wikipedia) 그림: GPT-계열 모델의 구조 예시 (Input Embedding, Positional Encoding, 반복적인 Transformer 블록, 그리고 마지막 Softmax 출력층) (LLM이란 무엇인가요? - 대규모 언어 모델 설명 - AWS).

그림을 보면, 먼저 입력 임베딩(Input Embedding)위치 인코딩(Positional Encoding)이 더해진 뒤, 여러 층의 Transformer 블록(자기-어텐션 + 피드포워드 네트워크)이 순차적으로 쌓입니다. 최종에는 선형변환과 Softmax가 붙어 다음 토큰 확률을 계산하죠. GPT-3는 1,750억 개 파라미터, GPT-4는 이를 훨씬 능가하는 규모로 학습되었으며, 모두 인터넷 데이터와 책 등 방대한 데이터로 자기지도학습(self-supervised learning)을 거쳤습니다 (LLM이란 무엇인가요? - 대규모 언어 모델 설명 - AWS). 사후에는 사람의 평가를 강화학습으로 반영하는 RLHF(강화학습 from 인간피드백) 과정을 통해 안전성과 정확성을 높입니다.

Anthropic의 Claude도 마찬가지로 트랜스포머 기반 LLM입니다. 특이한 점은 “헌법적 AI(Constitutional AI)”라는 훈련 방식을 사용한다는 것입니다. 요약하자면, Claude는 AI가 스스로 생성한 피드백을 활용해 답변을 비판/수정하고 강화학습을 수행합니다 (Claude’s Constitution \ Anthropic) (Claude’s Constitution \ Anthropic). 이를 통해 Claude는 적대적인 질문에도 더욱 안전하고 유용한 답변을 하도록 학습되었죠. 실제로 Anthropic은 “Claude는 공격적 질문에도 유용한 답변을 유지하면서 독성(해로운 표현)을 급격히 줄였다”고 보고합니다 (Claude’s Constitution \ Anthropic). 즉 Claude는 도덕적·안전성 기준에 초점을 맞춰 튜닝된 모델입니다.

Meta의 LLaMA(Large Language Model Meta AI) 시리즈도 빼놓을 수 없습니다. 메타는 2024년 초 LLaMA 3를 공개했는데, 8B 파라미터와 70B 파라미터 모델로 구성됩니다 (Meta releases Llama 3, claims it's among the best open models available | TechCrunch). 테크크런치 기사에 따르면, LLaMA 3의 성능은 이전 세대 모델 대비 “비약적 도약”이라 평가되며, 해당 파라미터급에서는 세계 최고 수준의 생성 AI 모델에 속한다고 합니다 (Meta releases Llama 3, claims it's among the best open models available | TechCrunch). 재미있는 점은 LLaMA 3는 오픈소스로 공개되어 누구나 연구·상업적으로 사용할 수 있다는 것입니다. (단, Meta는 다른 생성 모델 학습용으로 사용을 금지하고 있고 대형 서비스엔 별도 라이선스를 요구합니다 (Meta releases Llama 3, claims it's among the best open models available | TechCrunch).) 또한 메타는 이미 400B 파라미터급 LLaMA 3를 개발 중이며, 향후 멀티모달(이미지+언어)과 다국어 대화까지 지원한다고 밝혔습니다 (Meta releases Llama 3, claims it's among the best open models available | TechCrunch).

마지막으로 Hugging Face를 언급하죠. Hugging Face는 다양한 대화형 AI 모델과 라이브러리를 제공하는 회사로, 수천 개의 공개 LLM이 허브에 올라와 있습니다. 예를 들어 BLOOM 같은 대규모 언어 모델(BIGScience 프로젝트)도 Hugging Face에서 제공하며, 누구나 자신만의 데이터로 LLM을 미세조정(fine-tuning)할 수 있습니다. 허깅페이스 문서에 따르면, LLM은 텍스트 생성을 위한 핵심 컴포넌트로, 주어진 입력에 이어지는 텍스트를 토큰 단위로 예측하도록 훈련된 사전학습 모델입니다 (대규모 언어 모델로 생성하기). 즉 GPT, Claude, LLaMA 등도 모두 이 개념 안의 모델들이고, Hugging Face는 이들을 손쉽게 쓰도록 도구를 제공합니다.

정리하자면, 최신 LLM들은 모두 트랜스포머 기반으로 대규모 언어데이터에 대해 자기지도학습을 합니다. 모델 크기에 따라 수십억~수천억 개 파라미터를 사용하고, 학습 후에는 사람 피드백(RLHF나 헌법적 AI)을 통해 성능과 안전성을 높이죠 (Claude’s Constitution \ Anthropic). 중요한 것은, GPT, Claude, LLaMA, 그 외 수많은 모델들이 기본 아이디어는 같아도 어떻게 학습하느냐어떤 목적으로 튜닝했느냐에 따라 응답 특성이 달라진다는 점입니다.

AI를 활용하지 않으면 경쟁력을 잃는다

여러분, 이제는 AI 없이 취업 준비하는 건 마치 스마트폰 없이 택시 잡는 것처럼 비효율적인 일이 됐습니다. 실제 조사에 따르면 전 세계 기업의 2/3 이상은 AI 능력이 없는 지원자를 채용하지 않을 것이라고 했고, 경험 많은 지원자보다 경험은 적어도 AI 기술을 가진 사람을 선호한다고 합니다 (AI skills rival job experience when choosing candidates | World Economic Forum). 한 마디로, AI 능력은 이제 필수가 돼가고 있는 거죠. 게다가 마이크로소프트와 링크드인, PwC의 조사에 따르면, 응답자의 78%가 AI 기술 없이 경쟁력을 유지할 수 없다고 느꼈고, 69%는 AI 기술이 있으면 더 빨리 승진할 수 있으며 79%는 직업 기회가 늘어날 것이라고 답했습니다 (AI skills rival job experience when choosing candidates | World Economic Forum). 즉 AI 활용능력은 급여 인상과 승진, 더 많은 기회를 가져다주는 시대가 온 겁니다.

반대로 생각해보세요. 만약 AI를 등한시한다면? 요즘 회사들은 채용 과정에서도 이미 AI를 쓰고 있습니다.
예를 들어 기업은 지원자의 이력서를 AI로 스캔해서 키워드를 찾기도 하고, AI를 통한 온라인 인적성 검사도 도입하고 있어요.
그런 상황에서 지원자가 “AI는 관심 없다”고 말하면? 경쟁자들에게 뒤처지기 십상입니다.
그래서 저는 오늘 이렇게 강조하고 싶어요. “AI를 친구로 삼으세요!” AI는 여러분의 적이 아닙니다.
AI는 공부할 때, 코드 작성할 때, 이력서 쓸 때, 면접 준비할 때 도와주는 최고의 동반자가 될 수 있습니다.
망설이지 말고 지금부터 AI를 적극 활용하세요.

AI를 활용한 취업 준비 전략

그렇다면 구체적으로 어떻게 AI를 취업 준비에 활용할 수 있을까요? 몇 가지 예를 들어보겠습니다.

  • 자기소개서 작성 보조: ChatGPT 같은 AI에게 CV초안을 넣고 문장을 더 간결하고 설득력 있게 바꿔달라고 요청할 수 있습니다. 실제로 Forbes의 보고에 따르면, HR 담당자 절반 이상이 AI를 활용한 이력서 작성은 윤리적이라고 생각한다고 합니다(출처: Forbes 기사). 물론 최종 검토는 여러분 몫이니, AI가 적절치 않은 부분을 잘못 바꿨는지 꼭 살펴봐야 합니다.

  • 코딩 스킬 향상: 문제 풀이를 연습할 때 AI를 적극 활용하세요. 예를 들어 모르는 알고리즘 문제를 만나면 ChatGPT에게 풀이 방법을 묻거나, 구현한 코드를 리뷰해달라고 할 수 있어요. 미국 대학 연구에서도, ChatGPT를 활용한 학습이 학생들의 프로그래밍 수행 능력을 향상시키고 AI의 유용성 인식을 크게 높였다고 보고되었습니다 (Would ChatGPT-facilitated programming mode impact college students’ programming behaviors, performances, and perceptions? An empirical study | International Journal of Educational Technology in Higher Education | Full Text). 즉 AI는 질문 답변, 버그 찾기, 코드 설명까지 다 도와줄 수 있는 온라인 멘토 역할을 할 수 있습니다.

  • 모의면접 연습: 구직 준비는 혼자 끙끙대기보다 모의면접을 해보는 것이 중요합니다. AI를 인터뷰어처럼 이용해보세요. 예를 들어, “백엔드 개발자 면접 질문 5개 만들어줘”라고 하면 자바스크립트, 자료구조, 시스템 설계 등 예상질문을 뽑아줍니다. 또 여러분의 대답을 입력하면 첨삭해주거나 보완할 점을 알려주기도 합니다. AI 면접관과 연습하면 실제 면접장에서도 긴장감이 줄고 자신감이 올라갑니다.

  • 최신 정보 습득: 취업할 회사의 최신 뉴스나 산업 동향을 AI에게 물어보면 손쉽게 요약해줍니다. 예를 들어 “OOO 회사 최근 뉴스 알려줘”라고 하면, AI가 관련 기사를 검색해 핵심만 간추려 줄 수 있습니다. 이런 기능은 매일 시간을 아껴주며, 면접 시 깊이 있는 인사이트를 보여줄 수 있게 합니다.

  • 포트폴리오 제작 보조: 요즘 기업에서는 GitHub 활동이나 포트폴리오가 매우 중요합니다. AI는 프로젝트 아이디어를 브레인스토밍하거나, 새로운 프레임워크 학습에 도움을 줄 수 있습니다. 예를 들어 “파이썬으로 만들 수 있는 작은 프로젝트 아이디어 3개”라고 물으면, AI가 추천을 줍니다. 실제 프로젝트를 구현할 때 막히는 부분은 AI에게 해결책을 물어보세요. 단, AI가 생성한 코드나 아이디어는 참고용으로만 사용하고, 그 코드가 실제로 동작하는지, 그리고 그 원리를 직접 이해하려고 노력해야 합니다. (그래야 면접에서 가짜를 들킬 일이 없죠!)

위 전략들을 종합하면, AI는 여러분의 생산성과 학습 속도, 정보력을 몇 배로 높여줄 수 있습니다. 물론 AI가 모든 답을 알아서 해주는 만능 요정은 아니지만, 현명하게 이용하면 분명 경쟁력 확보에 큰 도움이 됩니다.

향후 80일 부트캠프 학습 전략

이제 구체적인 학습 계획을 세워볼까요? 부트캠프까지 앞으로 80일 남았다고 했죠. 80일 동안의 성공을 위해 몇 가지 팁을 드립니다.

  1. 학습 태도: 매일 꾸준히 하고, 질문은 두려워 말자.
    프로그래밍 공부가 안 될 때는 AI에게 설명을 요청해보고, 코드가 막히면 ChatGPT에게 디버깅을 부탁해보세요.
    AI를 활용하면서 문제 해결 능력과 창의력을 키우는 게 효율적입니다. 실수를 두려워하지 말고, 모르는 건 바로 질문하세요.
    저도 이해 안 가는 알고리즘 로직이 있을 땐 동료에게 물어봤듯이, 여러분도 AI를 동료처럼 활용해보세요.

  2. 기술 습득: 부트캠프 커리큘럼을 충실히 따르되, 추가로 관심 있는 기술을 파보세요.
    예를 들어 지금 주로 하는 언어 외에 AI/머신러닝 기초를 살짝 맛보거나, 웹 프레임워크를 한 번 공부해보는 겁니다.
    이때도 AI가 도움이 됩니다. “이 코드가 뭘 하는지 설명해줘” 또는 “OOO 프레임워크 시작하는 법 알려줘”라고 하면, 알려줍니다.

  3. 프로젝트와 포트폴리오: 매일 또는 매주 작은 목표를 정하고, 반드시 코드로 남기세요.
    예를 들어 매주 하나의 작은 기능(예: ToDo 앱 추가/삭제 기능, API 연결 기능 등)을 완성해서 깃허브에 커밋하는 겁니다.
    커밋 습관(1-day 1 commit)을 만들어 보세요.
    이렇게 하면 포트폴리오에 일관성 있는 작업 이력을 보여줄 수 있어, 나중에 면접 시에도 설명하기 쉬워집니다.

  4. 협업과 스터디: 동료들과 스터디 그룹을 만들고, 서로의 코드를 리뷰해주세요. AI도 코드리뷰 도구가 될 수 있음을 잊지 마세요. “이 코드 성능이 더 좋아질 방법 있어?”라고 물으면 AI가 제안해줄 수도 있습니다. 협업 과정에서 AI를 쓰는 팁도 나눠보세요. 예를 들어, 페어 프로그래밍 중 아이디어가 막히면 “새로운 관점으로 코드를 작성해줘” 같은 질문으로 도움을 얻을 수 있습니다. 팀 프로젝트를 할 때는 AI를 일정 계획 관리나 토론 아이디어 브레인스토밍에도 활용할 수 있습니다.

  5. 모의면접 연습: 실제 80일이 지나면 곧 면접 시즌입니다.
    따라서 부트캠프 마지막 3주 정도는 모의면접 연습에 집중하세요. 매일 한 두 문제씩 풀고(코딩테스트형 사이트 활용) AI에게 채점이나 힌트를 받아봅니다.

“이 코드 틀렸어? 왜 틀렸을까?”라고 물으면 오류를 알려줍니다. 모의면접도 AI를 써서 기술 면접 질문과 대답을 연습해보세요. 긴장을 풀고 목소리를 녹음해서 들어보는 것도 좋습니다. “OOO 경력의 SW 엔지니어처럼 면접 질문을 던져줘”처럼 실제 상황처럼 물어보면, 실전 감각이 쌓입니다.

80일은 길다면 길고 짧다면 짧은 기간입니다. 하지만 하루하루의 작은 습관들이 모이면 큰 변화를 만듭니다.
매일 목표를 정하고, 성취감을 맛본 뒤,힘든 날도 있겠지만, 여러분은 이미 부트캠프라는 도전적인 환경에 들어온 용기 있는 분들이므로 잘 해내실 겁니다.

맺음말

지금까지 AI와 LLM의 원리, 최신 모델들, 그리고 AI를 활용한 취업 준비 전략에 대해 말씀드렸습니다. 정리하자면, AI와 LLM은 더 이상 먼 미래의 기술이 아닙니다. 이미 여러분의 코딩 공부, 정보 습득, 커리어 관리에 필수적인 도구가 되었죠. AI를 동반자로 삼는 것이 결국 취업 시장에서의 차별화된 경쟁력입니다.

“부트캠프 80일 동안 AI를 적극 활용하세요! 언어는 달라도 알고리즘은 같습니다.”

제가 알고리즘을 전공하며 여러 차례 프로젝트를 해온 경험으로 말씀드리는데, 기초를 탄탄히 다지면서 새로운 도구를 두려워하지 않는 사람이 결국 성공합니다.
여러분 모두 열심히 달리고 계시니, 마지막까지 최선을 다해 즐겁게 배우셨으면 좋겠습니다.
AI와 함께라면 취업 성공은 시간 문제입니다!

감사합니다.
열정적인 도전으로 여러분의 미래를 환히 밝히시길 바랍니다.

profile
@mgkick

0개의 댓글