LLM 기초

모와이·2026년 1월 29일

llm

목록 보기

14/20

텍스트 생성: 소설, 기사 작성

Chat GPT : 범용성

Claude : 긴 문서

Copilot : 마이크로소프트 프로그램과 함께 쓰기에 좋다

Perplexity : 과제/리서치/논문

Grammarly : 영어 업무

Jasper / Copy.ai : 마케팅 업무

서비스	강점	주 사용 목적
ChatGPT	범용성	대화, 코딩, 기획
Claude	긴 문서	보고서, 계약서
Copilot	MS 연동	업무 자동화
Perplexity	출처 제공	리서치, 논문
Grammarly	영어 교정	비즈니스 영어
Jasper	마케팅 특화	광고, 카피
Copy.ai	마케팅 특화	SNS, 이메일

코딩 보조: 코드 자동 완성

AI 도구	주요 특징	강점	약점	추천 용도
GitHub Copilot	IDE 내 실시간 코드 자동 완성	코드 맥락 이해 우수, 함수/클래스 단위 생성	유료, 그럴듯한 오류 가능	실무 전반, 빠른 개발
Amazon CodeWhisperer	AWS 공식 코딩 보조	AWS 연동 강함, 보안 취약점 감지	범용성은 Copilot보다 약함	AWS 기반 개발
Tabnine	경량 코드 자동 완성	빠른 속도, 로컬/오프라인 가능	긴 코드 생성 약함	기업 내부 코드, 보안 환경
Cursor	AI 통합 IDE (VS Code 기반)	코드 전체 맥락 수정, 리팩토링 강함	IDE 종속	대규모 코드 수정
Codeium	무료 코드 자동 완성	무료, Copilot 유사 경험	고급 추론은 약함	개인 개발자
Replit Ghostwriter	온라인 IDE 연동	빠른 실험, 협업 친화적	로컬 개발엔 부적합	학습, 프로토타이핑
JetBrains AI	JetBrains IDE 통합	Java/Kotlin 등 강점	JetBrains 사용자 한정	백엔드 개발

Copilot은 범용 실무 최강,

Cursor는 코드 수정·리팩토링,

CodeWhisperer는 AWS,

Tabnine은 보안·로컬 환경에 강하다.

고객 응대: 챗봇 시스템

서비스	주요 특징	강점	주 사용처
Zendesk AI	고객지원 티켓 기반 AI 응답	기존 고객 데이터 활용, 자동 답변 정확	고객센터, CS
Intercom	실시간 고객 메시지 AI 응대	대화 흐름 자연스러움, CRM 연동	SaaS 고객 지원
통신사 챗봇	요금·장애·가입 문의 자동화	대규모 트래픽 처리, 정형 질문 강함	통신사 고객센터

과학 논문 요약: 복잡한 연구 논문의 핵심 요약

서비스	주요 특징	강점	추천 용도
Claude	긴 문서 이해·요약	논문 구조 유지, 맥락 요약 우수	리뷰 논문, 보고서
Scholarcy	논문 자동 구조화 요약	핵심 문장·표·참고문헌 추출	논문 빠른 파악

법률 문서 분석: 계약서, 법률 문서 해석 지원
서비스 주요 특징 강점 추천 용도
Harvey 법률 특화 LLM 계약서 조항 분석, 리스크 식별 로펌, 법무팀
의료 상담 보조: AI 기반 의료 지식 제공

서비스	주요 특징	강점	추천 용도
Harvey	법률 특화 LLM	계약서 조항 분석, 리스크 식별	로펌, 법무팀

서비스	주요 특징	강점	추천 용도
Google Med-PaLM	의료 특화 대형 언어 모델	의학 지식 정확성, 임상 추론	의료 상담 보조, 의료 정보 검색

LLM의 한계 및 윤리적 문제

프라이버시 문제: 사용자 입력 데이터의 유출 가능성 ⇒ 개체 NER → 홍길동 → [NAME]
계산 비용(비효율성): 모델 크기와 컴퓨팅 자원의 부담 증가 ⇒ RAG, 검색 결합, distiollation(큰 모델의 도메인 지식만 따와서 작은 모델에 학습)

최신 LLM 동향

에이전트 기반(agentic)
- 사용자의 TASK - 계획 → 실행 → 결과 확인 → 다음 행동 (판단) (코드 실행 도구, 파일 수정 도구, 도구 호출)
- 개발자 : 코드 수정 작업 / 코드 검토 작업

모델	개발사	핵심 특징	강점 요약
LLaMA 4	Meta	Open-weight, MoE 구조, 멀티모달	적은 파라미터로 대규모 성능
Gemini 2.5	Google	멀티모달 통합, 1M 토큰 컨텍스트	초장문·복잡 추론
DeepSeek R1	DeepSeek	685B open-weight, 고급 추론	심층 분석·문제 해결
Grok 4	xAI	256K 컨텍스트, 멀티모달	실시간 응답·확장성

3. Mixture-of-Experts (MoE)

의미

여러 개의 “전문가 모델” 중
입력에 맞는 일부만 선택해서 사용하는 구조

예시

질문: “이 계약서 위험 조항 알려줘”
- 법률 전문가 모델만 활성화
질문: “이 코드 시간복잡도 분석해줘”
- 코드 전문가 모델만 활성화

→ 전체 파라미터는 크지만,
실제로 쓰는 연산은 적음

nlp 최신 동향

distillation : 큰 모델이 작은 모델에게 지식을 가르친다
quantiziation : 모델의 숫자(가중치/연산)을 더 낮은 정밀도로 바꾼다
FP32(32비트 실수) : FP16 / INT8 / INT4
메모리 매우매우 감소, 속도 매우매우 빨라짐, 전력 매우매우 줄어든다

서비스중에서 실시간성 > 정확도
키보드 자동완성, 사지,음성 요약, 고객센터 질의응답 쳇봇

모와이

공부하는거 정리하는 블로그

이전 포스트

전이학습

다음 포스트