LLM 기초

모와이·2026년 1월 29일

llm

목록 보기
14/20

텍스트 생성: 소설, 기사 작성

Chat GPT : 범용성

Claude : 긴 문서

Copilot : 마이크로소프트 프로그램과 함께 쓰기에 좋다

Perplexity : 과제/리서치/논문

Grammarly : 영어 업무

Jasper / Copy.ai : 마케팅 업무

서비스강점주 사용 목적
ChatGPT범용성대화, 코딩, 기획
Claude긴 문서보고서, 계약서
CopilotMS 연동업무 자동화
Perplexity출처 제공리서치, 논문
Grammarly영어 교정비즈니스 영어
Jasper마케팅 특화광고, 카피
Copy.ai마케팅 특화SNS, 이메일

코딩 보조: 코드 자동 완성

AI 도구주요 특징강점약점추천 용도
GitHub CopilotIDE 내 실시간 코드 자동 완성코드 맥락 이해 우수, 함수/클래스 단위 생성유료, 그럴듯한 오류 가능실무 전반, 빠른 개발
Amazon CodeWhispererAWS 공식 코딩 보조AWS 연동 강함, 보안 취약점 감지범용성은 Copilot보다 약함AWS 기반 개발
Tabnine경량 코드 자동 완성빠른 속도, 로컬/오프라인 가능긴 코드 생성 약함기업 내부 코드, 보안 환경
CursorAI 통합 IDE (VS Code 기반)코드 전체 맥락 수정, 리팩토링 강함IDE 종속대규모 코드 수정
Codeium무료 코드 자동 완성무료, Copilot 유사 경험고급 추론은 약함개인 개발자
Replit Ghostwriter온라인 IDE 연동빠른 실험, 협업 친화적로컬 개발엔 부적합학습, 프로토타이핑
JetBrains AIJetBrains IDE 통합Java/Kotlin 등 강점JetBrains 사용자 한정백엔드 개발

Copilot은 범용 실무 최강,

Cursor는 코드 수정·리팩토링,

CodeWhisperer는 AWS,

Tabnine은 보안·로컬 환경에 강하다.


고객 응대: 챗봇 시스템

서비스주요 특징강점주 사용처
Zendesk AI고객지원 티켓 기반 AI 응답기존 고객 데이터 활용, 자동 답변 정확고객센터, CS
Intercom실시간 고객 메시지 AI 응대대화 흐름 자연스러움, CRM 연동SaaS 고객 지원
통신사 챗봇요금·장애·가입 문의 자동화대규모 트래픽 처리, 정형 질문 강함통신사 고객센터
  • 과학 논문 요약: 복잡한 연구 논문의 핵심 요약
    서비스주요 특징강점추천 용도
    Claude긴 문서 이해·요약논문 구조 유지, 맥락 요약 우수리뷰 논문, 보고서
    Scholarcy논문 자동 구조화 요약핵심 문장·표·참고문헌 추출논문 빠른 파악
  • 법률 문서 분석: 계약서, 법률 문서 해석 지원
    서비스주요 특징강점추천 용도
    Harvey법률 특화 LLM계약서 조항 분석, 리스크 식별로펌, 법무팀
  • 의료 상담 보조: AI 기반 의료 지식 제공
서비스주요 특징강점추천 용도
Google Med-PaLM의료 특화 대형 언어 모델의학 지식 정확성, 임상 추론의료 상담 보조, 의료 정보 검색

LLM의 한계 및 윤리적 문제

  • 프라이버시 문제: 사용자 입력 데이터의 유출 가능성 ⇒ 개체 NER → 홍길동 → [NAME]
  • 계산 비용(비효율성): 모델 크기와 컴퓨팅 자원의 부담 증가 ⇒ RAG, 검색 결합, distiollation(큰 모델의 도메인 지식만 따와서 작은 모델에 학습)

최신 LLM 동향

  • 에이전트 기반(agentic)
    • 사용자의 TASK - 계획 → 실행 → 결과 확인 → 다음 행동 (판단) (코드 실행 도구, 파일 수정 도구, 도구 호출)
    • 개발자 : 코드 수정 작업 / 코드 검토 작업
모델개발사핵심 특징강점 요약
LLaMA 4MetaOpen-weight, MoE 구조, 멀티모달적은 파라미터로 대규모 성능
Gemini 2.5Google멀티모달 통합, 1M 토큰 컨텍스트초장문·복잡 추론
DeepSeek R1DeepSeek685B open-weight, 고급 추론심층 분석·문제 해결
Grok 4xAI256K 컨텍스트, 멀티모달실시간 응답·확장성

3. Mixture-of-Experts (MoE)

의미

  • 여러 개의 “전문가 모델” 중
    입력에 맞는 일부만 선택해서 사용하는 구조

예시

  • 질문: “이 계약서 위험 조항 알려줘”

    • 법률 전문가 모델만 활성화
  • 질문: “이 코드 시간복잡도 분석해줘”

    • 코드 전문가 모델만 활성화

→ 전체 파라미터는 크지만,
실제로 쓰는 연산은 적음

nlp 최신 동향

  1. distillation : 큰 모델이 작은 모델에게 지식을 가르친다
  2. quantiziation : 모델의 숫자(가중치/연산)을 더 낮은 정밀도로 바꾼다
  3. FP32(32비트 실수) : FP16 / INT8 / INT4
    메모리 매우매우 감소, 속도 매우매우 빨라짐, 전력 매우매우 줄어든다

서비스중에서 실시간성 > 정확도
키보드 자동완성, 사지,음성 요약, 고객센터 질의응답 쳇봇

profile
공부하는거 정리하는 블로그

0개의 댓글