[ AI&ML_Eng : 개념 공부. ] AI&ML_Eng : 개념 공부. : ML 면접 대비 01.

post-thumbnail

[ AI&ML_Eng : 개념 공부. ] AI&ML_Eng : 개념 공부. : ML 면접 대비 01.

▽ [ AI&ML_Eng : 개념 공부.] AI&ML_Eng : 개념 공부. : ML 면접 대비 01.

머신러닝이란 무엇인가?


머신러닝의 개념.

  • 머신러닝(Machine Learning)은 인공지능(AI)의 한 분야로,
    컴퓨터가 명시적으로 프로그래밍되지 않아도 데이터를 통해 학습하고,
    그 결과를 바탕으로 예측(Prediction)과 의사결정(Decision Making)을 수행할 수 있게 하는 기술.

  • 인공지능의 하위 분야 중에서 지능을 구현하기 위한 소프트웨어의 핵심 축.

  • 머신러닝 모델은 주어진 데이터에서 '패턴과 규칙을 학습'하여
    새로운 데이터에 대해서도 { 분류(Classification), 회귀(Regression), 추천(Recommendation), 예측 } 등의 작업을 수행 가능.

  • 즉!, 사람이 모든 규칙을 코딩하지 않아도, '데이터 기반'으로 성능을 개선하고 스스로 학습하는 시스템을 구축 가능.

  • 수동적인 프로그래밍 대신 데이터를 기반으로 한 예측 및 의사결정 가능해짐.

머신러닝의 핵심 아이디어.

  • '규칙 기반'이 아니라, '데이터 기반' 학습

  • 모델이 데이터를 통해 '패턴을 발견하고 일반화'

  • 새로운 데이터에 대한 { 분류(Classification), 회귀(Regression), 추천(Recommendation) } 가능.

면접용 답변.

👉 머신러닝은 명시적인 규칙 대신 데이터를 통해 학습하여 예측이나 의사결정을 수행하는 인공지능 기술입니다.
모델이 데이터를 기반으로 패턴을 학습하고, 새로운 데이터에도 적용할 수 있습니다.

머신러닝과 딥러닝의 차이점은 무엇인가?


머신러닝과 딥러닝의 차이.

구분머신러닝 (Machine Learning)딥러닝 (Deep Learning)
정의데이터를 통해 학습하는 AI 알고리즘 전반머신러닝의 하위 분야로 인공신경망(ANN) 기반 기법
모델 구조선형회귀, 의사결정나무, SVM 등 비교적 단순한 구조다층 신경망(Deep Neural Network)으로 계층적 구조 사용
특징 추출사람이 직접 특징(feature)을 설계해야 하는 경우가 많음네트워크가 특징을 자동으로 추출 (Feature Engineering 자동화)
데이터 요구량적은 데이터에서도 작동 가능대규모 데이터와 연산 자원이 필요
주요 활용예측 분석, 추천 시스템, 금융 모델링 등이미지 인식, 자연어 처리(NLP), 음성 인식, 자율주행 등 복잡한 패턴 인식
  • 머신러닝은 컴퓨터가 데이터를 톹ㅇ해 학습하는 알고리즘과 기술들을 포함하는 분야.

  • 딥러닝은, 머신러닝의 한 부분으로 '인공신경망(ANN: Artificial Neural Networks)'을 기반으로 한 방법론.

    • 딥러닝은 복잡한 문제를 해결하기 위해 다양한 계층(Layer)으로 구성된 신경망을 사용하여
      데이터의 추상적인 표현을 학습.
    • 딥러닝은 특히 대용량의 데이터를 처리할 때 높은 성능을 보이며,
      {이미지 인식, 자연어 처리, 자율 주행} 등 복잡한 문제 해결에 사용.

👉 요약하면,

  • 머신러닝은 “데이터에서 학습하는 모든 기술”을 포함하는 큰 틀이고,

  • 딥러닝은 그중에서도 “인공신경망을 활용해 복잡한 문제를 해결하는 방법론”.

머신러닝과 딥러닝의 관계 도식화.

인공지능(AI)
   └── 머신러닝 (Machine Learning)
          ├── 지도학습 (Supervised Learning)
          ├── 비지도학습 (Unsupervised Learning)
          ├── 강화학습 (Reinforcement Learning)
          └── 딥러닝 (Deep Learning)
                 ├── CNN (합성곱 신경망) → 이미지 처리
                 ├── RNN/LSTM → 시계열·자연어 처리
                 └── GAN (적대적 생성 신경망) → 생성 모델
┌──────────────────────────┐
│      인공지능 (AI)       │
└───────────┬─────────────┘
            │
     ┌──────┴───────┐
     │  머신러닝    │
     │ (ML)        │
     └──────┬──────┘
            │
       ┌────┴─────┐
       │ 딥러닝    │
       │ (DL)     │
       └──────────┘
  • 비유

    • AI = “전체 분야”

    • ML = “AI를 가능하게 하는 방법들”

    • DL = “ML 중에서도 신경망 기반의 고도화된 방법”

면접용 답변.

👉 머신러닝은 데이터 학습 알고리즘 전반을 의미하고,
딥러닝은 그중에서도 인공신경망 기반의 학습 방법론입니다.
머신러닝은 사람이 특징을 직접 설계하는 경우가 많지만, 딥러닝은 신경망이 특징을 자동으로 추출합니다.
또한 딥러닝은 대규모 데이터에서 뛰어난 성능을 보이며, 이미지 인식·자연어 처리 등에 주로 사용됩니다.

👉 지도학습, 비지도학습, 강화학습으로 나뉩니다.
지도학습은 라벨이 있는 데이터로 학습하고, 비지도학습은 라벨이 없는 데이터에서 패턴을 찾습니다.
강화학습은 보상을 최대화하기 위해 환경과 상호작용하며 학습합니다.

머신러닝 알고리즘의 주요 종류는 무엇인가??


  • 머신러닝 알고리즘은 크게 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 그리고 강화학습(Reinforcement Learning)으로 나눌 수 있습니다.
구분설명대표 알고리즘활용 예시
지도학습입력 데이터와 정답(라벨)이 주어진 상태에서 학습선형회귀, 로지스틱 회귀, 서포트 벡터 머신(SVM), 결정트리, 랜덤포레스트, 신경망스팸 메일 분류, 주가 예측
비지도학습정답(라벨)이 없는 데이터에서 패턴이나 구조를 찾음K-평균 클러스터링(K-Means), 계층적 군집화, PCA(차원축소)고객 세분화, 이상치 탐지
강화학습환경과의 상호작용을 통해 보상을 최대화하도록 학습Q-Learning, Deep Q-Network (DQN), 정책경사(Policy Gradient)자율주행, 게임 AI, 로보틱스
mindmap
  root((머신러닝 알고리즘))
    지도학습
      분류(Classification)
        - 스팸메일 필터링
        - 질병 진단
      회귀(Regression)
        - 주택 가격 예측
        - 매출 예측
    비지도학습
      클러스터링
        - 고객 세분화
        - 추천 시스템
      차원축소
        - PCA
        - 시각화
    강화학습
      게임 AI
      자율주행
      로보틱스

면접용 답변.

👉 지도학습, 비지도학습, 강화학습으로 나뉩니다.
지도학습은 라벨이 있는 데이터로 학습하고, 비지도학습은 라벨이 없는 데이터에서 패턴을 찾습니다.
강화학습은 보상을 최대화하기 위해 환경과 상호작용하며 학습합니다.

'지도 학습'이란 무엇이며, 언제 사용되는가??


정의.

  • 지도학습(Supervised Learning)은 입력 데이터와 정답(라벨)이 함께 주어지는 데이터를 사용하여, 입력 → 출력 매핑을 학습하는 방법입니다.

  • 즉, 모델이 주어진 정답을 기반으로 오차를 줄여가며 학습하는 방식입니다.

언제 사용되는가?

  • 입력과 출력 관계가 명확한 경우

  • 충분한 라벨링된 데이터셋이 존재할 때

예시.

  • 이메일이 스팸인지 여부 분류 (분류 문제)

  • 주택 가격 예측 (회귀 문제)

면접용 답변.

👉 입력과 정답(라벨)이 주어진 데이터를 사용하여 입력 → 출력 관계를 학습하는 방법입니다.
분류(Classification)와 회귀(Regression)에 활용되며, 예를 들어 스팸메일 필터링이나 가격 예측에 사용됩니다.

'비지도 학습'이란 무엇이며, 언제 사용되는가??


정의.

  • 비지도학습(Unsupervised Learning)은 정답(라벨)이 없는 데이터에서
    숨겨진 패턴, 구조, 관계를 발견하는 방법입니다.

  • 즉, 데이터 내부의 유사성을 기반으로 클러스터링하거나, 차원을 줄여 데이터 구조를 단순화합니다.

언제 사용되는가?

  • 라벨링된 데이터가 부족하거나 없는 경우

  • 데이터의 내재된 구조를 파악해야 하는 경우

예시.

  • 고객 군집화(마케팅)

  • 이상치 탐지(보안/사기 탐지)

  • 추천 시스템의 사용자 패턴 분석

면접용 답변.

👉 라벨이 없는 데이터에서 패턴이나 구조를 찾는 학습 방식입니다.
클러스터링이나 차원 축소에 사용되며, 고객 세분화나 이상치 탐지에 효과적입니다.

0개의 댓글