머신러닝 기초 설명

CHOI CHOI·2024년 6월 27일
0

파이썬 중급

목록 보기
23/30

머신러닝의 정의

머신러닝은 데이터를 기반으로 패턴을 자동으로 학습하고, 입력 데이터와 출력 데이터 사이의 관계를 모델링 하는 인공지능의 한 분야이다

  • 언제 사용할까
    머신러닝은 복잡한 문제를 해결하거나 대규모 데이터에서 유의미한 정보를 추출할때 사용된다. 특히 전통적인 머신러닝 기법은 정형 데이터를 처리하는데 적합하다.

머신러닝의 종류

지도학습

정답(Label)을 가진 훈련 데이터를 사용하여 모델을 학습시키는 과정을 말한다
이 방식에서 모델은 훈련 데이터셋에서 패턴을 학습한 후, 새로운 데이터에 대해 정답을 예측하거나 분류한다. 예를들어, 고객 이메일이 스팸인지 아닌지 분류하거나, 집값을 예측하는 것이 이에 해당

지도학습 특징

  • 레이블된 데이터 필요 : 지도학습은 정답에 의존한다
    정답은 모델이 올바른 패턴을 학습하는데 필요
  • 명확한 목표 존재 : 분류는 정답이 카테고리 형태일 때 적용되며, 회귀는 정답이 연속적인 값일 때 사용된다
  • 결과 평가의 용이성 : 정답이 명확하기 때문에, 모델의 성능을 측정하고 평가하기 용이하다

비지도학습

정답이 없는 데이터를 사용하여 데이터 내의 패턴 구조, 또는 관계를 찾는 과정이다
이 방식에서는 정답이 주어지지 않으므로, 모델은 데이터의 숨겨진 특징이나 구조를 스스로 탐색한다. 예를들어 이상치 탐지, 차원축소, 군집화가 이에 해당.

비지도학습의 특징

  • 레이블이 없는 데이터 : 비지도 학습은 명시적인 정답이 없는 데이터만을 사용
  • 데이터 탐색 및 발견 중점 : 모델은 데이터의 숨겨진 패턴이나 구조를 탐색하여 새로운 통찰력을 제공한다
  • 평가의 복잡성 : 명확한 정답이 없기 때문에 모델의 성능을 평가하기가 더 복잡하고 주관적이다

강화학습

에이전트가 환경과 상호작용하며 보상을 최대화 하는 방향으로 학습하는 과정
여기서는 모델이 시행착오를 통해 최적의 행동 전략을 학습
예를 들어, 게임에서 최고 점수를 달성하거나, 자율주행 자동차를 개발하는 것이 여기에 속함

강화학습의 특징

  • 보상 기반 학습 : 강화학습은 주어진 환경에 대한 보상 또는 패널티를 통해 학습
  • 시행작오와 탐험 : 에이전트는 시행착오를 겪으며 최적의 행동을 탐색한다
  • 동적 환경 적응 : 에이전트는 변화하는 환경에 적응하며 학습할 수 있다.

인공지능의 정의

기계가 인간처럼 사고하고 학습할 수 있도록 하는 기술 분야
AI는 데이터 분석, 문제 해결, 패턴 인식 등 다양한 지능적 확동을 수행하는 알고리즘과 기술을 포함
이러한 지능적 프로세스는 자동화된 의사결정, 자연어처리, 로봇공학 등의 분야에서 적용된다
AI의 목표는 인간의 지능적 행동을 컴퓨터 프로그램을 통해 재현하는것

인공지능과 머신러닝의 차이점

인공지능은 광범위한 분야로, 기계가 지능적 행동을 모방하는 모든 기술을 포함한다. 반면, 머신러닝을 인공지능의 하위 분야로서, 머신러닝은 이러한 지능적 행동을 실현하기 위한 방법 중 하나로, 머신러닝은 인공지능의 하위 분야로서 데이터를 기반으로 패턴을 학습하고 예측이나 결정을 하는 기술에 중점을 둔다.

머신러닝은 인공지능이 목표로 하는 지능적인 행동을 실현하기 위한 방법으로 기계가 경험 혹은 데이터를 통해 학습하고 개선할 수 있게 만든다.
인공지능은 목표를, 머신러닝을 그 목표를 달성하기 위한 수단을 나타냄

인공지능 사용의 이점

데이터의 심층적인 분석 및 이해를 가능하게 하여 복잡한 문제를 해결하는데 이점을 제공한다
예측분석, 효율적인 지원 관리, 자동화된 의사결정을 통해 비즈니스 프로세스를 최적화 하고, 사용자의 경험을 개선한다
AI는 빅데이터를 처리하고 숨겨진 패턴을 발견하며, 의사결정을 보다 정확하고 빠르게 할 수 있게 도와준다.

머신러닝 워크플로우

머신러닝 워크플로우의 주요 단계

  • 데이터 수집 : 필요한 데이터를 수집하거나 생성
  • 탐색적 데이터 분석 : 데이터의 특성과 패턴을 파악
  • 데이터 전처리 : 데이터를 탐색적 데이터 분석을 통해 얻은 인사이트를 반영하거나 모델링에 적합한 형태로 변형
  • 피처 엔지니어링 : 데이터에서 유용한 피처를 선택 및 생성
  • 모델링 : 적합한 머신러닝 알고리즘을 선택해 모델 구축
  • 성능평가 : 모델 성능 검증
  • 고도화 : 모델 성능 향상

워크플로우의 번복과 유연성
머신러닝 워크플로우의 특징 중 하나는 그 과정이 선형적이기보다는 반복적이라는 점이다!
각 단계는 독립적이지 않으며, 프로젝트의 진행 상황에 따라 여러 번 반복되거나 이전 단계로 되돌아갈 수 있다.

  • 반복적인 프로세스 : 배포된 모델의 성능이 기대에 미치지 못한다면, 데이터 수집, 전처리, 피처 엔지니어링 등의 초기 단계로 돌아가 개선할 수 있다.
    또한 새로운 데이터가 추가될 때 마다 EDA와 데이터 전처리 단계를 다시 거치게 된다.
  • 유연한 대응 : 비즈니스 요구사항이 변경될 경우, 모델링 단계에서 다른 알고리즘을 적용하거나 기존 알고리즘을 수정 할 수 있다.
profile
뭐가 됐든 데이터분석가

0개의 댓글