과기부 AI 수업18 인공지능[머신러닝]

욱이·2024년 5월 20일
0

과기부 AI 수업 정리

목록 보기
18/20
post-thumbnail

인공지능?

인간의 지적능력을 인공적으로 구현한 것이다.

인공지능-> 머신러닝 -> 딥러닝

머신러닝(Machine Learning)?

  • 기계가 경험을 통해 정답을 찾기위한 컴퓨터 알고리즘
  • 경험을 통한다는것은 학습을 뜻한다.

1. 머신(Machine) : 사람들이 제공한 데이터에 있는 패턴이나 연결성을 수치화 해 나타내는 구조(= 함수)

2. 학습(Learning) : 주어진 데이터를 가장 잘 설명하고 예측할 수 있는 최적의 모델을 탐색하는 과정(= 모델의 파라미터 최적화)

머신의 학습 방법 : 통꼐적인 접근법이나 경사하강법을 활용하여 가장 적합한 파라미터를 결정한다.

- 경사하강법 : 머신러닝 모델의 가중치(weight) 매개변수를 최적화하는 가장 일반적인 기법 중 하나입니다. 이는 모델의 오차 함수 또는 비용 함수를 최소화하는 가중치 값을 찾는 반복적인 과정입니다.

  • 개념
    오차 함수는 현재 모델의 예측값과 실제값 사이의 차이를 나타내며, 이를 최소화해야 합니다.
    경사하강법은 오차 함수의 기울기(gradient)를 계산하여 가중치를 업데이트 합니다.
    기울기는 오차 함수를 가중치에 대해 편미분한 값입니다.
  • 단계
    모델의 초기 가중치를 임의로 설정
    학습 데이터 셋에 대해 모델을 실행하고 오차 함수 계산
    오차 함수를 가중치에 대해 편미분하여 기울기 계산
    기울기에 학습률(learning rate)을 곱하여 가중치 업데이트
    2~4 단계를 오차 함수가 수렴할 때까지 반복
  • 핵심 요소
    학습률: 가중치를 업데이트하는 정도를 결정하는 스칼라 값
    수렴 조건: 오차 함수가 더 이상 줄어들지 않거나 최소 횟수 반복하면 멈춤

- 경사하강법의 변종

확률적 경사하강법: 전체 데이터가 아닌 일부 배치로부터 기울기를 추정
모멘텀: 이전 업데이트 방향으로의 가속 추가
역전파(Backpropagation): 심층 신경망의 가중치 최적화
경사하강법은 간단하면서도 강력한 최적화 방법으로, 머신러닝 모델 학습의 중추적인 알고리즘입니다.

머신러닝 프로세스

MLOps(반복)

데이터수집(정형, 비정형) -> 데이터 전처리(결측치 이상치 데이터를 제거후 최적의 값을 뽑아낸다) -> 모델학습 -> 모델평가(평가시 성능이 낮으면 회귀해서 변경) -> 모델배포

머신러닝 분류

머신러닝

- 지도학습 : 데이터와 정답을 주고 학습

-회귀분석
-분류

- 비지도학습 : 데이터만 주고 정답을 주지 않고 머신러닝이 학습하도록 함.

-군집화(비슷한것 끼리 묶어짐)
-차원축소

- 강화학습 : 훈련사가 훈련을 시키는 것 같은 개념

  • 강아지 훈련시 행동에 대한 보상을 주고 더 좋은 방향으로 이끌어주는 학습방식

데이터셋

  • 많은 이미지를 가지고 학습을 시킬때 크게 3종류로 분류해서 시킨다.
  • 훈련데이터(Training Data set) : 100% 가 아닌 70~80% 정도만 뽑아서 머신러닝으로 학습을 시킨다.
  • 테스트 데이터 셋 : 남은 데이터로 정확도를 체크한다.
    ※ 주의사항 : 훈련데이터를 테스트로 사용하지 않는다.
  • 검증 데이터 셋 : 필수는 아니지만 최종적으로 만들어진 모델을 마지막으로 검증하는 데이터 셋
profile
개발자 기록 끄적

0개의 댓글