MLOPS 11/20 필기

YoonA Kim·2024년 11월 20일

AI Class

목록 보기
2/4

퀴즈

  • domain: www.github.com
  • host: www.github.com
  • port: http
  • path: /dlddu/seoul-line-mlops
  1. IP(Internet Protocol) 주소는 네트워크 상에서 장치를 식별하기 위해 사용되는 고유한 주소이다. DNS(Domain Name System) 는 인간이 이해하기 쉬운 도메인 이름(예: www.google.com)을 IP 주소(예: 93.184.216.34)로 변환하는 시스템입니다.

  2. GET, POST, PUT, PATCH, DELETE

  3. json, form data, binary...

DEVCONTAINER 만들어보기

  1. 새로 만들기 vs 만든거 열기

베이스: 정말 기본이 되는 1개의 조건 :
언어(pyton 등) - 한 언어만 돌리는 경우
운영체제(ubuntu등) - 언어 외에도 다양한 걸 하고 싶을 때
피처: 베이스 위에다 깔고 싶은거.. git lfs, python, 등 툴/서비스 등등
postCreateCommand : 위의 셋팅 아래에서 최초로 깔아야하는 것들
customizations : 각종 플러그인들을 설정해준다.
vscode의 플러그인 개별 설명페이지에서 바로 해당 플로그인을 .devcontainer.json에 추가할래? 라고 물어보며 추가가 된다! > 단 이경우 이미 컨테이너가 켜져있으면 리빌드를 해야한다.

과제설명!!

이 과제를 다해내면 간단한 MLOPS를 혼자서 다 해본것!!

XG부스트

ML모델 데이터 중 하나!

코드 공부

돌리는 값과
테스트해보는 값 구분!

소개

통계 머신러닝의 가장 유용한친구다

  1. 의사결정나무
    와인의 다양한 팩터들 중, 높은 점수의 와인들의 공통점들을 찾아서 의사결정나무가 갈라지는 조건을 자체적으로 만들어낸다.

최소한의 판단기준!

  1. 앙상블 기법
    앙상블 기법의 정의는 어떤 것이든지 여러개를 쓰는 것

가장 직관적인 대표적인 앙상블기법: 배깅 = 랜덤 포레스트

의사결정 나무를 여러개 만들어서 각자 값을 내서 그 중에 다수결로..
week leaner, 즉 얕은 트리를 여러개로 다수결을 내면 값은 좋아진다!!

병렬식!

  1. 앙상블 중에 보깅 : gradient boosting
    얕은 의사결정나무를 연달아서 태워서 값을 만든다
    앙상블과다른 것은 시퀀스로 움직인다는 것!
    앞의 의사결정나무가 나온 값을 뒤의 나무가 활용한다

앞의 결과를 미분적으로, 다음 에러를 줄이기 위해 학습ㅇ

로스 = ground truth와 얼마나 다른지, 틀렷는지 개량화한 것
앞의 의사결정 나무의 값의 로스를 측정하고
앞으로 일어날 에러를 예측한다
이 에러발생예측을 다음 의사결정나무에게 "넌 이러면 안대"라고 학습시키고 돌려서
그래서 나온 값의 로스를 측정하고...
에러를 예측하고 다음 의사결정나무에게 이를 학습시키고...

<> 정답지 : ground truth

에러를 줄이는 방법 중 하나로 gradient boosting

  1. xgboost
    gradient boosting을 병렬로 해서 빠르게 해준다!

그 중 gradient boosting은?

feathre importance

커버 : 의사결정나무에서 이 팩터가 사용된 횟수

게인 : ///

웨이트 : ///

xgboost가 좋은 이유는 이 feathre importance가 나오기 떄문!

profile
코딩 배우는 중

0개의 댓글