머신러닝 개요 개념 종류 과정 기본 용어 AL vs ML vs DL 인공지능: 컴퓨터가 인간의 지적 능력 갖게 하는 것! 머신
머신러닝의 7과정을 이해하자!머신러닝의 학습과정을 이해하고 결과를 확인해보자!온습도 데이터를 분석하여 결과를 예측하자!온습도 데이터를 활용하여 환기 여부를 파악Role: 서비스 기획자가정 내 온습도 데이터를 측정하는 기기를 고객에게 제공AI 제습기 개발하고자 함 (머신

일반화, 과대/과소적합에 대한 내용을 정리한 페이지입니다.모델의 신뢰도를 측정하고, 성능을 확인하기 위한 개념일반화과대적합과소적합하나의 관측치에만 과하게 학습하여 다른 데이터가 들어왔을 때 부정확한 값을 내뱉는 것train GOOD / test(new data) BAD

K-NN 알고리즘에 대한 내용을 정리한 페이지입니다.like 유유상종 ~새로운 데이터 포인트와 가장 가까운 훈련 데이터셋의 데이터 포인트를 찾아 예측k 값에 따라 가까운 이웃의 수가 결정분류/회귀 모두 사용 가능위 그림에서 k=3 일 때 새로운 데이터(초록원)은 별(빨

의사결정 나무에 대한 개념과 코드에 대해 정리한 페이지입니다.스무고개 하듯이 예/아니오 질문을 반복하며 학습특정 기준(질문)에 따라 데이터를 구분하는 모델분류/회귀 모두 사용 가능 불순도 줄여나가는 / 순도 높여나가는 방향으로 학습!지니 불순도해당 범주 안에 서로 다
타이타닉 데이터를 학습하여 생존, 사망을 예측하는 모델을 만들어보자머신러닝 과정 중 전처리 단계에 집중!타이타닉 데이터를 학습하여 생존자, 사망자 예측정확한 전처리 방법을 학습타이타닉 데이터https://www.kaggle.com/competitions/tit
데이터 전처리 중 인코딩에 정리한 페이지입니다.One-Hot EncodingLabel EncodingEncoding: 범주형 데이터를 숫자형 데이터로 변환예) Label Encoding, One-hot EncodingBinning: 숫자형 데이터를 범주형 데이터로 변환
데이터 스케일링에 대한 페이지입니다.데이터 성능을 올리기 위해서는하이퍼 파라미터 조절 (but 드라마틱한 변화는 없음)학습 데이터 추가데이터 전처리!!! ← 중요그 중 하나가 스케일링!데이터 특성(feature)들의 값 범위를 일정한 수준으로 맞춰주는 작업즉, 분산 정
모델 일반화 성능을 평가하는 “교차검증”에 대한 페이지입니다.학습-평가 데이터를 골고루 설정하여 모델의 안정성을 높이고 과대적합을 감소시키는 통계적 기법즉, 모델의 안정성을 확인하기 위한 과정train 데이터 내에서 다시 학습용(train)과 검증용(validation
선형회귀에 대한 페이지입니다. 선형 모델 (Linear Model) 개념 회귀 분석은 예측값이 평균과 같이 일정한 값으로 돌아가려는 경향을 이용한 통계학 기법 이용 즉, 데이터를 가장 잘 나타내는(즉, 대표하는) 직선을 찾는것! 그리고 그 직선에 값
Linear 모델을 활용하여 집값을 예측해보자!Linear 모델을 활용하여 집값을 예측해보자!결측치 확인상관관계 확인결측치 채우기모델링 진행을 위하여 집 값에 영향을 많이 미치는 컬럼을 선택하여 학습수업 시간 제한으로 강사님이 임의로 컬럼 선정하심나중에 시간 될 때 다
회귀모델 평가지표에 대한 페이지입니다. MSE RMSE MAE R2score 회귀 모델의 평가 지표 오차 기반의 평가 지표를 활용 오차가 크니? 작니? 에 따라서 모델의 성능을 평가 MSE Reference: https://medium.com/@mahes
경사하강법 알고리즘을 활용하는 선형회귀 모델인 SGDRegresoor 모델에 대한 페이지입니다.Stochastic Gradient Descent, 확률적 경사하강법scikitlearn 에서 제공하는 경사하강법을 활용한 선형회귀모델경사하강 알고리즘을 활용하여 w, b 값
선형 모델 중 분류 모델에 대한 페이지입니다.개념종류원리사용법평가지표특성들의 가중치 합이 0보다 크면 class 를 +1(양성클래스)로, 0보다 작다면 클래스를 -1(음성클래스)로 분류분류용 선형모델은 결정 경계가 입력의 선형함수선형 회귀 모델 기반인데, 시그모이드 함
선형 분류 모델의 학습 방법에 대해서 알 수 있다가설 설정을 진행하여 직원의 이직 여부를 예측할 수 있다분류평가지표에 대해서 알 수 있다Role: HR 팀장직원 이직 데이터를 분석하여 직원의 이직여부를 예측이직과 연관있는 사람들의 특징을 파악하여 직원 관리 프로그램 개
선형모델의 하이퍼 파라미터 중 “C” (규제강도)에 관한 페이지입니다.C = 자유도모델의 w 가중치 업데이트 시, 자유도를 조절자유도: w 를 부여할 수 있는 범위 정도.자유도가 크다 -> w 가 가질 수 있는 범위가 넓음자유도가 작다 -> w 가 가질 수 있는 범위가
군집(clustering) 에 대해 이해할 수 있다.K-means, 계층적 군집, DBSCAN 을 이해하고 사용할 수 있다.비슷한 데이터끼리 하나의 클러스터로 묶고, 다른 데이터끼리는 다른 클러스터로 분류일반적으로 사용되는 알고리즘알고리즘이 쉽고 간결함거리 기반 알고리

iris(붓꽃) 데이터를 이용하여 군집화 모델을 만들어보자!학습용 그래프 라이브러리 ‘mglearn’‘sklearn’ 에 있는 iris data아예 정답이 없으면 배울 때 답답해 해서 그냥 정답 있는 데이터 가져온거래요~데이터번치객체 (묶음, 다발) = sklearn
📢 딥러닝 기본개념에 대한 페이지입니다.인간의 신경망 모방 → 병렬적 다층 구조 통해 → 학습/예측 (Like 사람)ML 이랑 비슷한데 사용하는 알고리즘이 다름ML 은 찌그러진 자동차를 자동차가 아니라고 출력하지만, DL 은 사람처럼 생각하니까 자동차라고 출력함!ML

머신러닝 모델과 딥러닝 모델링을 통하여 비교동일한 데이터를 가지고 머신러닝, 딥러닝 모델링 차이점 확인공부시간에 따른 학생의 수학 성적을 예측하는 회귀모델 구성딥러닝이란?인간의 신경망을 모방해서 병렬적 다층구조를 통해 학습하고 예측대량의 데이터에서 복잡한 패턴이나 규칙
📢 퍼셉트론, 다층 퍼셉트론 개념에 대한 페이지입니다.퍼셉트론 = 선형모델 + 활성화 함수인공신경망 구성요소 중 하나딥러닝 모델의 가장 작은 기본단위뇌를 구성하는 신경세포인 뉴런의 동작과 유사하게 동작동그라미 하나! = node 하나!신경의 흥분이 전달되기 위해서는
유방암 환자 데이터를 통하여 유방암 여부를 분류딥러닝을 활용하여 이진분류 딥러닝 모델 설계 및 학습sklearn.datasets 에서 제공하는 breast_cancer (유방암) 데이터 활용목차라이브러리 불러오기데이터 불러오기 및 분리sklearn data 셋 이름 =

📢 활성화 함수의 종류와 각 layer 에서의 활성화 함수 역할에 대한 페이지입니다.Reference: https://www.researchgate.net/figure/a-Step-function-and-b-sigmoid-function_fig3_257219
📢 학습목표손글씨 데이터를 분류하는 딥러닝 모델링을 진행해보자다중분류 딥러닝 모델링을 설계하자이미지 데이터 기본 정보에 대해서 확인하자라이브러리 불러오기데이터 불러오기keras 에 있는 손글씨 데이터셋 이용데이터 확인 image.png28\*28 가로 28 픽셀,
📢 이미지 데이터(픽셀, Flatten)에 대한 내용과 batch, epoch, iter 에 대한 개념을 설명합니다.16 \* 1616 \* 16이미지를 구성하는 최소 단위네모 하나 = 픽셀 하나!픽셀이 작을수록 정교하게 작업이미지 데이터는 numpy array 형태

📢 경사하강법과 최적화함수(Optimizer)의 종류에 대한 페이지입니다.비용함수(loss function)가 최저가 되는 지점 찾기= 기울기가 가장 작은 부분 찾기전체 데이터를 이용해 업데이트장점: 안정적으로 최적해 찾아갈 수 있음단점: 연산량이 너무 많고 메모리

📢 다양한 활성화 함수와 경사하강법 조합을 활용하여 모델의 성능을 비교해보자손글씨 데이터 활용어떤 조합을 사용했을 때 좋은 결과가 나오는지 판단model 1Hidden layer 의 Activation function: SigmoidOptimizer: SGDmodel
📢 callback 함수 중 checkpoint 와 early stopping 에 대한 페이지입니다.model checkpoint특정 epoch 마다 모델 저장할 수 있음이를 활용하면 좋은 경우딥러닝 모델 학습 시, 지정된 epochs 모두 진행할 경우 과대적합일 경
📢 합성곱 신경망에 대한 페이지입니다.MLP 신경망을 이미지 처리에 사용한다면 “이미지의 위치”에 민감하게 동작→ 위치에 종속적인 결과를 얻게 됨! (모든 픽셀을 연산하기 때문)이미지의 특징을 추출해서 비교하자! → 이게 CNN!인간이 이미지 인식할 때 노의 모든 부

📢 개, 고양이 이미지(사진)를 분류하는 CNN 신경망 실습을 진행해보자개, 고양이 이미지를 numpy 배열로 변환하는 작업 진행 (이미지 데이터 전처리)압축된 형식의 배열로 저장 (npz 파일)npznumpy 에서 제공하는 파일 형식여러개의 numpy array

📢 이미지 데이터 증식을 통한 CNN 모델 성능개선학습 조기 중단(early stopping)과대적합이 되기 전까지 모델 학습데이터 증강(data augmentation) - 이미지 증식원본과 유사한 데이터를 생성하여 폭넓은 학습에 도움드롭아웃(Dropout)신경망
📢 전이학습에 대한 이론 페이지입니다.자체적으로 설계한 모델은 여러 번의 학습 및 평가를 통해 검증을 반드시 진행해야 한다.신경망의 하이퍼 파라미터를 조절하여 적절한 모델을 활용해야 함 (padding, stride 값, 커널 수, 커널 크기 등)수정과 보완의 시간이
📢 이미지넷 1,000개 카테고리로 학습된 VGG16 모델을 이용하여 개, 고양기 분류 모델을 만들어 보자!데이터 불러오기모델 불러오기모델 객체 생성모델의 특성 추출부만 불러오기include_toptop = classifierclassifier 포함할지 여부로, Fl
📢 RNN 개념에 대한 페이지입니다.기본 수치데이터: MLP이미지 데이터: CNN시계열 데이터(텍스트 데이터): RNN앞 단에 따라 뒷 단어 예측!다음 단어를 쓰기 위해서는 이전 단어를 기억하고 있어야 한다! → RNN 원리문장을 듣고 무엇을 의미하는지 알아야 서비스
📢 학습목표RNN 학습 방법에 대해 알아보자시계열 데이터를 학습하여 예측하는 방법에 대해서 알아보자keras 의 SimpleRNN() 활용해보자Char -> 알파벳 한 글자 단위로 학습하기알파벳 4개의 글자가 들어가면 마지막 글자를 맞추는 모델을 만들어보자5개 단어
📢 SimpleRNN 의 기억 소실 문제를 해결하기 위한 LSTM 과 GRU 에 대한 페이지입니다.기본 RNN(SimpleRNN) 의 경우 긴 문장으로 갈 수록 앞쪽의 단어를 잃게 됨 (시간이 지나면 이전의 입력값을 잊어버리게 됨!)SimpleRNN 의 경우 순환의
📢 RNN 으로 네이버 영화 리뷰에 대한 긍부정 감성 분석을 한 페이지입니다.SimpleRNNLSTMGRUWord Embedding + LSTMWord Embedding + LSTM 2 layer(참고) 딥러닝은 차원 수 상관 없음!TextVectorization :
📢 트랜스포머에 대한 간단한 내용입니다.딥러닝 기반의 자연어 처리(NLP) 모델기존의 RNN 을 활용한 모델은 Sequential 한 속성 때문에 연산의 시간이 많이 걸린다는 단점이 있음attention 이 RNN 을 대체하는 방향으로 제시된 모델트랜스포머는 2017
📢 내용네이버 영화 리뷰 데이터 감성 분석전이학습을 통한 성능 개선 (HuggingFace 활용)Transformer 계열의 모델 사용 (KoBert, KoElectra)데이터 로드결측치 제거한글, 띄어쓰기만 남기기한글과 공백을 제외한 나머지 부분 삭제 (영어, 숫자
📢 LangChain 개념에 대한 페이지입니다.LLM(대규모 언어모델)을 활용하여 애플리케이션 개발을 돕는 라이브러리LangChain 은 여러 구성요소들을 체인처럼 연결하여 복잡한 작업을 처리LLM 을 통하여 데이터를 분석하고 질문에 대한 답을 받는 작업을 진행이미
📢 LangChain 기초 실습 및 여러 기능들에 대한 페이지입니다.프롬프트: LLM 모델에게 입력하는 명령어모델이 최대한 정확하고 유용한 정보를 제공할 수 있도록 효과적인 프롬프트 작성하는 것이 매우 중요명확성, 구체성질문은 명확하고 구체적이어야 함배경 정보 포함모
📢 LangChain 심화 사용법에 대한 페이지입니다.제로샷 프롬프팅퓨샷 프롬프팅예시 선택스트리밍AI 모델이 사전 지식 없이 새로운 답변 출력하는 방법예시 없이 단순 단변을 출력하는 방법현재까지 만든 실습은 모두 제로샷 프롬프팅모델을 오로지 프롬프트 템플릿에 포함된
📢 Goal: 이전 대화 내용을 저장하여 연결된 대화를 할 수 있는 챗봇 구현RunnableWithMessageHistoryLangChain 의 채팅 기록 모듈 (메모리)실행 시, 대화 메시지를 자동으로 포함시켜주는 기능대화의 맥락을 유지 가능import librar
📢 RAG 를 활용하여 챗봇 만들기Retrieval - Argumented Generation기존의 LLM 을 확장하여 새로 주어진 콘텐츠나 질문에 대해 더욱 정확하고 확실한 정보를 제공하는 방법즉, 모델이 학습하지 않은 외부 데이터에 대해 환각(Hallucinati

LanChain 팀이 만든 LLM 애플리케이션 관찰 및 관리 플랫폼LangSmith 는 서비스를 배포할 때 안정적인 운영을 도와줌비교LangChain: 애플리케이션 만들기 도구LangSmith: 애플리케이션 관리/운영 도구모니터링, 디버깅 등 활용LangSmith We
📢 학습 목표YOLO v6 모델에 친칠라 데이터 셋을 입력하여 학습시키고 활용할 수 있다.친칠라 이미지를 학습시켜 친칠라 영역 탐지가 잘 되는지 확인할 수 있다.imagestrain/valid/test 3개의 그룹으로 묶여 존재jpg 파일로 존재labelsboundi

📢 YOLO v8 모델을 활용하여 주먹, 가위, 보 객체 탐지 개념 YOLO 계열의 모델은 실시간 객체 탐지 작업에 용이 8 버전은 6에 비해 성능이 좋아짐 ultralytics 회사에서 제공하는 라이브러리로, 코드와 사용법이 직관적이고 문서화가 잘 되어 있음 Y
📢 학습 목표동물 객체 탐지하는 모델 만들기YOLOv11 모델 활용크기, 속도를 기반으로 Nano, Tiny, Small, Mediem, Large, XLargeNano(n)가장 작은 크기로 초경량모델빠른속도, 낮은 메모리 사용량, 상대적으로 낮은 정확도Small(s

📢 Image Segmentation 을 활용하여 차량 파손 범위를 예측하는 모델을 학습할 수 있다.Classification: 분류Object Detection: 객체 탐지, 하나의 이미지 내 여러 객체 찾기(bounding box 로 labeling)Image S
📢 YOLO v11 모델을 활용하여 인간의 포즈 감지(skeleton 관절) 모델로 예측해보자!모델 로딩업로드중..모델 학습포즈 추정은 어차피 사람에 대해서 하는거라 따로 학습 안시킬 거임!예측업로드중..