# ML

1278개의 포스트
post-thumbnail

머신러닝(Machine Learning, ML)

머신러닝이란? 과거 특정 분야의 인공지능을 개발하기 위해 해당 분야의 전문가들이 만든 수 많은 샘플들을 데이터화시켜 기계에게 수작업으로 학습시키는 방식을 사용했다. 인간의 손을 거쳐 학습시키는 작업은 당시 기술력을 본다면 반강제적으로 사용 할 수 밖에 없던 방법이였으

약 21시간 전
·
0개의 댓글
·

[LeetCode] Machine Learning - Why?

앞의 챕터에서는 머신러닝 알고리즘이 무엇인지 알아보고, 프로젝트에 ML을 적용하는 방법에 대해 알아보았다.이제 이번 챕터에서는 왜 머신러닝 알고리즘이 필요한지에 대해 생각해보자.우선 우리 삶의 여러 측면에서 머신러닝 알고리즘이 필요하다는 점은 인정할 필요가 있다.우리가

2일 전
·
0개의 댓글
·
post-thumbnail

Aischool mini project

https://dacon.io/competitions/official/236075/codeshare/7765?page=1&dtype=recent동시에 진행하기위해 데이콘 전화 해지 여부 분류 AI 경진대회를 참가했다. 일단 데이터를 다운로드 하고 간단하게 살펴

3일 전
·
0개의 댓글
·
post-thumbnail

[Paper Review] do transformers really perform bad for graph representation (Graphormer)

Introduction 자연어처리, 컴퓨터비전 등 많은 분야에서 이미 Transformer의 활용성이 검증된 반면, 그래프 데이터에 대해서는 그 활용성이 확실히 검증되지 않았습니다. Transformer를 그래프 데이터에 잘 활용하려면 sequence modeling을

3일 전
·
0개의 댓글
·
post-thumbnail

[ML] 지도학습 - K-NN (K-최근접 이웃)

📍 K-NN (K-Nearest Neighbor) 거리기반의 분류 알고리즘으로, 주변의 가장 가까운 k개의 데이터를 보고 데이터가 속할 그룹을 판단하는 알고리즘이다. ✔ 비지도 학습의 Clustering 역시 거리기반의 분류 알고리즘인데? k-nn은 clusterin

3일 전
·
0개의 댓글
·
post-thumbnail

[ML] 나이브 베이즈

📌 나이브 베이즈란? > 테니스를 좋아하는 사람이 있다. 만약 이 사람이 날씨가 좋고 습도가 낮은 날에 테니스를 칠 확률은 얼마일까? 과거 데이터에 따라 학습을 시킨 모델을 기반으로 어떤 날씨가 주어졌을 때 이 사람이 테니스를 칠지 안 할지 판단하는 것이다. 조건부 확률과 베이즈 정리 기반의 지도학습 분류 모델이다. 나이브(Naive)는 순진,단순하다는...

3일 전
·
0개의 댓글
·
post-thumbnail

One-shot / Few-shot / Zero-shot Learning

딥러닝 모델에서 One-shot learning과 Few-shot learning은 모델을 학습하는 데 사용되는 데이터의 양을 나타내는 용어입니다. 이 용어들은 특히 이미지 인식, 자연어 처리, 게임 등의 분야에서 사용됩니다.하나의 샘플 이미지만으로 새로운 클래스를 인

3일 전
·
1개의 댓글
·

특성공학과 규제(regulation)

혼자 공부하는 머신러닝+딥러닝 정리

4일 전
·
0개의 댓글
·

Machine Learning (ML) - 2. Terms and Library

In machine learning, a model is a mathematical representation of a system that makes predictions or decision.It can be described of as a set of rules

5일 전
·
0개의 댓글
·

[클론DL] 밑바닥2 word2vec

추론 기반 기법 : 추론 과정에 신경망을 이용, word2vec 등장, 처리효율을 희생하는 대신 이해하기 쉽도록 구성한 단순한 word2vec 구현해보기단어를 벡터로 표현하는 방법: 통계 기반, 추론 기반(분포 가설을 배경으로 함)통계기반 기법에서는 주변 단어의 빈도를

5일 전
·
0개의 댓글
·

선형 회귀(Linear Regression)

혼자 공부하는 머신러닝+딥러닝 정리

5일 전
·
0개의 댓글
·
post-thumbnail

[이어드림 스쿨 2기] 첫 고비를 맞이하다

# 그룹 스터디 시작! (4.19) 테스트를 통해 배정된 그룹 스터디 조가 처음 편성되었다. ZEP에서 첫 모임을 가지고 자기소개를 하고 그룹 스터디 방향과 의견을 이야기하는 자리였다. 어색한 기류가 있었지만 다들 똑같겠지 하는 마음으로 이야기했던 것 같다. 그러나

5일 전
·
2개의 댓글
·

Machine Learning (ML) - 1. Concept and Definition

Arthru Samuel (1959): ML means that it gives computers the ability to learn without being explicitly programmed.\*\*Tom Mitchell (1988): There are 3 c

6일 전
·
0개의 댓글
·
post-thumbnail

[ML] 지도학습 - 나이브베이즈

📍 나이브베이즈 나이브베이즈 분류 알고리즘은 데이터를 단순(나이브)하게 독립적인 사건으로 가정하고, 이 독립 사건들을 베이즈 이론에 대입시켜 가장 높은 확률의 레이블로 분류를 실행하는 알고리즘이다. 나이브베이즈는 feature끼리 서로 독립이라는 조건이 필요하다. 예

6일 전
·
0개의 댓글
·
post-thumbnail

[교차검증] 홀드아웃, K-Fold, Stratified K-Fold, cross_val_score()

교차 검증(Cross Validation)은 별도의 여러 세트로 구성된 학습 데이터와 검증 데이터 세트에서 학습과 평가를 수행하는 것입니다.교차검증을 통해 각 세트에서 수행한 평가 결과에 따라, 이후 하이퍼 파라미터 튜닝 등의 모델 최적화를 더욱 쉽게 할 수 있습니다.

6일 전
·
0개의 댓글
·
post-thumbnail

[데이터 전처리] 데이터 스케일링(StandardScaler, MinMaxScaler, RobustScaler)

실습 데이터: 캐글 타이타닉 데이터 데이터 스케일링(Data Scaling)이란 서로 다른 변수의 값 범위를 일정한 수준으로 맞추는 작업을 의미합니다. 값을 조정하는 과정이기 때문에 수치형 변수에만 적용해야 합니다.사이킷런에서는 스케일링을 수행하기 위한 다양한 스케일러

2023년 3월 18일
·
0개의 댓글
·

AI SCHOOL ML

배운 ML모델의 파라미터를 알아보자 DecisionTreeClassifier의 모든 파라미터 criterion: 분할의 품질을 측정하는 함수로, 지니 불순도(gini impurity), 엔트로피(entropy), 로그 손실(log loss) 등을 선택할 수 있습니다

2023년 3월 16일
·
0개의 댓글
·
post-thumbnail

[데이터 전처리] 데이터 인코딩(Label encoding, One-Hot encoding)

이 글은 기본적으로 머신러닝 이론/실습 책인 《파이썬 머신러닝 완벽 가이드》의 내용을 바탕으로 작성되었으며, 이외에도 다양한 자료를 참고하였습니다.실습 데이터: 캐글 타이타닉 데이터사이킷런의 머신러닝 모델은 일반적으로 문자열 값을 인식하지 못합니다. 따라서 모든 문자열

2023년 3월 16일
·
0개의 댓글
·

K-최근접 알고리즘(K-NN, K-Nearest Neighbot Algorithm)

혼자 공부하는 머신러닝+딥러닝 정리

2023년 3월 16일
·
0개의 댓글
·