linear_ (김선형)

선형의 비선형적 기록 🐜

태그 목록

전체보기(142)
web(40)
Backend(29)
Java(27)
Database(24)
frontend(16)
Springboot(15)
vue.js(15)
python(13)
JavaScript(11)
sql(10)
DL(9)
cloud(8)
html(8)
ML(7)
NLP(7)
docker(6)
CSS(6)
OOP(5)
da(5)
cli(4)
OS(2)
LLM(2)
SE(2)
git(1)
node.js(1)
Linear Algebra(1)
linux(1)
API(1)

[NLP] Seq2Seq

Encoder-Decoder Model의 등장 배경 Machine Translation, QA, Speech Recognition, Image Captioning 같은 문제에서는 입력과 출력 길이가 다를 수 있다. 일반 RNN은 이러한 입력과 출력의 길이가 서로 다르거

DL NLP

2025년 9월 20일

0개의 댓글

[NLP] GRU와 LSTM

Sigmoid와 요소 단위 곱을 게이트로 사용하여 얼마나 많은 정보가 통과할지 제어한다.$$f=\\sigma\\left(\\mathbf{w}{hh}h{t-1}+\\mathbf{w}\_{xh}x_t\\right)$$Reset Gate $r_t$와 Update Gate $

DL NLP

2025년 9월 20일

0개의 댓글

[NLP] RNN

문장의 단어를 순차적으로 처리한다. 글을 읽고 맥락을 파악하는 행위는 한 단어, 한 단어 순차적으로 보고 이해하는 것과 같다. 앞선 단어의 기록을 hidden state를 통해 기억하고 있고, 이를 현재의 예측에 활용한다. long-term dependency를 개선하

DL NLP

2025년 9월 20일

0개의 댓글

[NLP] Language Model

LM은 가장 자연스러운 단어 시퀀스를 찾아내는 모델이다. 퇴근 후 공항에 택시를 타고 갔는데, 답승 시간에 늦어서 결국 비행기를 () 앞에 순차적으로 나열된 단어들을 살펴보았을 대 ()에 들어갈 만한 그럴듯한 (likeliness) 단어는? 앞의 단어들의 hist

DL NLP

2025년 9월 20일

0개의 댓글

[NLP] Tokenization과 Embedding

Tokenization Token은 특정 문서에서 연속된 문자들을 의미 있는 인스턴스다. Tokenization은 언어 입력을 토큰과 같은 작은 단위로 나누는 과정이다. Tokenization Level 단어 수준 일반적으로 공백, 구두점을 기준으로 분리하며, 각 단어

DL NLP

2025년 9월 20일

0개의 댓글

[DL] Gradient Descent

Gradient Descent Gradient를 계산하고, Gradient가 가능한 한 작아질 때까지 parameter $\theta$를 반복적으로 조정한다. Chain Rule로 Gradient를 계산하고 기울기의 반대 방향으로 small step 이동하여 param

2025년 9월 20일

0개의 댓글

[DL] Optimizer Function

Optimizer NN이 Loss로부터 어떻게 학습할지 알려준다. Loss Landscape을 직접 알지는 못한다. Argument Learning rate: Optimizer의 step size Momentum: 이전 몇 단계의 개선 방향을 반영해 조금 더 큰 st

2025년 9월 19일

0개의 댓글

[DL] Activation Function과 Loss Function

Activation Function 각 층에서 비선형 변환(non-linear transformation)을 적용하고, 뉴런이 활성화될지 여부를 결정합니다. 활성화 함수가 없으면 신경망은 단순히 선형 회귀(linear regression) 모델을 쌓아놓은 것과 같습

2025년 9월 19일

0개의 댓글

[DL] Neural Network

Neural Network와 Perceptron Neural Network는 인간의 신경 세포 구조에서 영감을 받았다. Perceptron은 Neural Network의 기본 요소로, 각 퍼셉트론은 신경 세포 하나를 나타낸다. 퍼셉트론은 벡터를 입력받아 Weighted

2025년 9월 19일

0개의 댓글

[ML] Regularization

모델이 과도하게 복잡해져 일반화 성능이 떨어지는 문제를 완화하기 위하여 모델의 파라미터나 구조에 인위적을오 패널티를 부과하는 기법이다. Overfitting을 방지하고, 모델 복잡도를 제어한다. LASSO (Least Absolute Shrinkage and Sele

2025년 9월 19일

0개의 댓글

[ML] Linear Regression

Linear Regression Feature와 연속형 결과값 사이의 관계를 설명하는 선형 방정식을 찾는 알고리즘 Input Feature Vector $\mathbf{x}=\left(x1,x2,\dots,x_n\right)$에 대응되는 결과값 $y$가 있을 때, $y

2025년 9월 19일

0개의 댓글

[ML] Logistic Regression

Logistic Function (=Sigmoid Function) 입력된 값에 0과 1 사이 값을 할당한다. $$ y(z)=\frac{1}{1+\exp(-z)} $$ Logistic Regression Feature 변환 Logistic Regression에서 Lo

2025년 9월 19일

0개의 댓글

[ML] Decision Tree

개요 Decision Tree Classifier는 트리 모양의 순차형 다이어그램을 통해 주어진 데이터를 분류한다. 데이터를 기반으로 조건을 자동 생성 및 판단하고, 이를 통해 최종 결과에 이른다. 대표적인 트리 생성 알고리즘에는 CART가 있다. 트리 분할 기본적으

2025년 9월 19일

0개의 댓글

[ML] SVM

개요 SVM (Support Vector Machine)은 클래스 별 데이터를 가장 잘 구분하는 최적의 Hyperplane을 찾는 알고리즘이다. 최적의 하이퍼플레인은 하이퍼플레인에 의해 양분된 두 공간 내에 있는 가장 가까운 데이터 포인트 간의 거리 (Margin)이

2025년 9월 19일

0개의 댓글

[ML] Naïve Bayes

개요 Naïve Bayes는 $n$개의 특성을 지닌 샘플 데이터 $\mathbf{x}$가 주어졌을 때, 이 샘플 데이터가 $K$개의 클래스 $y1, y2, \dots y_k$ 중 하나에 속할 확률을 결정한다. 즉, 각 클래스에 대해 $$ P\left(yk|\mathbf

2025년 9월 19일

0개의 댓글