so_oni_on (Soeon Park)

베풀기 위해 더 많이 공부하고 성장하기 ᓚᘏᗢ: 공부 정리용

태그 목록

전체보기 (16)딥러닝(3)DL(3)Seq2Seq(2)NLP(2)자연어처리(2)

[논문리뷰] Probing the Geometry of Truth: Consistency and Generalization of Truth Directions in LLMs Across Logical Transformations and Question Answering Tasks

요즘 Cross Lingual Generalization에도 관심이 생겨 가볍게 읽어본 논문이었는데, 가벼운 학습만으로 효과를 입증했고 심지어 LLM 학습이 아닌 회귀 분석? 수준의 머신러닝 학습만으로 ACL Findings에 기재된 논문이라는 점에서 흥미로워 가져와봤

2026년 1월 12일

0개의 댓글

[DL기초] Softmax의 성질과 관련된 마스크 행렬의 덧셈

들어가기에 앞서, 기본적인 어텐션 연산에 대한 설명은 해당 포스트에서 하지 않겠다!대신... 공부를 하다가 간과했던 부분이 알고보니 꽤 재밌는 내용이어서 가지고 왔다! 사실 제발 아무도 안봤으면 좋겠다. 지금 당장은 글로 정리가 좀 덜된 것 같아서 부끄럽슨.. ...

2025년 10월 13일

0개의 댓글

[RL] GRPO와 PPO

오늘은 시간이 없으니 GRPO와 PPO에 대해 공부한 내용을 개념/수식적으로 간략히 정리하는 글을 작성하겠다. 우선은 기본적인 개념적 강화학습과 Markov Decision Process(MDP)에 대한 내용을 알고있다고 가정하겠다.

2025년 10월 5일

0개의 댓글

AI를 하는데 Slicing을 모른다고?;;

Slicing은 Python과 Pytorch같은 라이브러리에서 배열이나 텐서의 "특정 부분"을 선택하는 방식임.따라서, 특히 Logit 계산을 해서 정확한 input이나 loss 등의 입력을 통한 DL 학습에 필수적인 요소이다!!!헷갈리면 절대 안됨 그러면 그냥 죽음

2025년 9월 20일

0개의 댓글

Cross-Encoder vs. Bi-Encoder

기초를 잘 다집시다 🥺😅..(Dear myself..)기본적으로 어떤 내용일까?언어 모델 중 하나인 "BERT"에 사용되는 기본적인 내용으로, 언어 모델에 관심이 있고, 특히 NLU 과정에 대해 공부하고자 하는 학생이라면 꼭 알고 넘어가야되는 내용이다.

2025년 8월 23일

0개의 댓글

[RLHF] DPO(Direct Preference Optimization) 정리

RLHF(Reinforcement Learning from Human Feedback)은 인간의 피드백을 바탕으로 언어 모델을 최적화시키는 대표적인 방식이다. 이때, 학습 방식은 크게 두 가지로 나눌 수 있는데,인간 피드백 데이터를 이용해 보상 모델(Reward Mod

2025년 7월 15일

0개의 댓글

[Metrics] Perplexity

언어 모델의 예측 성능을 수치화하는 지표로, 모델이 주어진 문장을 얼마나 “잘 예측하는지”를 나타냄

2025년 7월 5일

0개의 댓글

[LoRA] 하이퍼파라미터 정리

LoRA는 대형 언어 모델(LLM)의 일부 선형 변환 레이어에 “저용량 어댑터”를 추가하여, 모델 파라미터를 거의 건드리지 않으면서 새로운 태스크로 미세 조정(fine-tuning)할 수 있는 기술입니다.장점: 전체 모델을 재학습·저장할 필요 없이, 어댑터(작은 행렬)

2025년 6월 29일

0개의 댓글

[RAG] Simple RAG

RAG는 검색 기반 증강 생성 방식이다.

2025년 6월 28일

0개의 댓글

Screen 관련 Command 정리

<session_name> 으로 새 세션 생성 및 진입실행 중인 screen 세션 목록 확인분리(detached)된 <session_name> 세션에 재접속<session_name> 세션을 강제로 분리했다가 재접속동일한 세션에 다중 접속(공유)<s

2025년 6월 26일

0개의 댓글

Unsloth 설치 문제 Trouble Shooting

내가 처한 문제 상황과 오류 코드는 다음과 같았다.Unsloth을 활용한 학습 및 추론이 필요한 상황이었으나, 환경 설정 과정에서 Unsloth이 환경 버전과 안맞아 문제 발생(기준 2025.06.)실패 !!!하지만 진짜 Unsloth을 꼭 필요한 상황이어서 포기할 수

2025년 6월 24일

0개의 댓글

[Trouble-Shooting] dlib Installation Error(dlib 설치 오류)

이런 오류는 한 번쯤은 만나게된다. 해결방법1\. 기존의 cmake 삭제 및 재설치파이팅 ~.~!!

2025년 3월 15일

0개의 댓글

코랩 런타임 유지 꿀팁

코랩으로 오랜 시간(내 기준.. 4시간 이상)의 학습을 돌릴 땐 창을 닫으면 안되며, 켜진 창을 계속 터치해줘야된다는 불편함이 있었다.코랩은 일정 시간동안 화면이 켜져있다해도, 움직임이 없으면 런타임이 끊기는 것 같았다.이번 미국에서 비효율의 끝판왕인 나를 보더니 다른

2025년 1월 30일

0개의 댓글