iumiere-on (문재원)

얼렁뚱땅 요리조리

태그 목록

전체보기 (22)Reward Model(4)Database(3)rm(3)Spring(2)Room(2)Android Studio(2)db(2)node.js(2)reward(1)gan(1)Generative Adversarial Nets(1)디코더(1)프로세스(1)RLHF(1)TIL(1)VAE(1)promise(1)U-Net(1)LLM(1)UNet(1)변이형 오토인코더(1)flutter(1)catch(1)rds(1)UMC(1)Critique(1)네이버 뉴스 크롤링(1)생성 모델링(1)callback(1)MLLM(1)selenium(1)RealNVP(1)Firebase(1)await(1)서버(1)Autoregressive Model(1)async(1)비동기(1)udemy(1)디버깅(1)NF(1)AR(1)chrome driver(1)생성ai(1)비동기처리(1)Normalizing Flow(1)docker(1)MM-RLHF(1)debugging(1)소켓(1)build(1)데이터베이스(1)자귀회귀 모델(1)sqlite(1)FFJORD(1)AI(1)LM(1)glow(1)TTRL(1)인코더(1)노멀라이징 플로(1)RL(1)Then(1)segmentation(1)Crawling(1)aws(1)app(1)running(1)DPO(1)CLOUD RM(1)DRS(1)Biomedical(1)debug(1)self-rewarding(1)워크플로우(1)crtiques(1)FastAPI(1)GenAI(1)생성적 적대 신경망(1)스프링(1)

논문 리뷰(8) TTRL: Test-Time Reinforcement Learning

이번에는 TTRL: Test-Time Reinforcement Learning

TTRL

2025년 7월 15일

0개의 댓글

논문 리뷰(7) Self-Evolved Reward learning for LLMs

요즘 RLHF의 분야에서 human preference 데이터의 한계를 뛰어넘고자 하는 self-evolve 아이디어가 많이 나오는 것 같습니다. 오늘 읽어볼 Self-Evolved Reward learning for LLms도 유사한 맥락입니다. (참고로 이 논문은

2025년 7월 15일

0개의 댓글

논문 리뷰 (6) Self-Rewarding Language Models

논문을 파도타며 리서치하다보니 찾은 논문입니다. 제가 생각하는 연구 주제의 방향성과는 약간 다르지만 인사이트를 얻을 수 있을 것 같아 선정했습니다. 나는 언제쯤 연구 주제를 찾을 수 있을까! (●´⌓`●)

LLM RL Reward Model rm self-rewarding

2025년 7월 15일

0개의 댓글

[연구실]연구 주제 찾기(1)

저는 현재 AI랩실에서 학부인턴을 하고 있습니다.6월 중순에 종강한 뒤부터 연구 주제를 줄곧 찾고 있었고 아직도 찾는 중입니다...저는 어마어마한 감자지만.. 요즘 들어 꽤나 지쳐서...넉두리 겸 정리를 하며 저와 비슷한 처지에 있는 분들께 조금이나마 도움이 되고자(?

2025년 7월 15일

0개의 댓글

논문 리뷰 (4) Self-Generated Critiques Boost Reward Modeling for Language Models

오늘 다룰 논문은 [Self-Generated Critiques Boost Reward Modeling for Language Models](https://arxiv.org/pdf/2411.16646)입니다. 2025년 4월에 NAACL에 publish된 논문입니다.

LM Reward Model crtiques reward rm

2025년 7월 7일

0개의 댓글

논문 리뷰(5) U-Net: Convolutional Networks for Biomedical Image Segmentation

이번주 CV스터디 논문은 U-Net입니다. Segment의 기초 논문 중 하나이기에 꼼꼼하게 다뤄보도록 하겠습니다!본 논문에서는 data augmentation에 기반한 네트워크와 training strategy를 제시함구조는 contracting path & symm

Biomedical U-Net UNet segmentation

2025년 7월 7일

0개의 댓글

논문 리뷰(3) You Only Look Once: Unified, Real-Time Object Detection

오늘은 아주 유우명한 객체 탐지(object detection) 분야의 논문을 읽어보겠습니다. 바로 YOLO입니다!오늘도 Abstract부터 읽어보겠습니다.논문에서는 "한 개의 신경망이 한 평가에서 전체 이미지를 기반으로 bounding boxes를 예측 ➡️ 클래스

2025년 7월 1일

0개의 댓글

논문 리뷰(2) Critique-out-LOUD Reward Models

오늘 리뷰할 논문은 Critique-out-LOUD Reward Models입니다! 저번에 읽었던 논문 MM-RLHF: The Next Step Forward in Multimodal LLM Alignment과 Reward Modeling 측면에서 유사합니다. 따라서

CLOUD RM Critique Reward Model rm

2025년 6월 24일

0개의 댓글

논문 리뷰(1) MM-RLHF: The Next Step Forward in Multimodal LLM Alignment

Multimodal Large Language Model에 RLHF를 적용해 기존의 한계점들을 보완한 MM-RLHF에 대해 정리하겠습니다. MM-RLHF-Dataset, MM-RLHF-Reward Model, MM-DPO를 다뤄보겠습니다.

DPO DRS MLLM MM-RLHF RLHF Reward Model

2025년 6월 23일

0개의 댓글

FastAPI를 기반으로 한 Docker- build부터 running까지

안녕하세요! 오늘은 캡스톤 디자인과 창업프로젝트 개발 과정에 대해 말씀드리고자 합니다. 우선 전체 파이프라인에 대해 언급한 다음, fastAPI의 전체 구조와 도커 빌드에 대해 말씀드리겠습니다.

AI FastAPI build docker running

2025년 5월 19일

0개의 댓글

Selenium을 활용한 뉴스 크롤링

beautifulsoup을 이용해서 다음 기사를 크롤링하는 코드를 작성했는데, 몇 주 뒤에 확인해보니 URL이 바뀌었다... 그래서 급하게 Selenium을 이용해서 크롤링을 하기로 결정했다. 우선 크롤링할 때는 대부분 beautifulsoup 이 라이브러리를

Crawling chrome driver selenium 네이버 뉴스 크롤링

2024년 11월 26일

0개의 댓글

생성 AI - Ch6. 노멀라이징 플로 모델(Normalizing flow model)

생각보다 성실한 나날들의 연속이다.벌써 생성AI 6장을 배우고 이에 관해 정리하고 있다.자! 그럼 오늘도 힘내면서! 6장인 Normalizing flow 모델에 대해 배워보자. 공부를 본격적으로 시작하기에 앞서 normalizing flow 모델이 우리가 전에 배웠던

FFJORD NF Normalizing Flow RealNVP glow 노멀라이징 플로

2024년 5월 29일

0개의 댓글

생성 AI - Ch5. autoregressive model(자기회귀 모델)

오늘은 autoregressive model을 다루려고 한다.!목차는 5.2 LSTM 네트워크5.3 RNN 확장5.4 PixelCNN오늘은 4장에서 배웠던 GAN에 비해 비교적 간단하니 집중해서 빠르게

AR Autoregressive Model 자귀회귀 모델

2024년 5월 22일

0개의 댓글

생성 AI - Ch4. GAN(생성적 적대 신경망)

오늘은 GAN에 대해 배워보자!4장의 목차는 4.1 소개4.2 심층 합성곱 GAN(DCGAN)4.3 와서스테인 GAN-그레디언트 페널티(WGAN-GP)4.4 조건부 GAN(CGAN)으로 구성되어 있다. 우선 GAN은 Generative Adversarial Nework

Generative Adversarial Nets gan 생성적 적대 신경망

2024년 5월 15일

0개의 댓글

생성 AI - Ch3. VAE(변이형 오토인코더)

파트2부터는 본격적인 생성 모델링 방식에 대해 배운다.그럼 오늘은 파트 2(ch.3~ch.8)의 시작인 3장 VAE에 대해 배워보도록 하자!3장의 구성은 아래와 같다.3.1 소개3.2 오토인코더3.3 VAE(변이형 오토인코더)3.4 잠재 공간 탐색하기목차를 보면 알 수

VAE 디코더 변이형 오토인코더 인코더

2024년 5월 13일

0개의 댓글

UMC Spring - Ch.4 DATABASE 설계 & AWS RDS 설정 (1)

4장에서는 DB 설계를 다룹니다. 이제 데이터베이스를 상황에 따라 설계하는 방법을 배운 뒤 직접 설계해보도록 하겠습니다.데이터베이스를 설계해야하기 때문에 MySQL과 ERD에 관한 개념을 간단히 정리는 아래 링크를 참고해주세요!그럼 본문으로 들어가도록 하겠습니다.ERD

Database Spring UMC aws rds 데이터베이스 스프링

2024년 5월 8일

0개의 댓글

생성 AI - Ch1. 생성 모델링

이번 시리즈는 생성 AI 이다. ChatGPT처럼 산출물을 내는 생성형 AI에 관심은 많았는데, 이번 스터디를 통해 처음으로 제대로 공부하게 되었다. 스터디를 통해 이 책을 무사히 끝내길 기원하며 첫 장을 시작해보겠다. 우선 1장은 1.1 생성 모델링이란?1.2 첫 번

GenAI 생성 모델링 생성ai

2024년 5월 8일

0개의 댓글

UMC Spring - Ch.1 서버란 무엇인가

서버의 정의와 역할에 대한 이해서버가 구축되는 과정에 대한 이해오늘은 서버에 대한 정확히 이해하는 시간을 가져보겠습니다!1\. 시스템콜\-정의: OS의 커널이 제공하는 서비스에 대해, 응용 프로그램(ex)사용자 프로그램)의 요청에 대해 커널에 접근하기 위한 인터페이스.

Spring 서버 소켓 프로세스

2024년 5월 3일

0개의 댓글

비동기 처리 async & await in Node.js

오늘은 Node.js를 공부하려면 꼭 알아야하는 기능인 비동기처리에 대해서 알아보고자 한다. 우선 간략한 목차는 다음과 같다. 목차 동기 vs. 비동기 Node.js에서 비동기처리를 사용해야하는 이유 비동기처리의 발전과정 async & await 비동기처리의 효과

Then async await callback catch node.js promise 비동기 비동기처리

2024년 1월 31일

0개의 댓글

Room을 이용한 데이터베이스

나는 현재 플러터를 이용한 안드로이드 앱 개발을 진행 중이다. 앱은 프론트엔드와 백엔드가 명확히 나뉘어져 있지는 않지만 팀원 간 역할을 분배하는 과정에서 백엔드를 맡게 되었다. 프로젝트 초기에 데이터베이스는 로그인, 회원가입, 게시판 등의 기능은 구현하지 않기로 팀원

Android Studio Database Firebase Room db sqlite

2024년 1월 31일

0개의 댓글