세그멘테이션의 개념과 종류 이해FCN과 U-Net의 동작 원리 학습COCO 데이터셋 구조 및 활용 방법 습득전이학습을 활용한 세그멘테이션 실습배경 합성 등 실전 응용 기법 익히기정의: 이미지의 각 픽셀을 특정 클래스로 분류하여 픽셀 수준의 정밀한 분석을 수행하는 작업기
FCN(Fully Convolutional Networks)의 구조와 동작 원리 이해Semantic Segmentation과 Instance Segmentation의 차이 파악Oxford-IIIT Pet 데이터셋의 구조 및 Trimap 개념 학습이미지 보간법(Inter
FCN 모델의 입출력 구조 완벽 이해마스크 데이터의 본질과 처리 방법 파악다운샘플링과 업샘플링의 필요성 이해보간법(Interpolation)의 중요성 재확인전이학습 시 weight와 num_classes의 관계 이해세그멘테이션 = 같은 위치의 픽셀값만 비교목표: 예측값
U-Net의 구조와 작동 원리 이해Skip Connection의 역할과 효과 파악FCN과 U-Net의 차이점 비교Loss 함수와 Weight Map의 수학적 원리 이해의료 영상 분석에서의 U-Net 활용 이해정의2015년 Ronneberger et al.이 제안한 Se
입력 → 연산 → 출력forward() 안에서 self.conv1, self.pool, self.upconv 같은 레이어를 차례대로 호출해 입력 x를 변형시킵니다. 계산 그래프 기록forward() 안에서 수행되는 모든 연산(Conv, Pool, ReLU 등)은 au
(P(x)) : 실제 데이터의 확률분포(p(z)) : 잠재 변수의 사전분포(보통 표준 정규분포 (\\mathcal{N}(0,I)))Explicit : 분포를 명시적으로 지정하는 모델 (예: VAE, Normalizing Flow)Implicit : 분포를 직접 지정하지
생성 모델의 핵심 개념을 이해한다 Generator 와 Discriminator 의 구조와 역할을 명확히 인지한다 미니맥스 손실 함수와 대안 손실(LS‑GAN, WGAN, BEGAN 등)을 구분한다 다양한 GAN 변종(DCGAN, WGAN‑GP, StyleGAN,
GAN의 기본 구조와 작동 원리 이해생성자와 판별자의 적대적 학습 메커니즘 이해조건부 확률을 이용한 이미지 생성 원리 파악VAE, Diffusion 등 다양한 생성 모델 비교GAN의 학습 어려움과 해결 방안 이해이미지 생성이란?딥러닝 모델을 이용하여 기존 데이터 분포를
GAN의 Generator와 Discriminator 구현 방법 이해노이즈에서 이미지 생성 과정의 수학적 원리 파악배치 단위 학습의 중요성 이해생성모델의 성능을 평가하는 주요 지표 학습IS, FID, Precision/Recall 등의 평가지표 이해우리가 맞춰야 하는
아래는 “diffusion 모델 수식”을 처음 접하거나, 수식을 이해하고 싶어하시는 분들을 위해개념 → 수식 → 구현 순서대로 정리한 가이드입니다.(이 자료는 바로 실행해볼 수 있는 예시 코드와 수식의 의미를 직관적으로 설명한 도식도 포함합니다.)필수 전제 파이썬 3
디퓨전 모델(특히 UNet 기반 모델)은 이미지‑특징을 부드럽게 변환하고 그라디언트가 사라지지 않게 하기 위해 몇몇 비선형 활성화 함수를 선택합니다.가장 널리 사용되는 함수는 다음과 같습니다.핵심디퓨전 모델에서는 음수 입력에 대해 0이 되지 않도록 하는 부드러운 함수(
전통적인 이미지 분류 CNN은 마지막에 Fully‑Connected(FC) 레이어를 두어 고정 차원의 벡터를 만든다. FCN 은 FC 레이어를 모두 제거하고 Convolution 연산만으로 구성한다. 1×1 Conv 로 채널을 압축 → 전역적인 dense predi
MediaPipe 설치·가상환경 관리와 기본 디렉터리 구조를 이해한다. Face Detection(모델 선택·신뢰도·미러 현상)과 키포인트(6개 Landmark) 를 해석하고 실제 좌표로 변환한다. OpenCV와 연동해 실시간 영상에 Bounding Box와 Lan
MediaPipe Face Detection, Hands, Pose 모듈의 기본 구조와 주요 파라미터를 설명한다. 정규화 좌표(0 ~ 1) → 픽셀 좌표 변환 과정을 단계별로 이해한다. OpenCV와 연계해 실시간 영상에 Bounding Box·Landmark 를