이걸 모른다고? 인공지능 동아리 맞아?

AID·2025년 2월 15일

안녕하세요~~ 컴퓨터 비전 & 딥러닝 기초 스터디 입니다

여러분 최근 수능에서 큰 화제 였던 노이즈 문제에 대해 아시나요?

저희는 오늘 해당 칼럼에서 지문에 등장한 디퓨전 모델에 대해 학습하고

함께 수능 문제를 풀어보는 시간을 갖겠습니다 ㅎㅎ

다들 열심히 공부하시고 다 맞추시길 😎 ( 지켜보겠습니다.. )

최근 인공지능 분야에서 디퓨전 모델이 뜨거운 화제로 떠오르고 있죠.

물질의 확산 과정을 설명하는 데 사용되는 개념에서 착안해 개발되었다는 디퓨전 모델은, 고해상도 이미지 생성에서부터 다양한 데이터 구조 처리까지 다양한 분야에서 높은 성능을 보여주고 있는데요,

이번 칼럼에서는 디퓨전 모델이 무엇인지, 어떻게 작동하는지, 그리고 왜 주목받고 있는지에 대해 자세히 알아보겠습니다.

📌 디퓨전 모델이란?

디퓨전 모델은 데이터를 생성해내는 Deep Generative Model 중 하나입니다.

물리학에서의 물질의 확산과정을 모방해 수학적으로 구현하는 방식으로, 원본 데이터에 노이즈를 점차 더하고 이를 역으로 제거하는 방식을 통해 데이터를 생성해내죠.

현재까지 이미지 분야에서 가장 잘 작동하는 생성형 모델 중 하나이고, 고해상도 이미지를 생성하거나 변형하는데 주로 사용해요!

고해상도 이미지 생성 능력 🖼️: 매우 정교하고 높은 품질의 이미지를 생성할 수 있어서, 예술 작품이나 현실적인 이미지 생성에 활용해요.
높은 유연성 🤹‍♂️: 이미지뿐만 아니라 오디오, 텍스트 등 다양한 데이터 타입과 구조를 처리할 수 있어 다방면에서 응용도 가능해요.
안정적인 학습 과정 📈: GAN이나 VAE와 비교했을 때 학습이 보다 안정적이며, 모드 붕괴(mode collapse)와 같은 문제가 적어요.

GAN (Generative Adversarial Networks) 🤖: 적대적인 두 네트워크를 사용하여 현실적인 데이터를 생성하지만, 학습 불안정성과 모드 붕괴 문제가 생길 수 있어요.
VAE (Variational Autoencoders) 🔍: 데이터의 잠재 공간을 학습하여 데이터를 생성하지만 생성물의 품질이 상대적으로 떨어질 수 있어요.

디퓨전 모델은 이런 기존 모델들의 단점을 보완하고 고해상도 이미지를 생성하는 데 뛰어난 성능을 보여주는 모델이죠.

잘 읽으셨나요?

확인을 위해 테스트 문제 나갑니다~ ㅎㅎ

2025학년도 수능 국어 지문
2025학년도 수능 국어 10번
2025학년도 수능 국어 11번
2025학년도 수능 국어 12번
2025학년도 수능 국어 13번

다들 잘 푸셨나요?! (안푸셨으면 다시 위로 가서 꼭 풀어보세요 🤦‍♂️)

💯 정답과 풀이를 알려주겠습니다 (with. GPT4o)

10번 해설 [ 정답률 : 68% (화법과 작문), 84% (언어와 매체) ]
* GPT의 실수로 3번 문항 해설에 ‘적절’하다고 표기되어 있으나 지문에 노이즈의 중요성과 종류 및 성능에 대한 언급이 없으므로 부적절한 문항입니다.
11번 해설 [ 정답률 : 54% (화법과 작문), 73% (언어와 매체) ]
12번 해설 [ 정답률 : 63% (화법과 작문), 80% (언어와 매체) ]
13번 해설 [ 정답률 : 44% (화법과 작문), 60% (언어와 매체) ]

* 오류 수정 : 3번 문항의 ㄹ →ㄴ || 4번 문항 ㅅ → ㄷ (GPT가 왜 이럴까요 ㅎㅎ 참고로 4o 모델입니다..)