© 2025 Jonghyeon Sim. Licensed under CC BY-NC 4.0
목적 : 효율적이고 생산성 있는 작업을 위한 공부법 설계 및 개발
목표 : 모든 내용을 완벽히 이해. 지식을 체득.
일자 :2025.3.11
(기존) : 정독
(개선 방법 제시)
: Tutorials의 모든 주제(소제목)의 핵심을 파악 후, 중요도 위주로 정독.
1) 코드를 제외한 내용의 핵심 파악 및 요약.
2) ChatGPT 활용.
방법1.
방법2.
📌 한 줄 요약
TensorFlow에서 tf.keras.utils.image_dataset_from_directory()와 tf.data API를 활용해 이미지 데이터를 효율적으로 로드, 전처리, 최적화하는 방법을 학습하는 튜토리얼.
📌 핵심 요약
1️⃣ 이미지 데이터 로딩
image_dataset_from_directory()를 사용하여 폴더에서 자동으로 이미지 데이터를 로드하고 배치(batch) 구성
훈련(train) / 검증(validation) 데이터 분할 가능
2️⃣ 데이터 로딩 최적화 (tf.data API 활용)
cache(), shuffle(), prefetch(AUTOTUNE)을 사용하여 데이터 로딩 속도 향상 및 학습 최적화
3️⃣ 데이터 증강 (Augmentation)
RandomFlip(), RandomRotation() 등을 적용하여 과적합 방지 및 데이터 다양성 증가
4️⃣ 이미지 정규화 (Normalization)
Rescaling(1./255)을 사용하여 픽셀 값을 0~1 범위로 변환하여 학습 성능 개선
5️⃣ 데이터셋 구조 확인
class_names를 통해 클래스 자동 라벨링 확인
데이터 배치 구조를 출력하여 올바르게 로드되었는지 검증
방법1은 내용을 빠르게 확인하는 시간을 포함하므로 방법2보다 3배의 시간이 소요되었다. 요약 내용은 방법1이 방법2보다 더 간결해보이지만 학습을 위한 데이터를 다루는 방법을 명확하게 명시되지 않아 모든 방법을 다룬다는 착각을 일으킬 수 있다. 방법2는 내용을 자세히 명시되었지만, Tensorflow Datasets의 사용 부분의 내용이 누락되었고, 더 자세한 모든 내용을 요약하지 않아 핵심 요약 부분만 Tutorials에서 다룬다는 착각을 할 수 있다. 방법1의 과정이 없이 방법2의 내용을 이해하기 어려울 것이다.
결론적으로 방법1과 방법2을 모두 사용하는 것이 각 방법의 단점을 보안할 수 있어 효율적이다. 방법1로 전체 구성과 내용을 파악하고 정리하고 방법2를 통해 최종적으로 확인하며 방법1로 놓친 세부적인 요약을 확인할 수 있다.