0. Study Method

JHSIM·2025년 3월 11일

공부법

목록 보기

1/1

목적 : 효율적이고 생산성 있는 작업을 위한 공부법 설계 및 개발

1. Tutorials, Textbook

목표 : 모든 내용을 완벽히 이해. 지식을 체득.

주제1 : 처음부터 정독 vs 핵심 파악 후 정독

일자 :2025.3.11

소개

(기존) : 정독

장점 : 완벽한 지식 확장.
단점 :
1. 체감상 오랜 학습시간.
2. 실무에 활용하기까지 오랜 시간이 걸림.
3. 불안 심리 발생.

(개선 방법 제시)
: Tutorials의 모든 주제(소제목)의 핵심을 파악 후, 중요도 위주로 정독.

실험 자료

Load and preprocess images

실험 방법

1) 코드를 제외한 내용의 핵심 파악 및 요약.
2) ChatGPT 활용.

실험 결과

방법1.

소요 시간 : 17 min
한 줄 요약 : 모델 학습을 하기 위해 데이터를 Load하는 방법들.
핵심 요약.
1. 디스크 이미지를 load하는 두 가지 방법
- Keras preprocessing layers와 utilities 사용
- tf.data 사용.
2. TensorFlow Datasets을 사용.

방법2.

소요 시간 : 6min

📌 한 줄 요약
TensorFlow에서 tf.keras.utils.image_dataset_from_directory()와 tf.data API를 활용해 이미지 데이터를 효율적으로 로드, 전처리, 최적화하는 방법을 학습하는 튜토리얼.

📌 핵심 요약
1️⃣ 이미지 데이터 로딩
image_dataset_from_directory()를 사용하여 폴더에서 자동으로 이미지 데이터를 로드하고 배치(batch) 구성
훈련(train) / 검증(validation) 데이터 분할 가능

2️⃣ 데이터 로딩 최적화 (tf.data API 활용)
cache(), shuffle(), prefetch(AUTOTUNE)을 사용하여 데이터 로딩 속도 향상 및 학습 최적화

3️⃣ 데이터 증강 (Augmentation)
RandomFlip(), RandomRotation() 등을 적용하여 과적합 방지 및 데이터 다양성 증가

4️⃣ 이미지 정규화 (Normalization)
Rescaling(1./255)을 사용하여 픽셀 값을 0~1 범위로 변환하여 학습 성능 개선

5️⃣ 데이터셋 구조 확인
class_names를 통해 클래스 자동 라벨링 확인
데이터 배치 구조를 출력하여 올바르게 로드되었는지 검증

결과

방법1은 내용을 빠르게 확인하는 시간을 포함하므로 방법2보다 3배의 시간이 소요되었다. 요약 내용은 방법1이 방법2보다 더 간결해보이지만 학습을 위한 데이터를 다루는 방법을 명확하게 명시되지 않아 모든 방법을 다룬다는 착각을 일으킬 수 있다. 방법2는 내용을 자세히 명시되었지만, Tensorflow Datasets의 사용 부분의 내용이 누락되었고, 더 자세한 모든 내용을 요약하지 않아 핵심 요약 부분만 Tutorials에서 다룬다는 착각을 할 수 있다. 방법1의 과정이 없이 방법2의 내용을 이해하기 어려울 것이다.
결론적으로 방법1과 방법2을 모두 사용하는 것이 각 방법의 단점을 보안할 수 있어 효율적이다. 방법1로 전체 구성과 내용을 파악하고 정리하고 방법2를 통해 최종적으로 확인하며 방법1로 놓친 세부적인 요약을 확인할 수 있다.

JHSIM