[pytorch] 이미지 분류기(CLASSIFIER)

hottogi·2023년 1월 12일

pytorch로 CIFAR10 데이터셋 이미지 분류하기

'비행기(airplane)’, ‘자동차(automobile)’, ‘새(bird)’, ‘고양이(cat)’, ‘사슴(deer)’, ‘개(dog)’, ‘개구리(frog)’, ‘말(horse)’, ‘배(ship)’, ‘트럭(truck)’ 총 10개의 이미지로 나뉘어져 있다.
60000개의 32X32 컬러 이미지로 구성되어 있음.

진행 순서

torchvision을 사용하여 CIFAR10의 데이터셋을 불러오고 정규화

합성곱 신경망 정의

손실 함수 정의

학습용 데이터를 사용하여 CNN 학습

시험용 데이터를 사용하여 CNN 검사

1. 데이터 불러오기 & 정규화

import torch
import torchvision
import torchvision.transforms as transforms

transform = transforms.Compose(
    [transforms.ToTensor(),
     transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

batch_size = 4

trainset = torchvision.datasets.CIFAR10(root='./data', train=True,
                                        download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=batch_size,
                                          shuffle=True, num_workers=2)

testset = torchvision.datasets.CIFAR10(root='./data', train=False,
                                       download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=batch_size,
                                         shuffle=False, num_workers=2)

classes = ('plane', 'car', 'bird', 'cat',
           'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

이미지 확인

import matplotlib.pyplot as plt
import numpy as np


def imshow(img):
    img = img / 2 + 0.5     
    npimg = img.numpy()
    plt.imshow(np.transpose(npimg, (1, 2, 0)))
    plt.show()

images, labels = next(iter(trainloader))

imshow(torchvision.utils.make_grid(images))

print(' '.join(f'{classes[labels[j]]:5s}' for j in range(batch_size)))

2. 합성곱 신경망 정의

import torch.nn as nn
import torch.nn.functional as F


class Net(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = torch.flatten(x, 1) # 배치를 제외한 모든 차원을 평탄화(flatten)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x


net = Net()

3. 손실함수, optimizer 정의

import torch.optim as optim

criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

4. 신경망 학습

for epoch in range(2):   

    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data
       
        optimizer.zero_grad()
        
        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
       
        running_loss += loss.item()
        if i % 2000 == 1999:    # print every 2000 mini-batches
            print(f'[{epoch + 1}, {i + 1:5d}] loss: {running_loss / 2000:.3f}')
            running_loss = 0.0

print('Finished Training')

학습한 모델 저장

PATH = './cifar_net.pth'
torch.save(net.state_dict(), PATH)

5. 신경망 성능 검사

시험용 데이터 이미지 확인

images, labels = next(iter(testloader))

imshow(torchvision.utils.make_grid(images))
print('GroundTruth: ', ' '.join(f'{classes[labels[j]]:5s}' for j in range(4)))

예측 확인

_, predicted = torch.max(outputs, 1)

print('Predicted: ', ' '.join(f'{classes[predicted[j]]:5s}'
                              for j in range(4)))

예측 성공. 준수한 성능

Predicted: cat ship ship plane

각 분류별 정확도 측정

correct_pred = {classname: 0 for classname in classes}
total_pred = {classname: 0 for classname in classes}

with torch.no_grad():
    for data in testloader:
        images, labels = data
        outputs = net(images)
        _, predictions = torch.max(outputs, 1)
        for label, prediction in zip(labels, predictions):
            if label == prediction:
                correct_pred[classes[label]] += 1
            total_pred[classes[label]] += 1

for classname, correct_count in correct_pred.items():
    accuracy = 100 * float(correct_count) / total_pred[classname]
    print(f'Accuracy for class: {classname:5s} is {accuracy:.1f} %')

자료 출처: https://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.html?highlight=cifar

이전 포스트

[오류 해결] AttributeError: '_MultiProcessingDataLoaderIter' object has no attribute 'next'

다음 포스트

[pytorch] 이미지 분류기(CLASSIFIER)

1. 데이터 불러오기 & 정규화

2. 합성곱 신경망 정의

3. 손실함수, optimizer 정의

4. 신경망 학습

5. 신경망 성능 검사

[오류 해결] AttributeError: '_MultiProcessingDataLoaderIter' object has no attribute 'next'

[pytorch] 이미지 분류기(CLASSIFIER)

0개의 댓글

관련 채용 정보