줘이리의 인생적기

[tensorflow 25] Fashion MNIST05 본문

공부/tensorflow

[tensorflow 25] Fashion MNIST05

줘이리 2021. 8. 9. 23:01
728x90

데이터 증식(Data Augmentation)이라는 단어를 들어보셨나요?

 

데이터 증식 즉, 이미지 보강을 통해 가지고 있는 데이터를 새롭게 훈련 데이터에 보강하는 것으로 정확도를 개선해볼 수 있습니다.

 

기존 훈련데이터를 회전시키거나, 기울이거나, 확대하거나, 평행 이동시키거나, 뒤집어서 다양한 이미지를 만들어낼 수 있습니다.

 

tf.keras에 있는 ImageDataGenerator를 통해 쉽게 이미지 보강 작업을 할 수 있습니다.

import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import numpy as np


fashion_mnist = tf.keras.datasets.fashion_mnist
(train_X, train_Y), (test_X, test_Y) = fashion_mnist.load_data()

train_X = train_X / 255.0
test_X = test_X / 255.0

print(train_X.shape, test_X.shape)

train_X = train_X.reshape(-1, 28, 28, 1)
test_X = test_X.reshape(-1, 28, 28, 1)

# reshape 이후
print(train_X.shape, test_X.shape)



# 이 ImageDataGenerator 코드 부분은 다음 링크에서 참조했습니다.
# https://github.com/franneck94/MNIST-Data-Augmentation/blob/master/mnist.py
# rotation, zoom, shift, flip 등을 지정합니다.
image_generator = ImageDataGenerator(
            rotation_range=10,
            zoom_range=0.10,
            shear_range=0.5,
            width_shift_range=0.10,
            height_shift_range=0.10,
            horizontal_flip=True,
            vertical_flip=False)

augment_size = 100

#flow는 보강된 이미지를 생성하는 함수
x_augmented = image_generator.flow(np.tile(train_X[0].reshape(28*28),100).reshape(-1,28,28,1), np.zeros(augment_size), batch_size=augment_size, shuffle=False).next()[0]

model = tf.keras.Sequential([
    tf.keras.layers.Conv2D(input_shape=(28,28,1), kernel_size=(3,3), filters=32, padding='same', activation='relu'),
    tf.keras.layers.Conv2D(kernel_size=(3,3), filters=64, padding='same', activation='relu'),
    tf.keras.layers.MaxPool2D(pool_size=(2,2)),
    tf.keras.layers.Dropout(rate=0.5),
    tf.keras.layers.Conv2D(kernel_size=(3,3), filters=128, padding='same', activation='relu'),
    tf.keras.layers.Conv2D(kernel_size=(3,3), filters=256, padding='valid', activation='relu'),
    tf.keras.layers.MaxPool2D(pool_size=(2,2)),
    tf.keras.layers.Dropout(rate=0.5),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(units=512, activation='relu'),
    tf.keras.layers.Dropout(rate=0.5),
    tf.keras.layers.Dense(units=256, activation='relu'),
    tf.keras.layers.Dropout(rate=0.5),
    tf.keras.layers.Dense(units=10, activation='softmax')
])

model.compile(optimizer=tf.keras.optimizers.Adam(),
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

history = model.fit(train_X, train_Y, epochs=40, validation_split=0.25)

plt.figure(figsize=(12, 4))

plt.subplot(1, 2, 1)
plt.plot(history.history['loss'], 'b-', label='loss')
plt.plot(history.history['val_loss'], 'r--', label='val_loss')
plt.xlabel('Epoch')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(history.history['accuracy'], 'g-', label='accuracy')
plt.plot(history.history['val_accuracy'], 'k--', label='val_accuracy')
plt.xlabel('Epoch')
plt.ylim(0.7, 1)
plt.legend()

plt.show()

result = model.evaluate(test_X, test_Y, verbose=0)
print(result)

데이터 증식에 사용된 함수들을 보겠습니다. rotation_range는 회전시키는 파라미터, zoom_range는 일부 확대시키는 파라미터, shear_range는 기울이는 파라미터, width_shift_range와 height_shift_range는 평행이동 시키는 파라미터, horizontal_flip는 가로로 뒤집는 파라미터, vertical_flip은 세로로 뒤집는 파라미터입니다.

 

데이터에 맞는 파라미터들을 입력 후 결과를 보겠습니다.

 

 

잘 학습이 되었고, 보강과 조금 더 학습을 돌린다면 더욱 좋은 결과가 나올 거라 생각됩니다.

 

 

'공부 > tensorflow' 카테고리의 다른 글

[tensorflow 24] Fashion MNIST04  (0) 2021.05.27
[tensorflow 23] Fashion MNIST03  (0) 2021.05.26
[tensorflow 22] Fashion MNIST02  (0) 2021.05.25
[tensorflow 21] 레이어  (0) 2021.05.24
[tensorflow 20] CNN - 특징 추출  (0) 2021.05.21