ResourceExhaustedError:OOM ตอนที่ allocating tensor กับรูปร่าง[32,32,239,239 และแบลอย

0

คำถาม

ฉันกำลังพยายามสร้างโฮปขึ้นมาใหม่อีกครั้ซีเอ็นเอ็นเลยภาพนางแบบการยอมจาก นี่กระดาษ(รุ่น 1) ใช้ต่างออกภาพต่างๆ อย่างไรก็ตามที่ยอที่จะได้ค่ารุ่นของฉันเป็น ResourceExhaustedError ตอนแรก epoch. การประมวลผลกลุ่มภาพขนาดแล้วค่อนข้างเล็กๆดังนั้นฉันเดาว่าปัญหาก็คือกับฉันแบบนิยามซึ่งผมคัดลอกมาจากหนังสือพิมพ์ มีคำแนะนำอะไรจะเปลี่ยนกับคนรุ่นจะเป็นเกียรติอย่างยิ่ง ขอบคุณ!

#Load dataset
BATCH_SIZE = 32
IMG_SIZE = (244,244)
train_set = tf.keras.preprocessing.image_dataset_from_directory(
    main_dir, 
    shuffle = True,
    image_size = IMG_SIZE,
    batch_size = BATCH_SIZE)
val_set = tf.keras.preprocessing.image_dataset_from_directory(
    main_dir, 
    shuffle = True, 
    image_size = IMG_SIZE,
    batch_size = BATCH_SIZE)
class_names = train_set.class_names
print(class_names)

#Augment data by flipping image and random rotation
data_augmentation = tf.keras.Sequential([
    tf.keras.layers.experimental.preprocessing.RandomFlip('horizontal'),
    tf.keras.layers.experimental.preprocessing.RandomRotation(0.2),
])

#Model definition 
model = Sequential([
    data_augmentation,
    tf.keras.layers.experimental.preprocessing.Rescaling(1./255),
    Conv2D(filters=64,kernel_size=(4,4), activation='relu'),
    Conv2D(filters=32,kernel_size=(3,3), activation='relu'),
    AveragePooling2D(pool_size=(4,4)),

    Conv2D(filters=32,kernel_size=(3,3), activation='relu'),
    Conv2D(filters=32,kernel_size=(3,3), activation='relu'),
    Conv2D(filters=32,kernel_size=(3,3), activation='relu'),
    AveragePooling2D(pool_size=(2,2)),
    Flatten(),
    
    Dense(256, activation='relu'),
    Dense(256, activation='relu'),
    Dense(128, activation='relu'),
    Dense(128, activation='relu'),
    Dense(128, activation='tanh'),
    Dense(1, activation='softmax')

])

model.compile(optimizer='RMSprop',
              loss=keras.losses.CategoricalCrossentropy(from_logits=True),
              metrics=[keras.metrics.CategoricalAccuracy()])

history = model.fit(train_set,validation_data=val_set, epochs=150)

เกิดข้อผิดพลาดหลังจากที่นางแบบ:

ResourceExhaustedError:  OOM when allocating tensor with shape[32,32,239,239] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
     [[node gradient_tape/sequential_1/average_pooling2d/AvgPoolGrad (defined at <ipython-input-10-ef749d320491>:1) ]]

nvidia-smi

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.91.03    Driver Version: 460.91.03    CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce 940MX       Off  | 00000000:01:00.0 Off |                  N/A |
| N/A   46C    P0    N/A /  N/A |   1938MiB /  2004MiB |      2%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A       959      G   /usr/lib/xorg/Xorg                 97MiB |
|    0   N/A  N/A      1270      G   /usr/bin/gnome-shell               25MiB |
|    0   N/A  N/A      4635      G   /usr/lib/firefox/firefox          212MiB |
|    0   N/A  N/A      5843      C   /usr/bin/python3                 1595MiB |
+-----------------------------------------------------------------------------+

1

คำตอบที่ดีที่สุด

0

ข้อผิดพลาดคือสาเหตุมาจากตัวประมวลผลกราฟิกของคุณวิ่งหนีออกจากหน่วยความจำจนหมดแล้ว นี่อาจจะเป็นเหมือนกันเพราะ 1)คุณกำลังโหลดมากเกินไปข้อมูลต่อ epoch แม้แต่สำหรับตัวประมวลผลกราฟิกของคุณหรือ 2)ถ้าคุณเกิดขึ้นกับพอ VRAM อีกขั้นตอนงานสำรองความทรงจำบางอย่างระหว่าง epochs. นี่อาจจะเกิดขึ้นเพราะ tensorflow ลังงานทุกอย่างหมด 100%ของ VRAM ที่ runtime. คุณสามารถจำกัดจำนวนมากของ VRAM จจะแค่มีอะไรต้องการ

import tensorflow as tf
for gpu in tf.config.list_physical_devices("GPU")
    tf.config.experimental.set_memory_growth(gpu, True)

แก้ไข:ลังมองหาที่ของคุณกราฟิกการ์ดฉันมีบางอย่างที่แน่นอนคุรก้ไม่มีเหตุผลเพียงพอ VRAM ของคุณสำหรับการประมวลผลกลุ่มภาพขนาดและใส่ข้อมูลขนาดของ(ดังนั้นปัญหา 1). คุณควรจะลดการประมวลผลกลุ่มภาพขนาดด้วย

2021-11-23 17:57:42

ในภาษาอื่นๆ

หน้านี้อยู่ในภาษาอื่นๆ

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................

ดังอยู่ในนี้หมวดหมู่

ดังคำถามอยู่ในนี้หมวดหมู่