Please use this identifier to cite or link to this item: http://202.28.34.124/dspace/handle123456789/1680
Title: Classification of Diabetic Retinopathy Images using Deep Learning
การจำแนกรูปภาพจอประสาทตาที่มีภาวะเบาหวานขึ้นตาด้วยการเรียนรู้เชิงลึก
Authors: Pichada Saichua
พิชาดา สายเชื้อ
Olarik Surinta
โอฬาริก สุรินต๊ะ
Mahasarakham University. The Faculty of Informatics
Keywords: การจำแนกรูปภาพจอประสาทตาที่มีภาวะเบาหวานขึ้นตา
การเรียนรู้เชิงลึก
โครงข่ายประสาทเทียมคอนโวลูชัน
เทคนิคการเพิ่มข้อมูลรูปภาพ
Convolutional neural network
Fusion CNNs
Ensemble CNNs
Diabetic retinopathy classification
Data augmentation technique
Issue Date:  10
Publisher: Mahasarakham University
Abstract: In this paper, researchers have demonstrated the effectiveness of the fusion convolutional neural network (CNN) and ensemble CNN architectures for diabetic retinopathy classification. Due to the fusion and ensemble CNN architectures, authors proposed to use five CNN architectures consisting of InceptionV3, ResNet50, ResNet50V2, Xception, and DenseNet121 to find the best CNN model. The fusion and ensemble CNN architectures were then created combining two of the best CNN models and while training the CNN models, researchers also used data augmentation techniques. The data augmentation technique, researchers discovered, can increase the accuracy of CNNs. However, the data augmentation technique should not distort the retinal image. For the fusion CNNs, the Xception and InceptionV3 were combined and then attached with two dense layers with the size of 1,024 units for each dense layer. Hence, researchers selected the optimal dropout value with 0.4. For the ensemble CNNs, the output probabilities, that were calculated from the Xception and InceptionV3 models, were sent to the ensemble learning method. Researchers compared the weighted and unweighted average methods using ensemble learning methods. The results showed that the weighted average method outperformed the unweighted average method in all ensemble CNNs. In the experiments, researchers discovered that the fusion architecture slightly outperformed ensemble CNN architecture.
งานวิจัยฉบับนี้ได้ทำการศึกษาและเปรียบเทียบประสิทธิภาพการเรียนรู้เชิงลึกสำหรับการจำแนกรูปภาพจอประสาทตาที่มีภาวะเบาหวานขึ้นตาโดยใช้ CNN ร่วมกับเทคนิค Ensemble CNN และ Fusion CNN ซึ่งในการทดลองนั้นผู้วิจัยได้เลือกสถาปัตยกรรม CNN ที่แตกต่างกัน 5 รูปแบบ ได้แก่ InceptionV3, ResNet50, ResNet50V2, Xception และ DenseNet121 เพื่อสร้างเป็นแบบจำลองสำหรับการจำแนกประเภทรูปภาพจอประสาทตาที่มีภาวะเบาหวานขึ้นตา โดยในขั้นตอนการเรียนรู้เพื่อสร้างแบบจำลองมีการนำเทคนิค Data Augmentation มาร่วมทดลอง เพื่อเพิ่มมิติหรือมุมมองของชุดข้อมูลรูปภาพจอประสาทตาจึงทำให้ความสามารถในการจำแนกประเภทจอประสาทตาของแบบทุกแบบจำลองมีประสิทธิภาพมากยิ่งขึ้น โดยการทดลองที่กล่าวมาเป็นการทดลองเพื่อค้นหาแบบจำลอง CNN ที่มีประสิทธิภาพพร้อมทั้งอัตราความถูกต้องในการจำแนกประเภทจอประสาทตาสูงสุด เพื่อนำไปทำการทดลองร่วมกับเทคนิค Ensemble CNN และ Fusion CNN ซึ่งจากผลลัพธ์การทดลองพบว่าเมื่อนำแบบจำลอง Xeption และ InceptionV3 รวมเข้าด้วยกันด้วยเทคนิค Fusion CNN ที่ Dense จำนวน 2 เลเยอร์ โดยมีขนาดของ Dense เป็น 1024 และค่าของ Dropout ที่ 0.4 นั้นสามารถให้อัตราความถูกต้องมากถึงร้อยละ 86.30 และเมื่อรวมแบบจำลอง Xeption และ InceptionV3 ด้วยเทคนิค Ensemble CNN ซึ่งเป็นการนำค่าความน่าจะเป็นที่ได้จากการพยากรณ์ของแต่ละแบบจำลองไปทำการคำนวณด้วยวิธี Weighted Average และ Unweighted Average เพื่อเลือกผลลัพธ์หรือตำตอบที่มีค่ามากที่สุด โดยจากผลการศึกษาพบว่าเมื่อทำการรวมแบบจำลองด้วยเทคนิค Fusion CNN นั้นสามารถเพิ่มประสิทธิภาพแบบจำลองได้สูงสุด และมีอัตราความถูกต้องแตกต่างจากการรวมแบบจำลองด้วยเทคนิค Ensemble CNN เพียงเล็กน้อย
Description: Master of Science (M.Sc.)
วิทยาศาสตรมหาบัณฑิต (วท.ม.)
URI: http://202.28.34.124/dspace/handle123456789/1680
Appears in Collections:The Faculty of Informatics

Files in This Item:
File Description SizeFormat 
63011253001.pdf7.45 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.