Please use this identifier to cite or link to this item: http://202.28.34.124/dspace/handle123456789/2140
Title: Analysis of Factors Affecting Diabetes Mellitus by Using Data Mining Techniques
การวิเคราะห์ปัจจัยที่ก่อให้เกิดโรคเบาหวานด้วยเทคนิคการทำเหมืองข้อมูล
Authors: Kitkanog Sripimsor
กฤตกนก ศรีพิมพ์สอ
Kittipol Wisaeng
กิตติพล วิแสง
Mahasarakham University
Kittipol Wisaeng
กิตติพล วิแสง
kittipol.w@acc.msu.ac.th
kittipol.w@acc.msu.ac.th
Keywords: โรคเบาหวาน
การทำเหมืองข้อมูล
การควบคุมระดับน้ำตาลในเลือด
ผู้สูงอายุ
ความแม่นยำ
Diabetes
Data Mining
Blood Sugar Control
Elderly
Accuracy
Issue Date:  2
Publisher: Mahasarakham University
Abstract: This study used data mining techniques to predict diabetes patients by employing multilayer perceptrons, Nave Bayes, logistic regression, random forests, and decision trees to generate a patient forecasting model and compare the performance measures of data classification with a confusion matrix containing accuracy, precision, recall, and balance. (F-measure) and ROC (Receiver Operating Characteristic; ROC) curve that provides the greatest benefit. According to the findings of the study, the random forest technique provides the highest accuracy (99.75% with precision). The recall value for the risk of diabetes was 0.990%, while the risk of not having diabetes was 0.997%. The F-measure of the diabetes-risk model was 0.995%, while the F-measure of the no-risk model was 0.995%. 0.998%, and the ROC curve was 1.000% for both the diabetes and non-diabetes risks. In the future, the findings can be used to predict diabetes patients.
งานวิจัยนี้ได้ประยุกต์ใช้เทคนิคการทำเหมืองข้อมูลเพื่อพยากรณ์ผู้ป่วยโรคเบาหวาน ด้วยเทคนิคเพอร์เซ็ปตรอนแบบหลายชั้น (Multilayer perceptron) เทคนิคนาอีฟ เบย์ (Naïve bayes) เทคนิคโลจิสติก (Logistic Regression) เทคนิคป่าสุ่ม (Random forest) และเทคนิคต้นไม้ตัดสินใจ (Decision Trees) เพื่อสร้างแบบจําลองในการพยากรณ์ผู้ป่วยและนําค่าวัดประสิทธิภาพของการจําแนกประเภทข้อมูลมาเปรียบเทียบ โดยค่าความถูกต้อง (Accuracy) ค่าความแม่นยำ (Precision) ค่าความระลึก (Recall) ค่าความถ่วงดุล (F-measure) และการดูเส้นกราฟ ROC (Receiver operating characteristic; ROC) ที่ให้ค่ามากที่สุด ผลของการวิจัยพบว่า เทคนิคป่าสุ่ม (Random Forest) ให้ค่าความถูกต้องมากที่สุดที่อยู่ที่ 99.75% มีค่าความแม่นยํา (Precision) ในแบบที่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 1.000% และในแบบที่ไม่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 0.997% ที่ค่าความระลึก (Recall) ในแบบที่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 0.990% และในแบบที่ไม่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 1.000% ค่าความถ่วงดุล (F-measure) ในแบบที่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 0.995% และในแบบที่ไม่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 0.998% และการดูเส้นกราฟ ROC ในแบบที่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 1.000% และในแบบที่ไม่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 1.000% สามารถนําผลลัพธ์ที่ได้ไปใช้ในการประกอบการรักษาผู้ป่วยโรคเบาหวานต่อไปในอนาคต
URI: http://202.28.34.124/dspace/handle123456789/2140
Appears in Collections:Mahasarakham Business School

Files in This Item:
File Description SizeFormat 
62010982001.pdf2.65 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.