Please use this identifier to cite or link to this item:
http://202.28.34.124/dspace/handle123456789/2140
Title: | Analysis of Factors Affecting Diabetes Mellitus by Using Data Mining Techniques การวิเคราะห์ปัจจัยที่ก่อให้เกิดโรคเบาหวานด้วยเทคนิคการทำเหมืองข้อมูล |
Authors: | Kitkanog Sripimsor กฤตกนก ศรีพิมพ์สอ Kittipol Wisaeng กิตติพล วิแสง Mahasarakham University Kittipol Wisaeng กิตติพล วิแสง kittipol.w@acc.msu.ac.th kittipol.w@acc.msu.ac.th |
Keywords: | โรคเบาหวาน การทำเหมืองข้อมูล การควบคุมระดับน้ำตาลในเลือด ผู้สูงอายุ ความแม่นยำ Diabetes Data Mining Blood Sugar Control Elderly Accuracy |
Issue Date: | 2 |
Publisher: | Mahasarakham University |
Abstract: | This study used data mining techniques to predict diabetes patients by employing multilayer perceptrons, Nave Bayes, logistic regression, random forests, and decision trees to generate a patient forecasting model and compare the performance measures of data classification with a confusion matrix containing accuracy, precision, recall, and balance. (F-measure) and ROC (Receiver Operating Characteristic; ROC) curve that provides the greatest benefit. According to the findings of the study, the random forest technique provides the highest accuracy (99.75% with precision). The recall value for the risk of diabetes was 0.990%, while the risk of not having diabetes was 0.997%. The F-measure of the diabetes-risk model was 0.995%, while the F-measure of the no-risk model was 0.995%. 0.998%, and the ROC curve was 1.000% for both the diabetes and non-diabetes risks. In the future, the findings can be used to predict diabetes patients. งานวิจัยนี้ได้ประยุกต์ใช้เทคนิคการทำเหมืองข้อมูลเพื่อพยากรณ์ผู้ป่วยโรคเบาหวาน ด้วยเทคนิคเพอร์เซ็ปตรอนแบบหลายชั้น (Multilayer perceptron) เทคนิคนาอีฟ เบย์ (Naïve bayes) เทคนิคโลจิสติก (Logistic Regression) เทคนิคป่าสุ่ม (Random forest) และเทคนิคต้นไม้ตัดสินใจ (Decision Trees) เพื่อสร้างแบบจําลองในการพยากรณ์ผู้ป่วยและนําค่าวัดประสิทธิภาพของการจําแนกประเภทข้อมูลมาเปรียบเทียบ โดยค่าความถูกต้อง (Accuracy) ค่าความแม่นยำ (Precision) ค่าความระลึก (Recall) ค่าความถ่วงดุล (F-measure) และการดูเส้นกราฟ ROC (Receiver operating characteristic; ROC) ที่ให้ค่ามากที่สุด ผลของการวิจัยพบว่า เทคนิคป่าสุ่ม (Random Forest) ให้ค่าความถูกต้องมากที่สุดที่อยู่ที่ 99.75% มีค่าความแม่นยํา (Precision) ในแบบที่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 1.000% และในแบบที่ไม่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 0.997% ที่ค่าความระลึก (Recall) ในแบบที่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 0.990% และในแบบที่ไม่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 1.000% ค่าความถ่วงดุล (F-measure) ในแบบที่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 0.995% และในแบบที่ไม่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 0.998% และการดูเส้นกราฟ ROC ในแบบที่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 1.000% และในแบบที่ไม่มีความเสี่ยงต่อการเกิดโรคเบาหวานเท่ากับ 1.000% สามารถนําผลลัพธ์ที่ได้ไปใช้ในการประกอบการรักษาผู้ป่วยโรคเบาหวานต่อไปในอนาคต |
URI: | http://202.28.34.124/dspace/handle123456789/2140 |
Appears in Collections: | Mahasarakham Business School |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
62010982001.pdf | 2.65 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.