Please use this identifier to cite or link to this item: http://202.28.34.124/dspace/handle123456789/3084
Title: PREDICTION MODELS OF THE SELF-HARM FOR PSYCHIATRIC PATIENTS USING DATA MINING TECHNIQUES
แบบจำลองการพยากรณ์การทำร้ายตนเองของผู้ป่วยจิตเวชด้วยเทคนิคเหมืองข้อมูล
Authors: Sopita Samart
โสภิตา สามารถ
Jaree Thongkam
จารี ทองคำ
Mahasarakham University
Jaree Thongkam
จารี ทองคำ
jaree.thongkam@gmail.com
jaree.thongkam@gmail.com
Keywords: โรคทางจิตเวช
การคัดเลือกปัจจัย
เหมืองข้อมูล
Psychiatric Disease
Feature Selection
Data mining
Issue Date:  14
Publisher: Mahasarakham University
Abstract: The purpose of this research was to study the factors of self-harm attempts among psychiatric patients. and create a model and compare the effectiveness of a self-harm model for psychiatric patients. Data collected from the Khon Kaen Rajanagarindra Psychiatric Hospital database, Khon Kaen Province from January 2019 to December 2021. The data consists of 4,179 records in total and 16 variables. Factor selection using Chi-Square, Gain Ratio and Relief methods were used to show the importance of the factors. Including the Synthetic Minority Oversampling Technique (SMOTE) method were used to make the data more balanced. Naive bayes, C4.5 decision tree, support vector machine, deep learning and partial rule techniques. Were used to create classification models. 10-fold cross validation was used to segment the data into a learning and test sets. The accuracy, sensitivity and specificity values were used to show the performance of the models. The experimental result showed that factors affecting attempts at self-harm among psychiatric patients are psychiatric disease, gender, age, status, occupation, family relationships. drug or substance use, chronic disease, and weight. As for the results of comparing the efficiency of the models before and after factor selection, we found that C4.5 decision tree and support vector machine techniques have the highest accuracy value of 84.66 percent, sensitivity value of 100 percent, Partial rule technique has the highest specificity value of 25.21 percent before using factor selection while. Naive bayes technique has the highest specificity of 17.73 percent after using factor selection. After using SMOTE Naive bayes technique has the highest specific of 63.32 percent by increasing up to 45.59 percent.
งานวิจัยนี้มีวัตถุประสงค์เพื่อศึกษาปัจจัยการพยายามทำร้ายตนเองของผู้ป่วยจิตเวช และสร้างแบบจำลองและเปรียบเทียบประสิทธิภาพแบบจำลองการทำร้ายตนเองของผู้ป่วยจิตเวช ข้อมูลที่ถูกรวบรวมจากฐานข้อมูลโรงพยาบาลจิตเวชขอนแก่นราชนครินทร์ จังหวัดขอนแก่น จากเดือนมกราคม พ.ศ. 2562 ถึง เดือนธันวาคม พ.ศ. 2564 จำนวน 4,179 ระเบียน ประกอบด้วยตัวแปรจำนวน 16 ปัจจัย การคัดเลือกปัจจัยด้วยวิธี  Chi-Square, Gain Ratio และ Relief ได้ถูกนำมาใช้ในการแสดงลำดับความสำคัญของปัจจัย รวมถึงวิธี Synthetic Minority Oversampling Technique (SMOTE) มาทำให้ข้อมูลสมดุลมากขึ้น เทคนิคนาอีฟเบย์, เทคนิคต้นไม้ตัดสินใจ C4.5, เทคนิคสนับสนุนด้วยเครื่อง, เทคนิคการเรียนรู้เชิงลึกและเทคนิคกฎบางส่วน ได้ถูกนำมาใช้ในการสร้างแบบจำลองเพื่อการจำแนก 10-fold cross validation ได้ถูกนำมาใช้โดยการแบ่งกลุ่มข้อมูลเป็นชุดข้อมูลเรียนรู้ และชุดข้อมูลทดสอบ ส่วนค่าความถูกต้อง ค่าความไว และค่าความจำเพาะได้ถูกนำมาใช้ในการแสดงประสิทธิภาพของแบบจำลอง จากการทดลองพบว่า ปัจจัยที่มีผลต่อการพยายามทำร้ายตนเองของผู้ป่วยจิตเวชคือ โรคทางจิตเวช เพศ อายุ สถานภาพ อาชีพ ความสัมพันธ์ในครอบครัว การใช้ยาหรือสารเสพติด โรคเรื้อรัง และน้ำหนัก ส่วนผลการเปรียบเทียบประสิทธิภาพของแบบจำลองก่อนการคัดเลือกปัจจัยพบว่า เทคนิคต้นไม้ตัดสินใจ C4.5 และเทคนิคสนับสนุนด้วยเครื่อง ให้ค่าความถูกต้องมากที่สุดร้อยละ 84.66 และค่าความไวมากที่สุดร้อยละ 100 ขณะที่เทคนิคกฎบางส่วนมีค่าความจำเพาะมากที่สุดร้อยละ 25.21 ก่อนใช้การคัดเลือกตัวประกอบ ส่วนเทคนิคนาอีฟเบย์มีค่าจำเพาะสูงสุดร้อยละ 17.73 หลังใช้การคัดเลือกปัจจัยหลังจากใช้เทคนิค SMOTE เทคนิคนาอีฟเบย์ให้ค่าความจำเพาะมากที่สุดร้อยละ 63.32 สูงขึ้นร้อยละ 45.59
URI: http://202.28.34.124/dspace/handle123456789/3084
Appears in Collections:The Faculty of Informatics

Files in This Item:
File Description SizeFormat 
65011282001.pdf3.7 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.