Please use this identifier to cite or link to this item: http://202.28.34.124/dspace/handle123456789/2656
Full metadata record
DC FieldValueLanguage
dc.contributorChaiyarn Sukmunen
dc.contributorชัยยันต์ สุขหมั่นth
dc.contributor.advisorSupawadee Wichitchanen
dc.contributor.advisorสุภาวดี วิชิตชาญth
dc.contributor.otherMahasarakham Universityen
dc.date.accessioned2025-05-07T10:20:14Z-
dc.date.available2025-05-07T10:20:14Z-
dc.date.created2023
dc.date.issued21/12/2023
dc.identifier.urihttp://202.28.34.124/dspace/handle123456789/2656-
dc.description.abstractThis research focuses on evaluating the effectiveness of the Decision Tree Algorithm in classifying risk level of breast cancer, as well as investigating the associated risk factors. The study employs medical record data from breast mass patients at Faculty of Medicine, Mahasarakham University, spanning 2010 to 2022. The dataset, post-cleansing, comprises 1,524 records, with 1,343 representing low-risk breast cancer patients and 181 representing high-risk cases. The study indicates that the Decision Tree Algorithms, specifically C4.5, C5.0, and Random Forest, exhibit substantial classification accuracy. However, their area under the ROC curve (AUC) values are relatively low due to insufficient class separation, which stems from class imbalance. The research tackles this issue by employing oversampling to augment the minority class instances and undersampling to reduce the majority class instances. Various data-splitting techniques were also explored. The outcomes reveal that both C4.5 and C5.0 Decision Trees yield comparable results, while Random Forest demonstrates a superior AUC, higher than C4.5 and C5.0. The top 5 factors affecting the classification of breast cancer are body mass index, age group, chief complaint, symmetry and mass or cyst, respectively.en
dc.description.abstractงานวิจัยนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของอัลกอริทึมต้นไม้ตัดสินใจ (decision tree algorithm) ในการจำแนกประเภท (classification) โรคมะเร็งเต้านม (breast cancer) และศึกษาปัจจัยเสี่ยงที่ทำให้เกิดโรคมะเร็งเต้านม ผู้วิจัยได้ใช้ข้อมูลเวชระเบียนของผู้ป่วยที่มีก้อนเนื้อบริเวณเต้านม จากคณะแพทยศาสตร์ มหาวิทยาลัยมหาสารคาม ระหว่างปี พ.ศ. 2553 ถึง พ.ศ. 2565 จากการทำความสะอาดข้อมูลเหลือข้อมูลทั้งหมด 1,524 ระเบียน ซึ่งมีข้อมูลผู้ป่วยที่มีความเสี่ยงต่ำในการเป็นโรคมะเร็งเต้านม จำนวน 1,343 ระเบียน และข้อมูลผู้ป่วยที่มีความเสี่ยงสูงในการเป็นโรคมะเร็งเต้านมจำนวน 181 ระเบียน จากผลการศึกษาพบว่า อัลกอริทึมต้นไม้ตัดสินใจ C4.5, C5.0 และวิธี Random forest ให้ค่าความถูกต้อง (accuracy) ค่อนข้างสูง แต่ค่าเกณฑ์ในการทำนาย AUC (area under ROC curve) ค่อนข้างต่ำ เนื่องจากการทำนายโมเดลไม่สามารถแยกกลุ่ม (class) ได้ดีพอ ซึ่งพบว่าข้อมูลที่ใช้ในการจำแนกคลาสมีจำนวนของคลาสมากน้อยไม่เท่ากัน (class imbalance) เพื่อแก้ปัญหาข้อมูลไม่สมดุลในงานวิจัยนี้ใช้วิธีการสุ่มเกิน (oversampling) เพื่อเพิ่มจำนวนตัวอย่างในคลาสที่น้อยเพื่อทำให้จำนวนตัวอย่างในทุกคลาสเท่ากันหรือใกล้เคียงกัน และวิธีการสุ่มลด (undersampling) ลดตัวอย่างในคลาสที่มีจำนวนมากลงเพื่อทำให้จำนวนตัวอย่างในทุกคลาสเท่ากันหรือใกล้เคียงกัน รวมทั้งการแบ่งข้อมูล (split data) แบบต่าง ๆ พบว่าอัลกอริทึมต้นไม้ตัดสินใจ C4.5 และ C5.0 ให้ผลลัพธ์ไม่ต่างจากเดิมและผลลัพธ์ที่ได้ไม่ต่างกันมากนัก ส่วนวิธี Random forest ให้ค่า AUC ที่ดีขึ้นเมื่อเปรียบเทียบกับอัลกอริทึมต้นไม้ตัดสินใจ C4.5 และ C5.0 ซึ่งปัจจัยที่ส่งผลในการจำแนกโรคมะเร็งเต้านม 5 อันดับแรก ได้แก่ ดัชนีมวลกาย, กลุ่มอายุ, อาการที่นำมาพบแพทย์, ความสมมาตรของเต้านมสองข้าง และก้อนหรือถุงน้ำ ตามลำดับth
dc.language.isoth
dc.publisherMahasarakham University
dc.rightsMahasarakham University
dc.subjectมะเร็งเต้านมth
dc.subjectต้นไม้ตัดสินใจth
dc.subjectข้อมูลไม่สมดุลth
dc.subjectBreast canceren
dc.subjectDecision Treeen
dc.subjectClass-Imbalanceen
dc.subject.classificationMathematicsen
dc.subject.classificationComputer Scienceen
dc.subject.classificationDecision Sciencesen
dc.subject.classificationMining and quarryingen
dc.titleClassification of People at Risk for Breast Cancer Using  Decision Tree Algorithm, Case Study: Suddhavej Hospital Mahasarakham Universityen
dc.titleการจำแนกผู้ที่มีความเสี่ยงในการเป็นโรคมะเร็งเต้านมด้วยอัลกอริทึมต้นไม้ตัดสินใจ กรณีศึกษา: โรงพยาบาลสุทธาเวช มหาวิทยาลัยมหาสารคามth
dc.typeThesisen
dc.typeวิทยานิพนธ์th
dc.contributor.coadvisorSupawadee Wichitchanen
dc.contributor.coadvisorสุภาวดี วิชิตชาญth
dc.contributor.emailadvisorsupawadee.wi@msu.ac.th
dc.contributor.emailcoadvisorsupawadee.wi@msu.ac.th
dc.description.degreenameMaster of Science (M.Sc.)en
dc.description.degreenameวิทยาศาสตรมหาบัณฑิต (วท.ม.)th
dc.description.degreelevelMaster's Degreeen
dc.description.degreelevelปริญญาโทth
dc.description.degreedisciplineDepartment of Mathematicsen
dc.description.degreedisciplineภาควิชาคณิตศาสตร์th
Appears in Collections:The Faculty of Science

Files in This Item:
File Description SizeFormat 
63010257003.pdf5.49 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.