Please use this identifier to cite or link to this item:
http://202.28.34.124/dspace/handle123456789/2408
Title: | Data Mining Approaches for Loan Decision of a Bank การใช้เหมืองข้อมูลสำหรับพิจารณาการให้สินเชื่อสำหรับธนาคาร |
Authors: | Kuannabha Pimcharee ขวัญนภา พิมพ์ชารีย์ Olarik Surinta โอฬาริก สุรินต๊ะ Mahasarakham University Olarik Surinta โอฬาริก สุรินต๊ะ olarik.s@msu.ac.th olarik.s@msu.ac.th |
Keywords: | ซัพพอร์ตเวกเตอร์แมชชีน แบบจำลองโครงข่ายประสาทเทียมแบบหลายชั้น ต้นไม้ตัดสินใจ การคัดเลือกคุณลักษณะ Multi-Layer Perceptron Support Vector Machine Decision tree Feature selection Chi-square Information Gain Personal Loan Approval |
Issue Date: | 12 |
Publisher: | Mahasarakham University |
Abstract: | The approval of a bank's credit to an individual requires several factors to be considered, such as bank credit policy, loan amount, the purpose of the loan, ability to pay a debt, asset capital loan applicant's deposit. However, every type of credit is subject to the risk of non-repayment and non-performing loans (NLPs), which affect the liquidity of the banking operation. Therefore, good credit management aids decrease the risk of incurring debt. In this research, we studied the application of data mining techniques to identify key factors for the loan decision of a bank. We considered the 14 factors from 1,000 load applicants collected from the people who submitted the loan application to the bank. The main objective is to compare the data mining process of personal loan approval with and without feature selection techniques. The feature selection techniques including, Chi-square and information gain. In the evaluation process, we performed three models with K-fold cross-validation using k=10. For the experiments, we first created the data mining models using three methods, including support vector machine (SVM), multi-layer perceptron (MLP), and decision tree. The results showed that the SVM method outperformed other data mining models. The accuracy of the SVM method was obtained at 97.12%. Second, we experimented with feature selection techniques consisting of Chi-square and information gain. The Chi-square considered the ten factors, while information gain selected the best three factors. The experimental result showed that the Chi-square and information gain combined with the MLP method obtained an accuracy of 90.40% and 91.70%, respectively. Therefore, we concluded that the SVM classifier without combining the feature selection method was the best method to approve the personal loan. การพิจารณาเพื่ออนุมัติสินเชื่อของธนาคารให้แก่บุคคลต้องอาศัยปัจจัยประกอบการพิจารณา ได้แก่ นโยบายการให้สินเชื่อของธนาคาร วงเงินที่ขอกู้ วัตถุประสงค์ในการขอกู้ ความสามารถในการชำระหนี้ เงินทุนสินทรัพย์ และเงินฝากของผู้ขอสินเชื่อ เป็นต้น ทั้งนี้ การให้สินเชื่อทุกประเภทย่อมมีความเสี่ยงจากการที่ไม่ได้รับชำระเงินคืน และเกิดหนี้ที่ไม่ก่อรายได้ (Non-Performing Load: NPLs) ซึ่งส่งผลกระทบต่อสภาพคล่องในการดำเนินงานของธนาคาร ดังนั้น การบริหารสินเชื่อที่ดีมีส่วนช่วยลดความเสี่ยงในการเกิดหนี้ค้างชำระ งานวิจัยฉบับนี้ได้ศึกษาการนำเทคนิคเหมืองข้อมูลมาใช้เพื่อระบุปัจจัยสำคัญในการพิจารณาสินเชื่อ โดยพิจารณาจากข้อมูลผู้ที่ยื่นสินเชื่อโครงการธนาคารประชาชนจำนวน 14 ปัจจัย จากข้อมูลผู้ยื่นสินเชื่อทั้งหมด 1,000 ตัวอย่าง โดยมีวัตถุประสงค์เพื่อเปรียบเทียบกระบวนการอนุมัติสินเชื่อของธนาคารโดยไม่ใช้วิธีการคัดเลือกคุณลักษณะ และใช้วิธีการคัดเลือกคุณลักษณะ ซึ่งประกอบด้วยวิธี Chi-Square และวิธี Information Gain จากนั้นนำข้อมูลที่ได้ไปสร้างโมเดลด้วยวิธีซัพพอร์ทเว็กเตอร์แมชชีน (Support Vector Machine: SVM) โครงข่ายประสาทเทียมแบบหลายชั้น (Multi-Layer Perceptron: MLP) และต้นไม้ตัดสินใจ (Decision Tree) เพื่อใช้สำหรับพิจารณาการได้สินเชื่อของธนาคาร ในการทดสอบได้เลือกใช้วิธี K-Fold Cross-Validation โดยกำหนดให้ K มีค่าเท่ากับ 10 จากการทดลอง โดยไม่ใช้วิธีการคัดเลือกคุณลักษณะ พบว่าวิธีซัพพอร์ทเว็กเตอร์แมชชีนมีความถูกต้องสูงที่สุดที่ 97.12% จากนั้นทดสอบด้วยวิธีการคัดเลือกคุณลักษณะพิเศษ พบว่าวิธี Chi-Square คัดเลือกคุณลักษณะพิเศษจำนวนทั้งสิ้น 10 คุณลักษณะ และวิธี Information Gain คัดเลือกคุณลักษณะพิเศษจำนวนเพียง 3 คุณลักษณะ จากนั้นได้นำข้อมูลไปสร้างโมเดลด้วยวิธีซัพพอร์ทเว็กเตอร์แมชชีน โครงข่ายประสาทเทียมแบบหลายชั้น และต้นไม้ตัดสินใจ จากการทดลองพบกว่าวิธี Chi-Square ร่วมกับวิธีโครงข่ายประสาทเทียมแบบหลายชั้นมีความถูกต้อง 90.40% และวิธี Information Gain ร่วมกับวิธีโครงข่ายประสาทเทียมแบบหลายชั้นมีความถูกต้อง 91.70% จากการทดลองจึงสรุปได้ว่า การพิจารณาเพื่ออนุมัติสินเชื่อของธนาคารด้วยวิธีซัพพอร์ทเว็กเตอร์แมชชีนมีความถูกต้องสูงที่สุด และไม่จำเป็นต้องใช้กระบวนการคัดเลือกคุณลักษณะพิเศษ |
URI: | http://202.28.34.124/dspace/handle123456789/2408 |
Appears in Collections: | The Faculty of Informatics |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
61011284502.pdf | 1.51 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.