Please use this identifier to cite or link to this item: http://202.28.34.124/dspace/handle123456789/1213
Title: Opinion Analysis on PUBG Mobile Game Using Text Mining
การวิเคราะห์ความคิดเห็นต่อเกมมือถือผับจีด้วยเหมืองข้อความ
Authors: Wossawat Inplang
วสวัตติ์ อินทร์แปลง
Jaree Thongkam
จารี ทองคำ
Mahasarakham University. The Faculty of Informatics
Keywords: เหมืองข้อความ
ความคิดเห็น
เกมมือถือ
Text mining
Opinion
Mobile game
Issue Date:  12
Publisher: Mahasarakham University
Abstract: Text mining is a one of the most effective data analysis process by using alphabetically method. Currently, text mining techniques are used to classify a variety of ways. This research aims to fine the most effectiveness techniques from 4 techniques including Naïve Bayes, Support Vector Machine (SVM), K-Nearest Neighbor and C4.5. The data collected were all made by the viewers, in total of 3,798 messages. The categorization process has divided the data into 2 groups: positive character and negative character. Interestingly, the process has only indicated to selects adverbs and slangs as a core division to produce positive and negative characters. After analyzing the data, to problems were found class imbalanced. SMOTE were used to filtering and increase the minority class. 10-fold cross validation is applied to segment the data into training and testing sets. Moreover, accuracy sensitivity and specificity are used as the criteria for selecting the most effective model. The results presented the Support Vector Machine produce the most accuracy in categorizing the messages with accuracy of 99.65% sensitivity of 99.30% and specificity score of 100%
เหมืองข้อความเป็นกระบวนการวิเคราะห์ข้อมูลตัวอักษรเพื่อสกัดข้อมูลที่เป็นประโยชน์จากแหล่งข้อมูล ปัจจุบันเทคนิคในการจำแนกเหมืองข้อความมีหลายวิธี งานวิจัยนี้มีวัตถุประสงค์เพื่อค้นหาเทคนิคการจำแนก จาก 4 เทคนิคที่มีประสิทธิภาพ คือ เทคนิค Naïve Bayes เทคนิค Support Vector Machine (SVM) เทคนิค K-Nearest Neighbor  และเทคนิค C4.5  โดยเก็บรวบรวมข้อมูลความคิดเห็นต่อเกมมือถือผับจีจำนวน 3,798 ข้อความ ในกระบวนการคัดเลือกคำบ่งชี้เพื่อใช้ในการแยกคุณลักษณะได้เลือกใช้คำวิเศษณ์ และคำสแลงบางคำที่ความหมายของคำเป็นคำวิเศษณ์เพื่อทำการแยกคุณลักษณะเชิงบวกและเชิงลบ ผลการศึกษาพบว่ามีความไม่สมดุลของคลาสในข้อมูล โดยมีจำนวนคลาสหนึ่งมากกว่าอีกคลาสหนึ่งเป็นจำนวนมาก ผู้วิจัยจึงได้ทำการแก้ปัญหาโดยการปรับความสมดุลของข้อมูลด้วยวิธี SMOTE (Synthetic Minority Over-sampling Technique)  และใช้หลักการ 10-fold cross validation ในการแบ่งกลุ่มข้อมูลเป็นชุดข้อมูลเรียนรู้และชุดข้อมูลทดสอบ และวัดประสิทธิภาพการจำแนกของแบบจำลองด้วยค่าความถูกต้อง (Accuracy) ค่าความไว (Sensitivity) และค่าความจำเพาะ (Specificity) เมื่อทำการทดสอบและวัดประสิทธิภาพของโมเดลพบว่า เทคนิค Support Vector Machine ให้ผลดีที่สุดในการวิเคราะห์ความคิดเห็น โดยให้ค่าความถูกต้อง 99.65% ค่าความไว 99.30% และค่าความจำเพาะ 100% 
Description: Master of Science (M.Sc.)
วิทยาศาสตรมหาบัณฑิต (วท.ม.)
URI: http://202.28.34.124/dspace/handle123456789/1213
Appears in Collections:The Faculty of Informatics

Files in This Item:
File Description SizeFormat 
61011284503.pdf1.33 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.