Please use this identifier to cite or link to this item: http://202.28.34.124/dspace/handle123456789/1344
Title: A Hybrid Method for Sentiment Classification of Short Texts
กระบวนการแบบผสมผสานเพื่อการจำแนกความรู้สึกแบบข้อความสั้น
Authors: Sahachai Ngamchaiyaphum
สหชัย งามชัยภูมิ
Jantima Polpinij
จันทิมา พลพินิจ
Mahasarakham University. The Faculty of Informatics
Keywords: การวิเคราะห์ความรู้สึก
บทวิจารณ์
ข้อความสั้น
การประมวลผลภาษาธรรมชาติ
การจำแนกข้อความ
Sentiment analysis
Customer reviews
Short text
Natural language processing
Text classification
Issue Date:  25
Publisher: Mahasarakham University
Abstract: Customer reviews can be represented as short text, i.e. limited in length and usually spanning one sentence or less, but this may pose a challenge for sentiment analysis. When a customer review contains only a few words, this may present difficulty for traditional methods of analysis when dealing with short text classification. This is because a few words in a short text cannot represent the feature space and the relationship between words and documents. As a result, there is tremendous interest in sentiment analysis of customer reviews with short text. This study aims to presents a method for dealing with customer reviews with short text classification. Three weighting schemes and two machine learning algorithms are compared and used for modelling customer review classifiers. After testing by accuracy, recall, precision, and F1, the most satisfactory results are 0.97, 0.98, 0.97, and 0.97 respectively. 
บทวิจารณ์ความคิดเห็นของลูกค้าส่วนใหญ่มีรูปแบบเป็นข้อความสั้น ดังนั้นความยาวของข้อความที่มีอยู่จำกัด เป็นความท้าทายสำหรับการจำแนกบทวิจารณ์ของลูกค้า เพราะจำนวนคำที่แสดงในข้อความมีจำนวนน้อยทำให้ไม่สามารถคัดเลือกคุณลักษณะที่เหมาะสมและมีความหมาย หรือ อาจจะสกัดได้น้อยเกินไปจนยากต่อการสร้างตัวจำแนกความรู้สึกจากข้อความที่มีคุณภาพต่อการใช้งานที่ดีได้ งานวิจัยนี้ได้นำเสนอกระบวนการจำแนกบทวิจารณ์ที่มีลักษณะข้อความสั้น ด้วยการสร้างโมเดลแบบผสมผสานด้วย 3 เทคนิค คือ Support Vector Machine, Naive Bayes และ K nearest neighbor เพื่อเพิ่มประสิทธิภาพ และความแม่นยำในการจำแนกความรู้สึกจากเอกสารของข้อความที่มีข้อความสั้น โดยการวัดประสิทธิภาพด้วย ค่าความถูกต้อง = 0.97 ค่าความแม่นยำ = 0.98 ความความระลึก = 0.97 และ ค่า F-measur = 0.97
Description: Master of Science (M.Sc.)
วิทยาศาสตรมหาบัณฑิต (วท.ม.)
URI: http://202.28.34.124/dspace/handle123456789/1344
Appears in Collections:The Faculty of Informatics

Files in This Item:
File Description SizeFormat 
58011284501.pdf1.6 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.