Please use this identifier to cite or link to this item:
http://202.28.34.124/dspace/handle123456789/1344
Title: | A Hybrid Method for Sentiment Classification of Short Texts กระบวนการแบบผสมผสานเพื่อการจำแนกความรู้สึกแบบข้อความสั้น |
Authors: | Sahachai Ngamchaiyaphum สหชัย งามชัยภูมิ Jantima Polpinij จันทิมา พลพินิจ Mahasarakham University. The Faculty of Informatics |
Keywords: | การวิเคราะห์ความรู้สึก บทวิจารณ์ ข้อความสั้น การประมวลผลภาษาธรรมชาติ การจำแนกข้อความ Sentiment analysis Customer reviews Short text Natural language processing Text classification |
Issue Date: | 25 |
Publisher: | Mahasarakham University |
Abstract: | Customer reviews can be represented as short text, i.e. limited in length and usually spanning one sentence or less, but this may pose a challenge for sentiment analysis. When a customer review contains only a few words, this may present difficulty for traditional methods of analysis when dealing with short text classification. This is because a few words in a short text cannot represent the feature space and the relationship between words and documents. As a result, there is tremendous interest in sentiment analysis of customer reviews with short text. This study aims to presents a method for dealing with customer reviews with short text classification. Three weighting schemes and two machine learning algorithms are compared and used for modelling customer review classifiers. After testing by accuracy, recall, precision, and F1, the most satisfactory results are 0.97, 0.98, 0.97, and 0.97 respectively. บทวิจารณ์ความคิดเห็นของลูกค้าส่วนใหญ่มีรูปแบบเป็นข้อความสั้น ดังนั้นความยาวของข้อความที่มีอยู่จำกัด เป็นความท้าทายสำหรับการจำแนกบทวิจารณ์ของลูกค้า เพราะจำนวนคำที่แสดงในข้อความมีจำนวนน้อยทำให้ไม่สามารถคัดเลือกคุณลักษณะที่เหมาะสมและมีความหมาย หรือ อาจจะสกัดได้น้อยเกินไปจนยากต่อการสร้างตัวจำแนกความรู้สึกจากข้อความที่มีคุณภาพต่อการใช้งานที่ดีได้ งานวิจัยนี้ได้นำเสนอกระบวนการจำแนกบทวิจารณ์ที่มีลักษณะข้อความสั้น ด้วยการสร้างโมเดลแบบผสมผสานด้วย 3 เทคนิค คือ Support Vector Machine, Naive Bayes และ K nearest neighbor เพื่อเพิ่มประสิทธิภาพ และความแม่นยำในการจำแนกความรู้สึกจากเอกสารของข้อความที่มีข้อความสั้น โดยการวัดประสิทธิภาพด้วย ค่าความถูกต้อง = 0.97 ค่าความแม่นยำ = 0.98 ความความระลึก = 0.97 และ ค่า F-measur = 0.97 |
Description: | Master of Science (M.Sc.) วิทยาศาสตรมหาบัณฑิต (วท.ม.) |
URI: | http://202.28.34.124/dspace/handle123456789/1344 |
Appears in Collections: | The Faculty of Informatics |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
58011284501.pdf | 1.6 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.