Please use this identifier to cite or link to this item: http://202.28.34.124/dspace/handle123456789/2403
Full metadata record
DC FieldValueLanguage
dc.contributorPanithan Mekkamolen
dc.contributorปณิธาน เมฆกมลth
dc.contributor.advisorChatklaw Jareanponen
dc.contributor.advisorฉัตรเกล้า เจริญผลth
dc.contributor.otherMahasarakham Universityen
dc.date.accessioned2023-12-20T14:36:55Z-
dc.date.available2023-12-20T14:36:55Z-
dc.date.created2021
dc.date.issued26/6/2021
dc.identifier.urihttp://202.28.34.124/dspace/handle123456789/2403-
dc.description.abstractThis research aims to develop the clustering algorithm that the different domain can group using the domain similarity. This research tries to find to method that the document can classify to the previous domain or crate the new domain, and solves the problem of K-means. This problem is coming from the distance measurement of similarity from the new document to the centroid of each group. The new document will classify to the group that the relationship between groups and new document possibly are analogous or divergent. This experiment observes the proper group numbers using the Elbow before starting the process. After this process, the Threshold value will be calculated from the centroid of the document in the group and percentile. The new document will compare with the Threshold and decision to set to the group or create the new document. This research compares the performance of the weight between the TF-IDF and BM25. These results show that the best performance is came from the BM25, Euclidean distance and 80-85 percentile. The result of this research is more accuracy than the previous research.en
dc.description.abstractงานวิจัยนี้มีเป้าหมายเพื่อพัฒนาขั้นตอนวิธีจัดกลุ่มของเอกสารโดเมนที่แตกต่างกันตามความคล้ายคลึงกันของโดเมน เพื่อหาวิธีที่บ่งบอกได้เอกสารนั้นควรจะอยู่รวมในโดเมนหรือควรจะแยกเป็นกลุ่มของโดเมนใหม่ และแก้ปัญหาการจัดกลุ่มของขั้นตอนวิธี K-Means ที่จะทำการวัดความคล้ายคลึงของข้อมูลเมื่อพบว่าข้อมูลนั้นใกล้จุดศูนย์กลางของกลุ่มใด ข้อมูลจะถูกจัดให้อยู่ในกลุ่มนั้นเช่นเดียวกับข้อมูลที่มีค่าปกติ ซึ่งข้อมูลนั้นอาจจะมีความเกี่ยวข้องกับข้อมูลที่อยู่ในกลุ่มน้อยมากหรือไม่มีความเกี่ยวข้องเลยก็ได้ ในการทดลองนี้จะดูจำนวนกลุ่มที่เหมาะสมก่อนกำหนดจำนวนกลุ่มด้วยวิธี Elbow เมื่อจัดกลุ่มเอกสารแล้ว จะคำนวณหาระยะทางของเอกสารแต่ละตัวกับจุดศูนย์กลางเพื่อคำนวณหาค่า Threshold ของกลุ่ม เมื่อเอกสารใหม่เข้าไปจะคำนวณระยะห่างจากจุดศูนย์กลางแต่ละกลุ่มถ้าใกล้กลุ่มใดมากที่สุด จะนำระยะทางไปเปรียบเทียบกับค่า Threshold ของกลุ่มนั้น ผู้วิจัยนำเสนอการหาค่า Threshold ที่เหมาะสมโดยการหาระยะทางจากจุดศูนย์กลางของเอกสารในแต่ละกลุ่มแล้วหาตำแหน่งเปอเซนไทร์ของข้อมูลในกลุ่มนั้น ผู้วิจัยได้เปรียบเทียบประสิทธิภาพของการให้ค่าน้ำหนักของคุณลักษณะพบว่า TF-IDF ให้ผลลัพธ์ที่ดีกว่า BM25 การวัดความคล้ายคลึงของเอกสารที่ใช้ในขั้นตอนวิธีที่นำเสนอพบว่า Euclidean Distance ให้ผลลัพธ์ดีที่สุดเมื่อเปรียบเทียบกับวิธีอื่น ๆ  ขั้นตอนวิธีที่ผู้วิจัยนำเสนอนั้นสามารถแยกเอกสารออกจากกลุ่มได้และเมื่อส่งเอกสารกลุ่มเดิมเข้าไปทดสอบสามารถจัดเอกสารเข้ากลุ่มเดิมได้ โดยกำหนดตำแหน่งเปอเซนไทล์ที่ 80 - 85 ซึ่งขั้นตอนวิธีและการกำหนดค่า Threshold ในงานวิจัยนี้มีประสิทธิภาพกว่างานวิจัยก่อนหน้าth
dc.language.isoth
dc.publisherMahasarakham University
dc.rightsMahasarakham University
dc.subjectการจัดกลุ่มเอกสารth
dc.subjectการตรวจหาค่าผิดปกติth
dc.subjectขั้นตอนวิธี Cth
dc.subjectdocument clusteringen
dc.subjectoutlier detectionen
dc.subjectC algorithmen
dc.subject.classificationComputer Scienceen
dc.subject.classificationMining and quarryingen
dc.titleSentiment Analysis by Automatic Domain Clusteringen
dc.titleการวิเคราะห์ความรู้สึกด้วยวิธีการจัดกลุ่มโดเมนแบบอัตโนมัติth
dc.typeThesisen
dc.typeวิทยานิพนธ์th
dc.contributor.coadvisorChatklaw Jareanponen
dc.contributor.coadvisorฉัตรเกล้า เจริญผลth
dc.contributor.emailadvisorchatklaw.j@msu.ac.th
dc.contributor.emailcoadvisorchatklaw.j@msu.ac.th
dc.description.degreenameDoctor of Philosophy (Ph.D.)en
dc.description.degreenameปรัชญาดุษฎีบัณฑิต (ปร.ด.)th
dc.description.degreelevelDoctoral Degreeen
dc.description.degreelevelปริญญาเอกth
dc.description.degreedisciplineสาขาวิทยาการคอมพิวเตอร์en
dc.description.degreedisciplineสาขาวิทยาการคอมพิวเตอร์th
Appears in Collections:The Faculty of Informatics

Files in This Item:
File Description SizeFormat 
58011260501.pdf4.02 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.