Please use this identifier to cite or link to this item: http://202.28.34.124/dspace/handle123456789/1872
Full metadata record
DC FieldValueLanguage
dc.contributorUmaporn Chaisoongen
dc.contributorอุมาพร ไชยสูงth
dc.contributor.advisorChatklaw Jareanponen
dc.contributor.advisorฉัตรเกล้า เจริญผลth
dc.contributor.otherMahasarakham University. The Faculty of Informaticsen
dc.date.accessioned2023-01-20T11:37:19Z-
dc.date.available2023-01-20T11:37:19Z-
dc.date.issued7/11/2022
dc.identifier.urihttp://202.28.34.124/dspace/handle123456789/1872-
dc.descriptionDoctor of Philosophy (Ph.D.)en
dc.descriptionปรัชญาดุษฎีบัณฑิต (ปร.ด.)th
dc.description.abstractInformation retrieval (IR) is one of the Natural Language Processing (NLP). The purpose of the research is to develop an association framework of automatic questions and answers resolving the problem of spatial information access of tourists in a case study of the South Northeastern Region, THAILAND. The difficulty of Thai language processing is that the language has no space in a sentence, without punctuation or word separation. Correctly tokenizing or separating words affects precision and accuracy. The efficient data access of the tourists is a challenge of this research. The similarity method called the Cosine Similarity technique is based on the Vector Space Model (VSM) well-known and efficient, by bringing the outstanding points of Text Vectorization to calculate and acquire the crucial features for being the document representatives efficiently. The result in this stage is Bag of Words, in all 19,501 terms, from 1,237 documents. For the evaluation of model effectiveness an Accuracy value of 96%, which best indicates the ability to describe the answer and effectiveness of the model.en
dc.description.abstractการค้นคืนสารสนเทศ (Information Retrieval: IR) เป็นแขนงหนึ่งของการประมวลผลภาษาธรรมชาติ (Natural Language Processing: NLP) วัตถุประสงค์ของการพัฒนากรอบการทำงานหาความสัมพันธ์คำถามคำตอบอัตโนมัติสำหรับท่องเที่ยวชุมชน เพื่อแก้ไขปัญหาการเข้าถึงข้อมูลเชิงพื้นที่ของนักท่องเที่ยวโดยชุมชนอีสานใต้ ถือเป็นความท้าทายของการประมวลผลภาษาไทยและปัญหาของการเขียนภาษาไทย อาทิเช่นการเขียนติดกันโดยไม่มีช่องว่างหรือการแบ่งแยกคำ (Tokenize) ดังนั้นการตัดแบ่งคำที่ถูกต้องจึงส่งผลต่อความแม่นจำและความถูกต้องในการเข้าถึงข้อมูลอย่างมีประสิทธิภาพของนักท่องเที่ยว งานวิจัยในครั้งนี้จึงนำวิธีการวัดความคล้ายคลึง (Cosine Similarity) ทำงานบนฐานของ Vector Space Model (VSM) ที่ใช้กันอย่างแพร่หลาย โดยนำจุดเด่นของ Text Vectorization มาคำนวณเพื่อให้ได้มาซึ่งคุณสมบัติของคำสามารถเป็นตัวแทนเอกสารอย่างมีประสิทธิภาพ ผลการทดลองพบว่า ได้ถุงคำศัพท์ (Bag of Words: BoW) จำนวน 19,501 คำ (Term) จากเอกสารทั้งหมด 1,237 เอกสาร สำหรับการประเมินประสิทธิภาพของแบบจำลองให้ค่าความถูกต้อง (Accuracy) ร้อยละ 99 บอกถึงความสามารถในการอธิบายคำตอบและประสิทธิภาพของแบบจำลองได้อย่างแม่นยำth
dc.language.isoth
dc.publisherMahasarakham University
dc.rightsMahasarakham University
dc.subjectการค้นคืนเอกสารth
dc.subjectการตัดคำth
dc.subjectTF-IDFth
dc.subjectการวัดความคล้ายคลึงแบบโคไซน์th
dc.subjectการประมวลผลภาษาธรรมชาติth
dc.subjectการท่องเที่ยวth
dc.subjectInformation retrievalen
dc.subjectThai word segmentationen
dc.subjectTF-IDFen
dc.subjectCosine similarityen
dc.subjectNatural language processingen
dc.subjectTourismen
dc.subject.classificationComputer Scienceen
dc.titleDeveloping an Association Framework of Automatic Question and Answering for Community Tourismen
dc.titleการพัฒนากรอบการทำงานหาความสัมพันธ์คำถามคำตอบอัตโนมัติสำหรับท่องเที่ยวชุมชนth
dc.typeThesisen
dc.typeวิทยานิพนธ์th
Appears in Collections:The Faculty of Informatics

Files in This Item:
File Description SizeFormat 
62011261003.pdf3.77 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.