Please use this identifier to cite or link to this item:
http://202.28.34.124/dspace/handle123456789/1872
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor | Umaporn Chaisoong | en |
dc.contributor | อุมาพร ไชยสูง | th |
dc.contributor.advisor | Chatklaw Jareanpon | en |
dc.contributor.advisor | ฉัตรเกล้า เจริญผล | th |
dc.contributor.other | Mahasarakham University. The Faculty of Informatics | en |
dc.date.accessioned | 2023-01-20T11:37:19Z | - |
dc.date.available | 2023-01-20T11:37:19Z | - |
dc.date.issued | 7/11/2022 | |
dc.identifier.uri | http://202.28.34.124/dspace/handle123456789/1872 | - |
dc.description | Doctor of Philosophy (Ph.D.) | en |
dc.description | ปรัชญาดุษฎีบัณฑิต (ปร.ด.) | th |
dc.description.abstract | Information retrieval (IR) is one of the Natural Language Processing (NLP). The purpose of the research is to develop an association framework of automatic questions and answers resolving the problem of spatial information access of tourists in a case study of the South Northeastern Region, THAILAND. The difficulty of Thai language processing is that the language has no space in a sentence, without punctuation or word separation. Correctly tokenizing or separating words affects precision and accuracy. The efficient data access of the tourists is a challenge of this research. The similarity method called the Cosine Similarity technique is based on the Vector Space Model (VSM) well-known and efficient, by bringing the outstanding points of Text Vectorization to calculate and acquire the crucial features for being the document representatives efficiently. The result in this stage is Bag of Words, in all 19,501 terms, from 1,237 documents. For the evaluation of model effectiveness an Accuracy value of 96%, which best indicates the ability to describe the answer and effectiveness of the model. | en |
dc.description.abstract | การค้นคืนสารสนเทศ (Information Retrieval: IR) เป็นแขนงหนึ่งของการประมวลผลภาษาธรรมชาติ (Natural Language Processing: NLP) วัตถุประสงค์ของการพัฒนากรอบการทำงานหาความสัมพันธ์คำถามคำตอบอัตโนมัติสำหรับท่องเที่ยวชุมชน เพื่อแก้ไขปัญหาการเข้าถึงข้อมูลเชิงพื้นที่ของนักท่องเที่ยวโดยชุมชนอีสานใต้ ถือเป็นความท้าทายของการประมวลผลภาษาไทยและปัญหาของการเขียนภาษาไทย อาทิเช่นการเขียนติดกันโดยไม่มีช่องว่างหรือการแบ่งแยกคำ (Tokenize) ดังนั้นการตัดแบ่งคำที่ถูกต้องจึงส่งผลต่อความแม่นจำและความถูกต้องในการเข้าถึงข้อมูลอย่างมีประสิทธิภาพของนักท่องเที่ยว งานวิจัยในครั้งนี้จึงนำวิธีการวัดความคล้ายคลึง (Cosine Similarity) ทำงานบนฐานของ Vector Space Model (VSM) ที่ใช้กันอย่างแพร่หลาย โดยนำจุดเด่นของ Text Vectorization มาคำนวณเพื่อให้ได้มาซึ่งคุณสมบัติของคำสามารถเป็นตัวแทนเอกสารอย่างมีประสิทธิภาพ ผลการทดลองพบว่า ได้ถุงคำศัพท์ (Bag of Words: BoW) จำนวน 19,501 คำ (Term) จากเอกสารทั้งหมด 1,237 เอกสาร สำหรับการประเมินประสิทธิภาพของแบบจำลองให้ค่าความถูกต้อง (Accuracy) ร้อยละ 99 บอกถึงความสามารถในการอธิบายคำตอบและประสิทธิภาพของแบบจำลองได้อย่างแม่นยำ | th |
dc.language.iso | th | |
dc.publisher | Mahasarakham University | |
dc.rights | Mahasarakham University | |
dc.subject | การค้นคืนเอกสาร | th |
dc.subject | การตัดคำ | th |
dc.subject | TF-IDF | th |
dc.subject | การวัดความคล้ายคลึงแบบโคไซน์ | th |
dc.subject | การประมวลผลภาษาธรรมชาติ | th |
dc.subject | การท่องเที่ยว | th |
dc.subject | Information retrieval | en |
dc.subject | Thai word segmentation | en |
dc.subject | TF-IDF | en |
dc.subject | Cosine similarity | en |
dc.subject | Natural language processing | en |
dc.subject | Tourism | en |
dc.subject.classification | Computer Science | en |
dc.title | Developing an Association Framework of Automatic Question and Answering for Community Tourism | en |
dc.title | การพัฒนากรอบการทำงานหาความสัมพันธ์คำถามคำตอบอัตโนมัติสำหรับท่องเที่ยวชุมชน | th |
dc.type | Thesis | en |
dc.type | วิทยานิพนธ์ | th |
Appears in Collections: | The Faculty of Informatics |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
62011261003.pdf | 3.77 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.