Please use this identifier to cite or link to this item:
http://202.28.34.124/dspace/handle123456789/3069| Title: | A Method of identifying Treatment Modalities Related to COVID-19 From PubMed Abstracts การสกัดสารสนเทศที่สำคัญจากเอกสารทางการแพทย์ที่เกี่ยวข้องกับโรคโควิด-19 |
| Authors: | Pornpavit Donsena พรภวิษย์ ดอนเสนา Jantima Polpinij จันทิมา พลพินิจ Mahasarakham University Jantima Polpinij จันทิมา พลพินิจ Jantima.p@msu.ac.th Jantima.p@msu.ac.th |
| Keywords: | COVID-19 PubMed การสกัดข้อมูล การเรียนรู้เชิงลึก การจำแนกเอกสาร COVID-19 PubMed Information Extraction Deep Learning Text Classification |
| Issue Date: | 25 |
| Publisher: | Mahasarakham University |
| Abstract: | The COVID-19 pandemic has posed significant global public health challenges, leading to the widespread dissemination of medical information on treatment methods and disease management. To assist healthcare professionals and researchers in efficiently accessing relevant and critical information, this study focuses on developing a deep learning model capable of extracting sentences related to COVID-19 treatment from research abstracts published in the PubMed database. A Convolutional Neural Network (CNN) was employed as the primary tool for data processing. The dataset for this study consisted of 400 abstracts from PubMed, divided into 300 documents for training and 100 documents for testing. The developed CNN model utilized two types of activation functions: tanh and Sigmoid. Data processing involved steps such as tokenization, stop-word removal, lower case conversion, and stemming. The processed data was transformed into vectors using Word2Vec and subsequently fed into the CNN model to create a sentence filter capable of accurately identifying sentences related to COVID-19 treatment. Experimental results demonstrated that the model using the Sigmoid activation function outperformed the one using tanh, achieving an average ROUGE-1 score of 70% and a ROUGE-L score of 65%, compared to 65% and 60% for the tanh model, respectively. The selection of suitable activation functions and appropriate data processing techniques were found to be crucial factors influencing the model’s performance. การแพร่ระบาดของโรคโควิด-19 ได้สร้างความท้าทายทางสาธารณสุขในระดับโลก ทำให้มีการเผยแพร่ข้อมูลทางการแพทย์จำนวนมากเกี่ยวกับวิธีการรักษาและการจัดการกับโรคนี้ เพื่อช่วยให้แพทย์และนักวิจัยสามารถเข้าถึงข้อมูลที่สำคัญและเกี่ยวข้องได้อย่างมีประสิทธิภาพ งานวิจัยนี้จึงมุ่งเน้นไปที่การพัฒนาโมเดลการเรียนรู้เชิงลึกที่สามารถสกัดประโยคที่เกี่ยวข้องกับการรักษาโรคโควิด-19 จากบทคัดย่อของงานวิจัยที่ตีพิมพ์ในฐานข้อมูล PubMed โดยใช้โครงข่ายประสาทแบบคอนโวลูชัน (Convolutional Neural Network: CNN) เป็นเครื่องมือในการประมวลผลข้อมูล ชุดข้อมูลที่ใช้ในการศึกษาครั้งนี้ประกอบด้วยบทคัดย่อจาก PubMed จำนวน 400 เอกสาร ซึ่งแบ่งเป็น 300 เอกสารสำหรับฝึกอบรมโมเดล และ 100 เอกสารสำหรับทดสอบ โมเดล CNN ที่พัฒนาขึ้นใช้ Activation Function สองแบบ คือ tanh และ Sigmoid การประมวลผลข้อมูลประกอบด้วยการเตรียมข้อมูลผ่านการตัดคำ การกำจัดคำหยุด การแปลงตัวอักษรเป็นตัวพิมพ์เล็ก และการทำสเต็มมิ่ง ผลลัพธ์จากการเตรียมข้อมูลถูกแปลงเป็นเวกเตอร์โดยใช้ Word2Vec และนำเข้าสู่โมเดล CNN เพื่อสร้างตัวกรองประโยคที่สามารถจำแนกประโยคที่เกี่ยวข้องกับการรักษาโรค COVID-19 ได้อย่างแม่นยำ ผลการทดลองแสดงให้เห็นว่าโมเดลที่ใช้ Activation Function แบบ Sigmoid สามารถสกัดประโยคที่เกี่ยวข้องกับการรักษาได้มีประสิทธิภาพดีกว่า โดยได้ค่า ROUGE-1 เฉลี่ย 70% และ ROUGE-L เฉลี่ย 65% เมื่อเปรียบเทียบกับโมเดลที่ใช้ tanh ซึ่งได้ค่า ROUGE-1 เฉลี่ย 65% และ ROUGE-L เฉลี่ย 60% การเลือกใช้ Activation Function และการประมวลผลข้อมูลที่เหมาะสมเป็นสิ่งสำคัญที่ส่งผลต่อประสิทธิภาพของโมเดล |
| URI: | http://202.28.34.124/dspace/handle123456789/3069 |
| Appears in Collections: | The Faculty of Informatics |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| 64011253005.pdf | 2.26 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.