Please use this identifier to cite or link to this item:
http://202.28.34.124/dspace/handle123456789/533
Title: | Thai Character Detection and Recognition in Billboard การตรวจจับและรู้จำอักขระภาษาไทยในป้ายโฆษณา |
Authors: | Kriangsak Rukpukdee เกรียงศักดิ์ รักภักดี Phatthanaphong Chompoowises พัฒนพงษ์ ชมภูวิเศษ Mahasarakham University. The Faculty of Informatics |
Keywords: | ข้อมูลความรู้ก่อนหน้า การตรวจหาพื้นที่ข้อความในภาพ การแบ่งส่วนข้อความ การสกัดคุณลักษณะ การรู้จำตัวอักขระ Prior Information Text Localization Text Segmentation Feature Extraction Character Recognition |
Issue Date: | 21 |
Publisher: | Mahasarakham University |
Abstract: | The research emphasizes on developing detection methods and Thai character recognition in billboards. The proposed technique consists of 2 main processes 1) Detecting text in images and 2) recognizing detected the detected texts. In the text detection process, this work applies Adapted Maximally Stable Extremal Regions (AMSER) and text positioning techniques with prior information that relies on previous learning information to estimate the location of text in images. In addition, an optimization process is carried out to improve the quality of the text detection process in images. In text recognition in images, the images obtained from the text detection and are processed to extract the characters, then the characters are fed to the learning process, in order to obtain the results of text from the character image. This research compares two learning processes, i.e. learning by using distinctive features (Features Based) and Learning by artificial neural networks (Convolutional neural networks: CNN). The evaluation results demonstrate that detecting texts achieves 86% of accuracy with non-refinement process and 88% with refinement process. Moreover, text recognition results 82% of accuracy. งานวิจัยนี้ มุ่งเน้นการพัฒนาวิธีการตรวจจับและการรู้จำอักขระภาษาไทยในป้ายโฆษณา ประกอบไปด้วย 2 กระบวนการหลัก ได้แก่ 1) การตรวจจับข้อความในภาพ งานวิจัยนี้ได้นำเสนอเทคนิค Adapted Maximally Stable Extremal Regions (AMSER) และเทคนิคการระบุตำแหน่งข้อความด้วยข้อมูลความรู้ก่อนหน้า (Prior Information) ที่อาศัยข้อมูลการเรียนรู้ก่อนหน้า เพื่อนำมาใช้ในการประมาณตำแหน่งของข้อความในภาพ และการใช้เทคนิคทางด้านการหาค่าที่เหมาะสมที่สุด (Optimization) มาใช้ในการปรับปรุงคุณภาพของการตรวจจับข้อความในภาพให้ดีขึ้น ซึ่งการวัดความแม่นยำของเทคนิคที่นำเสนอ (Precision) พบว่าวิธีการที่นำเสนอมีอัตราการตรวจจับคิดเป็นร้อยละ 86% และ 88% ตามลำดับ 2) การรู้จำข้อความในภาพ โดยภาพที่ได้จากการตรวจจับข้อความจะถูกนำมาประมวลผลเพื่อทำการแยกตัวอักขระในภาพ จากนั้นอักขระที่ได้จะถูกนำผ่านกระบวนการเรียนรู้ เพื่อให้ได้ผลลัพธ์ที่แสดงออกมาเป็นข้อความจากภาพอักขระ ซึ่งวิจัยนี้ได้มีการเปรียบเทียบกระบวนการเรียนรู้ 2 กระบวนการ ได้แก่ 1) การเรียนรู้โดยการอาศัยคุณลักษณะเด่น (Features Baesed) และ 2) การเรียนรู้ด้วยโครงข่ายประสาทเทียมแบบสังวัตนาการ (Convolutional Neural Networks : CNN) ซึ่งการวัดประสิทธิภาพของกระบวนการ (Accuracy) พบว่าการเรียนรู้ด้วยโครงข่ายประสาทเทียมแบบสังวัตนาการมีประสิทธิภาพมากที่สุดคิดเป็นร้อยละ 82% |
Description: | Doctor of Philosophy (Ph.D.) ปรัชญาดุษฎีบัณฑิต (ปร.ด.) |
URI: | http://202.28.34.124/dspace/handle123456789/533 |
Appears in Collections: | The Faculty of Informatics |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
56011260502.pdf | 6.21 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.