Please use this identifier to cite or link to this item: http://202.28.34.124/dspace/handle123456789/533
Title: Thai Character Detection and Recognition in Billboard
การตรวจจับและรู้จำอักขระภาษาไทยในป้ายโฆษณา
Authors: Kriangsak Rukpukdee
เกรียงศักดิ์  รักภักดี
Phatthanaphong Chompoowises
พัฒนพงษ์ ชมภูวิเศษ
Mahasarakham University. The Faculty of Informatics
Keywords: ข้อมูลความรู้ก่อนหน้า
การตรวจหาพื้นที่ข้อความในภาพ
การแบ่งส่วนข้อความ
การสกัดคุณลักษณะ
การรู้จำตัวอักขระ
Prior Information
Text Localization
Text Segmentation
Feature Extraction
Character Recognition
Issue Date:  21
Publisher: Mahasarakham University
Abstract: The research emphasizes on developing detection methods and Thai character recognition in billboards. The proposed technique consists of 2 main processes 1) Detecting text in images and 2) recognizing detected the detected texts. In the text detection process, this work  applies  Adapted Maximally Stable Extremal Regions (AMSER) and text positioning techniques with prior information that relies on previous learning information to estimate the location of text in images. In addition, an optimization process is carried out to improve the quality of  the text detection process in images.  In text recognition in images, the images obtained from the text detection  and are processed to extract the characters, then the characters are fed to the learning process, in order to obtain the results of text from the character image. This research compares two learning processes, i.e. learning by using distinctive features (Features Based)  and Learning by artificial neural networks (Convolutional neural networks: CNN). The evaluation results demonstrate that detecting texts achieves 86% of accuracy with non-refinement process and 88% with refinement process.  Moreover, text recognition results   82% of accuracy.
งานวิจัยนี้ มุ่งเน้นการพัฒนาวิธีการตรวจจับและการรู้จำอักขระภาษาไทยในป้ายโฆษณา ประกอบไปด้วย 2 กระบวนการหลัก ได้แก่ 1) การตรวจจับข้อความในภาพ งานวิจัยนี้ได้นำเสนอเทคนิค Adapted Maximally Stable Extremal Regions (AMSER) และเทคนิคการระบุตำแหน่งข้อความด้วยข้อมูลความรู้ก่อนหน้า (Prior Information) ที่อาศัยข้อมูลการเรียนรู้ก่อนหน้า เพื่อนำมาใช้ในการประมาณตำแหน่งของข้อความในภาพ และการใช้เทคนิคทางด้านการหาค่าที่เหมาะสมที่สุด (Optimization) มาใช้ในการปรับปรุงคุณภาพของการตรวจจับข้อความในภาพให้ดีขึ้น ซึ่งการวัดความแม่นยำของเทคนิคที่นำเสนอ (Precision) พบว่าวิธีการที่นำเสนอมีอัตราการตรวจจับคิดเป็นร้อยละ 86% และ 88% ตามลำดับ 2) การรู้จำข้อความในภาพ โดยภาพที่ได้จากการตรวจจับข้อความจะถูกนำมาประมวลผลเพื่อทำการแยกตัวอักขระในภาพ จากนั้นอักขระที่ได้จะถูกนำผ่านกระบวนการเรียนรู้ เพื่อให้ได้ผลลัพธ์ที่แสดงออกมาเป็นข้อความจากภาพอักขระ ซึ่งวิจัยนี้ได้มีการเปรียบเทียบกระบวนการเรียนรู้ 2 กระบวนการ ได้แก่ 1) การเรียนรู้โดยการอาศัยคุณลักษณะเด่น (Features Baesed) และ 2) การเรียนรู้ด้วยโครงข่ายประสาทเทียมแบบสังวัตนาการ (Convolutional Neural Networks : CNN) ซึ่งการวัดประสิทธิภาพของกระบวนการ (Accuracy) พบว่าการเรียนรู้ด้วยโครงข่ายประสาทเทียมแบบสังวัตนาการมีประสิทธิภาพมากที่สุดคิดเป็นร้อยละ 82%
Description: Doctor of Philosophy (Ph.D.)
ปรัชญาดุษฎีบัณฑิต (ปร.ด.)
URI: http://202.28.34.124/dspace/handle123456789/533
Appears in Collections:The Faculty of Informatics

Files in This Item:
File Description SizeFormat 
56011260502.pdf6.21 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.