การจำแนกภาพสลิปโอนเงินและอ่านอักขระด้วยแสง

Main Article Content

ชญานนท์ อิสสอาด
สัจจาภรณ์ ไวจรรยา
ณัฐโชติ พรหมฤทธิ์
มนู มากมณี

บทคัดย่อ

บทความนี้นำเสนอการจำแนกภาพสลิปโอนเงินและการอ่านอักขระด้วยแสง (Optical Character Recognition: OCR) โดยใช้เทคนิคการเรียนรู้แบบอัตโนมัติด้วยการเรียนแบบการทำงานของโครงข่ายประสาทของมนุษย์ ซึ่งใช้สถาปัตยกรรมโครงข่ายประสาทเทียมแบบคอนโวลูชัน (Convolutional Neural Network: CNN) ที่ออกแบบเฉพาะ สำหรับการจำแนกภาพสลิปโอนเงิน โดยประกอบด้วยชั้น Convolutional 2D จำนวน 3 ชั้น ร่วมกับการใช้ Max pooling เพื่อป้องกันการเกิด Overfitting ในการจำแนกภาพสลิปโอนเงิน (Classification) จากนั้นจึงใช้เทคนิคการแบ่งส่วนภาพ (Image segmentation) ด้วย YOLOv5 สำหรับการตรวจสอบชื่อของธนาคาร และใช้เทคนิคการอ่านอักขระด้วยแสงด้วยเทคโนโลยี Tesseract OCR ในการอ่านข้อมูลบนสลิปโอนเงิน ในการทดสอบได้แบ่งชุดข้อมูลแบบสุ่มสำหรับการฝึกฝน (Training set) คิดเป็น 80% และชุดข้อมูลทดสอบ (Test set) 20% โดย 20% ของชุดข้อมูลฝึกฝนถูกใช้เป็นชุดข้อมูลสำหรับตรวจสอบความถูกต้อง (Validation set) แบบจำลองได้รับการฝึกฝนโดยกำหนดค่า Batch size เท่ากับ 32 และกำหนด Epochs จำนวน 50 รอบ พบว่าการจำแนกภาพสลิปโอนเงินที่ดีที่สุดได้ค่าความถูกต้องสูงสุดเท่ากับ 99% หลังจากนั้น นำภาพที่ได้จากการจำแนกมาตรวจหาชื่อของธนาคาร โดยใช้การแบ่งส่วนภาพ ก่อนนำภาพไปอ่านอักขระด้วยแสง และแสดงผลข้อมูลในแบบที่มนุษย์อ่านเข้าใจได้และส่งออกในรูปแบบ JSON

Article Details

รูปแบบการอ้างอิง
อิสสอาด ช., ไวจรรยา ส., พรหมฤทธิ์ ณ., & มากมณี ม. (2025). การจำแนกภาพสลิปโอนเงินและอ่านอักขระด้วยแสง. วารสารวิทยาศาสตร์ลาดกระบัง, 34(2), 1–15. สืบค้น จาก https://li01.tci-thaijo.org/index.php/science_kmitl/article/view/261945
ประเภทบทความ
บทความวิจัย

เอกสารอ้างอิง

Arslnd, Ö., & Uymaz, S. A. (2022). Classification of invoice images by using convolutional neural networks. Journal of Advanced Research in Natural and Applied Sciences, 8(1), 8-25.

Hien, N. N., Thanh, D. N. H., Erkan, U., & Tavares, J. M. R. S. (2022). Image noise removal method based on thresholding and regularization techniques. IEEE Access, 10, 71584-71595. https://doi.org/10.1109/ACCESS.2022.3188315

Iamsamang, W., & Kongkachandra, R. (2013). Automatic Thai handwritten characters segmentation based on linear regression analysis and decision tree learning. Thai Journal of Science and Technology, 2, 167-174. (in Thai)

Lestari, I. N. T., & Mulyana, D. I. (2022). Implementation of OCR (optical character recognition) using Tesseract in detecting character in quotes text images. Journal of Applied Engineering and Technological Science, 4(1), 58-63. https://doi.org/10.37385/jaets.v4i1.905

Memon, J., Sami, M., Khan, R. A., & Uddin, M. (2020). Handwritten optical character recognition (OCR): A comprehensive systematic literature review (SLR). IEEE Access, 8, 142642-142668. https://doi.org/10.1109/ACCESS.2020.3012542

Park, J., Lee, E., Kim, Y., Kang, I., Koo, H. I., & Cho, N. I. (2020). Multi-lingual optical character recognition system using the reinforcement learning of character segmenter. IEEE Xplore, 8, 174437-174446. https://doi.org/10.1109/ACCESS.2020.3025769

Rezkiani, K., Nurtanio, I., & Syafaruddin. (2022). Logo detection using You Only Look Once (YOLO) method. Proceedings of the 2nd International Conference on Electronic and Electrical Engineering and Intelligent System (ICE3IS) (pp. 227-232). IEEE. https://doi.org/10.1109/ICE3IS56585.2022.10010121

Saravanan, C. (2010). Color image to grayscale image conversion. Proceedings of the 2010 Second International Conference on Computer Engineering and Applications (pp. 196-199). IEEE. https://doi.org/10.1109/ICCEA.2010.192

Tanprasert, C., Sinthupinyo, W., Dubey, P., & Tanprasert, T. (1999). Improved mixed Thai & English OCR using two-step neural net classification. NECTEC Technical Journal, 1, 41-46.

Vaidya, M., Rule, P. K., Kumar, H., Jain, A., & Kamble, A. R. (2019). Automating data entry forms for banks using OCR and CNN. International Journal for Applied Sciences and Engineering Technology, 7, 890-893.