การทดสอบการสืบค้นข้อมูลข้อความภาษาไทยระหว่างการประมวลผลข้อความตามมาตรวัดความคล้ายคลึงเชิงความหมายด้วยขั้นตอนวิธีเชิงพันธุกรรมและการเข้าถึงข้อมูลด้วยภาษาแบบสอบถามข้อมูลอย่างมีโครงสร้าง
Main Article Content
บทคัดย่อ
ระบบสืบค้นข้อมูลด้วยคำค้นหาถูกใช้งานในด้านต่างๆ เช่น การสืบค้นข้อมูลคำถามหรือคำตอบที่ลูกค้าถามบ่อย การสืบค้นข้อมูลที่เกี่ยวข้องกับสินค้าหรือบริการ เป็นต้น ระบบสืบค้นข้อมูลในระบบต่างๆ ส่วนใหญ่ใช้การเข้าถึงข้อมูลด้วยภาษาแบบสอบถามข้อมูลอย่างมีโครงสร้าง ซึ่งการสืบค้นข้อมูลที่เป็นข้อความภาษาไทยด้วยการเข้าถึงข้อมูลด้วยภาษาแบบสอบถามข้อมูลอย่างมีโครงสร้างพบปัญหาการนำส่งข้อมูลยังไม่เหมาะสม ยังไม่ได้ข้อมูลที่ตรง และยังไม่ใกล้เคียงกับข้อมูลที่ผู้ใช้งานต้องการ บทความนี้มีจุดมุ่งหมายในการเสนอการทดสอบการสืบค้นข้อมูลข้อความภาษาไทยระหว่างการประมวลผลข้อความตามมาตรวัดความคล้ายคลึงเชิงความหมายด้วยขั้นตอนวิธีเชิงพันธุกรรมและการเข้าถึงข้อมูลด้วยภาษาแบบสอบถามข้อมูลอย่างมีโครงสร้าง สำหรับเป็นแนวทางการสืบค้นข้อมูลข้อความ[1]ภาษาไทยด้วยการประมวลผลข้อความตามมาตรวัดความคล้ายคลึงเชิงความหมายด้วยขั้นตอนวิธีเชิงพันธุกรรมที่นักพัฒนาโปรแกรมสามารถนำไปใช้สำหรับอ้างอิงในการพัฒนาการสืบค้นข้อมูลให้มีประสิทธิภาพสูงขึ้นได้
การศึกษานี้เป็นการวิจัยแบบผสานวิธีมีลักษณะการผสานกันระหว่างการวิจัยเชิงคุณภาพและการวิจัยเชิงปริมาณด้วยวิธีการวิจัยเอกสาร และการวิจัยเชิงทดลอง โดยการพัฒนาโปรแกรมทดสอบการสืบค้นข้อมูลข้อความภาษาไทยด้วยการประมวลผลข้อความตามมาตรวัดความคล้ายคลึงเชิงความหมายด้วยขั้นตอนวิธีเชิงพันธุกรรม และพัฒนาโปรแกรมทดสอบการเข้าถึงข้อมูลด้วยภาษาแบบสอบถามข้อมูลอย่างมีโครงสร้าง ซึ่งนำมาทดสอบเปรียบเทียบประสิทธิภาพ โดยใช้ประเด็นทดสอบประสิทธิภาพ 2 ประเด็น คือ อัตราการค้นพบข้อความที่สืบค้น และเวลาที่ใช้ประมวลผลการสืบค้นข้อมูล โดยทำการทดสอบสืบค้นข้อมูลจำนวน 25 ครั้ง และใช้ข้อความในการทดลองเท่ากับ 99 ข้อความ รวมถึงการทดลองแต่ละครั้งได้ใช้คำค้นหาที่เหมือนกันในการทดสอบประสิทธิภาพโปรแกรมทั้ง 2 โปรแกรม
ผลการศึกษา การสืบค้นข้อมูลข้อความภาษาไทยด้วยการประมวลผลข้อความตามมาตรวัดความคล้ายคลึงเชิงความหมายด้วยขั้นตอนวิธีเชิงพันธุกรรมมีประสิทธิภาพสูงกว่าการเข้าถึงข้อมูลด้วยภาษาแบบสอบถามข้อมูลอย่างมีโครงสร้าง โดยมีค่าสถิติ t เท่ากับ 159.716 (p<0.01) สำหรับอัตราการค้นพบข้อความโดยเฉลี่ยอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.01 และค่าสถิติ t เท่ากับ -16.237 (p<0.01) สำหรับเวลาที่ใช้ประมวลผลการสืบค้นข้อมูลอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.01
Article Details
References
2. Laothongdee D. Search engine algorithm study and web promotion analysis. (Maters Thesis, Thammasat University). 2003.
3. Google. Advanced Search. Available from: URL: https:/google.com/advanced_search May 16, 2019.
4. Boonrawd P, Srisuktaksin P. Retrieving Big Data Using NoSQL and Semantic Web Technology. The Journal of KMUTNB 2015; 5(2): 255-264.
5. Korler P. SQL Issues. Available from: URL: http://stackoverflow.com/quest/SQL/Like-not-found May 16, 2019.
6. Svetthitikun Y, Supasetsiri P, Pakdeeronachit S. The analysis of factors for e-commerce affects the purchasing behavior of consu mers’ fashion apparel. The Journal of Social Communication Innovation 2017; 5(1): 21-31.
7. Vongsirisin K. The product value affecting the customer's purchase decision on V CARE U Natural & Premium Dog Food in Bangkok. Maters Thesis, Bangkok University). 2016. (in thai).
8. Pattrawadee M. Research Design for Mixed Method Research. Journal of the Association of Researchers 2016; 2(2): 19-31.
9. Wellington J. Education research: contem porary issues and practical approaches. London: Continuum; 2000.
10. Netisopakul P. Text similarity measurement for synonyms term and antonyms term of Thai. Available from: URL: www.it.kmitl.ac.th
/index.php/ main_journal/article May 10 2019. (in thai).
11. Scott, J. Social research and documentary sources. Sage Benchmarks in Social Research Methods, Documentary Research Volume 1. Thousand Oaks, California: SAGE Publication. 2006; 3-40.
12. Rigotti, B. How do I get my website on the first page of Google. Available from: URL: https://cristersmedia.com/how-do-i-get-my-/se/
/website-on-the-first-page-of-google/-/ May 16, 2019.
13. Mathworks. Find global minima for highly nonlinear problems. Available from: URL: https://mathworks.com/genetic-algorithm.html May 16, 2019.
14. Salah FAAS, Mohamad SA, El-Horbaty ESM. Swarm Intelligent Algorithms for solving load balancing in cloud computing. Egyptian Computer Science Journal 2019; 43(1): 45-57.
15. Whitley D. Next generation genetic algorithms: a user’s guide and tutorial. In: Gendreau M, Potvin JY. (eds) Handbook of metaheuristics. International Series in Operations Research & Management Science 2019; 272: Springer, Cham.
16. Netisopakul P. text similarity measurement for synonyms term and antonyms term of Thai. Available from: URL: http://www.it.kmitl.ac.th/ ~journal/index.php/ main_journal/article/
download/100/49 May 16, 2019. (in thai).
17. Rigotti B. How do I get my website on the first page of Google. Available from: URL: https://cristersmedia.com/how-do-i-get-myweb/ siteonthefirstpageofgoogle/ May 16 2019.
18. Google. Data search. Available from: URL: https://www.google.co,/search May 16 2019.
19. Eiben K, Agoston E, Smith JE. Introduction to Evolutionary Computing, Springer. Goldberg, David E. (1989), Genetic Algorithm in Search Optimization and Machine Learning, New York: Addison Wesley. 2003.
20. Sagum RA, Ramos AD, Llanes MT. FICOBU: Filipino WordNet construction using decision tree and language modeling. International Journal of Machine Learning and Computing 2019; 9(1): 103-107.
21. Mishra A, Sainul IA, Bhuyan, S, Deb S, Sen D, Deb AK. Development of a fexible assembly system using industrial robot with machine vision guidance and dexterous multi-finger gripper. Precision Product-Process Design and Optimization 2018; 31-71.
22. Yifei T, Meng Z, Jingwei L, Dongbo L, Yulin W. Research on intelligent welding robot path optimization based on GA and PSO algorithms. IEEE Access 2019; 6: 65397-65404.
23. Thoongsup SR. Thai WordNet construction. Proceedings of the 7th workshop on Asian language resources Association for computaional linguistics 2009: 139-144.
24. Yang D, Powers DM. Measuring semantic similarity in the taxonomy of WordNet. Australian Computer Society 2005; 38(1): 315-322.
25. Cai Y, Zhang Q, Che WA. hybrid approach for measuring semantic similarity based on IC-weighted path distance in WordNet. Journal of Intelligent Information Systems 2018; 51(1): 33-47.
26. Fazlia W. Zagerb AAAK, Rozaidaa G. Using improved firefly algorithm based on genetic algorithm crossover operator for solving optimization problems. Journal of Intelligent & Fuzzy Systems 2019; 36(2): 1547-1562.
27. Haoweia Z, Junweia X, Jiaanga G, Zhaojianb Z, Binfengc ZA. hybrid adaptively genetic algorithm for task scheduling problem in the phased array radar European Journal of Operational Research 2019; 272 (3): 868-878.
28. Krishna GJ, Ravi V. Feature subset selection using adaptive differential evolution: an application to banking. Proceedings of the ACM India Joint International Conference on Data Science and Management of Data 2019: 157-163.
29. Juneja SS, Saraswat P, Singh K. Sharma J, Majumdar R, Chowdhary S. Travelling salesman problem optimization using genetic algorithm. Amity International Conference on Artificial Intelligence (AICAI) 2019.