การทดสอบประสิทธิภาพของเทคนิคการทำเหมืองข้อมูล สำหรับคัดกรองผู้ป่วยโรคมะเร็งเต้านม
Main Article Content
บทคัดย่อ
งานวิจัยนี้มีวัตถุประสงค์เพื่อประเมินประสิทธิภาพของเทคนิคการทำเหมืองข้อมูลในการสร้างแบบจำลองสำหรับคัดกรองผู้ป่วยโรคมะเร็งเต้านม โดยเปรียบเทียบเทคนิคการจำแนกข้อมูล 7 วิธี ได้แก่ โครงข่ายประสาทเทียม (Neural networks) ซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine: SVM) นาอีฟเบย์ (Naïve Bayes) เพื่อนบ้านใกล้ที่สุด (k-Nearest Neighbors: k-NN) ต้นไม้ตัดสินใจ (Decision tree) การเรียนรู้เชิงลึก (Deep learning) และวิธีการรวมกลุ่ม (Ensemble vote) ข้อมูลที่ใช้ในการวิเคราะห์เป็นชุดข้อมูลผู้ป่วยจำนวน 569 ราย จากฐานข้อมูลของมหาวิทยาลัยวิสคอนซินซึ่งเผยแพร่ผ่านเว็บไซต์ www.kaggle.com โดยดำเนินการวิเคราะห์ข้อมูลตามกระบวนการ CRISP-DM ซึ่งประกอบด้วยขั้นตอนการคัดเลือกตัวแปร การจัดการข้อมูลสูญหาย และการกำหนดบทบาทของแอตทริบิวต์แต่ละตัว ผลการศึกษาแสดงให้เห็นว่า เทคนิคโครงข่ายประสาทเทียมให้ผลลัพธ์ดีที่สุด โดยมีค่าความแม่นยำ 98.07% ความไว 99.15% ความจำเพาะ 96.21% และประสิทธิภาพโดยรวมที่ 98.47% ผลลัพธ์นี้ชี้ให้เห็นถึงศักยภาพของเทคนิคดังกล่าว ในการช่วยสนับสนุนกระบวนการวินิจฉัยโรคมะเร็งเต้านมในระยะเริ่มต้นได้อย่างมีนัยสำคัญ
Article Details

อนุญาตภายใต้เงื่อนไข Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
เอกสารอ้างอิง
Hfocus. (2024, November 21). MOPH emphasizes breast cancer threat: 49 Thai women diagnosed daily, 13 deaths per day. Hfocus. https://www.hfocus.org/content/2024/11/32298 (in Thai)
Kumjit, K., Jaikoomkao, D., Phumirang, W., Sattanako, A., & Sukprasert, A. (2022). The efficiency of data mining technique for the prognosis of cerebrovascular disease. Journal of Applied Informatics and Technology, 4(2), 87-98. https://doi.org/10.14456/jait.2022.7 (in Thai)
Muhammad, N. S. (2024). Breast cancer dataset. Kaggle. https://www.kaggle.com/datasets/nairasaeedmuhammad/breast-cancer
Papageorgiou, S. N. (2022). On correlation coefficients and their interpretation. Journal of Orthodontics, 49(3), 359–361. https://doi.org/10.1177/14653125221076142
Phikulsri, A., & Chanamarn, N. (2023). Efficiency comparison of classification methods for kidney disease with data mining techniques. Journal of Science Engineering and Technology, 3(1), 1-17. https://ph02.tci-thaijo.org/index.php/JSET/article/view/247493 (in Thai)
Prema, K. M., & Jagadeesh, P. (2023). Detection of breast cancer using artificial neural network classifier and comparing with support vector machine classifier. Proceedings of the 4th International Conference on Material Science and Applications (pp. 020105). AIP Publishing LLC. https://doi.org/10.1063/5.0173034
Rideach, N., Khaoead, A., & Srisomboon, P. (2022). A behavioral analysis model and the cause of alcohol dependence with the decision tree technique. Journal of Kasetsart Educational Review, 37(3), 202-211. https://so04.tci-thaijo.org/index.php/eduku/article/view/251166 (in Thai)
Ruangsawud, A., Sukprasert, A., Sinthukoot, T., & Kaiwinit, S. (2023). Comparison of predictive models for the prognosis of lung cancer. Kalasin University Journal of Science Technology and Innovation, 2(2), 39-52. https://doi.org/10.14456/ksti.2023.8 (in Thai)
Siphating, K., Peranam, N., Sawangloke, W., & Sukprasert, A. (2023). Classification of MRI images for brain tumor patient screening. Journal of Applied Informatics and Technology, 5(2), 100-115. https://doi.org/10.14456/jait.2023.8 (in Thai)
Srisuk, U., & Thongkam, J. (2021). The efficiency comparison of data mining techniques for patient incidence. Journal of Science and Technology Mahasarakham University, 40(2), 157-163. https://li01.tci-thaijo.org/index.php/scimsujournal/article/view/247870 (in Thai)
Sukprasert, A. (2023). Data Mining with RapidMiner Studio (5th ed.). Department of Business Computer, Mahasarakham Business School, Mahasarakham University, Mahasarakham. (in Thai)
Taiwiriyawet, W. (2023). The number 1 cancer among women worldwide: Understand breast cancer before it spreads. Thammasat University. https://tu.ac.th/thammasat-090566-breast-cancer-no1-cancer-among-women-worldwide (in Thai)
Tongkunwong, S., & Sawatkamon, P. (2024). Comparing the performance of machine learning models for classifying lung cancer patients. UTK Research Journal, 18(1), 33-42. https://ph02.tci-thaijo.org/index.php/rmutk/article/view/252954 (in Thai)
Wacharaphapaiboon, W. (2021). What causes breast cancer? Praram 9 Hospital. https://www.praram9.com/breast-cancer-staging/ (in Thai)
Wirth, R., & Hipp, J. (2000). CRISP-DM: Towards a standard process model for data mining. Proceedings of the 4th International Conference on the Practical Applications of Knowledge Discovery and Data Mining (pp. 29-40), Manchester, UK. http://www.cs.unibo.it/~danilo.montesi/CBD/Beatriz/10.1.1.198.5133.pdf
World Health Organization. (2024). Breast cancer. https://www.who.int/news-room/fact-sheets/detail/breast-cancer