การทดสอบประสิทธิภาพของเทคนิคการทำเหมืองข้อมูล สำหรับคัดกรองผู้ป่วยโรคมะเร็งเต้านม

Main Article Content

อนุพงศ์ สุขประเสริฐ
ศิรินภา พรมโสภา
ยศภัทร ศรีโม๊ะ

บทคัดย่อ

งานวิจัยนี้มีวัตถุประสงค์เพื่อประเมินประสิทธิภาพของเทคนิคการทำเหมืองข้อมูลในการสร้างแบบจำลองสำหรับคัดกรองผู้ป่วยโรคมะเร็งเต้านม โดยเปรียบเทียบเทคนิคการจำแนกข้อมูล 7 วิธี ได้แก่ โครงข่ายประสาทเทียม (Neural networks) ซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine: SVM) นาอีฟเบย์ (Naïve Bayes) เพื่อนบ้านใกล้ที่สุด (k-Nearest Neighbors: k-NN) ต้นไม้ตัดสินใจ (Decision tree) การเรียนรู้เชิงลึก (Deep learning) และวิธีการรวมกลุ่ม (Ensemble vote) ข้อมูลที่ใช้ในการวิเคราะห์เป็นชุดข้อมูลผู้ป่วยจำนวน 569 ราย จากฐานข้อมูลของมหาวิทยาลัยวิสคอนซินซึ่งเผยแพร่ผ่านเว็บไซต์ www.kaggle.com โดยดำเนินการวิเคราะห์ข้อมูลตามกระบวนการ CRISP-DM ซึ่งประกอบด้วยขั้นตอนการคัดเลือกตัวแปร การจัดการข้อมูลสูญหาย และการกำหนดบทบาทของแอตทริบิวต์แต่ละตัว ผลการศึกษาแสดงให้เห็นว่า เทคนิคโครงข่ายประสาทเทียมให้ผลลัพธ์ดีที่สุด โดยมีค่าความแม่นยำ 98.07% ความไว 99.15% ความจำเพาะ 96.21% และประสิทธิภาพโดยรวมที่ 98.47% ผลลัพธ์นี้ชี้ให้เห็นถึงศักยภาพของเทคนิคดังกล่าว ในการช่วยสนับสนุนกระบวนการวินิจฉัยโรคมะเร็งเต้านมในระยะเริ่มต้นได้อย่างมีนัยสำคัญ

Article Details

รูปแบบการอ้างอิง
สุขประเสริฐ อ., พรมโสภา ศ., & ศรีโม๊ะ ย. (2025). การทดสอบประสิทธิภาพของเทคนิคการทำเหมืองข้อมูล สำหรับคัดกรองผู้ป่วยโรคมะเร็งเต้านม. วารสารวิทยาศาสตร์ลาดกระบัง, 34(2), 41–58. สืบค้น จาก https://li01.tci-thaijo.org/index.php/science_kmitl/article/view/267178
ประเภทบทความ
บทความวิจัย

เอกสารอ้างอิง

Hfocus. (2024, November 21). MOPH emphasizes breast cancer threat: 49 Thai women diagnosed daily, 13 deaths per day. Hfocus. https://www.hfocus.org/content/2024/11/32298 (in Thai)

Kumjit, K., Jaikoomkao, D., Phumirang, W., Sattanako, A., & Sukprasert, A. (2022). The efficiency of data mining technique for the prognosis of cerebrovascular disease. Journal of Applied Informatics and Technology, 4(2), 87-98. https://doi.org/10.14456/jait.2022.7 (in Thai)

Muhammad, N. S. (2024). Breast cancer dataset. Kaggle. https://www.kaggle.com/datasets/nairasaeedmuhammad/breast-cancer

Papageorgiou, S. N. (2022). On correlation coefficients and their interpretation. Journal of Orthodontics, 49(3), 359–361. https://doi.org/10.1177/14653125221076142

Phikulsri, A., & Chanamarn, N. (2023). Efficiency comparison of classification methods for kidney disease with data mining techniques. Journal of Science Engineering and Technology, 3(1), 1-17. https://ph02.tci-thaijo.org/index.php/JSET/article/view/247493 (in Thai)

Prema, K. M., & Jagadeesh, P. (2023). Detection of breast cancer using artificial neural network classifier and comparing with support vector machine classifier. Proceedings of the 4th International Conference on Material Science and Applications (pp. 020105). AIP Publishing LLC. https://doi.org/10.1063/5.0173034

Rideach, N., Khaoead, A., & Srisomboon, P. (2022). A behavioral analysis model and the cause of alcohol dependence with the decision tree technique. Journal of Kasetsart Educational Review, 37(3), 202-211. https://so04.tci-thaijo.org/index.php/eduku/article/view/251166 (in Thai)

Ruangsawud, A., Sukprasert, A., Sinthukoot, T., & Kaiwinit, S. (2023). Comparison of predictive models for the prognosis of lung cancer. Kalasin University Journal of Science Technology and Innovation, 2(2), 39-52. https://doi.org/10.14456/ksti.2023.8 (in Thai)

Siphating, K., Peranam, N., Sawangloke, W., & Sukprasert, A. (2023). Classification of MRI images for brain tumor patient screening. Journal of Applied Informatics and Technology, 5(2), 100-115. https://doi.org/10.14456/jait.2023.8 (in Thai)

Srisuk, U., & Thongkam, J. (2021). The efficiency comparison of data mining techniques for patient incidence. Journal of Science and Technology Mahasarakham University, 40(2), 157-163. https://li01.tci-thaijo.org/index.php/scimsujournal/article/view/247870 (in Thai)

Sukprasert, A. (2023). Data Mining with RapidMiner Studio (5th ed.). Department of Business Computer, Mahasarakham Business School, Mahasarakham University, Mahasarakham. (in Thai)

Taiwiriyawet, W. (2023). The number 1 cancer among women worldwide: Understand breast cancer before it spreads. Thammasat University. https://tu.ac.th/thammasat-090566-breast-cancer-no1-cancer-among-women-worldwide (in Thai)

Tongkunwong, S., & Sawatkamon, P. (2024). Comparing the performance of machine learning models for classifying lung cancer patients. UTK Research Journal, 18(1), 33-42. https://ph02.tci-thaijo.org/index.php/rmutk/article/view/252954 (in Thai)

Wacharaphapaiboon, W. (2021). What causes breast cancer? Praram 9 Hospital. https://www.praram9.com/breast-cancer-staging/ (in Thai)

Wirth, R., & Hipp, J. (2000). CRISP-DM: Towards a standard process model for data mining. Proceedings of the 4th International Conference on the Practical Applications of Knowledge Discovery and Data Mining (pp. 29-40), Manchester, UK. http://www.cs.unibo.it/~danilo.montesi/CBD/Beatriz/10.1.1.198.5133.pdf

World Health Organization. (2024). Breast cancer. https://www.who.int/news-room/fact-sheets/detail/breast-cancer