The Performance Comparison of Cardiovascular Risk Prediction Models using Data Mining Algorithms

Main Article Content

ผศ.ดร.นงเยาว์ ในอรุณ

Abstract

This research aimed (1) to create cardiovascular risk diagnosis prediction model using algorithms including Neural Network, Random Forest, Naïve Bayes, K-Nearest Neighbors and Decision Tree (2) five algorithms were used with attribute selection and (3) comparing the model performance using 10-Fold cross validation method. Tools used are MySQL and RapidMiner Studio programs. The data set were people who screened patients with cardiovascular disease that were collected from the Saraburi Provincial Public Health Office during 2018-2019 from 12 Saraburi hospitals and 126 health promoting hospitals. The results were found that the model with the best prediction performance was the neural network model with attribute selection having 99.29% accuracy and the lowest was the decision tree model with 70.39% accuracy. This research concluded that neural network model with attribute selection of the best qualifications that should be further developed for early diagnosis of cardiovascular risk web applications.

Article Details

Section
Original Articles

References

1. กรมควบคุมโรค กระทรวงสาธารณสุข. (2562). แนวทางการเฝ้าระวังโรค ของกระทรวงสาธารณสุข. กรุงเทพฯ: องค์การรับส่งสินค้าและวัสดุภัณฑ์.
2. กระทรวงสาธารณสุข. (2561). ระบบการเฝ้าระวัง ควบคุม ป้องกันโรคหัวใจและหลอดเลือด. กรุงเทพฯ: โรงพิมพ์สำนักพระพุทธศาสนาแห่งชาติ.
3. บุณยานุช ใหมเง่า และคณะ. (2560). โปรแกรมช่วยวิเคราะห์อัตราเสี่ยงต่อการเป็นโรคหัวใจและหลอดเลือด. วารสารวิชาการเทคโนโลยีอุตสาหกรรม. มหาวิทยาลัยราชภัฏสวนสุนันทา. 5(1), 55-65.
4. สายชล สินสมบูรณ์ทอง. (2560). การทำเหมืองข้อมูล เล่ม 1 : การค้นหาความรู้จากข้อมูล. (พิมพ์ครั้งที่ 2). กรุงเทพฯ: จามจุรีโปรดักส์.
5. สราวุธ มีศรี, ศุภกานต์ พิมลธเรศ และ อัจฉรา มหาวีรวัฒน์. (2560). การวินิจฉัยโรคหัวใจโดยใช้ตัวจำแนกผสม. ปริญญานิพนธ์วิทยาศาสตร์มหาบัณฑิต. จุฬาลงกรณ์มหาวิทยาลัย. กรุงเทพฯ: จุฬาลงกรณ์มหาวิทยาลัย.
6. เอกสิทธิ์ พัชรวงศ์ศักดา. (2563). Big Data and Machine Learning. กรุงเทพฯ: ไอดีซี พรีเมียร์.
7. Ali, J., Khan, R., Ahmad, N., & Maqsood, I. (2012). Random forests and decision tree. International Journal of Computer Science, 9(5), 272-278.
8. Assari, R., Azimi, P., & Taghva, M. R. (2017). Heart Disease Diagnosis Using Data Mining Techiques. International Journal of Economics & Management Science, 6(3), 72-79.
9. Breiman, L. (2001). Random forests. Journal of Machine Learning, 45, 5–32.
10. Chakrabarti, S., Cox, E., Frank, E., Guting, R. H., Han, J., Jiang, X., Kamber, M. ฿ Lightstone, S. S. (2009). Data mining: Know it all. USA: Morgan Kaufmann.
11. Han, J. & Kamber, M. (2006). Data mining: Concepts and techniques (2nd ed.). USA: Morgan Kaufmann.
12. Han, J., Kamber, M., & Pei, J. (2011). Data mining concepts and techniques. (3rd ed.). USA: Morgan Kaufmann.
13. Jones, M. T. (2008). Artificial intelligence. N.P.: Infinity Science Press.
14. Nai-arun N., & Moungmai M. (2020). Diagnostic Prediction Models for Cardiovascular Disease Risk using Data Mining Techniques. Journal of ECTI TRANSACTIONS ON COMPUTER AND INFORMATION TECHNOLOGY, 14(2), 113-121.
15. Suksawatchon, U., Suksawatchon J., & Lawang W. (2018). Health Risk Analysis Expert System for Family Caregiver of Person with Disabilities using Data Mining Techniques. Journal of ECTI TRANSACTIONS ON COMPUTER AND INFORMATION TECHNOLOGY. 12(1), 62-72.
16. Witten, I. H. & Frank, E. (2005). Data mining: Practical machine learning tools and techniques. (2nd ed.). USA: Morgan Kaufmann.
17. World Health Organization. (2019).Cardiovascular Disease. Retrieved November 15, 2019, from https://www.who.in/Cardiovascular_Disease/