The Performance Comparison of Cardiovascular Risk Prediction Models using Data Mining Algorithms

Main Article Content

ผศ.ดร.นงเยาว์ ในอรุณ

บทคัดย่อ

งานวิจัยนี้มีวัตถุประสงค์เพื่อ (1) สร้างแบบจำลองการทำนายความเสี่ยงโรคหัวใจและหลอดเลือดโดยใช้อัลกอริทึมเหมืองข้อมูล ได้แก่ โครงข่ายประสาทเทียม ฟอเรสต์แบบสุ่ม เค-เนียร์เรสเนเบอร์ นาอีฟเบย์ และต้นไม้ตัดสินใจ (2) ใช้อัลกอริทึมทั้ง 5 วิธีพร้อมการเลือกคุณสมบัติของแอตทริบิวต์ และ (3) เปรียบเทียบประสิทธิภาพของแบบจำลองด้วยวิธี 10-Fold Cross Validation โดยเครื่องมือที่ใช้ในการวิจัยคือโปรแกรม MySQL และ RapidMiner Studio และชุดข้อมูลเป็นคนที่ผ่านการคัดกรองผู้ป่วยโรคหัวใจและหลอดเลือดที่รวบรวมข้อมูลมาจากสำนักงานสาธารณสุขจังหวัดสระบุรี ระหว่างปี พ.ศ. 2561-2562 จากโรงพยาบาลในจังหวัดสระบุรี 12 แห่ง และโรงพยาบาลส่งเสริมสุขภาพตำบล 126 แห่ง จำนวน 31,929 คน ผลการวิจัย พบว่า แบบจำลองที่มีประสิทธิภาพการทำนายดีที่สุดคือ แบบจำลองโครงข่ายประสาทเทียมพร้อมการเลือกคุณสมบัติ มีค่าความถูกต้อง 99.29% และต่ำสุดคือ แบบจำลองต้นไม้ตัดสินใจ มีค่าความถูกต้อง 70.39% งานวิจัยนี้ สรุปผลว่า แบบจำลองโครงข่ายประสาทเทียมพร้อมการเลือกคุณสมบัติของแอตทริบิวต์เป็นแบบจำลองที่เหมาะสมที่สุด ที่ควรนำไปพัฒนาเว็บแอปพลิเคชันเพื่อการวินิจฉัยโรคเบื้องต้นเกี่ยวกับความเสี่ยงโรคหัวใจและหลอดเลือด

Article Details

บท
Original Articles

References

1. กรมควบคุมโรค กระทรวงสาธารณสุข. (2562). แนวทางการเฝ้าระวังโรค ของกระทรวงสาธารณสุข. กรุงเทพฯ: องค์การรับส่งสินค้าและวัสดุภัณฑ์.
2. กระทรวงสาธารณสุข. (2561). ระบบการเฝ้าระวัง ควบคุม ป้องกันโรคหัวใจและหลอดเลือด. กรุงเทพฯ: โรงพิมพ์สำนักพระพุทธศาสนาแห่งชาติ.
3. บุณยานุช ใหมเง่า และคณะ. (2560). โปรแกรมช่วยวิเคราะห์อัตราเสี่ยงต่อการเป็นโรคหัวใจและหลอดเลือด. วารสารวิชาการเทคโนโลยีอุตสาหกรรม. มหาวิทยาลัยราชภัฏสวนสุนันทา. 5(1), 55-65.
4. สายชล สินสมบูรณ์ทอง. (2560). การทำเหมืองข้อมูล เล่ม 1 : การค้นหาความรู้จากข้อมูล. (พิมพ์ครั้งที่ 2). กรุงเทพฯ: จามจุรีโปรดักส์.
5. สราวุธ มีศรี, ศุภกานต์ พิมลธเรศ และ อัจฉรา มหาวีรวัฒน์. (2560). การวินิจฉัยโรคหัวใจโดยใช้ตัวจำแนกผสม. ปริญญานิพนธ์วิทยาศาสตร์มหาบัณฑิต. จุฬาลงกรณ์มหาวิทยาลัย. กรุงเทพฯ: จุฬาลงกรณ์มหาวิทยาลัย.
6. เอกสิทธิ์ พัชรวงศ์ศักดา. (2563). Big Data and Machine Learning. กรุงเทพฯ: ไอดีซี พรีเมียร์.
7. Ali, J., Khan, R., Ahmad, N., & Maqsood, I. (2012). Random forests and decision tree. International Journal of Computer Science, 9(5), 272-278.
8. Assari, R., Azimi, P., & Taghva, M. R. (2017). Heart Disease Diagnosis Using Data Mining Techiques. International Journal of Economics & Management Science, 6(3), 72-79.
9. Breiman, L. (2001). Random forests. Journal of Machine Learning, 45, 5–32.
10. Chakrabarti, S., Cox, E., Frank, E., Guting, R. H., Han, J., Jiang, X., Kamber, M. ฿ Lightstone, S. S. (2009). Data mining: Know it all. USA: Morgan Kaufmann.
11. Han, J. & Kamber, M. (2006). Data mining: Concepts and techniques (2nd ed.). USA: Morgan Kaufmann.
12. Han, J., Kamber, M., & Pei, J. (2011). Data mining concepts and techniques. (3rd ed.). USA: Morgan Kaufmann.
13. Jones, M. T. (2008). Artificial intelligence. N.P.: Infinity Science Press.
14. Nai-arun N., & Moungmai M. (2020). Diagnostic Prediction Models for Cardiovascular Disease Risk using Data Mining Techniques. Journal of ECTI TRANSACTIONS ON COMPUTER AND INFORMATION TECHNOLOGY, 14(2), 113-121.
15. Suksawatchon, U., Suksawatchon J., & Lawang W. (2018). Health Risk Analysis Expert System for Family Caregiver of Person with Disabilities using Data Mining Techniques. Journal of ECTI TRANSACTIONS ON COMPUTER AND INFORMATION TECHNOLOGY. 12(1), 62-72.
16. Witten, I. H. & Frank, E. (2005). Data mining: Practical machine learning tools and techniques. (2nd ed.). USA: Morgan Kaufmann.
17. World Health Organization. (2019).Cardiovascular Disease. Retrieved November 15, 2019, from https://www.who.in/Cardiovascular_Disease/