การเปรียบเทียบประสิทธิภาพในการทำนายผลการเป็นโรคเบาหวาน

Main Article Content

สายชล สินสมบูรณ์ทอง

Abstract

Abstract


In this study, an efficiency comparison of diabetes prediction were determined and tested against real data obtained from a hospital, and their prediction efficiencies were compared. The tested classification methods were the following: (1) k-nearest neighbor method using IBk algorithm, (2) decision tree method using J48 algorithm, (3) artificial neural network method using multilayer perceptron algorithm, (4) support vector machine method using polynomial kernel, (5) binary logistic regression method, and (6) Naïve Bayes method. The following performance values were employed: accuracy, mean absolute error (MAE), and mean square error (MSE). The important results are as follows. The artificial neural network method showed the best accuracy, MAE, and MSE at 95.94 %, 0.0491 and 0.0396 respectively. Then the artificial neural network method offered the best efficiencies in prediction method for diabetes. 


Keywords: k-nearest neighbor method; decision tree method; artificial neural network method; support vector machine method; binary logistic regression method; Naïve Bayes method

Article Details

Section
Physical Sciences
Author Biography

สายชล สินสมบูรณ์ทอง

ภาควิชาสถิติ คณะวิทยาศาสตร์ สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง ถนนฉลองกรุง เขตลาดกระบัง กรุงเทพมหานคร 10520

References

[1] Iyer, A., Jeyalatha, S. and Sumbaly. R., 2015, Diagnosis of Diabetes Using Classification Mining Techniques, Int. J. Data Min. Knowl. Manag. Process 5: 1-14.
[2] นุชรี อาบสุวรรณ และนิตยา พันธุเวทย์, 2558, ประเด็นสารรณรงค์วันเบาหวานโลก, สำนักโรคไม่ติดต่อ กรมควบคุมโรค กระทรวงสาธารณสุข, กรุงเทพฯ.
[3] อมรา ทองหงษ์, 2555, โรคเบาหวาน, สรุปรายงานการเฝ้าระวังโรค, สำนักระบาดวิทยา กรมควบคุมโรค กระทรวงสาธารณสุข, กรุงเทพฯ.
[4] พยูน พาณิชย์กุล, 2548, การพัฒนาระบบดาต้าไมน์นิ่งโดยใช้ Decision Tree : โครงการพัฒนาระบบงาน, วิทยานิพนธ์ปริญญาโท, สถาบันเทค โนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง, กรุงเทพฯ.
[5] Wu, X. and Kumar, V., 2009, The Top Ten Algorithms in Data Mining, University of Minnesota Department of Computer Science and Engineering, CRC Press, Minneapolis, Boca Raton. 215 p.
[6] รุจิรา ธรรมสมบัติ, 2554, ระบบสนับสนุนการตัดสินใจในการเลือกใช้แพคเกจอินเทอร์เน็ตมือถือโดยใช้ต้นไม้ตัดสินใจ, รายงานการวิจัย, สาขาคอมพิวเตอร์ธุรกิจ คณะบริหารธุรกิจ วิทยาลัยราชพฤกษ์, 68 น.
[7] Berson, A. and Smith, S.J., 1997, Data Warehousing, Data Mining, and OLAP, McGraw-Hill, New York, 612 p.
[8] ภรัณยา อำมฤครัตน์, เดช ธรรมศิริ, วาทินี นุ้ยเพียร, ภัทราวุฒิ แสงศิริ, ณรงค์ โพธิ และพยุง มีสัจ, 2553, การเปรียบเทียบประสิทธิภาพการคัดเลือกและจำแนกข้อมูลด้วยวธิีการทางเครือข่ายประสาทเทียม, น. 131-138, การประชุมวิชาการระดับชาติทางด้านคอมพิวเตอร์และเทคโนโลยีสารสนเทศ ครั้งที่ 5, วิทยาลัยนครราชสีมา, นครราชสีมา.
[9] กัลยา วานิชย์บัญชา, 2552, การวิเคราะห์ข้อมูลหลายตัวแปร, บริษัท ธรรมสาร จำกัด, กรุงเทพฯ, 589 น.
[10] Larose, D.T., 2006, Data Mining: Methods and Models, John Wiley and Sons, New Jersey, 322 p.
[11] Larose, D.T., 2005, Discovering knowledge in Data: An Introduction to Data Mining, John Wiley and Sons, Hoboken, N.J., 222 p.
[12] กิตติพล วิแสง, สิรภัทร เชี่ยวชาญวัฒนา และคํารณ สุนัติ, 2552, การวิเคราะห์ปัจจัยเสี่ยงของโรคเบาหวาน, น. 798-805, การประชุมวิชาการแห่งชาติทางด้านคอมพิวเตอร์และเทคโนโลยีสารสนเทศ ครั้งที่ 5, วิทยาลัยนครราชสีมา, นครราชสีมา.
[13] ชาญชัย พรมโคตร, ทิพวรรณ ศรีชนะ และ อัจฉรา มหาวีรวัฒน์, 2554, การวิเคราะห์ข้อมูลความเสี่ยงของการเกิดโรคหอบหืดด้วยเทคนิคโครงข่ายประสาทเทียมแบบหลายขั้นร่วมกับขั้นตอนวิธีการเรียนรู้แบบแพร่ย้อนกลับ, น. 51, การประชุมวิชาการ มอบ.วิจัย ครั้งที่ 5, มหาวิทยาลัยอุบลราชธานี, อุบลราชธานี.
[14] สุมนพิชญ์ พลศรี และอัจฉรา มหาวีรวัฒน์, 2554, การวิเคราะห์ความเสี่ยงของการเป็นวัณโรคด้วยเทคนิคโครงข่ายประสาทเทียม, น. 41, การประชุมวิชาการ มอบ.วิจัย ครั้งที่ 5, มหา วิทยาลัยอุบลราชธานี, อุบลราชธานี.
[15] Vijayarani, S. and Dhayanand, S., 2015, Kidney disease prediction using SVM and an nalogorithms, Int. J. Cybern. Inform. 4(4): 13-25.
[16] ณัฐวุฒิ ศิริกุลรุ่งโรจน์, รัฐธชัย บุญวิเศษ, สหัสนัยน์ ไพสานต์ และสุรวัชร ศรีเปารยะ, 2556, การเปรียบเทียบประสิทธิภาพการจำแนกประเภทโดยใช้วิธีความใกล้เคียงกันมากที่สุด วิธีแผนภาพต้นไม้เพื่อการตัดสินใจ วิธีโครงข่ายประสาทเทียมและวิธีซัพพอร์ตเวกเตอร์แมชชีน, ปัญหาพิเศษปริญญาตรี, สาขาวิชาสถิติ สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง, กรุงเทพฯ, 132 น.
[17] สุรวัชร ศรีเปารยะ, 2560, การเปรียบเทียบประสิทธิภาพวิธีการจำแนกกลุ่มการเป็นโรคไตเรื้อรัง : กรณีศึกษาโรงพยาบาลแห่งหนึ่งในประเทศอินเดีย, ว.วิทยาศาสตร์และเทคโนโลยี 25(5): 839-853.