Dengue outbreak prediction using geographic information system and machine learning: A case study of Mueang Phayao District, Phayao Province

Main Article Content

Sathien Hunta
Phanthitra Luecha
Jirapad Boonsoong

Abstract

Dengue fever is a mosquito-borne infectious disease and is a public health problem in many countries around the world. This research aims to study the factors affecting the spread of dengue fever and to create prediction models using machine learning techniques. The data were collected from the Phayao Meteorological Station and Phayao Hospital between 2018 and 2022. The geographic information system was used to analyze the related factors. The data preparation was performed by separating the datasets according to various factors,


including gender, age group, population, forest area, distance between outbreak areas and water sources, distance between re-outbreak areas, average temperature, average relative humidity, average rainfall, and number of rainy days.


                All data were generated as monthly and weekly datasets. The prediction models are divided into regression and classification types. The regression includes support vector machines, generalized linear models, and artificial neural networks. The classification includes decision trees, gradient boosting trees, and random forests. The ensemble method of stacking models is used to combine multiple machine learning algorithms to improve the performance by using 2 algorithms as base learners and using another algorithm as the stacking model learner. Performance evaluation was performed through five-fold cross-validation and the different datasets and learning methods were compared.


                The results found that the regression type using the generalized linear model as the stacking model learner gave the best performance with an RMSE value of 1.457, while the classification using the gradient boosting tree gave the highest performance with an accuracy of 99.12%. This study highlights the importance of using machine learning techniques in forecasting dengue fever outbreaks, which can be used as an effective tool for disease surveillance and control in the future.

Article Details

Section
Original Articles

References

กรมควบคุมโรค. (2560). ความรู้ทั่วไปโรคไข้เลือดออก. กระทรวงสาธารณสุข.

กรมควบคุมโรค. (2563). ไข้เลือดออก (Dengue Fever และ Dengue Hemorrhagic Fever) (ICD 10 A90, A91). https://ddc.moph.go.th/dcd/pagecontent.php?page=565&dept=dcd

กอบเกียรติ สระอุบล. (2563). เรียนรู้ Data Science และ AI: Machine Learning ด้วย Python (พิมพ์ครั้งที่ 1). มีเดีย เนทเวิร์ค.

จิรโรจน์ ตอสะสุกุล. (2564). แบบจำลองการพยากรณ์ของการระบาดโรคไข้เลือดออกโดยใช้เทคนิคการทำเหมืองข้อมูล. วารสารวิชาการซายน์เทค มรภ.ภูเก็ต, 5(2), 51–60.

โรงพยาบาลพญาไท. (ม.ป.ป.). ไข้เลือดออก อย่าปล่อยให้เป็นซ้ำ อันตรายถึงชีวิต. https://www.phyathai-sriracha.com/article/medicine/

สายชล สินสมบูรณ์ทอง. (2560). การทำเหมืองข้อมูล เล่ม 1: การค้นหาความรู้จากข้อมูล. จามจุรีโปรดักส์.

สำนักงานสาธารณสุขจังหวัดพะเยา. (2566). บทสรุปผู้บริหาร สถานการณ์โรคไข้เลือดออก จังหวัดพะเยา (ฉบับที่ 1 ปี 2566).

สุรศักดิ์ สุขสาย และ วนิดา แก่นอากาศ. (2550). การพยากรณ์พื้นที่เสี่ยงต่อการเกิดโรคไข้เลือดออกเพื่อการวางแผนเฝ้าระวังและป้องกันโรคในจังหวัดอุบลราชธานี. วารสารวิจัย มข. (ฉบับบัณฑิตศึกษา), 7(2), 83–97. https://ph02.tci-thaijo.org/index.php/gskku/article/view/23776/20224

ศูนย์วิจัยภูมิสารสนเทศเพื่อประเทศไทย. (ม.ป.ป.). ความหมายของคำว่า "ระบบสารสนเทศภูมิศาสตร์". https://www.gisthai.org/about-gis/gis.html

Dietterich, T. G. (2000). Ensemble methods in machine learning. In J. Kittler & F. Roli (Eds.), Multiple classifier systems (pp. 1–15). Springer. https://doi.org/10.1007/3-540-45014-9_1

EFD Initiative. (2024, September 5). Forest cover could reduce hospital admissions caused by dengue fever. https://www.efdinitiative.org/news/forest-cover-could-reduce-hospital-admissions-caused-dengue-fever

Hofmann, M., & Klinkenberg, R. (Eds.). (2013). RapidMiner: Data mining use cases and business analytics applications. CRC Press.

Kohavi, R. (1995). A study of cross-validation and bootstrap for accuracy estimation and model selection. Proceedings of the 14th International Joint Conference on Artificial Intelligence (IJCAI), 1137–1145. https://doi.org/10.5555/1643031.1643047

Majeed, M. A., Shafri, H. Z. M., Zulkafli, Z., & Wayayok, A. (2023). A deep learning approach for dengue fever prediction in Malaysia using LSTM with spatial attention. International Journal of Environmental Research and Public Health, 20(5), 4087. https://doi.org/10.3390/ijerph20054087

Sylvestre, E., Joachim, C., Cécilia-Joseph, E., Bouzillé, G., Campillo-Gimenez, B., Cuggia, M., & Cabié, A. (2022). Data-driven methods for dengue prediction and surveillance using real-world and Big Data: A systematic review. PLoS Neglected Tropical Diseases, 16(1), e0010056. https://doi.org/10.1371/journal.pntd.0010056