# A Comparison of the Daily Income of a Hospital by using Machine Learning Methods and the ARIMA Model.

## Abstract

This research compares the daily income of a hospital during an epidemic situation using Machine Learning and ARIMA Models. Tableau Desktop is used to create data reports and R studio is used to analyze data. By studying the daily data of a large private hospital in western Bangkok, the data is divided into 2 periods: 1. The normal situation during the year 2016 to 2019, combined with the year of the coronavirus outbreak the pandemic year 2021, and 2. The irregular situation of the coronavirus 2019 outbreak pandemic from 2020 to 2021. Using 6 machine learning model methods: Simple Linear Regression Model, Multiple Linear Regression Model, Polynomial Regression Model, Support Vector Regression Model, Decision Tree Regression Model, and Random Forest Regression model, both periods of the Machine Learning. Divide the training data and the test data in an 80:20 ratio. Compared with the ARIMA model. Where the ARIMA model during normal situations. Divide the training data is the years 2016 to 2019, and the test data is the year 2021 and the irregular situation period. coronavirus epidemic. Divide the training data is the years 2020, and the test data is the year 2021, the statistics used to measure the model's performance and accuracy. Considering the Mean Absolute Percentage Error: MAPE, and Mean Squares Error: MSE, by the models that gave the lowest MAPE and MSE values. The results of the research showed that in Machine Learning with independent variables involved there is a lower error in the forecast model than in the ARIMA model with no independent variables involved, both during normal situations and during irregular situations in coronavirus epidemic. The presence of independent variables involved significantly affects the reduction of the mistakes of the model used in the forecast and can group the days of the day as follows: Monday and Wednesday the model with the suitable forecast performance is the Multiple Linear Regression model in irregular situations of the coronavirus 2019 outbreak pandemic, giving the value of the lowest MAPE(MSE) as 0.00161% (3.60E-09MB2) and 8.13E-15% (1.10E-31MB2), respectively. Tuesday Thursday and Friday the model with the suitable forecast performance is the Random Forest Regression model in the normal situation giving the value of the lowest MAPE(MSE) as 5.04484% (0.04521MB2), 3.17105% (0.00979MB2) and 4.78181% (0.02949MB2), respectively. Saturday and Sunday the model with the suitable forecast performance is the Random Forest Regression model in irregular situations of the coronavirus 2019 outbreak pandemic, giving the value of the lowest MAPE(MSE) as 6.76110% (0.05932MB2) and 4.51761% (0.02101MB2), respectively. When there is another epidemic crisis in the future. The daily appropriate forecasting model derived from this research can be used as the default model for forecasting hospital daily revenues and enabling the strategy to continue even in critical situations.

## Article Details

How to Cite
Nakphithak, S., & Phaphan, wikanda. (2022). A Comparison of the Daily Income of a Hospital by using Machine Learning Methods and the ARIMA Model. Kalasin University Journal of Science Technology and Innovation, 1(1), 20–42. https://doi.org/10.14456/ksti.2022.8
Section
Research Articles

## References

Our World in Data and JHU CSSE COVID-19 Data. COVID19 [Internet]. 2022

[Update 2022; cited 2022 Mar 9]. Available from:

โรคติดเชื้อไวรัสโคโรนา 2019 [Internet]. 2565 [แก้ไขล่าสุด 2565; สืบค้นวันที่ 2565

มีนาคม 9]. Available from: https://th.wikipedia.org/wiki/โรคติดเชื้อไวรัสโคโร-

นา-2019.

พนิดา กาศกลางดอน, โสภณ มงคลลักษมี, ศิริสรรพ เหล่าหะเกียรติ, รัตน์ชัยนันท์ ธรรมสุจริต.

การวิเคราะห์ประสบการณ์จากการใช้บริการโรงพยาบาลในประเทศไทย จากความคิดเห็น

ของผู้ใช้บริการ. การประชุมวิชาการ วิทยาการข้อมูลครั้งที่ 1; 2564;

มหาวิทยาลัยศรีนครินทรวิโรฒ. กรุงเทพมหานคร: หน้า 48-60.

รัชนีวรรณ ไพศาลวรเกียรติ. การเปรียบเทียบตัวแบบการถดถอยลอจิสติกและเทคนิค

เหมืองข้อมูลสำหรับพยากรณ์การเป็นโรคเบาหวาน. (วิทยานิพนธ์ปริญญามหาบัณฑิต).

ภาควิชาคณิตศาสตร์. คณะวิทยาศาสตร์. พิษณุโลก: มหาวิทยาลัยนเรศวร; 2564.

อัจฉราภรณ์ สุขเพิ่ม. แบบจำลองการวินิจฉัยอัตโนมัติสำหรับความเสี่ยงต่อการเกิดลิ่มเลือดอุด

ตันในหลอดเลือดดำตามอาการโดยอาศัยการเรียนรู้ของเครื่อง. การประชุมวิชาการ วิทยาการ

ข้อมูลครั้งที่ 1; 2564; มหาวิทยาลัยศรีนครินทรวิโรฒ. กรุงเทพมหานคร: หน้า 21-24.

อรุณรักษ์ ตันพานิช, ดุษณี ศุภวรรธนะกุล, พิเชฐ บัญญัติ และจรูญ จันแทน. การเปรียบเทียบ

โมเดลการเรียนรู้ของเครื่องสำหรับคัดกรองผู้ป่วยโรคเบาหวานที่มีภาวะชาปลายเท้า. การ

ประชุมหาดใหญ่วิชาการระดับชาติและนานาชาติครั้งที่ 10; 12 กรกฎาคม 2562;

มหาวิทยาลัยหาดใหญ่. สงขลา: หน้า 736-49.

Hema SRR, Giuseppe V, Mirko M, Nadia A, Vassilios F. Comparison of

Conventional Statistical Methods with Machine Learning in Medicine: Diagnosis,

Drug Development, and Treatment. Medicina Journal. 2020;56:455+.

doi:10.3390/medicina56090455.

Ching-Yen K, Liang-Chin Y, Hou-Chaung C, Chien-Lung C. Comparison of Models

for the Prediction of Medical Costs of Spinal Fusion in Taiwan Diagnosis-

Related Groups by Machine Learning Algorithms. Healthcare Informatics

Research. 2018;24(1):29-37. doi:10.4258/hir.2018.24.1.29.