Comparison of Model Performance between Penalized Regression and Machine Learning for Diesel Prices in Thailand
Main Article Content
Abstract
This research study was to compare of model performance for the price of diesel B7, diesel B10, and diesel B20 and find a suitable model to forecast the price of diesel B7, diesel B10, and diesel B20 using daily data from January 1, 2020 to December 31, 2022. The factors used in the study were crude oil prices in the world market, consumption of diesel B7, diesel B10, and diesel B20, exchange rate, consumer price index, oil fuel fund rate of diesel B7, diesel B10, and diesel B20, and crude palm oil prices. Then, compare models to find the best model by measuring the model’s performance with the Root Mean Square Error (RMSE) using Stepwise Regression, Penalized Regression such as Ridge Regression, Lasso Regression, Adaptive Lasso Regression, Elastic Net Regression, and Machine Learning such as Support Vector Regression and Random Forest. According to the research results, Random Forest is the most suitable method for forecasting the price of diesel B7, diesel B10, and diesel B20 with RMSE values of 0.379, 0.3833, and 0.3539, respectively.
Article Details
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
References
กรมธุรกิจพลังงาน กระทรวงพลังงาน. 2565. ข่าวสถานการณ์การใช้น้ำมันเชื้อเพลิงของปี 2564 (มกราคม – ธันวาคม), แหล่งข้อมูล : https://www.doeb.go.th/news_activity/2498.pdf ค้นเมื่อวันที่ 4 กุมภาพันธ์ 2566.
กรมธุรกิจพลังงาน กระทรวงพลังงาน. 2566. ข่าวสถานการณ์การใช้น้ำมันเชื้อเพลิงของปี 2565 (มกราคม – ธันวาคม), แหล่งข้อมูล : https://www.doeb.go.th/news_activity/2515.pdf ค้นเมื่อวันที่ 4 กุมภาพันธ์ 2566.
มารุต จำลอง และศักดิ์ชาย นาคนก. 2561. การศึกษาปัจจัยที่ส่งผลกระทบต่อราคาน้ำมันสำเร็จรูปดีเซลและการพยากรณ์ราคาน้ำมันดีเซลในประเทศไทย. Graduate School MINI-Conference 2018 การประชุมวิชาการเสนอผลงานวิจัยระดับชาติ, ครั้งที่ 2, มหาวิทยาลัยราชภัฏสวนสุนันทา กรุงเทพมหานคร, 818-828. [Marut Jamlong and Sakchai Nakanok. 2018. A study of factors affecting and Forecasting the price of diesel oil in Thailand, Graduate School Conference 2018 2nd National Conference, Suan Sunandha Rajabhat University, Bangkok, 818-828. (in Thai)]
Hoerl, A.E. and Kennard, R.W. 1970. Ridge Regression: Biased Estimation for Nonorthogonal Problems, Technometrics, 12(1), 55-67, https://doi.org/10.2307/1267351.
Tibshirani, R. 1996. Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society Series B: Statistical Methodology, 58(1), 267-288, https://doi.org/10.1111/j.2517-6161.1996.tb02080.x.
Zou, H. and Hastie, T. 2005. Regularization and Variable Selection Via the Elastic net. Journal of the Royal Statistical Society Series B: Statistical Methodology, 67(2), 301-320, https://doi.org/10.1111/j.1467-9868.2005.00503.x.
วรางคณา วัชรเสถียร. 2561. การเปรียบเทียบประสิทธิภาพของวิธีการวิเคราะห์การถดถอยแบบพีนอลไลซ์ในตัวแบบการถดถอยลอจิสติกภายใต้ข้อมูลที่มีมิติสูงแบบบางเบาและตัวแปรทํานายมีความสัมพันธ์กันสูง. วิทยานิพนธ์ปริญญาวิทยาศาสตรมหาบัณฑิต (สถิติประยุกต์), สาขาวิชาคณิตศาสตร์และสถิต, คณะวิทยาศาสตร์และเทคโนโลยี, มหาวิทยาลัยธรรมศาสตร์. [Warangkhana Watcharasatian. 2018. Performance comparison of penalized regression method in logistic regression for high-dimensional sparse data with multicollinearity. Master of Science (Applied Statistics), Department of Mathematics and Statistics, Faculty of Science and Technology, Thammasat University (in Thai)]
เบญจมาส รุ่งศรานนท์ และอัชฌา อระวีพร. 2563. การเปรียบเทียบวิธีการประมาณค่าพารามิเตอร์ของการวิเคราะห์การถดถอยที่ปรับด้วยฟังก์ชันการลงโทษภายใต้ข้อมูลที่มีมิติสูง. วารสารวิทยาศาสตร์และเทคโนโลยี, 28(8), 1346-1358, https://doi.org/10.14456/tstj.2020.108. [Benjamas Rungsaranon and Autcha Araveeporn. 2020. Comparing Methods of Parameter Estimation with Penalized Regression Analysis under High-Dimensional Data. Science and Technology Journal, 28(8), 1346-1358, https://doi.org/10.14456/tstj.2020.108. (in Thai)]
Yasin, H., Caraka, R.E., Tarno, and Hoyyi, A. 2016. Prediction of Crude Oil Prices Using Support Vector Regression (SVR) with grid search - cross validation algorithm. Global Journal of Pure Applied Mathematics, 12(4), 3009-3020.
ฐิติรัตน์ แพทย์มงคล. 2552. ปัจจัยที่มีผลตอการปรับตัวของราคาน้ำมันดีเซลในประเทศไทย. วิทยานิพนธ์ปริญญาเศรษฐศาสตร์มหาบัณฑิต, สาขาวิชาเศรษฐศาสตร์ธุรกิจ, บัณฑิตวิทยาลัยมหาวิทยาลัยหอการค้าไทย. [Thitirat Pheatmongkhon. 2009. Factors Affecting the Adjustment of Diesel Prices in Thailand. Master of Economics. Department of Business Economics, Graduate School, University of the Thai Chamber of Commerce. (in Thai)]
วิลาสินี หีบแก้ว. 2550. การกำหนดราคาและปัจจัยที่มีผลกระทบต่อการเปลี่ยนแปลงราคาน้ำมันดีเซล. วิทยานิพนธ์ปริญญาเศรษฐศาสตร์มหาบัณฑิต, สาขาวิชาเศรษฐศาสตร์ธุรกิจ มหาวิทยาลัยเกษตรศาสตร์. [Wilasinee Heepkaew. 2007. Price Determination and Factors Affecting Diesel Oil Price Changes. Master of Economics. Department of Business Economics, Kasetsart University. (in Thai)]
ณัฐพินท์ เดชขุน. 2553. การศึกษาปัจจัยทางเศรษฐกิจที่มีผลต่อราคาน้ำมันสำเร็จรูปดีเซล. บริหารธุรกิจมหาบัณฑิต, สาขาวิชาการเงิน, มหาวิทยาลัยหอการค้าไทย. [Natthaphin Dechkhun. 2010. Study of Economic Factors Affecting Diesel Finished Oil Prices. Master of Business Administration, Department of Finance, University of the Thai Chamber of Commerce. (in Thai)]
Zou, H. 2006. The Adaptive Lasso and Its Oracle Properties. Journal of the. American. Statistical. Journal of the American Statistical Association, 101(476), 1418-1429, https://doi.org/10.1198/016214506000000735.
อรพิน ประวัติบริสุทธิ์. 2564. Python สำหรับงาน Data Science Data Visualization และ Machine Learning. พิมพ์ครั้งที่ 1, บริษัทโปรวิชั่นจำกัด, กรุงเทพฯ. [Orapin Prawatborisud. 2021. Python for Data Science, Data Visualization and Machine Learning. 1st ed., Provision Co., Ltd., Bangkok. (in Thai)]
สห ธิติถามวัต. 2562. การพัฒนารูปแบบการแนะนำงานสำหรับองค์กรและผู้สมัคร ตามทักษะการเรียนรู้ด้วยเทคนิคป่าแบบสุ่ม. วิทยานิพนธ์ปริญญาวิทยาศาสตรมหาบัณฑิต, สาขาเทคโนโลยีสารสนเทศ, สถาบันเทคโนโลยีไทย-ญี่ปุ่น.