Factors analysis affecting stroke disease revealed using association rules
Main Article Content
Abstract
The World Stroke Organization (WSO) survey found 20 million people working age and elderly annually were at risk of stroke. Several factors can affect the risk of stroke, including family history, work stress, lifestyle, and diet. These factors can be intensified by living in an ever-changing society and environment. When the symptoms of a stroke (such as blurred vision, hemiplegia, myasthenia gravis, and Bell’s palsy) significantly impact daily life it is crucial to get medical attention. So, it is essential to analyze relevant factors to assist individuals to avoid behaviors that may contribute to the risk of a stroke. This research aims to analyze the risk factors that may yield an opportunity for stroke with association mining rules using the Apriori algorithm. For the experiment, the Apriori algorithm was used to compute and determine the support and confidence values as 0.27 and 0.25, respectively. This research identified the top five factors contributing to stroke: body mass index (BMI), ever-married, work type, heart disease, and age. We then used the gain ratio technique to select features with a gain value of 0.05. The gain ratio algorithm selected the following significant factors: age, body mass index (BMI), ever-married, hypertension, and heart disease, respectively. The experimental results showed that the factors selected using the Gain ratio method were the same as the factors chosen by the Apriori algorithm. Consequently, the five chosen factors significantly impact the cause of stroke.
Article Details
References
กรสิริณัฐ โรจนวรรณ์ และวิยุดา เพชรจิรโชติกุล. (2564). การเลือกคุณลักษณะที่เหมาะสมสาหรับการแทนค่าข้อมูลสูญหายของข้อมูลอนุกรมเวลาด้วยเทคนิคเหมืองข้อมูล. วารสารมหาวิทยาลัยนราธิวาสราชนครินทร์, 13(2), 326–341.
กิตติศักดิ์ ขำจิตร, ดารภา ใจคุ้มเก่า, วัชรพงษ์ ภูมิรัง, อาทิตยา สัตนาโค และอนุพงศ์ สุขประเสริฐ. (2565). ประสิทธิภาพของเทคนิคเหมืองข้อมูลสำหรับพยากรณ์การเกิดโรคหลอดเลือดในสมอง. วารสารวิทยาการสารสนเทศและเทคโนโลยีประยุกต์, 4(2), 87–98.
กันต์ ดวงประเสริฐ และดิลก ตันทองทิพย์. (2565). การรักษาโรคหลอดเลือดสมองตีบในปัจจุบัน. วารสารสมาคมโรคหลอดเลือดสมองไทย, 21(1), 26–42.
ขวัญชนก เทพปัน และปัทมา สุพรรณกุล. (2563). เครือข่ายสังคมออนไลน์และโมบายแอปพลิเคชันกับการป้องกันโรคหลอดเลือดสมอง. วารสารวิทยาลัยพยาบาลพระปกเกล้า จันทบุรี, 31(1), 198-204.
จารุณี สุธีร์. (2564). การพัฒนาระบบการคัดแยกผู้ป่วย Stroke Fast Track ของศูนย์รับแจ้งเหตุและสั่งการ โรงพยาบาลยโสธร. วารสารวิชาการสาธารณสุขชุมชน, 7(1), 158-172.
ชิษณุพงศ์ บุบผาทาเต และจารี ทองคำ. (2563). กฎความสัมพันธ์เพื่อการรักษาผู้ป่วยความดันโลหิตสูง. วารสารวิชาการนวัตกรรมการจัดการเทคโนโลยี มหาวิทยาลัยราชภัฏมหาสารคาม, 7(1), 20–28.
ณฐกร นิลเนตร. (2562). ปัจจัยเสี่ยงและการป้องกันโรคหลอดเลือดสมอง ในกลุ่มผู้ป่วยความดันโลหิตสูง.วารสารพยาบาลทหารบก, 20(2), 51–57.
ณิชา นภาพร จงกะสิกิจ. (2561). การประยุกต์ใช้เทคนิคเหมืองข้อมูลในการค้นหาปัจจัยที่เกี่ยวข้องกับ การเลือกศึกษาต่อในคณะเทคโนโลยีอุตสาหกรรม มหาวิทยาลัยราชภัฏลาปาง. วารสารวิชาการคณะเทคโนโลยีอุตสาหกรรม มหาวิทยาลัยราชภัฏลาปาง, 11(2), 29–39.
ณีรนุช วรไธสง, อนุวัฒน์ สุรินราช, จิราภรณ์ จำปาจันทร์, ศิริลักษณ์ วงค์เครือสอน, ลัดดาวรรณ บุระเนตร, ดวงกมล พลวงค์ษา และลัดดาวรรณ เคี้ยมก้อม. (2565). ผลของโปรแกรมป้องกันความเสี่ยงโรคหลอดเลือดสมองในผู้ป่วยกลุ่มเสี่ยงที่อาศัยอยู่ในชุมชน. วารสารวิชาการสุขภาพและสิ่งแวดล้อม, 1(1), 1-13.
นัฐพงษ์ ประทีป ณ ถลาง, พลเทพ เกษกุล, วิภาวรรณ บัวทอง และสมใจ จิตคำนึงสุข. (2563). เทคนิคการทำเหมืองข้อมูลแบบการสร้างกฎความสัมพันธ์ในการจัดการร้านอาหาร. วารสารวิชาการซายน์เทค มรภ.ภูเก็ต, 4(1), 1–12.
ปฏิพัทธ์ ปฤชานนท์ และวงกต ศรีอุไร. (2561). การประยุกต์ใช้กฎความสัมพันธ์เพื่อวิเคราะห์ความเสี่ยงการออกกลางคัน ของนักศึกษาสาขาเทคโนโลยีสารสนเทศ. วารสารวิทยาศาสตร์และวิทยาศาสตร์ศึกษา, 1(2), 123–133.
ประมูล สุขสกาวผ่อง และพยุง มีสัจ. (2562). การค้นหากฎความสัมพันธ์ด้วยการนับความถี่ของเส้นเชื่อมกราฟแบบเพิ่มเติมได้และสร้างกฎความสัมพันธ์แบบพลวัตสำหรับพาณิชย์อิเล็กทรอนิกส์. วารสารวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยอุบลราชธานี, 21(3), 127–139.
ปิยะนุช จิตตนูนท์, อาภรณ์ทิพย์ บัวเพ็ชร์, พิมพิศา ศักดิ์สองเมือง, วิชัย อารับ, สุวนิตย์ วงศ์ยงค์ศิลป์, และญนัท วอลเตอร์. (2564). ความรู้โรคหลอดเลือดสมองและพฤติกรรมป้องกัน ของกลุ่มเสี่ยงโรคหลอดเลือดสมอง: กรณีศึกษาตำบลห้วยนาง จังหวัดตรัง. วารสารพยาบาลสงขลานครินทร์, 41(2), 13–25.
พุทธิพร ธนธรรมเมธี และเยาวเรศ ศิริสถิตย์กุล. (2562). เทคนิคการจำแนกข้อมูลที่พัฒนาสำหรับ ชุดข้อมูลที่ไม่สมดุลของภาวะข้อเข่าเสื่อมในผู้สูงอายุ. วารสารวิทยาศาสตร์และเทคโนโลยี, 27(6), 1164–1178.
พรพิมล ชัยวุฒิศักดิ์ และยุวดี กล่อมวิเศษ. (2562). การพัฒนากฎการทำนายผลการเรียนของนักศึกษาชั้นปีที่ 1 โดยใช้เทคนิคการทำเหมืองข้อมูล. วารสารวิจัยรามคำแหง (วิทยาศาสตร์และเทคโนโลยี), 23(1), 17-25.
ภัทรา วัฒนพันธุ์. (2561). การฟื้นฟูสภาพผู้ป่วยโรคหลอดเลือดสมองและการป้องกันภาวะแทรกซ้อน. วารสารประสาทวิทยาศาสตร์ ภาคตะวันออกเฉียงเหนือ, 12(1), 31-43.
วิทยา ปัญญา และ วฤษาย์ ร่มสายหยุด. (2566). วิธีการสร้างแบบจำลองเชิงทำนายพฤติกรรมการผิดเงื่อนไขการปล่อยชั่วคราวของศาล จากชุดข้อมูลที่ไม่สมดุลโดยใช้เทคนิคการเรียนรู้ของเครื่อง. วารสารวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยมหาสารคาม, 42(2), 47–57.
สมาคมโรคหลอดเลือดสมองไทย. (2562). สถานการณ์โรคหลอดเลือดสมองในประเทศไทย. Thai Stroke Society. https://thaistrokesociety.org/
สลานนท์ ไทยเขียว และภรัณยา ปาลวิสุทธิ์. (2564). การพัฒนาตัวแบบสืบค้นพฤติกรรมการออกกาลังกายของนักศึกษาโดยใช้อัลกอริทึมเอไพรออริ. วารสารวิจัย มทร.กรุงเทพ, 15(1), 31–44.
อุดม สุทธิพนไพศาล. (2563). โรคหลอดเลือดสมอง (Stroke). MedPark Hospital. https://www.medparkhospital.com/content/stroke.
Agrawal, R., & Srikant, R. (1994). Fast algorithms for mining association rules in large databases. Proceedings of the 20th International Conference on Very Large Data Bases (pp. 487–499).
Ampornphan, P. (2021). Association analysis of COVID-19 outbreak in Thailand using data mining techniques. PSAKU International Journal of Interdisciplinary Research, 10(2), 21–33.
Bagui, S., Devulapalli, K., & Coffey, J. (2020). A heuristic approach for load balancing the FP-growth algorithm on MapReduce. Array, 7, 100035.
Butryn, B., Chomiak-Orsa, I., Hauke, K., Pondel, M., & Siennicka, A. (2021). Application of machine learning in medical data analysis illustrated with an example of association rules. 25th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems (pp. 3134–3143). Elsevier B.V.
Das, S., Dutta, A., Jalayer, M., Bibeka, A., & Wu, L. (2018). Factors influencing the patterns of wrong-way driving crashes on freeway exit ramps and median crossovers: Exploration using ‘Eclat’ association rules to promote safety. International Journal of Transportation Science and Technology, 7(2), 114–123.
Dupre, M. E., & Lopes, R. D. (2023). Marital history and survival after stroke. Journal of the American Heart Association, 5(12), 1–10.
Hassan, M., Karim, A., Mollick, S., Azam, S., Ignatious, E. & Haque, A. S. M. F. A. (2023). An Apriori algorithm-based association rule analysis to detect human suicidal behaviour. International Conference on ENTERprise Information Systems / ProjMAN – International Conference on Project MANagement / HCist -International Conference on Health and Social Care Information Systems and Technologies 2022 (pp. 1279–1288). Elsevier B.V.
Huang, C., Huang, X., Fang, Y., Xu, J., Qu, Y., Zhai, P., Fan, L., Yin, H., Xu, Y., & Li, J. (2020). Sample imbalance disease classification model based on association rule feature selection. Pattern Recognition Letters, 133, 280–286.
Kittiphattanabawon, N. (2022). Uncovering the most and the least factors affecting elderly health using association mining. ECTI Transactions on Computer and Information Technology, 16(2), 174–185.
Khumros, W., & Ekpreechakul, T. (2019). Cerebrovascular disease, risk factors, and quality of life: A systematic review. Chulalongkorn Medical Bulletin, 1(5), 473–487.
Mohammed, S. N. (2023). Diagnosis of COVID-19 infection via association rules of cough Encoding. ECTI Transactions on Computer and Information Technology, 17(1), 95–104.
Pasha, S. J., & Mohamed, E. S. (2022). Advanced hybrid ensemble gain ratio feature selection model using machine learning for enhanced disease risk prediction. Informatics in Medicine Unlocked, 32, 101064.
Pereira, R. M., Costa, Y. M. G., & Silla Jr., C. N. (2021). Toward hierarchical classification of imbalanced data using random resampling algorithms. Information Sciences, 578, 344–363.
Plotnikova, V., Dumas, M., & Milani, F. P. (2022). Applying the CRISP-DM data mining process in the financial services industry: Elicitation of adaptation requirements. Data & Knowledge Engineering, 139, 102013.
Papi, R., Attarchi, S., Boloorani, A. D., & Samany, N. N. (2022). Knowledge discovery of Middle East dust sources using Apriori spatial data mining algorithm. Ecological Informatics, 72, 101867.
Shabtay, L., Fournier-Viger, P., Yaari, R., & Dattner, I. (2020). A guided FP-Growth algorithm for mining multitude-targeted item-sets and class association rules in imbalanced data. Information Sciences, 553, 353–375.
Tanimoto, A., Yamada, S., Takenouchi, T., Sugiyama, M., & Kashima, H. (2022). Improving imbalanced classification using near-miss instances. Expert Systems with Applications, 201, 117130.
Kleindorfer, D. O., Towfighi, A., Chaturvedi, S., Cockroft, K. M., Gutierrez, J., Lombardi-Hill, D., Kamel, H., Kernan, W. N., Kittner, S. J., Leira, E. C., Lennon, O., Meschia, J. F., Nguyen, T. N., Pollak, P. M., Santangeli, P., Sharrief, A. Z., Smith Jr., S. C., Turan, T. N., & Williams, L. S. (2021). 2021 Guideline for the prevention of stroke in patients with stroke and transient ischemic attack: A guideline from the American heart association/American stroke association. Stroke, 52(7), 364–467.
Wang, H.-B., & Gao, Y.-J. (2021). Research on parallelization of Apriori algorithm in association rule mining. 10th International Conference of Information and Communication Technology (pp. 641–647). Elsevier B.V.
Wang, X., Song, C., Xiong, W., & Lv, X. (2018). Evaluation of flotation working condition recognition based on an improved Apriori algorithm. IFAC-PapersOnLine, 51(21), 129–134.
World Stroke Organization. (2020). โรคหลอดเลือดสมอง (Stroke). MedPark Hospital. www.medparkhospital.com/content/stroke.
Zhang, H., Yang, W., Yi, W., Lim, J. B., An, Z., & Li, C. (2023). Imbalanced data based fault diagnosis of the chiller via integrating a new resampling technique with an improved ensemble extreme learning machine. Journal of Building Engineering, 70, 106338.