Comparison of Predictive Models for the Prognosis of Lung Cancer

Main Article Content

Atsadawut Ruangsawud
Anupong Sukprasert
Thiwa Sinthukoot
Sirilak Kaiwinit

Abstract

The purpose of this research is to examine the efficiency of data mining techniques by creating a model to predict the likelihood of lung cancer. In the research procedure, the 310 rows 16 variables data was analyzed under the Cross Standard Process for Data Mining (CRISP-DM) and divided into two groups (teaching and testing data) using the 10-fold cross-validation method. Four data mining techniques consist of k-Nearest Neighbors, Decision Tree, Random Forest, and Vote Ensemble to evaluate algorithms for optimization value for each set of parameters in the model and compare the data classification performance by Accuracy, F-measure, Sensitivity, Specificity and Positive Predictive Value with RapidMiner Studio Version 10. The results show that technique of grouping method is the most suitable technique to build a model for trend prediction of cancer with the highest accuracy of 91.57%, which is very high level. The efficiency value is 60.61%, which is moderate level. The sensitivity is 51.67%, which is moderate level. And the specific value is 97.42%, which is very high level. The positive predictive is 73.08%, which is high level. Finally, the results of this research can be used to build a trend prediction for lung cancer patients. It is a preliminary screening of patient information before reaching the doctor.

Article Details

How to Cite
Ruangsawud, A. ., Sukprasert, A., Sinthukoot, T. ., & Kaiwinit, S. . (2023). Comparison of Predictive Models for the Prognosis of Lung Cancer. Kalasin University Journal of Science Technology and Innovation, 2(2), 39–52. https://doi.org/10.14456/ksti.2023.8
Section
Research Articles

References

World Health Organization, Cancer fact sheets, lung cancer [อินเตอร์เน็ต]. 2020 [เข้าถึงเมื่อ 7 ธันวาคม 2565]. เข้าถึงจาก : http://gco.iarc.fr/today/fact-sheets-cancers

Virani S, Bilheem S, Chansaard W, Chitapanarux I, Daoprasert K, Khuanchana S, et al. National and subnational population-based incidence of cancer in thailand: Assessing cancers with the highest burdens. Cancers (Basel). 2017;9(8).

National Cancer Institute. Hospital cancer registration B.E.2561.National Cancer Institute. Department of Medical Services. The Ministry of Public Health. 2019.

Non-Small Cell Lung Cancer Collaborative Group. Chemotherapy in non-small cell lung cancer: a meta-analysis using updated data on individual patients from 52 randomised clinical trials. Bmj, 1995, 311.7010: 899-909.

Ciuleanu T, Brodowicz T, Zielinski C et al. Maintenance pemetrexed plus best supportive care versus placebo plus best supportive care for non-small-cell lung cancer: a randomised, double-blind, phase 3 study. Lancet 2009; 374: 1432-1440.

Schiller JH, Harrington D, Belani CP, Langer C, Sandler A, Krook J, et al. Comparison of four chemotherapy regimens for advanced non-small-cell lung cancer. N Engl J Med. 2002; 346(2): 92–8.

วรลักขณ์. วิชพัฒน์, ปัจจัยที่เกี่ยวกับการเสียชีวิต และอัตราการรอดชีวิตในผู้ป่วยโรคมะเร็งปอดชนิดเซลล์ขนาดไม่เล็กระยะแพร่กระจายที่ได้รับการวินิจฉัยและรักษาที่โรงพยาบาลสระบุรี. วารสารกรมการแพทย์, 2563, หน้า 182-192.

TETSUYA SASAKI. Survey lung cancer. [อินเตอร์เน็ต]. 2565 [เข้าถึงเมื่อ 7 ธันวาคม 2565]. เข้าถึงจาก :

https://www.kaggle.com/code/sasakitetsuya/age-allergy-yellow-fingers-lung-cancer/data?fbclid=IwAR3wFRvO3S1F2V8FxPLmmmcuKKEtgDU8_ssA2wYZ_nE1Ut88f2nDymiV2No

อนุพงศ์ สุขประเสริฐ. คู่มือการทำเหมืองข้อมูลด้วยโปรแกรม RapidMiner Studio. พิมพ์ครั้งที่ 4. สาขาวิชาคอมพิวเตอร์ธุรกิจ คณะการบัญชีและการจัดการ มหาวิทยาลัมหาสารคามมหาสารคาม, 2564, หน้า 1-366

ศรราม หงส์พรหม และจันตรี ผลประเสริฐ. การทำนายระดับความยากจนจากของข้อมูลสำมะโนประชากรด้วยการเรียนรู้ของเครื่อง. สารนิพนธ์ วท.ม.(เทคโนโลยีสารสนเทศ), มหาวิทยาลัยศรีนครินทรวิโรฒ, 2563, หน้า 1-99.

ภรัณยา อำมฤครัตน์ และพยุง มีสัจ, การหาค่าเหมาะสมที่สุดที่มีหลายวัตถุประสงค์ด้วยขั้นตอนวิธีด้านวิวัฒนาการ. วารสารเทคโนโลยีสารสนเทศ, ปีที่ 8, ฉบับที่ 2, กรกฎาคม–ธันวาคม. 2555, หน้า 73-80.

จิราภา เลาหะวรนันท์ รชต ลิ้มสุทธิวันภูมิ และบัณฑิต ฐานะโสภณ. การใช้เทคนิคการทำเหมืองข้อมูลในการจำแนกและคัดเลือกแขนงวิชาสำหรับนักศึกษาคณะเทคโนโลยีสารสนเทศ. วารสารเทคโนโลยีสารสนเทศลาดกระบัง, 2558, หน้า 1-9.

พิชญะ พรมลา และจรัญ แสนราช. การเปรียบเทียบประสิทธิภาพการวิเคราะห์ความพึงพอใจเกี่ยวกับการจัดการเรียนการสอนด้วยกระบวนการวิเคราะห์ความรู้สึกโดยใช้เทคนิคการรวมกลุ่มเพื่อจำแนกข้อมูล. วารสารวิจัย มข. ฉบับบัณฑิตศึกษา, ปีที่ 20, ฉบับที่ 4, ตุลาคม-ธันวาคม. 2563, หน้า 140-149.