Comparison of Predictive Models for the Prognosis of Lung Cancer
Main Article Content
Abstract
The purpose of this research is to examine the efficiency of data mining techniques by creating a model to predict the likelihood of lung cancer. In the research procedure, the 310 rows 16 variables data was analyzed under the Cross Standard Process for Data Mining (CRISP-DM) and divided into two groups (teaching and testing data) using the 10-fold cross-validation method. Four data mining techniques consist of k-Nearest Neighbors, Decision Tree, Random Forest, and Vote Ensemble to evaluate algorithms for optimization value for each set of parameters in the model and compare the data classification performance by Accuracy, F-measure, Sensitivity, Specificity and Positive Predictive Value with RapidMiner Studio Version 10. The results show that technique of grouping method is the most suitable technique to build a model for trend prediction of cancer with the highest accuracy of 91.57%, which is very high level. The efficiency value is 60.61%, which is moderate level. The sensitivity is 51.67%, which is moderate level. And the specific value is 97.42%, which is very high level. The positive predictive is 73.08%, which is high level. Finally, the results of this research can be used to build a trend prediction for lung cancer patients. It is a preliminary screening of patient information before reaching the doctor.
Article Details
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
Copyright
All content, data, and information stored in Thai Journal Citation Index Center (TCI) are under full responsible of authors. TCI has full copyright on published articles/manuscripts with content, data, information, photos, figures and etc. If a person/corporation needs an access on the published articles/manuscripts for further applications, permission must be granted by TCI.
References
World Health Organization, Cancer fact sheets, lung cancer [อินเตอร์เน็ต]. 2020 [เข้าถึงเมื่อ 7 ธันวาคม 2565]. เข้าถึงจาก : http://gco.iarc.fr/today/fact-sheets-cancers
Virani S, Bilheem S, Chansaard W, Chitapanarux I, Daoprasert K, Khuanchana S, et al. National and subnational population-based incidence of cancer in thailand: Assessing cancers with the highest burdens. Cancers (Basel). 2017;9(8).
National Cancer Institute. Hospital cancer registration B.E.2561.National Cancer Institute. Department of Medical Services. The Ministry of Public Health. 2019.
Non-Small Cell Lung Cancer Collaborative Group. Chemotherapy in non-small cell lung cancer: a meta-analysis using updated data on individual patients from 52 randomised clinical trials. Bmj, 1995, 311.7010: 899-909.
Ciuleanu T, Brodowicz T, Zielinski C et al. Maintenance pemetrexed plus best supportive care versus placebo plus best supportive care for non-small-cell lung cancer: a randomised, double-blind, phase 3 study. Lancet 2009; 374: 1432-1440.
Schiller JH, Harrington D, Belani CP, Langer C, Sandler A, Krook J, et al. Comparison of four chemotherapy regimens for advanced non-small-cell lung cancer. N Engl J Med. 2002; 346(2): 92–8.
วรลักขณ์. วิชพัฒน์, ปัจจัยที่เกี่ยวกับการเสียชีวิต และอัตราการรอดชีวิตในผู้ป่วยโรคมะเร็งปอดชนิดเซลล์ขนาดไม่เล็กระยะแพร่กระจายที่ได้รับการวินิจฉัยและรักษาที่โรงพยาบาลสระบุรี. วารสารกรมการแพทย์, 2563, หน้า 182-192.
TETSUYA SASAKI. Survey lung cancer. [อินเตอร์เน็ต]. 2565 [เข้าถึงเมื่อ 7 ธันวาคม 2565]. เข้าถึงจาก :
อนุพงศ์ สุขประเสริฐ. คู่มือการทำเหมืองข้อมูลด้วยโปรแกรม RapidMiner Studio. พิมพ์ครั้งที่ 4. สาขาวิชาคอมพิวเตอร์ธุรกิจ คณะการบัญชีและการจัดการ มหาวิทยาลัมหาสารคามมหาสารคาม, 2564, หน้า 1-366
ศรราม หงส์พรหม และจันตรี ผลประเสริฐ. การทำนายระดับความยากจนจากของข้อมูลสำมะโนประชากรด้วยการเรียนรู้ของเครื่อง. สารนิพนธ์ วท.ม.(เทคโนโลยีสารสนเทศ), มหาวิทยาลัยศรีนครินทรวิโรฒ, 2563, หน้า 1-99.
ภรัณยา อำมฤครัตน์ และพยุง มีสัจ, การหาค่าเหมาะสมที่สุดที่มีหลายวัตถุประสงค์ด้วยขั้นตอนวิธีด้านวิวัฒนาการ. วารสารเทคโนโลยีสารสนเทศ, ปีที่ 8, ฉบับที่ 2, กรกฎาคม–ธันวาคม. 2555, หน้า 73-80.
จิราภา เลาหะวรนันท์ รชต ลิ้มสุทธิวันภูมิ และบัณฑิต ฐานะโสภณ. การใช้เทคนิคการทำเหมืองข้อมูลในการจำแนกและคัดเลือกแขนงวิชาสำหรับนักศึกษาคณะเทคโนโลยีสารสนเทศ. วารสารเทคโนโลยีสารสนเทศลาดกระบัง, 2558, หน้า 1-9.
พิชญะ พรมลา และจรัญ แสนราช. การเปรียบเทียบประสิทธิภาพการวิเคราะห์ความพึงพอใจเกี่ยวกับการจัดการเรียนการสอนด้วยกระบวนการวิเคราะห์ความรู้สึกโดยใช้เทคนิคการรวมกลุ่มเพื่อจำแนกข้อมูล. วารสารวิจัย มข. ฉบับบัณฑิตศึกษา, ปีที่ 20, ฉบับที่ 4, ตุลาคม-ธันวาคม. 2563, หน้า 140-149.