การเปรียบเทียบประสิทธิภาพของตัวแบบสำหรับการพยากรณ์โรคมะเร็งปอด
Main Article Content
บทคัดย่อ
งานวิจัยฉบับนี้มีวัตถุประสงค์เพื่อศึกษาประสิทธิภาพของเทคนิคเหมืองข้อมูล โดยการสร้างตัวแบบเพื่อพยากรณ์โอกาสการเกิดโรคมะเร็งปอด จำนวนข้อมูลทั้งหมด 310 แถว 16 ตัวแปร และนำข้อมูลมาวิเคราะห์ตามมาตรฐานในการทำเหมืองข้อมูล (CRISP-DM) การวิเคราะห์ข้อมูลครั้งนี้ผู้วิจัยทำการแบ่งชุดข้อมูลจำนวน 2 กลุ่ม ด้วยวิธีการ 10-fold Cross Validation สำหรับข้อมูลสอนและข้อมูลทดสอบ และทำการวิเคราะห์ข้อมูลด้วยเทคนิคการทำเหมืองข้อมูลทั้งหมด 4 เทคนิคประกอบด้วย เทคนิคเพื่อนบ้านใกล้ที่สุด (k-Nearest Neighbors) เทคนิคต้นไม้ตัดสินใจ (Decision Tree) เทคนิคต้นไม้ป่าสุ่ม (Random Forest) และทำการเพิ่มประสิทธิภาพของตัวแบบด้วยเทคนิควิธีการรวมกลุ่ม (Vote Ensemble) วิธีการหาค่าที่เหมาะสมที่สุด (Optimization) ด้วยวิธีด้านวิวัฒนาการ (Evolutionary Algorithms) เพื่อค้นหาค่าที่เหมาะสมที่สุดสำหรับชุดของพารามิเตอร์ในแต่ละตัวแบบและทำการเปรียบเทียบประสิทธิภาพการจำแนกประเภทข้อมูลด้วยค่าความแม่น (Accuracy) ค่าประสิทธิภาพโดยรวม (F-measure) ค่าความไว (Sensitivity) ค่าจำเพาะ (Specificity) และค่าทำนายผลบวก (Positive Predictive Value) โดยใช้โปรแกรม RapidMiner Studio Version 10 ในการสร้างตัวแบบและการวิเคราะห์ข้อมูล ผลการวิจัยพบว่า เทคนิควิธีการรวมกลุ่ม เป็นเทคนิคความเหมาะสมมากที่สุดในการสร้างตัวแบบสำหรับการพยากรณ์โอกาสการเกิดโรคมะเร็งโดยค่าความแม่น มากที่สุดถึง 91.57% อยู่ระดับสูงมาก ค่าประสิทธิภาพ เท่ากับ 60.61% อยู่ระดับปานกลาง ค่าความไว เท่ากับ 51.67% อยู่ระดับปานกลาง และค่าจำเพาะ เท่ากับ 97.42% อยู่ระดับสูงมาก ค่าทำนายผลบวก เท่ากับ 73.08% อยู่ระดับสูง ซึ่งผลการวิจัยนี้สามารถนำไปสร้างเป็นระบบสารสนเทศเพื่อพยากรณ์ผู้ป่วยมะเร็งปอด โดยเป็นการคัดกรองข้อมูลผู้ป่วยเบื้องต้นก่อนถึงมือแพทย์
Downloads
Article Details

อนุญาตภายใต้เงื่อนไข Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
เจ้าของลิขสิทธิ์ (สถาบันวิจัยและพัฒนา มหาวิทยาลัยกาฬสินธุ์) ผู้เขียน ตกลงว่าการทำสำเนาบทความหรือส่วนใดส่วนหนึ่งของบทความดังกล่าวในรูปแบบสิ่งพิมพ์หรืออิเล็กทรอนิกส์ตามที่ได้รับอนุญาต จะต้องระบุประกาศลิขสิทธิ์ตามที่กำหนดไว้ในวารสาร พร้อมทั้งอ้างอิงข้อมูลฉบับสมบูรณ์ของบทความที่ตีพิมพ์ในวารสารที่จัดทำโดย สถาบันวิจัยและพัฒนา มหาวิทยาลัยกาฬสินธุ์ อย่างครบถ้วนทุกครั้ง
เอกสารอ้างอิง
World Health Organization, Cancer fact sheets, lung cancer [อินเตอร์เน็ต]. 2020 [เข้าถึงเมื่อ 7 ธันวาคม 2565]. เข้าถึงจาก : http://gco.iarc.fr/today/fact-sheets-cancers
Virani S, Bilheem S, Chansaard W, Chitapanarux I, Daoprasert K, Khuanchana S, et al. National and subnational population-based incidence of cancer in thailand: Assessing cancers with the highest burdens. Cancers (Basel). 2017;9(8).
National Cancer Institute. Hospital cancer registration B.E.2561.National Cancer Institute. Department of Medical Services. The Ministry of Public Health. 2019.
Non-Small Cell Lung Cancer Collaborative Group. Chemotherapy in non-small cell lung cancer: a meta-analysis using updated data on individual patients from 52 randomised clinical trials. Bmj, 1995, 311.7010: 899-909.
Ciuleanu T, Brodowicz T, Zielinski C et al. Maintenance pemetrexed plus best supportive care versus placebo plus best supportive care for non-small-cell lung cancer: a randomised, double-blind, phase 3 study. Lancet 2009; 374: 1432-1440.
Schiller JH, Harrington D, Belani CP, Langer C, Sandler A, Krook J, et al. Comparison of four chemotherapy regimens for advanced non-small-cell lung cancer. N Engl J Med. 2002; 346(2): 92–8.
วรลักขณ์. วิชพัฒน์, ปัจจัยที่เกี่ยวกับการเสียชีวิต และอัตราการรอดชีวิตในผู้ป่วยโรคมะเร็งปอดชนิดเซลล์ขนาดไม่เล็กระยะแพร่กระจายที่ได้รับการวินิจฉัยและรักษาที่โรงพยาบาลสระบุรี. วารสารกรมการแพทย์, 2563, หน้า 182-192.
TETSUYA SASAKI. Survey lung cancer. [อินเตอร์เน็ต]. 2565 [เข้าถึงเมื่อ 7 ธันวาคม 2565]. เข้าถึงจาก :
อนุพงศ์ สุขประเสริฐ. คู่มือการทำเหมืองข้อมูลด้วยโปรแกรม RapidMiner Studio. พิมพ์ครั้งที่ 4. สาขาวิชาคอมพิวเตอร์ธุรกิจ คณะการบัญชีและการจัดการ มหาวิทยาลัมหาสารคามมหาสารคาม, 2564, หน้า 1-366
ศรราม หงส์พรหม และจันตรี ผลประเสริฐ. การทำนายระดับความยากจนจากของข้อมูลสำมะโนประชากรด้วยการเรียนรู้ของเครื่อง. สารนิพนธ์ วท.ม.(เทคโนโลยีสารสนเทศ), มหาวิทยาลัยศรีนครินทรวิโรฒ, 2563, หน้า 1-99.
ภรัณยา อำมฤครัตน์ และพยุง มีสัจ, การหาค่าเหมาะสมที่สุดที่มีหลายวัตถุประสงค์ด้วยขั้นตอนวิธีด้านวิวัฒนาการ. วารสารเทคโนโลยีสารสนเทศ, ปีที่ 8, ฉบับที่ 2, กรกฎาคม–ธันวาคม. 2555, หน้า 73-80.
จิราภา เลาหะวรนันท์ รชต ลิ้มสุทธิวันภูมิ และบัณฑิต ฐานะโสภณ. การใช้เทคนิคการทำเหมืองข้อมูลในการจำแนกและคัดเลือกแขนงวิชาสำหรับนักศึกษาคณะเทคโนโลยีสารสนเทศ. วารสารเทคโนโลยีสารสนเทศลาดกระบัง, 2558, หน้า 1-9.
พิชญะ พรมลา และจรัญ แสนราช. การเปรียบเทียบประสิทธิภาพการวิเคราะห์ความพึงพอใจเกี่ยวกับการจัดการเรียนการสอนด้วยกระบวนการวิเคราะห์ความรู้สึกโดยใช้เทคนิคการรวมกลุ่มเพื่อจำแนกข้อมูล. วารสารวิจัย มข. ฉบับบัณฑิตศึกษา, ปีที่ 20, ฉบับที่ 4, ตุลาคม-ธันวาคม. 2563, หน้า 140-149.