การเปรียบเทียบประสิทธิภาพของวิธีการวิเคราะห์การถดถอยแบบพีนอลไลซ์ในตัวแบบการถดถอยลอจิสติกภายใต้ข้อมูลที่มีมิติสูงแบบบางเบาและตัวแปรทำนายมีความสัมพันธ์กันสูง

Main Article Content

สุปราณี ลิสวัสดิ์
วรางคณา วัชรเสถียร
เบญจมาศ ตุลยนิติกุล

บทคัดย่อ

ปัจจุบันเทคโนโลยีได้รับการพัฒนาเป็นอย่างมาก ความเจริญก้าวหน้าทางด้านเทคโนโลยีส่งผลต่อกระบวนการทางข้อมูล ทำให้การเก็บรวบรวมข้อมูลมีประสิทธิภาพมากขึ้น ดังนั้นในการวิเคราะห์ข้อมูล นักวิเคราะห์ข้อมูลจึงได้มีการค้นหาวิธีการที่เหมาะสมเพื่อวิเคราะห์ข้อมูลขนาดใหญ่ นักวิเคราะห์นิยมใช้วิธีการวิเคราะห์การถดถอยแบบพีนอลไลซ์ในการวิเคราะห์ข้อมูลที่มีขนาดใหญ่และมีจำนวนตัวแปรเป็นจำนวนมาก ซึ่งวิธีการวิเคราะห์การถดถอยแบบพีนอลไลซ์เป็นวิธีการหนึ่งที่ใช้ประมาณค่าพารามิเตอร์สัมประสิทธิ์การถดถอย การคัดเลือกตัวแปรเข้าสู่ตัวแบบ และการแก้ไขปัญหาตัวแปรมีความสัมพันธ์เชิงเส้นกัน ในการศึกษาครั้งนี้ได้พิจารณาการประมาณค่าสำหรับตัวแบบการถดถอยลอจิสติกที่ข้อมูลมีมิติสูง (n < p) แบบบางเบาและตัวแปรทำนายมีความสัมพันธ์กันสูง โดยพิจารณาตัวประมาณจากวิธีการถดถอยแบบพีนอลไลซ์ ได้แก่ วิธีการวิเคราะห์การถดถอยแบบริดจ์ วิธีการวิเคราะห์การถดถอยแบบแลซโซ และวิธีการวิเคราะห์การถดถอยแบบแลซโซแบบปรับปรุง ซึ่งตัวประมาณทั้งสามสามารถใช้ในการประมาณค่าพารามิเตอร์สัมประสิทธิ์การถดถอยในข้อมูลที่มีมิติสูงและสามารถแก้ปัญหาตัวแปรทำนายมีความสัมพันธ์กันสูง โดยพิจารณาเปรียบเทียบด้วยค่าเฉลี่ยของค่าคลาดเคลื่อนกำลังสองเฉลี่ยของการพยากรณ์ (mPMSE) จากการจำลองข้อมูลด้วยวิธีมอนติคาร์โล ซึ่งการศึกษาข้อมูลดังกล่าวสามารถสรุปว่าตัวประมาณแลซโซแบบปรับปรุงมีประสิทธิภาพที่ดีที่สุดเมื่อเปรียบเทียบจากทั้งสามตัวประมาณ

Article Details

รูปแบบการอ้างอิง
ลิสวัสดิ์ ส., วัชรเสถียร ว., & ตุลยนิติกุล เ. (2021). การเปรียบเทียบประสิทธิภาพของวิธีการวิเคราะห์การถดถอยแบบพีนอลไลซ์ในตัวแบบการถดถอยลอจิสติกภายใต้ข้อมูลที่มีมิติสูงแบบบางเบาและตัวแปรทำนายมีความสัมพันธ์กันสูง. Thai Journal of Science and Technology, 9(6), 761–772. https://doi.org/10.14456/tjst.2020.79
ประเภทบทความ
วิทยาศาสตร์กายภาพ
ประวัติผู้แต่ง

สุปราณี ลิสวัสดิ์

สาขาวิชาคณิตศาสตร์และสถิติ คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยธรรมศาสตร์ ศูนย์รังสิต ตำบลคลองหนึ่ง อำเภอคลองหลวง จังหวัดปทุมธานี 12120

วรางคณา วัชรเสถียร

สาขาวิชาคณิตศาสตร์และสถิติ คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยธรรมศาสตร์ ศูนย์รังสิต ตำบลคลองหนึ่ง อำเภอคลองหลวง จังหวัดปทุมธานี 12120

เบญจมาศ ตุลยนิติกุล

สาขาวิชาคณิตศาสตร์และสถิติ คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยธรรมศาสตร์ ศูนย์รังสิต ตำบลคลองหนึ่ง อำเภอคลองหลวง จังหวัดปทุมธานี 12120

เอกสารอ้างอิง

Hardin, J., Garcia, S.R. and Golan, D., 2013, A method for generating realistic correlation matrices, Ann. Appl. Stat. 7: 1733-1762.
Hoerl, A.E. and Kennard, R.W., 1970, Ridge regression: Biased estimation for non-orthogonal problems, Technometrics 12: 55-67.
Hossain, S. and Ahmed, S.E., 2012, Shrinkage and penalty estimators of a Poisson regression model, Aust. N. Z. J. Stat. 54: 359-373.
Hossain, S. and Ahmed, S., 2014, Shrinkage estimation and selection for a logistic regression model, CRM Proc. Contemp. Math. 622: 159-176.
Honboonherm, O. and Pungpapong, V., 2013, Empirical bayes variable selection and estimation for the COX's proportional hazard model with high dimensional data, The 4th Hatyai National Conference, Hatyai University, Songkhla. (in Thai)
Pungpapong, V., 2015, A brief review on high-dimensional linear regression, Thai Sci. Technol. J. 23(2): 212-223. (in Thai)
Sarakor, T. and Kulvanich, N., 2014, Comparing the prediction accuracy and subset selection performances of stepwise, Lasso, elastic net and adaptive Lasso for small and sparse signals, Rajamangala University of Technology Tawan-ok Research Conference, Rajamangala University, Nakhon Nayok. (in Thai)
Singruang, S. and Pungpapong, V., 2017, A method comparison of gene set enrichment analysis and binary logistic regression for investigating the relationship between gene sets and a binary phenotype, Thai Sci. Technol J. 25(5): 778-790. (in Thai)
Tibshirani, R., 1996, Regression shrinkage and selection via the LASSO, J. Royal Stat. Soc. Ser. B 58: 267-288.
Zou, H., 2006, The adaptive LASSO and its oracle properties, J. Am. Stat. Assoc. 101: 1418-1429.