ผลกระทบของการกำหนดตัวแบบไม่ถูกต้องที่มีต่อตัววัด R2 ของการถดถอยลอจิสติก
Main Article Content
Abstract
บทคัดย่อ
ในการวิจัยนี้ ผู้วิจัยศึกษาผลกระทบของการกำหนดตัวแบบไม่ถูกต้องที่มีต่อตัววัดสัมประสิทธิ์การตัดสินใจ (R2) ของการถดถอยลอจิสติก โดยการกำหนดตัวแบบไม่ถูกต้องใน 3 ลักษณะ คือ (1) กำหนดรูปแบบของตัวแปรอิสระไม่ถูกต้อง (2) กำหนดฟังก์ชันเชื่อมโยงของตัวแบบไม่ถูกต้อง และ (3) กำหนดให้ตัวแบบการถดถอยมีตัวแปรอิสระขาดหายไป ตัววัด R2 ที่นำมาพิจารณาคือตัววัดที่คำนวณด้วยหลักการของสัดส่วนการลดลงของการกระจาย (;) และ R2 ที่คำนวณโดยอาศัยฟังก์ชันควรจะเป็น (;;;) ผลกระทบของการกำหนดตัวแบบไม่ถูกต้องจะประเมินเชิงตัวเลขที่ได้จากการจำลองข้อมูลโดยอาศัยเทคนิคมอนติคาร์โลที่กำหนดให้มีขนาดตัวอย่างเท่ากับ 100; 250; 500; และ 1000 และจำนวนตัวแปรอิสระเท่ากับ 1; 5; และ 10 ตัว การประเมินจะพิจารณาค่าความเอนเอียงสัมพัทธ์ และค่ารากที่สองของความคลาดเคลื่อนกำลังสองเฉลี่ย ผลการวิจัยสรุปได้ว่า การกำหนดตัวแบบไม่ถูกต้องทั้ง 3 รูปแบบ มีผลกระทบต่อ อย่างมากและเป็นไปทิศทางที่ตรงกันข้ามกับ R2 ตัวอื่นๆ โดยการกำหนดรูปแบบของตัวแปรอิสระไม่ถูกต้องและตัวแบบมีตัวแปรอิสระที่สำคัญขาดหายไปนั้นทำให้ มีค่าความเอนเอียงสัมพัทธ์ และรากที่สองของความคลาดเคลื่อนกำลังสองเฉลี่ยสูง ในขณะที่ R2 ตัวอื่นๆ นั้นจะเป็นตัวประมาณที่เอนเอียงเฉพาะในกรณีที่ตัวอย่างมีขนาดเล็ก และตัวแบบมีจำนวนตัวแปรอิสระน้อย สำหรับการกำหนดฟังก์ชันเชื่อมโยงไม่ถูกต้องในรูปฟังก์ชันโพรบิทนั้น มีผลกระทบต่อ และ เท่านั้น โดย ให้ค่าความเอนเอียงสัมพัทธ์สูงกว่า ในทางตรงกันข้ามกับการกำหนดฟังก์ชันเชื่อมโยงไม่ถูกต้องในรูปฟังก์ชันคอมพลีเมนทารีล็อก-ล็อกนั้นจะมีผลกระทบต่อ R2 ทุกตัวที่นำมาศึกษา
คำสำคัญ : สัมประสิทธิ์การตัดสินใจเทียม; การถดถอยลอจิสติก; การกำหนดตัวแบบไม่ถูกต้อง;
Abstract
In this study; we evaluated the three types of misspecified model on R-squared measures that have been suggested to measure the explained variation in the logistic regression models. The first type of misspecification is incorrect link function. The second type occurs when the explanatory variables are wrong functional form. The third type occurs when the important explanatory variables are omitted from the model. The R-squared measures based on proportional reduction in dispersion (;) and the R-squared measures based on likelihood function (;;;) have been explored. We report the results of a Monte Carlo simulation and evaluate the effects of misspecification based on the relative bias and root mean square error. We found that theis substantially sensitive to all of types of misspecifications and it performs inversely of the other measures. Theis a bias estimate with highest relative bias on the misspecification of wrong functional form of covariate and with missing one covariate from the model. While the other measures are bias estimates only with small sample and a few covariate. For the misspecified link function of probit; theyields higher relative bias than the; while the other measures do not affect on this misspecification. Inversely; the complementary-log-log link function does affect on all R-squared measures under study.
Keywords: pseudo-R-squared measure; logistic regression; model misspecification