การเปรียบเทียบสถิติทดสอบความเท่ากันของเมทริกซ์ความแปรปรวนร่วมสองประชากรสำหรับข้อมูลที่มีมิติสูง
Main Article Content
บทคัดย่อ
บทคัดย่อ
งานวิจัยนี้มีวัตถุประสงค์เพื่อ เปรียบเทียบประสิทธิภาพของสถิติทดสอบความเท่ากันของเมทริกซ์ความแปรปรวนร่วมสองประชากร สำหรับข้อมูลที่มีการแจกแจงปรกติหลายตัวแปรและเป็นข้อมูลที่มิติสูง (high-dimensional data) ของสถิติทดสอบ 2 สถิติ ได้แก่ สถิติทดสอบ LC ของ Li และ Chen และสถิติทดสอบ SE ของ Srivastava และคณะ โดยมีเกณฑ์ในการเปรียบเทียบ คือ ค่าความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1 และอำนาจการทดสอบ จำลองข้อมูลภายใต้สถานการณ์ต่าง ๆ ด้วยเทคนิคมอนติคาร์โล กระทำซ้ำ 1,000 ครั้ง โดยกำหนดให้ข้อมูลมีการแจกแจงปรกติหลายตัวแปรและมีโครงสร้างของเมทริกซ์ ความแปรปรวนร่วมของประชากร 5 แบบ ได้แก่ โครงสร้าง compound symmetry, simple, Toeplitz, unstructured และโครงสร้าง variance components และกำหนดให้ขนาดตัวอย่างทั้งสองกลุ่มเท่ากัน และจำนวนตัวแปรมีมากกว่าหรือเท่ากับขนาดตัวอย่าง ดังนี้ ผลการวิจัยพบว่าสถิติทดสอบ LC สามารถควบคุมความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1 ได้ทุกโครงสร้างของเมทริกซ์ความแปรปรวนร่วมที่พิจารณา ในขณะที่สถิติทดสอบ SE ไม่สามารถควบคุมความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1 ได้ นอกจากนี้สถิติทดสอบ LC มีค่าอำนาจการทดสอบสูงกว่าสถิติทดสอบ SE และลู่เข้าสู่ 1 เมื่อเพิ่มขนาดตัวอย่างและจำนวนตัวแปรในทุกสถานการณ์
คำสำคัญ : การแจกแจงปรกติหลายตัวแปร; ความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1; อำนาจการทดสอบ; เมทริกซ์ความแปรปรวนร่วม
Article Details
เอกสารอ้างอิง
[2] กัลยา วานิชย์บัญชา, 2554, การวิเคราะห์ข้อมูลหลายตัวแปร, ภาควิชาสถิติ คณะพานิชยศาสตร์และการบัญชี จุฬาลงกรณ์มหาวิทยาลัย, กรุงเทพ, 589 น.
[3] Anderson, T.W., 2003, An Introduction to Mutivariate Statistical Analysis, 3rd Ed., Wiley-Interscience, New york, pp. 265-267.
[4] Schott, J. R., 2007, A high-dimensional test for the equality of the smallest eigenvalues of a covariance matrix, J. Multivariate Anal. 97: 827-843.
[5] Srivastava, M.S., 2007, Testing the equality of two covariance matrix and testing the independence of two subvectors with fewer observations than the dimension, Proceedings of the International Conference on Advanced in Inter-disciplinary Statistics and Combinatorics.
[6] Srivastava, M.S. and Yanagihara, H., 2010, Testing the equality of several covariance matrices with fewer observations than the dimension, J. Multivariate Anal. 101: 1319-1329.
[7] Li, J. and Chen, S.X., 2012, Two sample test for high dimensional covariance matrices, Anal. Stat. 40: 908-940.
[8] Bai, Z., Jiang, D., Yao, J.F. and Zheng, S., 2009, Corrections to LRT on large-dimensional covariance matrices by RMT, Ann. Statist. 37: 3822-3840.
[9] Srivastava, M.S., Yanagihara, H. and Kunokawa, T., 2014, Test for covariance matrices in high dimension with less sample size, J. Multivariate Anal. 130: 289-309.
[10] Chaipitak, S., 2013, Tests for covariance Matrices with High-Dimensional Data, Ph.D. Thesis, National Institute of Development Administration, Bangkok, 124 p.
[11] Chochran, W.G., 1954, Some methods for strengthening the common test, Biometrics 10: 417-451.
[12] Chen, S.X. and Qin, Y.L., 2010, A two-sample test for high-dimensional data with applications to gene-set testing, Anal. Stat. 38: 808-835.
[13] Cai, T., Lui, W. and Xai, Y., 2013 Two-sample covariance matrix testing and support recovery in high-dimensional and sparse settings, J. Amer. Stat. Assoc. 108: 265-277.