การเปรียบเทียบสถิติทดสอบความเท่ากันของเมทริกซ์ความแปรปรวนร่วมสองประชากรสำหรับข้อมูลที่มีมิติสูง

Main Article Content

ศศิภรณ์ สิทธิศร
เสาวภา ชัยพิทักษ์
ธิดาพร ศุภภากร

บทคัดย่อ

บทคัดย่อ


งานวิจัยนี้มีวัตถุประสงค์เพื่อ เปรียบเทียบประสิทธิภาพของสถิติทดสอบความเท่ากันของเมทริกซ์ความแปรปรวนร่วมสองประชากร สำหรับข้อมูลที่มีการแจกแจงปรกติหลายตัวแปรและเป็นข้อมูลที่มิติสูง (high-dimensional data) ของสถิติทดสอบ 2 สถิติ ได้แก่ สถิติทดสอบ LC ของ Li และ Chen และสถิติทดสอบ SE ของ Srivastava และคณะ โดยมีเกณฑ์ในการเปรียบเทียบ คือ ค่าความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1 และอำนาจการทดสอบ จำลองข้อมูลภายใต้สถานการณ์ต่าง ๆ ด้วยเทคนิคมอนติคาร์โล กระทำซ้ำ 1,000 ครั้ง โดยกำหนดให้ข้อมูลมีการแจกแจงปรกติหลายตัวแปรและมีโครงสร้างของเมทริกซ์ ความแปรปรวนร่วมของประชากร 5 แบบ ได้แก่ โครงสร้าง compound symmetry, simple, Toeplitz, unstructured และโครงสร้าง variance components และกำหนดให้ขนาดตัวอย่างทั้งสองกลุ่มเท่ากัน  และจำนวนตัวแปรมีมากกว่าหรือเท่ากับขนาดตัวอย่าง ดังนี้  ผลการวิจัยพบว่าสถิติทดสอบ LC สามารถควบคุมความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1 ได้ทุกโครงสร้างของเมทริกซ์ความแปรปรวนร่วมที่พิจารณา ในขณะที่สถิติทดสอบ SE ไม่สามารถควบคุมความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1 ได้ นอกจากนี้สถิติทดสอบ LC มีค่าอำนาจการทดสอบสูงกว่าสถิติทดสอบ SE และลู่เข้าสู่ 1 เมื่อเพิ่มขนาดตัวอย่างและจำนวนตัวแปรในทุกสถานการณ์ 


คำสำคัญ : การแจกแจงปรกติหลายตัวแปร; ความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1; อำนาจการทดสอบ; เมทริกซ์ความแปรปรวนร่วม

Article Details

ประเภทบทความ
Physical Sciences
ประวัติผู้แต่ง

ศศิภรณ์ สิทธิศร

ภาควิชาสถิติ คณะวิทยาศาสตร์ มหาวิทยาลัยเกษตรศาสตร์ วิทยาเขตบางเขน แขวงลาดยาว เขตจตุจักร กรุงเทพมหานคร 10900

เสาวภา ชัยพิทักษ์

ภาควิชาสถิติ คณะวิทยาศาสตร์ มหาวิทยาลัยเกษตรศาสตร์ วิทยาเขตบางเขน แขวงลาดยาว เขตจตุจักร กรุงเทพมหานคร 10900

ธิดาพร ศุภภากร

ภาควิชาสถิติ คณะวิทยาศาสตร์ มหาวิทยาลัยเกษตรศาสตร์ วิทยาเขตบางเขน แขวงลาดยาว เขตจตุจักร กรุงเทพมหานคร 10900

เอกสารอ้างอิง

[1] Srivastava, M.S., 2002, Methods of Multivariate Statistics, John Wiley and Sons, Inc., New York, 728p.
[2] กัลยา วานิชย์บัญชา, 2554, การวิเคราะห์ข้อมูลหลายตัวแปร, ภาควิชาสถิติ คณะพานิชยศาสตร์และการบัญชี จุฬาลงกรณ์มหาวิทยาลัย, กรุงเทพ, 589 น.
[3] Anderson, T.W., 2003, An Introduction to Mutivariate Statistical Analysis, 3rd Ed., Wiley-Interscience, New york, pp. 265-267.
[4] Schott, J. R., 2007, A high-dimensional test for the equality of the smallest eigenvalues of a covariance matrix, J. Multivariate Anal. 97: 827-843.
[5] Srivastava, M.S., 2007, Testing the equality of two covariance matrix and testing the independence of two subvectors with fewer observations than the dimension, Proceedings of the International Conference on Advanced in Inter-disciplinary Statistics and Combinatorics.
[6] Srivastava, M.S. and Yanagihara, H., 2010, Testing the equality of several covariance matrices with fewer observations than the dimension, J. Multivariate Anal. 101: 1319-1329.
[7] Li, J. and Chen, S.X., 2012, Two sample test for high dimensional covariance matrices, Anal. Stat. 40: 908-940.
[8] Bai, Z., Jiang, D., Yao, J.F. and Zheng, S., 2009, Corrections to LRT on large-dimensional covariance matrices by RMT, Ann. Statist. 37: 3822-3840.
[9] Srivastava, M.S., Yanagihara, H. and Kunokawa, T., 2014, Test for covariance matrices in high dimension with less sample size, J. Multivariate Anal. 130: 289-309.
[10] Chaipitak, S., 2013, Tests for covariance Matrices with High-Dimensional Data, Ph.D. Thesis, National Institute of Development Administration, Bangkok, 124 p.
[11] Chochran, W.G., 1954, Some methods for strengthening the common test, Biometrics 10: 417-451.
[12] Chen, S.X. and Qin, Y.L., 2010, A two-sample test for high-dimensional data with applications to gene-set testing, Anal. Stat. 38: 808-835.
[13] Cai, T., Lui, W. and Xai, Y., 2013 Two-sample covariance matrix testing and support recovery in high-dimensional and sparse settings, J. Amer. Stat. Assoc. 108: 265-277.