การทดสอบประสิทธิภาพการแบ่งข้อมูลตัวแปรเดียวด้วยการใช้การแบ่งช่วงธรรมชาติเจงค์แบบซ้ำ

Main Article Content

วิชญ์ยุตม์ สุขแพทย์
นัท กุลวานิช

บทคัดย่อ

การแบ่งช่วงธรรมชาติเจงค์เป็นวิธีการจัดกลุ่มข้อมูลที่ได้รับความนิยม งานวิจัยนี้ได้นำการแบ่งช่วงธรรมชาติเจงค์มาปรับใช้ด้วยการเพิ่มจำนวนกลุ่มที่ใช้แบ่งเรื่อย ๆ จนกว่าจุดแบ่งแรกของการแบ่งช่วงธรรมชาติเจงค์จะเปลี่ยนแปลงไปน้อยกว่าค่าร้อยละที่กำหนดและใช้จุดแบ่งแรกนั้นในการแบ่งข้อมูลออกเป็น 2 กลุ่ม จากการทดสอบประสิทธิภาพด้วยการจำลองข้อมูลตัวแปรเดียวที่มีการแจกแจงในรูปแบบการแจกแจงปกติแบบผสมและการแจกแจงล็อกปกติแบบผสม 2 กลุ่มและเปรียบเทียบกับวิธีการแบ่งกลุ่มข้อมูลอื่น ๆ  พบว่าการแบ่งช่วงธรรมชาติเจงค์แบบซ้ำนั้นไม่มีประสิทธิภาพในการแบ่งข้อมูลแจกแจงปกติแบบผสมเมื่อต้องการให้ได้ความแม่นยำสูงสุด และเหมาะสมกับการใช้ในข้อมูลแจกแจงล็อกปกติแบบผสมเมื่อข้อมูล 2 กลุ่มมีจำนวนใกล้เคียงกันหรือกลุ่มที่ค่าเฉลี่ยสูงกว่ามีจำนวนมากกว่า นอกจากนี้การแบ่งช่วงธรรมชาติเจงค์แบบซ้ำยังสามารถในไปใช้ในการแบ่งข้อมูลเมื่อผู้ใช้ต้องการให้ความสำคัญกับความแม่นยำข้อมูลกลุ่มที่มีค่าเฉลี่ยสูงกว่าได้

Article Details

ประเภทบทความ
Physical Sciences

เอกสารอ้างอิง

Jenks, G.F. and University of Kansas Department of Geography, Optimal Data Classification for Choropleth Maps. 1977: University of Kansas, Kansas, 24 p.

Qiu, D., and Tamhane, A., 2007, A comparative study of the K-means algorithm and the normal mixture model for clustering: Univariate case. Journal of Statistical Planning and Inference. 137:3722-3740.

Wang, Z., Da Cunha, C., Ritou, M., and Furet, B., 2019, Comparison of K-means and GMM methods for contextual clustering in HSM. Procedia Manufacturing. 28: 154-159.

Patel, E., and D.S. Kushwaha, 2020, Clustering cloud workloads: K-Means vs gaussian mixture model. Procedia Computer Science, 2020. 171: 158-167.

Behboodian, J., 1970, On the modes of a mixture of two normal distributions. Technometrics. 12(1): 131-139.

Jiang, B., 2012, Head/tail Breaks: A new classification scheme for data with A heavy-tailed distribution. Professional Geographer -PROF GEOGR. 65(3): 482-494.

Chen, Y., and Gupta, M.R., 2010, EM Demystified: An Expectation-Maximization Tutorial. Electrical Engineering.