ข้อมูลก่อนประมวลผลสำหรับการจัดกลุ่มเคมีนส์แบบขนาน
Keywords:
การจัดกลุ่มเคมีนส์แบบขนาน, ข้อมูลก่อนประมวลผล, การจัดกลุ่ม, Parallel k-means clustering, data pre-processing, clusteringAbstract
ข้อมูลก่อนประมวลผลเป็นกลุ่มเป็นขั้นตอนสำคัญในการทำเหมือนแยกแยะข้อมูล การเตรียมข้อมูลที่ดีนำไปสู่กลุ่มสมรรถนะที่ดี การเตรียมข้อมูลมีหลากหลายวิธีการ การวิจัยนี้เสนอแนวคิดของการเตรียมความสมดุลของข้อมูลอย่างไร ก่อนประมวลผลในระบบการปฏิบัติงานแบบขนาน วัตถุประสงค์เพื่อหารูปแบบการแบ่งจำนวนข้อมูลที่เหมาะสม สำหรับขั้นตอนวิธีการจัดกลุ่มเคมีนส์แบบขนาน รวมถึงพัฒนาขั้นตอนวิธีด้วยการใช้ภาษาเออร์แลงอันเป็นภาษาเชิงหน้าที่ร่วมกันภาษาหนึ่ง จากนั้นทดลองกับชุดข้อมูลสังเคราะห์ลักษณะหลายมิติ และมีจำนวนกลุ่มแปรผันตั้งแต่ 2 ถึง 10 กลุ่ม ผลลัพธ์การทดลองแสดงให้เห็นว่า สมรรถนะเวลาของรูปแบบการแยกเท่าเทียมกันดีกว่ารูปแบบอื่น
Data pre-processing for parallel k-means clustering
Phaichayon Kongchai1*, Pasapitch Chujai1, Wiphasith Hiranrat2, Nittaya Kerdprasop1 and Kittisak Kerdprasop1
1 School of Computer Engineering, Institute of Engineering, Suranaree University of Technology, Nakhon Ratchasima Province 30000
2 School of Information Technology, Institute of Social Technology, Suranaree University of Technology, Nakhon Ratchasima Province 30000
Data pre-processing in clustering is an important step in data mining. A good data preparation can lead to a good clustering performance. Preparation of data has variety of methods. This research proposed the concept of how to prepare data balancing before processing in a parallel machine. The objective is to find the pattern of splitting the amount of data that is appropriate for parallel k-means clustering algorithm. In addition, the algorithm was developed using Erlang language, which is a concurrent functional language. Then we experiment with synthetic data sets that are multi-dimensional, and have a number of clusters varying from 2 to 10. The experimental results show that the time performance of equal pattern decomposition is better than other patterns.Downloads
How to Cite
Issue
Section
License
ผู้นิพนธ์ต้องรับผิดชอบข้อความในบทนิพนธ์ของตน มหาวิทยาลัยพะเยาไม่จำเป็นต้องเห็นด้วยกับบทความที่ตีพิมพ์เสมอไป ผู้สนใจสามารถคัดลอก และนำไปใช้ได้ แต่จะต้องขออนุมัติเจ้าของ และได้รับการอนุมัติเป็นลายลักษณ์อักษรก่อน พร้อมกับมีการอ้างอิงและกล่าวคำขอบคุณให้ถูกต้องด้วย
The authors are themselves responsible for their contents. Signed articles may not always reflect the opinion of University of Phayao. The articles can be reproduced and reprinted, provided that permission is given by the authors and acknowledgement must be given.