ข้อมูลก่อนประมวลผลสำหรับการจัดกลุ่มเคมีนส์แบบขนาน
คำสำคัญ:
การจัดกลุ่มเคมีนส์แบบขนาน, ข้อมูลก่อนประมวลผล, การจัดกลุ่ม, Parallel k-means clustering, data pre-processing, clusteringบทคัดย่อ
ข้อมูลก่อนประมวลผลเป็นกลุ่มเป็นขั้นตอนสำคัญในการทำเหมือนแยกแยะข้อมูล การเตรียมข้อมูลที่ดีนำไปสู่กลุ่มสมรรถนะที่ดี การเตรียมข้อมูลมีหลากหลายวิธีการ การวิจัยนี้เสนอแนวคิดของการเตรียมความสมดุลของข้อมูลอย่างไร ก่อนประมวลผลในระบบการปฏิบัติงานแบบขนาน วัตถุประสงค์เพื่อหารูปแบบการแบ่งจำนวนข้อมูลที่เหมาะสม สำหรับขั้นตอนวิธีการจัดกลุ่มเคมีนส์แบบขนาน รวมถึงพัฒนาขั้นตอนวิธีด้วยการใช้ภาษาเออร์แลงอันเป็นภาษาเชิงหน้าที่ร่วมกันภาษาหนึ่ง จากนั้นทดลองกับชุดข้อมูลสังเคราะห์ลักษณะหลายมิติ และมีจำนวนกลุ่มแปรผันตั้งแต่ 2 ถึง 10 กลุ่ม ผลลัพธ์การทดลองแสดงให้เห็นว่า สมรรถนะเวลาของรูปแบบการแยกเท่าเทียมกันดีกว่ารูปแบบอื่น
Data pre-processing for parallel k-means clustering
Phaichayon Kongchai1*, Pasapitch Chujai1, Wiphasith Hiranrat2, Nittaya Kerdprasop1 and Kittisak Kerdprasop1
1 School of Computer Engineering, Institute of Engineering, Suranaree University of Technology, Nakhon Ratchasima Province 30000
2 School of Information Technology, Institute of Social Technology, Suranaree University of Technology, Nakhon Ratchasima Province 30000
Data pre-processing in clustering is an important step in data mining. A good data preparation can lead to a good clustering performance. Preparation of data has variety of methods. This research proposed the concept of how to prepare data balancing before processing in a parallel machine. The objective is to find the pattern of splitting the amount of data that is appropriate for parallel k-means clustering algorithm. In addition, the algorithm was developed using Erlang language, which is a concurrent functional language. Then we experiment with synthetic data sets that are multi-dimensional, and have a number of clusters varying from 2 to 10. The experimental results show that the time performance of equal pattern decomposition is better than other patterns.ดาวน์โหลด
รูปแบบการอ้างอิง
ฉบับ
ประเภทบทความ
สัญญาอนุญาต
ผู้นิพนธ์ต้องรับผิดชอบข้อความในบทนิพนธ์ของตน มหาวิทยาลัยพะเยา ไม่จำเป็นต้องเห็นด้วยกับบทความที่ตีพิมพ์เสมอไป ผู้สนใจสามารถคัดลอก และนำไปใช้ได้ แต่จะต้องขออนุมัติเจ้าของ และได้รับการอนุมัติเป็นลายลักษณ์อักษรก่อน พร้อมกับมีการอ้างอิงและกล่าวคำขอบคุณให้ถูกต้องด้วย

