การเปรียบเทียบประสิทธิภาพการจำแนกข้อมูลด้วยเทคนิคต้นไม้ตัดสินใจ รุ่นที่ 3 ที่ใช้เทคนิคการแบ่งข้อมูลที่แตกต่างกัน

Authors

  • สุระสิทธิ์ ทรงม้า

Keywords:

ข้อมูลชนิดแบบต่อเนื่อง, ข้อมูลชนิดแบบไม่ต่อเนื่อง, การจำแนกข้อมูล, เทคนิคการแบ่งข้อมูลชนิด แบบไม่มีผู้สอน, ต้นไม้ตัดสินใจ

Abstract

การวิจัยครั้งนี้มีวัตถุประสงค์ 1) เพื่อเปรียบเทียบประสิทธิภาพการจำแนกข้อมูลด้วยเทคนิคต้นไม้
ตัดสินใจ รุ่นที่ 3 ที่ใช้เทคนิคการแบ่งข้อมูลที่แตกต่างกัน และ 2) เพื่อทดสอบประสิทธิภาพของเทคนิค
การแบ่งข้อมูลชนิดแบบไม่มีผู้สอน ชุดข้อมูลที่ใช้ในการทดลอง คือ ชุดข้อมูล KDD Cup 1999 ประสิทธิภาพ
ของการจำแนกข้อมูลวัดจากอัตราการจำแนกข้อมูลถูกต้อง และอัตราการจำแนกข้อมูลผิดพลาด โดยใช้
โปรแกรมเวก้าและแมทแลปในการประมวลผล
จากการเฉลี่ยผลการทดลองจำนวน 10 รอบ โดยใช้เทคนิคในการแบ่งข้อมูลของชุดข้อมูลฝึกสอน
ให้อยู่ในรูปแบบไม่ต่อเนื่องและจำแนกข้อมูลด้วยต้นไม้ตัดสินใจ รุ่นที่ 3 พบว่าการแบ่งข้อมูลด้วยขนาด
ความถี่เท่ากัน จำนวน 10 ชั้น มีอัตราการจำแนกข้อมูลถูกต้องสูงที่สุด เท่ากับ 99.79% รองลงมาคือ
การแบ่งข้อมูลด้วยการจัดกลุ่มเคมีนส์ จำนวน 40 กลุ่ม เท่ากับ 99.75% และน้อยที่สุดคือการแบ่งข้อมูลด้วย
ขนาดความกว้างเท่ากัน จำนวน 20 ชั้น เท่ากับ 99.57% เมื่อเปรียบเทียบประสิทธิภาพการจำแนกข้อมูล
ด้วยต้นไม้ตัดสินใจ รุ่นที่ 3 โดยนำกฎที่สร้างขึ้นจากชุดข้อมูลฝึกสอนไปใช้กับชุดข้อมูลทดสอบ พบว่า
ประสิทธิภาพของการใช้เทคนิคแบ่งข้อมูลด้วยขนาดความกว้างเท่ากันและจำแนกข้อมูลด้วยต้นไม้ตัดสินใจ
รุ่นที่ 3 มีประสิทธิภาพสูงที่สุด โดยมีอัตราการจำแนกข้อมูลถูกต้อง เท่ากับ 92.30% มีอัตราการจำแนก
ข้อมูลผิดพลาด เท่ากับ 4.89% และสามารถจำแนกข้อมูลที่ไม่สามารถจัดเข้ากลุ่มได้ เท่ากับ 2.81%
ผลการทดลองยังแสดงให้เห็นว่าเทคนิคการแบ่งข้อมูลชนิดแบบไม่มีผู้สอนแต่ละชนิดส่งผลต่อประสิทธิภาพ

การจำแนกข้อมูลของต้นไม้ตัดสินใจ รุ่นที่ 3 และพบว่าการใช้เทคนิคการแบ่งข้อมูลร่วมกับเทคนิคต้นไม้
ตัดสินใจ รุ่นที่ 3 สามารถช่วยกรองข้อมูลที่ไม่อยู่ในกฎที่สร้างขึ้นได้ ซึ่งเป็นสิ่งที่แตกต่างกับเทคนิคต้นไม้
ตัดสินใจ รุ่นที่ C4.5 ฉะนั้นวิธีที่นำเสนอหากเลือกนำไปใช้ได้อย่างเหมาะสมจะเกิดประโยชน์อย่างมาก

Downloads

Published

2015-09-01

How to Cite

ทรงม้า ส. (2015). การเปรียบเทียบประสิทธิภาพการจำแนกข้อมูลด้วยเทคนิคต้นไม้ตัดสินใจ รุ่นที่ 3 ที่ใช้เทคนิคการแบ่งข้อมูลที่แตกต่างกัน. Journal of Food Health and Bioenvironmental Science, 8(3), 29–45. Retrieved from https://li01.tci-thaijo.org/index.php/sdust/article/view/183742

Issue

Section

Original Articles