การเปรียบเทียบประสิทธิภาพโครงสร้างเหมืองข้อมูลเพื่อจำแนกโรคซึมเศร้าจากพฤติกรรมการโพสต์ข้อความบนทวิตเตอร์

Main Article Content

ดำรงเดช เดินรีบรัมย์
ฉัตรเกล้า เจริญผล
จริยา จิรานุกูล

บทคัดย่อ

ในปี ค.ศ. 2018 องค์กรอนามัยโลกระบุว่า โรคซึมเศร้าทำให้เกิดการสุญเสียของสุขภาพเป็นอันดับ 2 โดยอาจเกิดจากการใช้งานโซเชียลมีเดียอย่างไม่เหมาะสม เสพสื่ออย่างไม่ระมัดระวัง ทำให้เกิดความเครียด ความรุนแรง และส่งผลทำให้เกิดโรคซึมเศร้าได้ งานวิจัยนี้มีจุดประสงค์ของการจำแนกโรคซึมเศร้าจากพฤติกรรมการโพสต์ข้อความบนทวิตเตอร์ โดยมีการเปรียบเทียบการจำแนกระหว่างแบบ 1 ระดับและแบบ 2 ระดับ ได้แก่ 1) 1 ระดับ จะใช้งานอัลกอริทึม Bayes จำแนกข้อความทั่วไปและข้อความที่บ่งบอกถึงลักษณะอาการซึมเศร้าตามแบบสอบถาม DSM-5 ได้แก่ 1. อารมณ์ซึมเศร้า 2. ความสนใจลดลง 3. น้ำหนักลดลงหรือเพิ่มขึ้นอย่างผิดสังเกต 4. นอนไม่หลับหรือนอนหลับมากกว่าปกติ  5. ร่างกายอ่อนเพลีย 6. รู้สึกตนเองไร้ค่า 7. สมาธิสั้น 8. เคลื่อนไหวช้า และ 9. คิดฆ่าตัว 2) 2 ระดับ คือ 2.1 อัลกอริทึม SVM เพื่อจำแนกข้อความทั่วไปกับข้อความที่บ่งบอกถึงโรคซึมเศร้า 2.2 อัลกอริทึม Bayes เปรียบเทียบกับอัลกอริทึม Random Forest เพื่อจำแนก 9 อาการที่บ่งบอกถึงโรคซึมเศร้าตามแบบสอบถาม DSM-5 โดยใช้ข้อมูล 2 ชุด ได้แก่ ชุดเรียนรู้ (Training set) และ ชุดทดสอบ (Test set) ที่มาจากการโพสต์ของดาราต่างประเทศ ผลการทดลองของชุด Training set ระหว่าง 1 ระดับ และ 2 ระดับ คือ 1 ระดับ อัลกอริทึม Bayes ได้ Accuracy = 82.55% และจำแนก  2 ระดับอัลกอริทึม SVM ได้ Accuracy = 98.20% ส่วนผลการทดลองอัลกอริทึม SVM จับคู่กับอัลกอริทึม Bayes ได้ Accuracy = 83.23% และอัลกอริทึม SVM จับคู่กับอัลกอริทึม Random Forest ได้ Accuracy = 91.45% ผลการทดลองของชุด Test set โดยมีการกำหนดค่าความน่าจะเป็นตั้งแต่ 0.1 – 0.9 การจำแนก 1 ระดับอัลกอริทึม Bayes ได้ Accuracy = 76.67% และการจำแนก 2 ระดับอัลกอริทึม SVM จับคู่กับอัลกอริทึม Bayes ได้ Accuracy = 73.33% ส่วนอัลกอริทึม SVM จับคู่กับอัลกอริทึม Random Forest ได้ Accuracy = 70.00%

Article Details

บท
บทความวิจัย