Thai-textual Cyberbullying Detection using Support Vector Machines

Authors

  • Nuttakit Jenkarn

Keywords:

Text Mining, Cyberbullying, Machine learning

Abstract

This research applied data mining and machine learning to develop a prototype “Thai-textual Cyberbullying Detection using Support Vector Machines” that can be future online Cyberbullying social media detection. Support Vector Machines (SVMs), K-Nearest Neighbour and Naïve Bayes are selected to use in our research. From the evaluation by Confusion Matrix, SVMs had the highest classification accuracy as 83.91

References

เด็กไทยเสี่ยงภัยออนไลน์ ห่วง Cyber bullying สูงกว่าค่าเฉลี่ยโลก. [ออนไลน์] 2561. [สืบค้นวันที่ 1 ตุลาคม 2561]. จาก https://www.it24hrs.com/2018/cyber-bullying-thai-child-above-the-world-average/

คุณรู้จักความหมายของ Cyberbullying ดีพอแล้วหรือยัง?. [ออนไลน์] 2561. [สืบค้นวันที่ วันที่ 1 ตุลาคม 2561]. จาก https://medium.com/@supanatwongchai/คุณรู้จักความหมายของ-cyberbullying-ดีพอแล้วหรือยัง-ce4d6f434b47

Stop Bullying หยุดกลั่นแกล้งทางโลกออนไลน์ หลังไทยติดอันดับ Top5 ของโลก!. [ออนไลน์] 2561. [สืบค้นวันที่ วันที่ 1 ตุลาคม 2561]. จาก https://brandinside.asia/stop-bullying-thailand-top5/

ทำความรู้จัก Stop Cyberbullying Day วันหยุดการกลั่นแกล้งบนโลกออนไลน์. [ออนไลน์] 2561. [สืบค้นวันที่ 1 ตุลาคม 2561]. จากhttp://stopbullying.lovecarestation.com/articles-news/articles/stop-cyberbullying-day/

Noviantho, Sani Muhamad Isa, Livia Ashianti. (2017). Cyberbullying classification using text mining. 2017 1st International Conference on Informatics and Computational Sciences (ICICoS). : 241-246

รวิสุดา เทศเมือง นิเวศ จิระวิชิตชัย. (2017). การวิเคราะห์ความคิดเห็นภาษาไทยเกี่ยวกับการรีวิวสินค้าออนไลน์ โดยใช้ขั้นตอนวิธีซัพพอร์ตเวกเตอร์แมทชีน. Engineering Journal of Siam University. ปีที่ 18 ฉบับที่.34 (2017)

cybe. [ออนไลน์] 2560. [สืบค้นวันที่ วันที่ 4 มีนาคม 2562]. จาก https://dict.longdo.com/search/-cyber-

ป้องภัยใกล้ตัวลูกจาก Cyber bullying. [ออนไลน์] 2560. [สืบค้นวันที่ วันที่ 4 มีนาคม 2562]. จาก https://www.dmh.go.th/news-dmh/view.asp?id=27717

ทำความรู้จักเกี่ยวกับ Social Media และผู้ให้บริการ Social Media bullying. [ออนไลน์] 2557. [สืบค้นวันที่ วันที่ 4 มีนาคม 2562]. จาก https://medium.com/@Natthapete/ ทำความรู้จักเกี่ยวกับ-social-media-และผู้ให้บริการ-social-media-f210a83d2d76

การทําเหมืองข้อมูล (Data Mining). [ออนไลน์] 2560. [สืบค้นวันที่ วันที่ 1 ตุลาคม 2561]. จาก http://compcenter.bu.ac.th/news-information/data-mining

อัลกอริทึม คืออะไร มีความสำคัญอย่างไร การเขียนโปรแกรม. [ออนไลน์] 2562. [สืบค้นวันที่ วันที่ 4 มีนาคม 2562]. จาก https://www.mindphp.com/คู่มือ/73-คืออะไร/6842-what-is-a-algorithm.html

API คืออะไร เอพีไอ คือ ช่องทางหนึ่งที่จะเชื่อมต่อกับเว็บไซต์ผู้ให้บริการ API จากที่อื่น. [ออนไลน์] 2560. [สืบค้นวันที่ วันที่ 4 มีนาคม 2562]. จาก https://www.mindphp.com /คู่มือ/73-คืออะไร/2038-api-คืออะไร.html

เหมืองข้อความและการประยุกต์ใช้. [ออนไลน์] 2556. [สืบค้นวันที่ วันที่ 4 มีนาคม 2562]. จาก https://www.tci-thaijo.org/index.php/pimjournal/article/view/12048

อัลกอริทึม Support Vector Machine (SVM). [ออนไลน์] 2560. [สืบค้นวันที่ วันที่ 4 มีนาคม 2562]. จาก http://kokzard.blogspot.com/2011/10/jfjkdshfkjsldf.html

ขั้นตอนวิธีการค้นหาเพื่อนบ้านใกล้สุด k ตัว. [ออนไลน์] 2560. [สืบค้นวันที่ วันที่ 4 มีนาคม 2562]. จาก https://th.wikipedia.org /wiki/ขั้นตอนวิธีการค้นหาเพื่อนบ้านใกล้สุด_k_ตัว

การเรียนรู้แบบเบย์ (Bayesian Learning). [ออนไลน์] 2558. [สืบค้นวันที่ วันที่ 4 มีนาคม 2562]. จาก https://mis.csit.sci.tsu.ac.th/noppamas/download/DataMining

Text normalization. [ออนไลน์] 2560. [สืบค้นวันที่ วันที่ 4 มีนาคม 2562]. จาก https://en.wikipedia.org/wiki/Text_normalization

Virach Sornlertlamvanich.(1993). Word segmentation for Thai in machine translation system. จาก https://www.researchgate.net/profile/VirachSornlert lamvanich/publication/243659316_Word_segmentation_for_Thai_in_machine_translation_system/links/5451ff2e0cf2bf864cbabb07/Word-segmentation-for-Thai-in-machine-translation-system.pdf

นิเวศ จิระวิชิตชัย ปริญญา สงวนสัตย์ และพยุง มีสัจ. (2011). “การพัฒนาประสิทธิภาพการจัดหมวดหมู่เอกสารภาษาไทยแบบอัตโนมัติ.” NIDA Development Journal. Vol.51 No.3 (2011)

Salton, G. and C. Buckley.(1988). “Term-weighting approaches in automatic text retrieval. Information Processing and Management.” 24(5): 513-523.

การแบ่งข้อมูลเพื่อนำทดสอบประสิทธิภาพของโมเดล. [ออนไลน์] 2561. [สืบค้นวันที่ วันที่ 4 มีนาคม 2562]. จาก http://dataminingtrend.com/2014/data-mining-techniques/cross-validation/

Cyberbullying ภัยใกล้ตัวบนโลกออนไลน์ที่ไม่ควรมองข้าม. [ออนไลน์] 2561. [สืบค้นวันที่ วันที่ 4 มีนาคม 2562]. จาก https://theprototype.pim.ac.th/2018/01/04/whatiscyberbullying/

Selma Ayúe Özel,Esra Saraç, Seyran Akdemir Hülya Aksu. (2017). Detection of Cyberbullying on Social Media Messages in Turkish. 2017 International Conference on Computer Science and Engineering (UBMK)

Hani Nurrahmi,Dade Nurjanah. (2018). Indonesian Twitter Cyberbullying Detection using Text Classification and User Credibility. 2018 International Conference on Information and Communications Technology (ICOIACT).

Kelly Reynolds,April Kontostathis,Lynne Edwards. (2011). Using Machine Learning to Detect Cyberbullying. 2011 10th International Conference on Machine Learning and Applications and Workshops.

Batoul Haidar,Maroun Chamoun,Ahmed Serhrouchni. (2017). Multilingual Cyberbullying Detection System Detecting Cyberbullying in Arabic Content. 2017 1st Cyber Security in Networking Conference (CSNet).

พิมพวัลย์ บุญมงคล ณัฐรัชต์ สาเมาะ มุจลินท์ ชลรัตน. [ออนไลน์] 2561. [สืบค้นวันที่ 10 ตุลาคม 2561]. การพัฒนาศักยภาพเครือข่ายโรงเรียนเพื่อลดความรุนแรงในพื้นที่. http://www.sh.mahidol.ac.th/chps/th/3175

Silvana Tambosi,Vanessa Mondini,Gustavo Borges,Maria José Domingues. 2015. Cyberbullying: Concerns of Teachers and School Involvement. 2015 Ninth International Conference on Complex, Intelligent, and Software Intensive Systems.

วัณณุวรรธน์ อินทรผล วฤษาย์ ร่มสายหยุด. [ออนไลน์] 2561. [สืบค้นวันที่ 10 ตุลาคม 2561]. การทำเหมืองข้อความสำหรับการแก้ปัญหาข้อร้องเรียนเกี่ยวกับการบริการลูกค้าที่บริษัทการสื่อสาร. https://tci-thaijo.org/index.php/itm- journal/article/download/115352/89152/

อมรทิพย์ อมราภิบาล. สายหยุด. [ออนไลน์] 2561. [สืบค้นวันที่ 10 ตุลาคม 2561]. เหยื่อการรังแกผ่านโลกไซเบอร์ในกลุ่มเยาวชน:ปัจจัยเสี่ยงผลกระทบต่อสุขภาพจิตและการปรึกษาบุคคลที่สาม. https://www.tci-thaijo.org/index.php/RMCS/article/view/59642

พิชญสินี กิจวัฒนาถาวร ธรา อั่งสกุล จิติมนต์ อั่งสกุล. [ออนไลน์] 2556. [สืบค้นวันที่ 10 ตุลาคม 2561]. ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์คลุมเครือ. https://www.tci-thaijo.org/index.php/kmutnb-journal/article/view/18234

สุริยศักดิ์ เลิศสกุลสมบูรณ์. [ออนไลน์] 2556. [สืบค้นวันที่ 10 ตุลาคม 2561]. การสกัดความสัมพันธ์แบบสตัฟฟ์จากเอกสารงานวิจัยทางวิทยาศาสตร์. http://libdoc.dpu.ac.th/thesis/149444.pdf

ศิริพร อ่วมมีเพียร สันติพงษ์ ไทยประยูร. 2559. ระบบติดตามการคัดลอกเนื้อหาเว็บอัตโนมัติ โดยใช้วิธีการเลือกข้อความสำคัญ. วารสารเทคโนโลยีสารสนเทศ. ปีที่ 12 ฉบับที่ 2 (2559)

Yasin N. Silva,Christopher Rich,Deborah Hall. 2016. BullyBlocker: Towards the Identification of Cyberbullying in Social Networking Sites. 2016 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (ASONAM). :1377-1379

I-Hsien Ting Wun Sheng Liou Dario Liberona Shyue-Liang Wang Giovanny Mauricio Tarazona Bermudez. 2017. Towards the Detection of Cyberbullying Based on Social Network Mining Techniques. 2017 International Conference on Behavioral, Economic, Socio-cultural Computing (BESC)

กานดา แผ่วัฒนากุล. [ออนไลน์] 2555. [สืบค้นวันที่ 10 ตุลาคม 2561]. การวิเคราะห์เหมืองข้อเสนอแนะจากบทวิจารณ์รายการโทรทัศน. http://libdcms.nida.ac.th/thesis6/2555/b179815.pdf

Published

2020-02-24

How to Cite

Jenkarn, N. (2020). Thai-textual Cyberbullying Detection using Support Vector Machines. Science Technology and Innovation Journal, 1(1), 24–34. Retrieved from https://li01.tci-thaijo.org/index.php/stij/article/view/247612

Issue

Section

Research Articles