Performance Improving Topic Modeling with Big Data Environment
Main Article Content
Abstract
Data mining is a method which uses to find knowledge in data. There are many techniques to find the knowledge in text data such as document summation, Latent meaning, document topics, Document clustering. Latent Dirichlet Allocation (LDA) is an algorithm used to find hidden topics of the document, it can improve performance b parameters tuning. We use Ant colony optimization (ACO) to optimize LDA parameters.it takes a long time to calculate the topic from many documents. In this work, we apply a map-reduce programming technique which working under the Hadoop environment to accurately calculate time. The results have shown that processing documents with LDA with optimizing parameters by ACO under Hadoop environment is obviously faster and much improve performance compare to the one without map-reduce.
Article Details
บทความที่ได้รับการตีพิมพ์เป็นลิขสิทธิ์ของ วารสารวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยอุบลราชธานี
ข้อความที่ปรากฏในบทความแต่ละเรื่องในวารสารวิชาการเล่มนี้เป็นความคิดเห็นส่วนตัวของผู้เขียนแต่ละท่านไม่เกี่ยวข้องกับมหาวิทยาลัยอุบลราชธานี และคณาจารย์ท่านอื่นๆในมหาวิทยาลัยฯ แต่อย่างใด ความรับผิดชอบองค์ประกอบทั้งหมดของบทความแต่ละเรื่องเป็นของผู้เขียนแต่ละท่าน หากมีความผิดพลาดใดๆ ผู้เขียนแต่ละท่านจะรับผิดชอบบทความของตนเองแต่ผู้เดียว