Text Mining Development Tool for Identification of Transcription Factor and DNA Interactions in Nitrogenase Expression การพัฒนาชุดคำสั่งการทำเหมืองข้อความสำหรับการระบุปฏิสัมพันธ์ระหว่างทรานสคริปชันแฟคเตอร์และดีเอ็นเอในการแสดงออกของไนโตรจีเนส
Main Article Content
บทคัดย่อ
งานวิจัยนี้มีวัตถุประสงค์เพื่อพัฒนาชุดคำสั่งการทำเหมืองข้อความและวิเคราะห์เครือข่ายความสัมพันธ์ของยีนโดยระบุคู่ของทรานสคริปชันแฟคเตอร์และดีเอ็นเอที่มีความสำคัญในการแสดงออกของไนโตรจีเนสในไรโซเบียม ผลของการพัฒนาชุดคำสั่งการทำเหมืองข้อความใช้ข้อมูลที่เกี่ยวข้องกับแบคทีเรียที่มีความสามารถในการตรึงไนโตรเจน จากฐานข้อมูลทางวิชาการ PubMed เป็นข้อมูลนำเข้าจำนวนทั้งสิ้น 18,011 บทคัดย่อ พัฒนาชุดคำสั่งด้วยภาษาคอมพิวเตอร์ Java ให้กลายเป็นข้อความรวมได้จำนวน 935,900 บรรทัด และสกัดเป็นประโยคได้ 264,624 ประโยค เมื่อนำข้อความทั้งหมดไปประมวลผลด้วยชุดคำสั่งต่อ พบว่ามีข้อมูลผลลัพธ์เป็นคำสำคัญที่ใช้บ่งบอกความสัมพันธ์ระหว่างยีนจำนวน 39,524 บรรทัด และเป็นรายชื่อยีนหรือรายชื่อโปรตีนจำนวน 51,193 บรรทัด ซึ่งข้อมูลทั้งสองนี้จะแสดงลำดับตำแหน่งและลำดับประโยคที่พบในข้อความรวมในแต่ละบรรทัด ผลสุดท้ายที่ได้จากการประมวลผลชุดคำสั่งการทำเหมืองข้อความ เป็นข้อมูลความสัมพันธ์ระหว่างคู่ของยีนหรือโปรตีนกับคำสำคัญที่บ่งบอกความสัมพันธ์ของข้อมูลคู่นั้นจำนวน 187 บรรทัด นอกจากนี้ยังแสดงข้อความเต็มทั้งประโยคที่ค้นพบความสัมพันธ์ และแสดงค่าระยะห่างของข้อมูล (token) ซึ่งบ่งบอกระยะห่างระหว่างคู่ของคำ เมื่อนำข้อมูลผลลัพธ์ที่ได้จากการทำเหมืองข้อความมาแสดงเป็นภาพเครือข่ายความสัมพันธ์ของยีนด้วยโปรแกรม Cytoscape พบโหนดจำนวน 119 โหนด และเส้นเชื่อมจำนวน 187 เส้นเชื่อม จากการวิเคราะห์การเป็นจุดเชื่อมต่อศูนย์กลางเครือข่าย และพิจารณาความสัมพันธ์ระหว่างโหนด พบว่าโหนดที่เป็นยีน nifH และโหนดที่เป็นโปรตีน NifA มีความสัมพันธ์กันในรูปแบบของยีนและทรานสคริปชันแฟคเตอร์ที่ทำงานร่วมกันในการแสดงออกของไนโตรจีเนส ซึ่งส่งผลต่อการตรึงไนโตรเจนของไรโซเบียม ซึ่งข้อมูลที่ได้นี้สามารถนำไปประยุกต์ใช้ในงานด้านพันธุวิศวกรรมต่อไป
Article Details
เนื้อหาและข้อมูลในบทความที่ลงตีพิมพ์ในวารสารวิชชา มหาวิทยาลัยราชภัฏนครศรีธรรมราช ถือเป็นข้อคิดเห็นและความรับผิดชอบของผู้เขียนบทความโดยตรง ซึ่งกองบรรณาธิการวารสารไม่จำเป็นต้องเห็นด้วยหรือร่วมรับผิดชอบใด ๆ
บทความ ข้อมูล เนื้อหา รูปภาพ ฯลฯ ที่ได้รับการตีพิมพ์ในวารสารวิชชา มหาวิทยาลัยราชภัฏนครศรีธรรมราช ถือเป็นลิขสิทธ์ของวารสารวิชชา มหาวิทยาลัยราชภัฏนครศรีธรรมราช หากบุคคลหรือหน่วยงานใดต้องการนำข้อมูลทั้งหมดหรือส่วนหนึ่งส่วนใดไปเผยแพร่ต่อหรือเพื่อการกระทำการใด ๆ จะต้องได้รับอนุญาตเป็นลายลักษณ์อักษรจากวารสารวิชชา มหาวิทยาลัยราชภัฏนครศรีธรรมราชก่อนเท่านั้น
The content and information in the article published in Wichcha journal Nakhon Si Thammarat Rajabhat University, It is the opinion and responsibility of the author of the article. The editorial journals do not need to agree. Or share any responsibility.
เอกสารอ้างอิง
Ananiadou, S., Kell, D.B. and Tsujii, J. (2006). Text mining and its potential applications in systems biology. Trends in Biotechnology, 24(12), 571-579.
Ferrucci, D. and Lally, A. (2004). UIMA: an architectural approach to unstructured information processing in the corporate research environment. Natural Language Engineering, 10(3-4), 327-348.
Murphy, G.C., Kersten, M. and Findlater, L. (2006). How are Java software developers using the Eclipse IDE. Institute of Electrical and Electronics Engineers Software, 23(4), 76-83.
Newton, W.E. (1993). Nitrogenases: distribution, composition, structure and function. In Palacios, R., Mora, J., Newton, W.E. (Eds.). New Horizons in Nitrogen Fixation, pp. 5-18. Springer: Dordrecht.
Ng, F.S.L., Ruau, D., Wernisch, L. and Gottgens, B. (2016). A graphical model approach visualizes regulatory relationships between genome-wide transcription factor binding profiles. Briefings in Bioinformatics, 19(1), doi: http://doi.org/10.1093/bib/bbw102.
Postgate, J. (1998). Nitrogen Fixation. (3rd ed). Cambridge: Cambridge University Press.
Przybyla, P., Shardlow, M., Aubin, S., Bossy, R., Castilho, R.E., Piperidis, S., McNaught, J. and Ananiadou, S. (2016). Text mining resources for the life sciences. Database, 2016(2016), doi: https://doi.org/10.1093/database/baw145.
Sarkar, A. and Reinhold-Hurek, B. (2014). Transcriptional profiling of nitrogen fixation and the role of NifA in the diazotrophic endophyte Azoarcus sp. strain BH72. PLOS ONE, 9(2), doi: https://doi.org/10.1371/journal.pone.0086527.
Song, Y.L. and Chen, S.S. (2009). Text mining biomedical literature for constructing gene regulatory networks. Interdisciplinary Sciences Computational Life Sciences, 1(3), 179-186.
Vibert, N., Ros, C., Bigot, L.L., Ramond, M., Gatefin, J. and Rouet, J. (2009). Effects of domain knowledge on reference search with the PubMed database: An experimental study. Journal of the American Society for Information Science and Technology, 60(7), 1423-1447.
Wilcock, G. (2009). Introduction to Linguistic Annotation and Text Analytics. California: Morgan and Claypool Publishers.
Zhou, D. and He, Y. (2008). Extracting interactions between proteins from the literature. Journal of Biomedical Informatics, 41(2), 393-407.