Text Mining Development Tool for Identification of Transcription Factor and DNA Interactions in Nitrogenase Expression การพัฒนาชุดคำสั่งการทำเหมืองข้อความสำหรับการระบุปฏิสัมพันธ์ระหว่างทรานสคริปชันแฟคเตอร์และดีเอ็นเอในการแสดงออกของไนโตรจีเนส

Main Article Content

สิทธิรักษ์ สุนทรารักษ์
เทพปัญญา เจริญรัตน์
ภัทรพร คุ้มภัย

บทคัดย่อ

งานวิจัยนี้มีวัตถุประสงค์เพื่อพัฒนาชุดคำสั่งการทำเหมืองข้อความและวิเคราะห์เครือข่ายความสัมพันธ์ของยีนโดยระบุคู่ของทรานสคริปชันแฟคเตอร์และดีเอ็นเอที่มีความสำคัญในการแสดงออกของไนโตรจีเนสในไรโซเบียม ผลของการพัฒนาชุดคำสั่งการทำเหมืองข้อความใช้ข้อมูลที่เกี่ยวข้องกับแบคทีเรียที่มีความสามารถในการตรึงไนโตรเจน จากฐานข้อมูลทางวิชาการ PubMed เป็นข้อมูลนำเข้าจำนวนทั้งสิ้น 18,011 บทคัดย่อ พัฒนาชุดคำสั่งด้วยภาษาคอมพิวเตอร์ Java ให้กลายเป็นข้อความรวมได้จำนวน 935,900 บรรทัด และสกัดเป็นประโยคได้ 264,624 ประโยค เมื่อนำข้อความทั้งหมดไปประมวลผลด้วยชุดคำสั่งต่อ พบว่ามีข้อมูลผลลัพธ์เป็นคำสำคัญที่ใช้บ่งบอกความสัมพันธ์ระหว่างยีนจำนวน 39,524 บรรทัด และเป็นรายชื่อยีนหรือรายชื่อโปรตีนจำนวน 51,193 บรรทัด ซึ่งข้อมูลทั้งสองนี้จะแสดงลำดับตำแหน่งและลำดับประโยคที่พบในข้อความรวมในแต่ละบรรทัด ผลสุดท้ายที่ได้จากการประมวลผลชุดคำสั่งการทำเหมืองข้อความ เป็นข้อมูลความสัมพันธ์ระหว่างคู่ของยีนหรือโปรตีนกับคำสำคัญที่บ่งบอกความสัมพันธ์ของข้อมูลคู่นั้นจำนวน 187 บรรทัด นอกจากนี้ยังแสดงข้อความเต็มทั้งประโยคที่ค้นพบความสัมพันธ์ และแสดงค่าระยะห่างของข้อมูล (token) ซึ่งบ่งบอกระยะห่างระหว่างคู่ของคำ เมื่อนำข้อมูลผลลัพธ์ที่ได้จากการทำเหมืองข้อความมาแสดงเป็นภาพเครือข่ายความสัมพันธ์ของยีนด้วยโปรแกรม Cytoscape พบโหนดจำนวน 119 โหนด และเส้นเชื่อมจำนวน 187 เส้นเชื่อม จากการวิเคราะห์การเป็นจุดเชื่อมต่อศูนย์กลางเครือข่าย และพิจารณาความสัมพันธ์ระหว่างโหนด พบว่าโหนดที่เป็นยีน nifH และโหนดที่เป็นโปรตีน NifA มีความสัมพันธ์กันในรูปแบบของยีนและทรานสคริปชันแฟคเตอร์ที่ทำงานร่วมกันในการแสดงออกของไนโตรจีเนส ซึ่งส่งผลต่อการตรึงไนโตรเจนของไรโซเบียม ซึ่งข้อมูลที่ได้นี้สามารถนำไปประยุกต์ใช้ในงานด้านพันธุวิศวกรรมต่อไป

Article Details

รูปแบบการอ้างอิง
สุนทรารักษ์ ส., เจริญรัตน์ เ., & คุ้มภัย ภ. (2021). Text Mining Development Tool for Identification of Transcription Factor and DNA Interactions in Nitrogenase Expression การพัฒนาชุดคำสั่งการทำเหมืองข้อความสำหรับการระบุปฏิสัมพันธ์ระหว่างทรานสคริปชันแฟคเตอร์และดีเอ็นเอในการแสดงออกของไนโตรจีเนส. วารสารวิชชา มหาวิทยาลัยราชภัฏนครศรีธรรมราช, 40(1), 1–15. สืบค้น จาก https://li01.tci-thaijo.org/index.php/wichcha/article/view/248392
ประเภทบทความ
บทความวิจัย

เอกสารอ้างอิง

Ananiadou, S., Kell, D.B. and Tsujii, J. (2006). Text mining and its potential applications in systems biology. Trends in Biotechnology, 24(12), 571-579.

Ferrucci, D. and Lally, A. (2004). UIMA: an architectural approach to unstructured information processing in the corporate research environment. Natural Language Engineering, 10(3-4), 327-348.

Murphy, G.C., Kersten, M. and Findlater, L. (2006). How are Java software developers using the Eclipse IDE. Institute of Electrical and Electronics Engineers Software, 23(4), 76-83.

Newton, W.E. (1993). Nitrogenases: distribution, composition, structure and function. In Palacios, R., Mora, J., Newton, W.E. (Eds.). New Horizons in Nitrogen Fixation, pp. 5-18. Springer: Dordrecht.

Ng, F.S.L., Ruau, D., Wernisch, L. and Gottgens, B. (2016). A graphical model approach visualizes regulatory relationships between genome-wide transcription factor binding profiles. Briefings in Bioinformatics, 19(1), doi: http://doi.org/10.1093/bib/bbw102.

Postgate, J. (1998). Nitrogen Fixation. (3rd ed). Cambridge: Cambridge University Press.

Przybyla, P., Shardlow, M., Aubin, S., Bossy, R., Castilho, R.E., Piperidis, S., McNaught, J. and Ananiadou, S. (2016). Text mining resources for the life sciences. Database, 2016(2016), doi: https://doi.org/10.1093/database/baw145.

Sarkar, A. and Reinhold-Hurek, B. (2014). Transcriptional profiling of nitrogen fixation and the role of NifA in the diazotrophic endophyte Azoarcus sp. strain BH72. PLOS ONE, 9(2), doi: https://doi.org/10.1371/journal.pone.0086527.

Song, Y.L. and Chen, S.S. (2009). Text mining biomedical literature for constructing gene regulatory networks. Interdisciplinary Sciences Computational Life Sciences, 1(3), 179-186.

Vibert, N., Ros, C., Bigot, L.L., Ramond, M., Gatefin, J. and Rouet, J. (2009). Effects of domain knowledge on reference search with the PubMed database: An experimental study. Journal of the American Society for Information Science and Technology, 60(7), 1423-1447.

Wilcock, G. (2009). Introduction to Linguistic Annotation and Text Analytics. California: Morgan and Claypool Publishers.

Zhou, D. and He, Y. (2008). Extracting interactions between proteins from the literature. Journal of Biomedical Informatics, 41(2), 393-407.