興大團隊建構大規模基因資訊資料庫

【本刊訊】由於正常細胞與癌細胞的基因表現量並不相同,因此基因定序可以運用在癌症診斷與個人化醫療上。隨著大數據時代掀起的浪潮, 近年來發展出革命性次世代定序(Nextgeneration DNA sequencing, NGS)技術, 此為傳統定序技術的改良版, 可在同時間內大量而快速的讀取短序列片段,再根據短片段的訊號,藉由電腦演算法,拼組成完整的長序列,因為可以同時大規模的分析基因,這項技術的普及也擴展了基因體學的研究深度。

核醣核酸定序(RNA-Seq)是NGS技術的一種,中興大學基因體暨生物資訊學研究所副教授劉俊吉的研究團隊,與美國南加州大學合作,運用了NGS大數據,經歷兩年的努力,建立了第一個大規模的癌症生物資訊資料庫:Cancer RNA-Seq Nexus(http://syslab4.nchu.edu.tw/CRN)。這個大數據資料庫提供了前所未有的豐富內容:(1)有大規模的癌症RNA數據,總共涵蓋了30種以上的癌症與1萬1030 個RNA定序樣本。( 2 ) 包含了編碼及長鏈非編碼RNA(long non-coding RNA,lncRNAs)的表現量以及共表現網路。(3)用視覺化方式呈現基因表現量、差異表現基因以及基因調控網路。這些資訊提供了生物醫學研究者一個重要的資源,也能藉此探討核酸異構物的差異表現,以便了解癌症的調控機制或治療模式,有助於未來的癌症臨床研究。

另一方面,劉俊吉研究團隊也與交通大學團隊合作,使用大規模的 RNAseq數據,建立了第一個大規模的環形核醣核酸(Circular RNAs)資料庫:CircNet(http://syslab5.nchu.edu.tw/
CircNet/)。circRNAs是一群特殊非編碼的RNA,因為呈現封閉環形的特性,它們可不受RNA外切酶影響, 因此序列不會被剪切,而使基因表達能保持完整。近年的研究表示,circRNAs上有許多miRNAs的結合位點,而miRNAs具有調控基因表達的功能,因此兩者的交互作用下對於基因產生的影響值得研究。

這個資料庫不僅擴展與探索最新的環狀RNA領域, 而且提供了結合過去發現和新發現之circRNAs詳細的表現量分析。透過所提供之整合circRNAs與miRNAs和基因之間的調控網路,將
可以發現在人類疾病上更多新的調控機制,以提供生物醫學研究上最新而有潛力應用的資訊。這兩個資料庫的研究論文均於今年發表在國際期刊《核酸研究》(Nucleic Acids Research)上。

沒有留言:

張貼留言