生物資訊結合大數據 中研院找到有害突變演化機制

中研院基因研究中心研究員莊樹諄(着黃外套者)及其研究團隊,右二爲中研院基因體研究中心博士後研究員麥德倫。(中研院提供/李侑臺北傳真)

DNA是由四種核苷酸A、C、G、T所組成,機制正常與否和自閉症癲癇阿茲海默症神經疾病相關,中央研究院基因體研究中心研究員莊樹諄團隊,將生物資訊結合大數據分析,精確評估DNA序列,可望減少探討基因突變時,誤判相關致病及危害程度,甚至解釋了爲何某些有害突變能演化保存至今,研究成果已發表於國際期刊《基因體研究》(Genome Research)。

組成DNA的四種核苷酸A、C、G、T四個「密碼」,排列順序蘊藏遺傳訊息。這些訊息需先轉錄成核糖核酸(RNA),再編輯轉譯成蛋白質,才能運作生命機制。過去相關研究在討論基因突變的致病性時,未曾考慮過RNA編輯機制的影響

莊樹諄研究員團隊將生物資訊結合大數據分析,首先整合447位不同人類個體的DNA及RNA序列資料,進行大數據統計與演化分析,接着再深入分析「千人基因體計劃」(1000 Genomes Project),並蒐集到逾2000人的DNA序列資料後證實,「A-to-G RNA編輯(RNA editing)機制」與基因突變的關係

莊樹諄表示,A-to-G RNA編輯機制的正常與否,和自閉症、癲癇及阿茲海默症等複雜的神經疾病密切相關,此研究結果將有助於瞭解相關疾病,盼能協助診斷,可望減少探討基因突變時,對其致病及危害程度的誤判,同時也解釋了病理基因體學的一大謎題,爲何某些有害突變能在演化中保存至今。

莊樹諄提到,A-to-G RNA編輯事件常見於多細胞生物,其功能造成的影響好壞,在學界仍有爭議,不過這起機制,一方面有機會讓蛋白質產生新功能,另一方面也可能使蛋白質功能受損而導致「錯義突變」,許多研究顯示,這個機制的失調,和自閉症、肌萎縮側索硬化症顛癇、阿茲海默症等神經疾病有關

莊樹諄表示,本次研究成果有賴大數據、生物資訊與堅實的演算邏輯推導。在人類DNA序列上30億個鹼基解碼之後,科學家得以探索人體內各種生命機制變化與DNA的關係。近年來,個人化全基因定序分析日益普遍,大量且多樣的定序資料,若經大數據處理,可協助醫療診斷判讀,生物資訊分析愈形重要。