大陸學者首次建立 從端粒到端粒的中國人全基因組

大陸學者首次建立從端粒到端粒的中國人全基因組。圖爲高佔成與研究生在細胞培養間觀察細胞生長狀態。(北京大學官網)

大陸《科技日報》29日報導,北京大學人民醫院高佔成教授研究團隊、中國科學院北京基因組研究所康禹教授研究團隊日前在《基因組蛋白質組與生物資訊學報》雜誌,發表研究論文,首次在世界成功完成從端粒到端粒的中國人全基因組,獲得包括Y染色體在內的高品質真實人類二倍體、完整無間隙的全基因組參考序列(44+XY)——「唐堯」基因組,其DNA序列具有明確的漢族中國人遺傳特徵。

該研究報告了一個完整、準確的中國漢族參考基因組T2T-YAO,能應用於未來的醫學研究和臨牀實踐中,爲精準醫療夯實了基礎。

報導稱,此前,端粒到端粒(T2T)聯盟組裝的參考基因組T2T-CHM13,是有史以來第一個具有卓越品質的完整單倍體人類基因組。但遺憾的是,基因組計劃發展到現在,仍然沒有中國人自己的參考基因組。

據悉,樣本來自一名生活在山西省一個古老村莊的健康男性,經核型檢測,未見染色體結構異常。研究團隊將該參考基因組命名爲「T2T-YAO」,因爲這個採樣點位於幾千年前的堯帝遺址附近,這個地區是明代洪洞移民的起點。這場遷徙持續了近半個世紀,大量移民遍佈中國各地並進入東南亞。因此,T2T-YAO基因組有望成爲漢族人羣的全面代表。

根據祖源分析,YAO基因組的大部分來自東亞。其Y染色體單倍羣鑑定爲O-F2137,是中國主要的Y單倍羣O-M122的主要後代羣之一。

研究團隊使用merqury(評估基因組品質的重要工具)來評估T2T-YAO,並分析其完整性、組裝錯誤和單倍型之間的切換錯誤。其中T2T-YAO的品質值(QV)達到了參考品質的準確度,母本與父本分別達到了Q70.49和Q72.28,選擇父母本中QV較高的常染色體及性染色體組成一套單倍體參考基因組,其品質達到了Q74.69。

研究發現,與基準基因組HG002相比,T2T-YAO表現出較少的錯誤重複、交換錯誤和較短的摺疊區域,且T2T-YAO擁有更完整的rDNA(核糖體DNA)序列。與CHM13相比,YAO的單倍體間具有更多的序列共用性和更高的同一性。這意味着與漢族人羣相比,不同族羣之間存在更大的基因組距離。而不同單倍型間有10%的序列是獨特的,代表了大部分個體間的基因組多樣性。

研究團隊還成功完成T2T-YAO的所有十個SAACs(近端着絲粒染色體短臂)區域,SAACs的成對比對揭示了異源染色體上幾乎有相同的序列存在,形成了具有大量倒位、重複和易位的同源嵌合體,特別是在chr13、14、21和22之間。對十個SAACs區域的k-mer(一段長度爲k的DNA片段)進行聚類,他們發現同源染色體的短臂顯示出幾乎相同的位置,但不同異源染色體的長臂彼此遠離。

研究發現,YAO-Y基因結構與既往報導一致,兩端包含僞常染色體區(PARs)、X轉座區、擴增序列、異染色質衛星區和X簡併區。擴增子存在於擴增區域,與CHM13-Y中觀察到的模式相似。