本文來自微信公眾號:學術經緯 (ID:Global_Academia),作者:藥明康德內容團隊,頭圖來源: 視覺中國,原文標題:《新的里程碑!〈自然〉重磅專題:首個人類泛基因組草圖公布》
(資料圖)
今日,人類遺傳學研究迎來了又一里程碑:首個人類泛基因組參考(human pangenome reference)草圖發布!
▲最新一期《自然》封面專題,介紹了首個人類泛基因組參考草圖(圖片來源:Darryl Leja/NHGR)
這份泛基因組參考草圖的問世,意味著我們將更全面、更準確地了解全世界人類的基因組多樣性。最新圖譜結合了來自不同祖源的47個個體的遺傳信息,比現有的單一參考基因組序列(GRCh38)新增1.19億個堿基字母。該圖譜為人類基因組提供了更完整的圖像,也更能代表人類這個物種的遺傳多樣性,應用這一參考圖譜能極大提高對人類基因組中變異體的檢測。
頂尖學術期刊《自然》同時發表了3篇論文,另有第4篇論文發表于《自然-生物技術》。在這一專題中,人類泛基因組參考聯盟(Human Pangenome Reference Consortium)提出了首個人類泛基因組參考草圖的構建和使用方法,并報告了使用該圖譜獲得的兩項新發現。
從1到全世界
21世紀之初,人類基因組計劃(Human Genome Project)發布了第一版人類參考基因組草圖,標志著解讀人類生命藍圖的突破性里程碑。然而由于當時的測序技術所限,這版草圖中留有許多空白。
最初的參考序列在此后的二十年里不斷更新,包括修復錯誤和填補空白。2003年,人類基因組計劃產生了占人類基因組90%以上的序列。然而直到2019年,人類基因組測序結果中仍有數百萬個堿基位置上是空白的。
就在去年,填補人類基因組空白的工作取得重大突破。由于長讀長和超長讀長測序技術的發展,研究者讀取生物樣本的DNA時可以一次性解碼幾千甚至百萬個堿基對,然后通過專門的算法將這些DNA長片段組裝成更完整的基因組序列?!岸肆5蕉肆!甭撁耍═2T)建出了第一個完整的人類參考基因組(被命名為T2T-CHM13)。
相關閱讀:《科學》封面重磅:迄今最完整的人類基因組測序結果公布
不過,上述這些都是單個參考基因組的不斷升級。原有參考基因組序列的一個重要局限在于,它是由大約20個志愿者的遺傳數據拼湊組成的一套基因組,大部分參考序列(約70%)實際上只來自一個志愿者。
“無論你對一個基因組的表征有多準確,都不能代表所有人類群體”,從一開始就參與人類基因組計劃、此次也是人類泛基因組參考聯盟一員的David Haussler教授解釋說,“現在則是一個轉折:不再是一個標準人類基因組的基因組學,而是可用于所有人的基因組學?!?/p>
此次發布的人類泛基因組參考納入了T2T的完整基因組序列,還拓展了多樣性上的新維度,將來自47個志愿者的全基因組序列集合排列,能方便地分析基因組在個體之間的變化,反映人類物種內部的遺傳多樣性。
為什么需要更多樣化的參考基因組
每個人都是獨一無二的,每個人的基因組也略有不同。平均來說,你與另一個人的基因組有大約0.4%的差異。讀懂這些微小的差異,可以更好地掌握一個人的健康與疾病狀況,有助于疾病的診斷、治療方法的選擇、治療結果的預測。
當科研人員或臨床醫生想要根據一個人的基因組找出與疾病相關的變異,他們需要將這個人的DNA與一個作為標準的參照物進行比較,從而確定哪些位置的堿基出現了特殊變化。參考基因組就是這樣一個標準,但目前為止的人類參考基因組中基本上每條染色體只有一個序列,這個序列基本上來自一個個體。然而,人類群體中存在大量遺傳變異,有些變異在某些特定人群(例如特定祖源)存在,在另一些人群中不存在。
因此,在臨床使用基因組學信息——例如預測一種遺傳病時,如果想要減少偏差,作為標準的參照物就不能只是某個單一人群的代表,而需要擴大其代表性。
新的泛基因組參考便提供了更多樣化、也更準確的標準。研究人員通過復雜的算法,將組裝完成的單個基因組序列集合編譯為圖形結構。如果過去的參考基因組只是一根線,現在的人類泛基因組參考是多個基因組序列的多線并行圖。在堿基完全相同的序列,它還是單線形式;而存在人群差異的序列部分,線條則從一根“分化”出地鐵軌道般交錯的多根,提供了更廣泛的參考選擇。
▲泛基因組管狀圖譜(Credit:Darryl Leja)
人類泛基因組參考聯盟的主要研究者之一、德國海因里希海涅大學(Heinrich Heine University)的Tobias Marschall教授指出:“人類泛基因組參考是我們已經等待了十年的一個里程碑,這是在測序技術和生物信息學方面取得了諸多創新后才得以達成的。”
更準確地理解變異和疾病的關系
最新的泛基因組參考圖譜比當下的參考人類基因組多了1.19億個新堿基,其中有大約9000萬個堿基來自結構變異。結構變異包括序列的倒置、插入、缺失或串聯重復,通常涉及50個以上的堿基,由于其復雜性,過去在使用單一參考基因組的情況下,人類基因組中存在的結構變異70%以上難以識別。而現在,基于更全面的泛基因組參考圖譜進行基因組分析,結構變異的檢測率可以提高104%,研究人員有機會在未來將結構變異與疾病更好地聯系起來。
除了結構變異的檢測率提高外,檢測較小的遺傳變異(例如只有一個或數個堿基差異)時,使用泛基因組參考的準確性也有34%左右的提高。
最新的泛基因組參考圖譜還有一項重大突破。我們的染色體成對存在,一套遺傳自母親,一套遺傳自父親,而泛基因組參考包括的單倍型信息——來自47個人的94套基因組序列,可以在分析一個人的基因組時更準確地區分出來自父母的不同染色體。這也將幫助我們更好地理解各種基因和疾病的遺傳方式。
圣路易斯華盛頓大學的王艇教授也是該項目的主要研究者之一,他介紹道:"新的泛基因組參考能更準確地發現和評估人類遺傳變異,特別是結構變異。人類遺傳學和基因組醫學的幾乎所有領域都可以因此受益。例如,鑒定與人類疾病相關的遺傳變異將更加敏感和具體,從而直接改善疾病診斷和治療。新的參考基因組還為研究遺傳變異的功能后果奠定了基礎。"
更多新發現
在《自然》專題同時發表的兩篇相關論文中,其中一篇聚焦于人類基因組中的單核苷酸變異(SNV)。
美國華盛頓大學醫學院的Evan Eichler教授和同事開發了一個SNV圖譜,系統評估了片段重復序列(在基因組一個以上位點重復出現、共享高度相同序列的DNA區域)中的SNV,描述了數百萬此前未繪制的SNV,并對重復序列和單一序列中出現的SNV進行了比較。
另一篇論文中,美國田納西大學的研究人員觀察了異源著絲粒染色體短臂(中節位于靠近染色體一端)間的重組模式。有關這類染色體之間的DNA交換機制,50年前便已有人提出過假說,卻始終因缺乏合適數據而未經觀測到。此次,借助泛基因組參考的多對多比較,研究人員終于獲得了證據。
下一個里程碑
人類泛基因組參考聯盟的研究人員介紹,該項目還在繼續采樣,目標是納入350名個體的基因組信息,尤其是目前還未納入的人群代表,以便擴大多樣性和增強不同人群之間的平衡性。他們計劃在2024年發布人類泛基因組參考的最終版本,力求代表人類這個物種盡可能多的DNA序列。
▲覆蓋全球范圍的泛基因組(Credit:Darryl Leja)
王艇教授指出,這不是一個項目的結束,而是一個新領域的開始,以便更有意義地將人類多樣性納入生物學、生物醫學和臨床科學。新的人類參考基因組將繼續增長、擴大和打磨,從而更準確地描繪我們這個物種的生命藍圖——這需要全世界的努力。
人類參考基因組問世二十多年,盡管并不完整,卻已經在生物醫學領域產生了深遠的影響;隨著包容性更強、多樣性更全面的泛基因組參考上線,下一個十年、二十年,這一成果必將通過臨床研究、藥物開發和醫療實踐的發展造福全球。
參考資料:
[1] Wen-Wei Liao et al., (2023) A draft human pangenome reference. Nature Doi: https://doi.org/10.1038/s41586-023-05896-x
[2] Mitchell R. Vollger et al., (2023) Increased mutation and gene conversion within human segmental duplications. Nature Doi: https://doi.org/10.1038/s41586-023-05895-y
[3] Andrea Guarracino et al., (2023) Recombination between heterologous human acrocentric chromosomes. Nature Doi: https://doi.org/10.1038/s41586-023-05976-y
[4] Glenn Hickey et al., (2023) Pangenome graph construction from genome alignments with Minigraph-Cactus. Nature Biotechnology Doi: https://doi.org/10.1038/s41587-023-01793-w
[5] Arya Massarat et al., (2023) A collective human reference genome. Nature
[6] Human pangenome reference will enable more complete and equitable understanding of genomic diversity. Retrieved May 10, 2023 from https://www.eurekalert.org/news-releases/988471
本文來自微信公眾號:學術經緯 (ID:Global_Academia),作者:藥明康德內容團隊
關鍵詞: