每天資訊綜述 | 人類疾病遺傳學簡史

菜單

綜述 | 人類疾病遺傳學簡史

在過去的25年裡,隨著技術的飛速發展,成熟的基因組資料資源以及不斷更新的分析工具的出現,基因型與表型資料的大量挖掘,讓人類遺傳學的目標:確定影響機體功能的DNA變異序列,特別是與人類疾病相關的變異序列,有望得以實現。遺傳學的發展讓我們對許多罕見病和常見疾病機制有了更加透徹的認識,並有效推動了疾病的預防和治療。現代醫學將更加致力於精準個體遺傳治療模式的開發。

近日,來自牛津大學的

Mark I。 McCarthy

Nature

上發表了綜述

A brief history of human disease genetics

系統回顧了人類疾病遺傳學發展的里程碑事件,詳細枚舉了遺傳變異與功能表型關係的全基因組分析方法和未來十年發展的策略和方向,並總結反思人類疾病遺傳學領域研究獲得的經驗教訓。

綜述 | 人類疾病遺傳學簡史

01

罕見病與罕見變異

在1980s到1990s期間,遺傳學研究致力於研究罕見單基因遺傳病。疾病的分析研究是由多重譜系的連鎖分析來精確定位的,技術方法則主要使用Sanger測序法對引發疾病的突變的連鎖基因進行鑑定。致病基因的評估會對多個患病家庭致病突變基因進行分離,並同時會在健康個體中獲得風險基因型的證據。致病基因評估也會利用細胞和動物模型進行功能性研究確認驗證人樣本中的結果。這種方法效率較低,並且花費較大

。到2000年,已經鑑定出了約7000種單基因遺傳疾病中約1000種疾病,包括具有亨廷頓氏病和囊性纖維化等。

人類基因組計劃的完成降低了致病基因突變研究的困難,推動了罕見單基因遺傳病致病基因鑑定數量達四倍的增長。

目前基於微陣列的結構變異檢測以及外顯子組和全基因組測序對遺傳疾病的檢測已變得至關重要,這些技術是透過計算機分析從而鑑定致病基因變異情況。對不同種族背景下的人口遺傳變異進行分類的資料整合熟度也不斷提高,有力地支援了基因變異到表型變化推論的可信度。近幾年,高通量測序技術的採用使得鑑定出從單個突變到大型結構重排的因果遺傳變異成為可能。這些技術已從基礎研究擴充套件到臨床應用,推動了對遺傳疾病的更早,更快的診斷。

罕見疾病致病基因的發現使少數具有相似臨床表現的個體的基因表徵轉變為更大的表型多樣患者佇列的全基因組測序。這種由基因型驅動的方法已經揭示了與臨床表現更加可變有關的新疾病。

對於新疾病的表徵和潛在因果等位基因的診斷解釋,更系統的資料共享方法也在不斷髮展。

共享那些被認為帶有罕見未診斷遺傳病的基因和表型資料的價值,已經促進了全球協作網路的設計

(如Matchmaker Exchange,DECIPHER和GeneMatcher)

,旨在匹配具有相似遺傳變異和表型的患者 。研究人員與罕見病家庭之間的互動推動了研究的速度。研究人員一旦發現了致病基因突變,便可以從患者佇列中收集資料。

這些技術的臨床轉化受益於一系列資訊資源,包括與罕見疾病相關的開放基因資料庫

(如OMIM ORPHANET)

,臨床相關性突變體解釋資料庫

(如ClinVar和ClinGen)

和記錄患者資料庫

(如DECIPHER和MyGene2,https://mygene2。org/MyGene2)

。對資源進行分類以獲取群體間遺傳變異的資源

(如ExAC,gnomAD)

,使人們有信心排除在群體水平資料中常見的遺傳變異,而這些遺傳變異可能是罕見性早期發病遺傳疾病的合理原因,這些分析減少了不能解釋疾病原因的變體對資料庫的汙染,並解決了由於對多重譜系的研究而引起的疾病外顯率過高估計。對許多單基因疾病等位基因可變外顯率的認識得到了改善,這促使研究將致力於確定引起遺傳和環境變化的因素。

儘管在將特定基因與特定疾病相關聯方面已取得了巨大進展,但是在這些基因中建立單個突變的因果關係仍然存在問題,許多疑似的罕見遺傳疾病仍未得到明確的診斷。

即使對於具有確定因果關係的變體,其外顯率通常也不一致。解決這些不確定性正是該領域目前的主要挑戰。來自大量病例和人群樣品的測序資料的綜合分析將為可靠解釋突變體與外顯率之間的關係提供所需的證據。同時進行的體外細胞功能檢測可以評估疾病相關基因中突變體的功能效應。使用RNA測序和DNA甲基化測定法對疾病相關的組織進行功能基因組探索,可以識別以前未發現的隱性因果遺傳突變,特別是在基因中編碼區之外未充分研究的區域。這些領域中的每一個領域的發展都將擴充套件突變體和遺傳的範圍,從而可以向患者及其家人提供診斷和預後資訊。

02

普遍性的疾病

對於具有較複雜的多因素病因的常見晚發性狀,應用多重譜系連鎖反應大多是失敗的,例如哮喘,糖尿病和抑鬱症這些疾病。

在認識到基於譜系關聯的研究方法更側重於檢測突變等位基因頻率與表型相關的差異後,識別較低外顯性的常見等位基因方向則變得具有更大的吸引力,研究學者也將注意力轉移到對照樣品的分析上。但是,最初針對候選基因內突變體的識別受到技術限制,篩選門檻過於寬鬆以及對偏見和混淆因素的辨別不足,從而導致研究失敗。

最初透過HapMap聯盟對錶徵基因組範圍的全基因組模式進行系統性分析後將基因組的等位基因結構被分割為單倍型模組,每個模組均包含相關突變體集。認識到這種模式可以支援全基因組關聯調查,從而開發出新技術即基因分型陣列的分析技術。從而使此類研究成為可能。關於急性黃斑變性和炎性腸病的研究成果令人鼓舞。在其他幾個方面也取得了進展,包括研究規模的擴大,基因分型排列的密集,用於歸因的新穎策略,對偏倚的關注和適當選擇的顯著性閾值,為各種疾病的研究提供了強有力的支援。早期的全基因組關聯研究

(GWAS)

分析發現的突變體是非常常見的,其影響比研究預期的要小很多。透過對來自多個GWAS研究的資料進行彙總和綜合分析發現,常見的突變體會形成一系列特異性的基因和功能富集,大量的基因和功能之間的關聯圖譜得以確定。最近,透過直接關聯分析和歸因,增加了對外顯子組和全基因組序列資料的分析深度,將發現和分析範圍擴充套件到了GWAS以前無法探究的低頻和罕見的等位基因。

自從使用GWAS的十年來,人類也致力於揭示常見疾病的遺傳基礎。研究發現常見病不單單是孟德爾遺傳條件的聚集。對於多數複雜的性狀,遺傳易感性在上千種變異體中都存在,對個體患病率無明顯影響。

對於大多數疾病來說,來自歐洲的樣本資訊不成比例地推動了大型GWAS綜合分析工作。在主要人群中,遺傳導致的疾病易感性模式大致相似。在一個人群中發現的許多常見風險等位基因在其他人群中也是可檢測的,而等位基因的頻率在不同人群中卻有很大差異。

將GWAS和基因測序研究擴充套件到不同人群則定會產生大量未發現的風險等位基因。對常見突變體和罕見突變體的研究表明,對於許多性狀,特別是具有晚期外顯的性狀,自然選擇所發揮的作用有限。

儘管人類內部廣泛的連鎖不平衡對於GWAS的發現至關重要,但突變體之間的高度相關性使這些關聯的特定突變體的定位受挫。樣本數量的增加,對跨民族資料質量的改善以及更具有代表性的參考資料為改善突變體與因果關係的解析度以及研究其運作的分子機制提供了一條途徑。對於編碼區內序列的突變造成的後果,功能方面的解釋也許是最容易的。然而,大多數常見的疾病相關的突變體往往對映到非編碼區序列,並切研究認為突變體透過影響轉錄調控來影響疾病易感性。對於許多性狀,涉及同一疾病的基因之間存在明顯的特定訊號通路的富集,並且GWAS分析會發現這些突變基因與已知疾病相關的細胞型別中特異性的調控元件中富集。這也驗證了即使與疾病相關聯基因突變數量激增,這些關聯也將在特定訊號和細胞過程中匯合,並在發病機理中發揮核心作用。

03

基因型與表型圖譜

致病基因分為單基因和多基因的劃分方法是由於分析方法的發展變化引起的

(基於譜系調查和病例控制關聯的方法)

其中一項重大進步是越來越多的以大型人群為基礎的佇列研究。這些生物庫工作是在弗雷明漢佇列研究和DeCODE在冰島等研究中開創的,現在涵蓋了北美,歐洲,亞洲及其他地區越來越多的佇列研究。UK Biobank的研究(

包括500,000名健康狀況良好的中年參與者)

則具有較大的影響力,透過允許多個研究小組分析資料的共享政策,改善了人類基因研究。

對基因型-表型關係進行全面,系統的分析的第二個推動因素是獲得全基因組序列資料。

儘管測序成本的降低正在加快發展的速度,但基於序列資料的遺傳分析仍落後於全基因組基因資料的規模

(基於最大序列的資料集僅為最大GWAS的十分之一)

。大多數高通量序列資料分析都集中在編碼區域上。匹配突變產生的功能並同時分析具有相似功能的突變基因集合的策略已實現了不常見的功能與基因突變關聯的總體基因水平測試,這種方法通常優於單基因突變體檢測。

這些發展使研究人員能夠跨越單基因和多基因領域之間的鴻溝,確定基因突變與表型的聯絡,從而有助於罕見和影響較大等位基因的可變表達以及影響多性狀的低頻基因突變體的研究。這使得研究學者能夠更嚴謹地評估罕見和常見突變體對性狀易感性的貢獻,並支援對疾病機理和研究至關重要的等位基因圖譜的繪製和治療手段的最佳化。這些發展正在迅速趨向最終目標:完成在所有可能的橫向和縱向生物醫學表型範圍內,所有可觀察到的遺傳變異的影響的綜合矩陣。這項努力的成功也取決於透過對資料共享的持續支援來實現各個研究之間更大程度的協調和整合。

04

附加功能

從第一個連鎖圖到大型佇列的全基因組測序,人類遺傳學已經構建了越來越複雜且系統的方法來繪製構成疾病特徵的遺傳因子。但是,透過系統地研究其對分子,細胞和生理過程的功能影響,確定這些變異體如何影響疾病的進展要慢得多。

對於常見疾病,功能研究具有更根本的作用。儘管已經在成千上萬的人類常見疾病和特徵中發現了成千上萬的關聯,但多種因素阻礙了將這些遺傳訊號轉換成因果關係,以及對於基因和機制的知識。而對於構成複雜疾病風險主體的常見變異而言,關聯圖譜的解析度通常受到人類基因組單倍型結構的限制。此外,大多數GWAS關聯都對映到非編碼,因此缺乏直接介導其作用的編碼區基因。對多效性的日益關注也使問題變得複雜:

由GWAS鑑定的許多突變體都與性狀相關,並在多種細胞型別中發揮不同的作用。

總體而言,探究感興趣的基因變異體和基因的大規模功能評估的投入將減少

(但可能不會消除)

。開發專用系統對疾病發病機制進行“最後一英里”的研究需要大量工作,從而加快下游臨床應用工作。

05

臨床應用

應用於罕見疾病的醫學遺傳學的特點是,

其在轉化基因組技術的臨床應用中迅速得到應用,這些技術也推動了最初的研究發現。

現在,針對幾乎所有可歸因於影響較大的等位基因的臨床表現,都進行了針對性的基因檢測,同時進行了更廣泛的基因組測序,必要時需研究較多的相關基因。在許多臨床科室中,通常對有症狀的個體和高危親屬進行基因檢測。同時隨著針對特定突變事件的療法進入臨床實踐,體細胞癌基因檢測的使用也有所增加。

從靶向基因測試到基因組測序的過渡使研究能夠進行遞迴重新分析,包括根據有關致病突變等位基因及其表型的後續發現對單個基因序列進行重新解釋。然而需要改進分子診斷方法才能確保可靠地檢測遺傳疾病的基因集,包括由三重重複和複雜的重排引起的那些疾病。對受影響組織進行基因變異的深度測序,以及使用RNA測序檢測驅動早發疾病的非編碼變異

(例如,透過剪接作用)

則代表了基因臨床診斷的新領域。

06

展望

在未來十年中,挑戰仍將是最佳化和大規模實施利用人類遺傳學的主題,研究致力於進一步瞭解健康和疾病的機制,並最大程度地應用於臨床實踐。要實現這些目標,將需要學術界研究人員的共同努力。如最近成立的國際常見病聯盟

(https://www。icda)

。在一系列層次上的相互合作給遺傳學領域帶來變革。這些努力將致力於建立:

(a)跨人口和環境的基因型-表型關係的綜合圖譜;

(b)跨細胞型別,機體狀態和不同程度的基因突變體與功能的系統分析;

(c)不斷創新,將基礎知識轉化為疾病發病機理的研究,並構建相應的細胞和生理模型;

(d)運用這些生物學研究成果來推動預防和治療手段更新。

更為重要的是,基因組學應用在研究和臨床中,需要在生物倫理框架內進行。該框架應認識到人類遺傳學的個人相關性以及自主同意和保護隱私的至關重要性,同時將研究可能存在的不利後果降至最低。該框架也重申公民有權利透過參與研究為科學進步做出個人貢獻,並鼓勵為臨床和研究目的而共享資料和成果。

最後作者指出要充分發揮基因組學的潛力,需要在多個方面進行持續的協作努力,以確保基因突變與表型圖譜更為詳細,這樣也能夠全面地瞭解疾病,為將來臨床治療轉化提供依據和靶點。

原文連結:

https://doi。org/10。1038/s41586-019-1879-7