大約 1% 的人類基因組能夠折疊成 G 四鏈體 (G quadruplexes,G4s)——在富含 G 的基序上形成的非經典鏈特異性 DNA 結構。G4 的熱穩定性不同,這可能會影響它們的功能。然而,G4s 也可能阻礙復制、轉錄和翻譯,并可能增加基因組的不穩定性和突變率。因此,根據其基因組位置、熱穩定性和功能性,G4 基因座可能會在不同的選擇壓力下進化,而這一點從未被研究過。
一、基因組中 G4 基因座的密度不均勻
與全基因組平均值相比,CpG 島、上游區域和轉錄鏈的 G4 密度的倍數差異特別高:分別為 12.3、4.98 和 4.11。相比之下,內含子的非轉錄和轉錄鏈、非轉錄外顯子鏈和 3' UTR 的非轉錄鏈具有 G4密度接近全基因組平均值;校正 G 含量總體趨勢不變,復制起點和增強子具有特別高的 G4 密度:分別比全基因組平均值高 6.88 倍和 3.03 倍。
二、G4 穩定性在基因區和非基因功能區之間存在差異
根據穩定性得分將G4基因座分為2組,高于19分的為“穩定G4基因座”(342778個),低于19分的為“不穩定G4基因座”(327298個),繪制穩定性得分分布圖:
三、G4功能受到不同基因區域的限制
HKT檢驗顯示,G4 基因座的進化取決于它們位于哪個基因組件內。 G4基因座在上游、下游基因區域、5' UTR、3' UTR的優勢比顯著大于1。位于增強子、復制起點以及在TAD邊界區域的G4 基因座優勢比都很高,這一發現表明這三種區域的G4基因座是有功能的。
這項工作表明, G4 的覆蓋率、密度、預測穩定性和選擇壓力取決于它們所在的基因成分和非基因功能區域。自然選擇在基因組的某些功能區域中保持了高密度的 G4 位點和高穩定性的 G4 結構,以及在其他功能區中保持低密度和低穩定性。每個特定區域組的情況可能取決于維持功能性 G4 的選擇壓力與容納此類結構的成本之間的平衡。