microRNA (miRNA) 是長度為23nt左右的單鏈非編碼RNA,亦是豐富的調節性RNA,可作為基因轉錄后表達調節劑,主要指導其靶基因轉錄物的切割、降解和/或翻譯抑制。為此,對它們在組織和細胞類型中的豐度進行準確分類是了解生理和病理條件下基因調控和失調的重要工具。同樣重要的是,在疾病和健康狀態之間或在疾病過程中,組織和生物體液中改變的 miRNA 水平可以區分疾病或與臨床表型和結果相關聯,突出特定 miRNA 可能攜帶的診斷、預后或預測生物標志物能力。有關miRNA在細胞類型和組織中的表達和分布的信息對于理解它們的功能以及它們作為生物標志物或治療靶點的轉化用途至關重要。
近日,希臘研究團隊構建了一個新的microRNA組織表達數據庫——DIANA-mitED,該數據庫相關文章刊登在Nucleic Acids Research期刊(IF=16.971),題名為DIANA-miTED: a microRNA tissue expression database。網址為http://www.microrna.gr/mited。
大多數可用數據庫要么包含少量數據集,要么僅或幾乎僅關注 TCGA,這主要是由于實際原因。TCGA 是一個相當統一的資源,而 GEO/SRA 研究在文庫制備、使用的適配器和樣品質量方面極為多樣化。DIANA-mitED 彌補了這一差距,使研究人員能夠研究迄今為止最廣泛的文庫中的 miRNA 表達,以及從單一資源執行簡單或復雜的分析。DIANA-mitED包含SRA和TCGA中的15183個原始人類小RNA-Seq(sRNA-Seq)數據集的分析,涵蓋了總共包含199個組織、82個解剖亞位、267個細胞系和261種疾病。
為了生成 miTED,我們利用 DIANA-mAP 分析工作流程對從TCGA和 SRA檢索到的>15000個sRNA-Seq數據集進行了預處理和分析。在 miTED 中,用戶可以檢索一個或多個miRNA和/或組織/細胞系的表達值,識別最高表達的 miRNA,或感興趣的miRNA表達最多的最高組織/細胞系.
miTED實現了一個友好的在線圖形用戶界面,使用戶能夠搜索、瀏覽和元分析這個廣泛的集合,而無需生物信息學支持或專業知識。DIANA-miTED通過Querying DB頂部菜單提供三個主要查詢頁面,即Multi-query、Top-miRNAs 和Top-sites。
在Multi-query頁面中,用戶可以查詢、檢索和比較組織或細胞系中一種或多種miRNA 的表達。搜索框允許自由文本搜索和選擇特定組織或細胞系和 miRNA。多查詢表單提供了將搜索限制為特定疾病的機會,僅包括來自 SRA 或 TCGA 數據收集的結果,根據健康狀況(即“健康”或“疾病”)檢索數據。結果分為三個不同的部分。(A) 第一部分專門用于可視化檢索到的結果。分組箱線圖可以比較特定組織/疾病中的 miRNA 豐度。此外,通過描繪組織-疾病關系的?;鶊D和性別、采集和健康狀況的餅圖探索樣本分布。(B) 第二部分滿足 miTED 結果與每個 miRNA 的相關 DIANA 資源(工具和數據庫)的互連。(C)在第三部分中,提供了一個數據表,其中包含樣本元數據以及用戶請求的miRNA 的表達。
Top-miRNAs頁面是 miTED 資源中的第二個查詢頁面。通過此頁面,用戶可以搜索特定組織或細胞系中表達最高的 miRNA。顯示的結果包括以降序顯示所有 miRNA 表達的數據表和描繪所需組織或細胞系中最高表達 miRNA 的條形圖。
Top-sites頁面專門用于檢索特定 miRNA 最豐富的組織或細胞系。與Top-miRNAs頁面類似,結果包括一個表格,其中包含按降序排列的組織/細胞系的表達值,以及一個描述輸入表達最多的頂部組織或細胞系的條形圖。
DIANA-miTED 還通過其Visualizations菜單提供三個可視化頁面。第一頁,提供了一個圖網絡,描述了組織或起源器官與組織子區域之間的關系。它是一個交互式圖表,能夠突出顯示和移動節點,以探索它們之間的互連程度?!?/span>TCGA Projects Exploration”頁面包含用于分別探索 TCGA 數據集的組織-疾病和組織-性別關系的?;鶊D。