NAR | 首個glycoRNA多組學數據庫“GlycoRNAdb”

2025-12-11

我們在既往已發表多篇糖基化RNA(glycoRNA)相關的推文報道,glycoRNA主要位於細胞表麵,在免疫調節、分子識別及細胞間通訊中發揮關鍵作用。有研究發現外泌體中也存在glycoRNA。盡管glycoRNA研究價值日益凸顯,但相關數據仍然分散且缺乏係統整理。目前亟需一個集中的資源平台來整合序列、結構、修飾位點及表達信息,以推動這一新興領域的深入研究。

 

 

(DOI: 10.1093/nar/gkaf1246)

 

2025年,中山大學鄭淩伶/廣州實驗室苗智超團隊聯合在《Nucleic Acids Research》發表題為“GlycoRNAdb: a database of glycoRNA sequences, structures, abundance, and glycan information across tissues and cell lines”的研究論文。他們最近開發並發表的GlycoRNAdb數據庫平台http://www.glycornadb.com),是首個綜合性glycoRNA數據庫。該平台整合了來自人類和小鼠不同組織及細胞係的實驗數據,係統收錄了3379個經過實驗驗證或富集分析鑒定的glycoRNA條目,提供了包括RNA序列、糖基化位點、二級結構、表達豐度以及詳細的糖鏈組成(如單糖組成、連接方式)在內的多維注釋信息,填補了該領域專用數據庫的空白。

 

 

多源數據整合與標準化分析流程

 

GlycoRNAdb收集了目前所有可公開獲取的glycoRNA數據,涵蓋32種組織/細胞類型和11種RNA類別(如tRNA、snoRNA、snRNA等),支持1426個質譜數據集和21篇文獻來源。建立了符合FAIR原則(可發現、可訪問、互操作、可重用)的數據處理流程。針對RNAwenkuzhibeifangfadebutong,zuozhecaiyongleyouhuadefenxiguandao,tebieshixitongxingdijiangnizhuanluzhongzhiweidianzuoweiqianzaitangjihuaweidiandeguanjianzhishibiaoji。tongguoduicexushenduhefugaidudejisuan,GlycoRNAdb不僅收錄了人類(GRCh38)和小鼠(GRCm39)的轉錄本信息,還利用R2DT工具預測了RNA二級結構,並將糖基化峰值映射到基因組特征上,從而精確識別出富集的glycoRNA序列。

 

 

 

功能模塊與可視化交互

 

GlycoRNAdb網站構建了六大核心功能模塊:

(1)數據集:統一元數據維度包括發表年份、物種、組織來源等;

 

(2)序列:支持關鍵詞、轉錄本ID或GlycoRNAdb定義的標識符精確查詢;

 

(3)BLAST:通過序列同源性鑒定潛在glycoRNA;

 

(4)JBrowse:可視化基因組背景下的修飾位點;

 

(5)表達豐度:通過熱圖和柱狀圖量化組織或細胞類型特異性表達;

 

(6)糖鏈信息:詳細描述位點特異性修飾的質譜指數、分子式、糖苷鍵連接方式和單糖組成。

 

用戶可以通過關鍵詞(如RNA類型、基因名)快速檢索,查看糖基化位點在RNA二級結構上的空間分布。特別是JBrowse模塊,允許用戶在基因組上下文中查看glycoRNA位點與其他RNA修飾的相對位置;而糖鏈信息模塊則通過質譜數據,可視化展示了從人體組織中鑒定出的複雜糖鏈結構(如唾液酸、岩藻糖修飾)及其化學連接方式。

 

 

 

案例研究驗證

 

 

作為功能演示,作者以snoRNA(小核仁RNA) SNORD3B-1(hsa-glycoRNA-1)為例,展示了數據庫的深度分析能力。通過序列模塊,用戶可以清晰地看到該RNA在HeLa和H9細胞係中經過RT-stop驗證的糖基化位點(如U134位點)。表達豐度分析顯示,SNORD3B-1在glycoRNA富集文庫中的豐度顯著高於Input對照組(在H9細胞中log2FC高達3.49),有力支持了其作為保守糖基化靶點的身份。

 

其次,使用BLAST模塊成功鑒定了一段未表征RNA序列為tRNA-Ile(hsa-glycoRNA-145a),並通過JBrowse界麵發現其預測的糖基化位點與acp3U修飾位點在空間上緊密相鄰(E),這與近期發現acp3U作為glycoRNA連接子的研究結果一致。

 

 

 

糖基化位點與RNA修飾的關聯

 

數據庫特別整合了其他RNA修飾(如acp3U、t6A、m6A、m5C等)的注釋信息,通過JBrowse可視化界麵,研究人員可以係統探究糖基化與其他RNA修飾類型的相互作用。

 

 

GlycoRNAdb(http://www.glycornadb.com)作為glycoRNA研(yan)究(jiu)領(ling)域(yu)的(de)首(shou)個(ge)專(zhuan)業(ye)數(shu)據(ju)庫(ku),成(cheng)功(gong)整(zheng)合(he)了(le)分(fen)散(san)的(de)研(yan)究(jiu)數(shu)據(ju),為(wei)探(tan)索(suo)這(zhe)一(yi)新(xin)興(xing)分(fen)子(zi)類(lei)別(bie)的(de)生(sheng)物(wu)學(xue)功(gong)能(neng)和(he)治(zhi)療(liao)潛(qian)力(li)提(ti)供(gong)了(le)不(bu)可(ke)或(huo)缺(que)的(de)資(zi)源(yuan)。隨(sui)著(zhe)glycoRNA在免疫調節、細胞通訊和疾病機製中作用的逐步揭示,這一平台有望加速相關基礎研究和轉化應用。研究團隊表示,未來將擴展至更多細胞類型(如神經元和肝細胞),整合冷凍電鏡/交聯衍生的3D結構,並開發機器學習預測工具,持續推動glycoRNA研究向前發展。正如論文所述,該資源與團隊先前開發的deepBase、RMBase、STARBase和tModBase一起,共同構成了非編碼RNA研究的完整生態係統。

- - - 推薦閱讀 - - -