科研

首页 - 全部文章 - 科研 - Nucleic Acids Res | 陈润生/何顺民团队发表非编码RNA相互作用数据库NPInter v5.0

Nucleic Acids Res | 陈润生/何顺民团队发表非编码RNA相互作用数据库NPInter v5.0

非编码RNA对生物分子的调控作用,一直是RNA功能研究的前沿。在以往的研究中,非编码RNA被发现可以和蛋白质、RNA以及基因组相互作用,调控复杂生物过程。比如经典的长非编码RNA Xist可以和X染色体相互作用并影响剂量补偿效应。因此,理解非编码RNA和生物分子的相互作用对于研究非编码RNA的功能以及生物分子调控网络的构建是非常重要的。

2022年11月14日,Nucleic Acids Research在线发表了中科院生物物理所健康大数据研究中心团队的研究文章“NPInter v5.0: ncRNA interaction database in a new era”(图1),发布了最新版的NPInter(NPInter v5.0)。研究团队对非编码RNA分子多维度的相互作用以及相关分子进行了详细的注释以及可视化,提供了一个全面、系统的非编码RNA相互作用的研究平台。

图1:文章发表于Nucleic Acids Research

陈润生院士课题组于2006年发布了NPInter数据库的第一个版本(Nucleic Acids Research)。在过去的十几年中,NPInter数据库一直获得业内的广泛认可,被RNAcentral收录为专家数据库,迄今为止,已经更新过四个版本。本次更新,内容方面除了对NPInter第四版涉及到的相关内容进行扩充外,也关注于非编码RNA相互作用在热点领域如肿瘤生物学和新冠病毒中的研究,致力于为用户提供非编码RNA分子多维度多领域的相互作用及功能注释参考(图2)。

图2:NPInter v5.0数据库

此次NPInter v5.0更新,数据量有较大幅度的增加,来自文献挖掘和高通量测序数据分析的RNA相互作用数据条目从原有的1,100,618条增加到了2,596,695条(不包括RNA-DNA相互作用对),其中包括来自5,143篇文献中的8,586条非编码RNA相互作用对,由实验验证的非编码RNA相互作用数目得到了较大提升。

整合了多对多RNA-DNA相互作用数据,对来自iMARGI、ChAR-seq、GRID-seq的高通量测序数据结果进行了收集与整合。这三种测序方式都能够同时对所有与染色体相互作用的非编码RNA进行定位与鉴定,极大地增加了RNA-DNA的相互作用条目以及与染色体相互作用的非编码RNA分子数目。其中RNA-DNA相互作用数目从原有的888,915条增加到了8,329,382条,非编码RNA分子数从原有的15增加至16,806。

对新冠病毒SARS-CoV-2相关RNA相互作用进行了整合与展示,为了给寻找抗SARS-CoV-2病毒药物靶点方面提供全面的参考,提出了专门针对于SARS-CoV-2 RNA相互作用的集合,其中包括病毒与宿主之间不同类型相互作用的五个面板(共1567条相互作用对)。

对肿瘤单细胞RNA-seq(scRNA-seq)数据细胞特异表达lncRNA的鉴定与注释及相互作用分子的展示,从20种肿瘤scRNA-seq测序数据中鉴定出细胞亚型特异表达的lncRNA, 并展示了数据库中已存在的这些lncRNA的相互作用对,最终鉴定出了来自248个细胞亚型的1442个lncRNA,为肿瘤中的非编码RNA相互作用提供了一定的参考。

本次更新对网站也进行了升级,针对SARS-CoV-2病毒相关RNA相互作用和单细胞RNA-seq数据细胞特异表达lncRNA的展示增加了相应的模块,浏览页面增加了与基因组相互作用的非编码RNA分子的整理与展示。此外,根据用户反馈,为了展示RNA结合蛋白(RBP)更为具体的相互作用和功能,NPInter网站中整合了名为RBP的新模块。该模块列出了数据库中的277个RBP,并展示了RBP的function、localization和domain三个属性(图3)。

图3:NPInter数据整合。来源:Nucleic Acids Research

NPInter非编码RNA相互作用相关数据信息可以通过http://bigdata.ibp.ac.cn/npinter5/进行访问、浏览、搜索和下载。

综上,NPInter非编码RNA相互作用数据资源平台涵盖了非编码RNA与蛋白质、RNA和基因组全方位多维度的相互作用,提供了更加丰富的相互作用及分子功能注释,并为热点研究领域如肿瘤生物学和新冠病毒的研究提供了新的参考。

中国科学院生物物理研究所的何顺民研究员、陈润生院士为该文共同通讯作者,中国科学院大学生命科学学院的博士研究生郑宇、中国科学院生物物理研究所的副研究员罗华夏博士、中国科学院生物物理研究所毕业博士生滕学奕(现为加州大学尔湾分校博士后)为该文并列第一作者。该研究得到了国家重点研发计划,中科院网络安全和信息化专项,中科院战略性先导科技专项,国家自然科学基金,中国博士后科学基金,科技基础资源调查专项,国家基因组科学数据中心的支持。

原文链接:

https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac1002/6827104

(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

热评文章