2022年10月10日,美国科学院院士、斯坦福大学统计系Wing Hung Wong教授课题组联合清华大学自动化系江瑞长聘副教授课题组在Nucleic Acids Research杂志(IF=19.16)上在线发表文章“HiChIPdb: a comprehensive database of HiChIP regulatory interactions”[2]。研究团队发表了首个附带全基因组功能注释HiChIP数据库(http://health.tsinghua.edu.cn/hichipdb/)。数据库收录了截止于2022年5月份上传至GEO数据库的人类HiChIP约200个样本。HiChIP数据库采用了统一的数据处理流程(pipelines),从原始Fastq测序原始数据统一处理至不同分辨率的HiChIP相互作用数据。HiChIP数据库覆盖了超过100个人类细胞类型下总计2.62亿条HiChIP相互作用(interactions)。
图1. 文章发表于Nucleic Acids Research
图2. HiChIPdb的可视化功能
此外,与已有的三维基因组数据库最大的不同点在于HiChIP对全基因组上每一条相互作用都提供了丰富的功能性注释,包括anchor最近基因的详细信息注释、GWAS SNP信息的注释等。对于注释的基因以及变异SNP信息,均提供详细的位置信息以及NCBI等外部链接。更重要的是,对于每一条HiChIP相互作用,都提供类似于基因浏览器的可视化的窗口,用于可视化全基因组上某个区域中的HiChIP相互作用以及基因等注释信息。另外,用户也可以选择同时加载不同细胞系下同一个基因组区域中的HiChIP相互作用,从而方便研究HiChIP相互作用的细胞特异性。
图3. HiChIPdb的功能性注释
参考文献:
[1] Mumbach M R, Rubin A J, Flynn R A, et al. HiChIP: efficient and sensitive analysis of protein-directed genome architecture[J]. Nature methods, 2016, 13(11): 919-922.
[2] Zeng W, Liu Q, Yin Q, Rui J and Wing H W. HiChIPdb: a comprehensive database of HiChIP regulatory interactions[J]. Nucleic Acids Research, 2022.
[3] Zeng, W., Chen, X., Duren, Z., Wang, Y., Jiang, R. and Wong, W.H. (2019) DC3 is a method for deconvolution and coupled clustering from bulk and single-cell genomics data. Nat Commun, 10, 4613.
[4] Zeng, W., Wang, Y. and Jiang, R. (2020) Integrating distal and proximal information to predict gene expression via a densely connected convolutional neural network. Bioinformatics, 36, 496-503.
[5] Zeng, W., Xin, J., Jiang, R. and Wang, Y. (2021) Reusability report: compressing regulatory networks to vectors for interpreting gene expression and genetic variants. Nature Machine Intelligence, 3, 576-580.
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!