(资料图)
超级增强子(SEs)是具有细胞特异性的DNA顺式调控元件,是由多个增强子聚集在一起形成的具有高调控能力的基因组区域。其通过招募大量的转录因子、转录辅因子、染色质调控子和染色质复合物来参与下游基因的转录调控过程,被认为能够决定细胞命运、维持干细胞多能性以及诱导复杂疾病发生发展。大量研究显示,SEs可以通过调节许多生物过程,如肿瘤发生和发展、胚胎发育、免疫反应以及细胞侵袭和转移等许多生物过程,表明SEs在复杂疾病的发展和维持健康的细胞特性和功能方面具有巨大的调节潜力。
近年来,研究人员开发了多个与SEs相关的数据库,包括dbSUPER和SEA,为研究人员提供了大量的SE信息。 2019年, 李春权教授科研团队开发了SEdb 1.0 ,以细胞类型特异性的方式从多个角度注释SE对基因转录调控的功能影响,其中包含大量人类SEs和SEs的丰富注释数据,以破译转录调控机制 。此外,SEdb 1.0发布后,多物种ChIP-seq数据的持续快速积累为探索SE功能提供了宝贵资源。
近日,南华大学附属第一医院李春权教授科研团队在超级增强子转录调控领域研究中再次取得突破性进展,相关研究成果以”SEdb 2.0: a comprehensive super-enhancer database of human and mouse”为题发表在生命科学、生物信息学领域TOP期刊 Nucleic Acids Research (IF=19.160,JCR1区)上。 研究团队将 SEdb 1.0全面更新为SEdb 2.0 ,旨在提供全面的SE资源,并注释它们在基因转录中的潜在作用。与SEdb 1.0相比, SEdb 2.0的主要改进是增加了小鼠SE数据集、扩展了人类SE规模以及优化了SE识别工作流程 ,为研究人员提供了一个友好的平台,以更全面地阐明SEs在生物过程中的重要作用。
文章发表在 Nucleic Acids Research 上
SEdb 2.0支持了多达 2,500多个组织/细胞类型 ,来自2670个样本的 超过170万个超级增强子 (人:1,167,518;鼠:550,226),其中包括541个原始人类样本、1198个新发布的人类样本和931个小鼠样本。与SEdb 1.0相比, SEdb 2.0数据集和SE的规模增加了5倍以上 。重要的是, SEdb 2.0通过TF motif分析和TF ChIP-seq数据预测了SE区域内的TF结合 。简而言之,研究团队收集并处理了来自人和小鼠的>1400个TF的结合数据,以解释不同细胞/组织类型之间SE相关的调控信息。
同时,研究团队 开发了SEs功能注释新方法 ,将数据库查询技术与DNA调控区域区域间比对技术有效偶联,为百万级的SEs实现快速实时的开放染色质注释、拓扑结构域定位、转录因子ChIP-seq绑定信号和motif区域的功能注释,而且提供了5种SE功能分析新方法,以及对所有的SE样本计算了质量分析报告。
此外, SEdb 2.0平台融合大量包括染色质状态以及3D染色质互作在内的多种遗传学和表观遗传学特征,提供最全面的SEs注释信息 。SEdb 2.0以SEs锚定解读复杂疾病中的基因转录调控机制,为心血管疾病、癌症等复杂疾病提供了全新诊断治疗靶点。SEdb 2.0还增加了新的分析和搜索功能,如“基于TF的SE搜索”、“差异重叠SE分析”和“基于SE的TF基因分析”。总的来说,SEdb 2.0是一个易于使用的平台,可以管理大量的人类和小鼠SE数据,为SEs的注释提供了全面的注释和分析工具(图1)。
图:SEdb 2.0数据库内容和建设。
南华大学附属第一医院李春权教授为该论文唯一通讯作者,南华大学附属第一医院为第一通讯单位,该研究得到了国家自然科学基金、南华大学附属第一医院高层次人才科研启动专项经费等项目的支持。