单细胞数据库TEDD,助力人类疾病和发育生物学遗传研究

作者:华大时空
近日 , 香港中文大学蔡光伟教授及董梓瑞博士团队和深圳华大生命科学研究院谈聪博士团队在NucleicAcidsResearch杂志上发表题为《TEDD:adatabaseoftemporalgeneexpressionpatternsduringmultipledevelopmentalperiodsinhumanandmodelorganisms》的论文 , 发布了一个人和模式动物组织器官发育单细胞转录组与染色质可及性数据库TEDD(TemporalExpressionduringDevelopmentDatabase) 。
单细胞数据库TEDD,助力人类疾病和发育生物学遗传研究
文章图片
NucleicAcidsResearch官网截图
TEDD系统地整合了现阶段最新、最全的单细胞组学数据资源:来自人与多种模式动物(小鼠、斑马鱼、线虫等)的2760个样本的RNA测序数据 , 以及510万个单细胞测序数据(单细胞RNA-seq和单细胞ATAC-seq) 。 同时 , TEDD提供用户友好的交互式分析工具 , 供研究人员分析和可视化跨组织及不同发育期的基因表达、调控和网络 。 研究人员通过TEDD , 不仅能够识别细胞类型、组织类型的特定和时间性的基因表达及染色质谱 , 还可将发育和疾病中未确定生物功能的基因联系起来 。
单细胞数据库TEDD,助力人类疾病和发育生物学遗传研究
文章图片
解决数据挖掘和再分析难题
细胞命运决定(cellfatedecision)在多细胞生物从合子到功能分化的细胞类型、组织和器官的发育过程中起着非常重要的作用 。 人和其它哺乳动物的每个发育阶段都涉及复杂的增殖、分化和重编程等细胞分化过程 。 近年来 , 单细胞和时空多组学技术的快速发展 , 使得深入理解模式动物及人组织器官的发育过程中细胞分化与基因动态调控成为可能 。 随着单细胞测序研究数量的急剧增加 , 尽管已开发多种单细胞组学数据库(如HCA、MCA、CDCP等) , 但目前仍缺乏一个参考数据库 , 覆盖模式动物和人生命发育周期最新和最全的数据集 , 以应对数据挖掘和再分析面临的挑战 。 基于此 , 香港中文大学和深圳华大生命科学研究院合作开发了TEDD 。
多功能上线助力人类疾病和发育生物学遗传研究
TEDD目前已上线覆盖多研究场景的功能 , 用户通过TEDD导航栏子菜单引导即可进入相应页面 。
单细胞数据库TEDD,助力人类疾病和发育生物学遗传研究
文章图片
TEDD主要功能
NO.1以UMAP展示基因表达与染色质可及性
为了更好地展示数据 , 在输入参数(物种、组织类型和查询基因等)后 , TEDD按照细胞类型、组织类型、时间点以及性别4种不同要素标记UMAP中的细胞 , 用户亦可手动去除某一或某些标记(如细胞类型)仅保留其感兴趣的部分 , 基因表达或染色质可及性以热图形式展示 。 为了便于比较 , TEDD还可在同一界面展示两个查询结果 。
NO.2共表达分析
在以往研究中科研人员较难确认具有多基因共同表达的细胞类型与表达比例 。 TEDD解决了这一难题 , 其提供了细胞类型、时间点以及性别3种不同要素下 , 共表达多个目标基因的细胞类型以及比例 , 供研究者挑选下一步实验的对象 。
单细胞数据库TEDD,助力人类疾病和发育生物学遗传研究】NO.3多基因表达趋势聚类分析
在选择参数(物种、组织类型、细胞类型和时间点等)后 , TEDD提供多基因列表进行表达聚类 , 用户也可查询目标基因所在的GO和KEGG通路获取该通路所包含的基因列表进行表达聚类 。
NO.4时序性特异表达基因查找
TEDD提供同一组织类型、不同时间节点中存在显著差异表达的基因;也可选择不同组织类型、细胞类型和时间节点后 , 在自定义差异倍数变化及最大输出基因个数的情况下 , 查找与已检测到差异表达基因存在相同或不同表达趋势的基因列表 , 供研究人员进一步探索不同基因之间的调控关系 。 此外 , TEDD提供时序性稳定表达基因查找功能 。