理解和治疗疾病需要对不同的细胞及其在人类组织和器官中的相互作用进行深入、系统的描述,同时也需要对导致疾病风险的遗传变异进行表征。近期的研究将特定人类组织和器官的单细胞图谱与人类疾病相关的基因相结合,将疾病风险变异与可能的起作用的细胞联系起来。然而,将这些研究扩展到整个身体的多个组织和器官,进行群体规模的研究,并整合来自多个器官的细胞图谱以产生统一的见解,这一直是一个挑战。 由于疾病相关变异体的多效性(pleiotropy)和特异性,系统地将变异与细胞和分子过程联系起来需要对多个组织和个体进行分析。以前的细胞图谱主要依赖于来自单一器官或组织的新鲜组织样本。单核RNA测序(snRNA-seq)可以应用于冷冻、存档的组织,并捕捉那些在许多组织中在脱离出来后无法存活的细胞类型。深度学习方法可以通过控制批次效应来整合来自不同个体和组织的数据,同时保留生物差异。 在一项新的研究中,来自美国布罗德研究所的研究人员建立了一个多组织人类细胞图谱的框架,并从16个人的8种组织类型中生成了由209126个snRNA-seq图谱组成的跨组织图谱,作为基因型-组织表达(Genotype-Tissue Expression, GTEx)项目的一部分,这些组织以冷冻组织形式存档。相关研究结果发表在2022年5月13日的Science期刊上,论文标题为“Single-nucleus cross-tissue molecular reference maps toward understanding disease gene function”。 这些作者对四种流程进行了基准测试,并展示了如何将它们应用于一个集合的环境中,以实现更大的研究。他们使用条件变异自动编码器整合了这种跨组织图谱,用43个大类和74个小类对它进行注释,并展示了它在破译组织驻留(比如在不同组织中都保留的巨噬细胞二分法和脂质关联)以及组织特异性的成纤维细胞特征(包括可能在机械感觉中发挥作用的肺泡成纤维细胞)方面的用途。他们将细胞与人类疾病生物学以及罕见和常见疾病的风险基因联系起来,包括在肌细胞和非肌细胞的不同亚群中富集的一组罕见肌肉疾病基因,以及映射到全基因组关联研究位点的表达数量性状位点(QTL)和拼接数量性状位点靶基因的细胞类型特异性富集。 利用8个冷冻的成人组织构建出的跨组织snRNA-seq图谱,图片来自Science, 2022, doi:10.1126/science.abl4290。 综上所述,这些作者建立的框架将能够在单细胞分辨率下进行大规模的、跨组织的人群和/或疾病研究。这种框架和他们提供的跨组织观点将构成未来大规模研究的基础,以提高人们对与疾病相关的遗传变异有关的细胞表型在不同组织和个体中差异的理解。 参考资料: Gökcen Eraslan et al. Single-nucleus cross-tissue molecular reference maps toward understanding disease gene function. Science, 2022, doi:10.1126/science.abl4290. 来源:生物谷