时间尺度,识别出上千个与基因表达时间路径具有线性或非线性关联的DNA序列变异

BioArt  |   2019-06-30 20:02

来源:BioArt

原标题:Science | 首次为eQTL分析添加时间尺度,识别出上千个与基因表达时间路径具有线性或非线性关联的DNA序列变异

基因调控领域的一个重要课题是个体基因组特征,如DNA序列,与基因表达之间的关联。表达数量性状座位分析(expression quantitative trait loci, eQTL)是解析基因表达的遗传基础的主要方法之一。包括迄今规模最大的人类组织转录组表达数据库GTEx在内的多项研究揭示了诸多对基因表达水平具有显著影响的组织或环境特异性基因特征。随着研究界对基因表达在时间尺度上的变化和决定因素愈发重视,为eQTL分析加上时间尺度就显得尤为必要。

2019年6月28日,来自约翰霍普金斯大学(Johns Hopkins University)和芝加哥大学(University of Chicago)的研究人员在Science上首次报道了基于iPSC诱导分化心肌细胞系统的时间尺度eQTL分析,识别出了上千个与基因表达时间路径具有线性或非线性关联的DNA序列变异。

10041d.jpg

在该研究中,作者收集了来自19个个体的iPSC细胞系,在16天的分化历程中每隔24小时对细胞系的转录组进行测序定量分析,从而得到297个基因表达谱,与已有的细胞系全基因组测序信息进行对比分析,实现了时间尺度上的eQTL标定(下图)

10179f.jpg

作者首先对每个时间点的eQTL单独进行了识别,发现有71-231个基因具有至少一个显著的eQTL位点。将各时间点的显著eQTL位点与完全iPSC细胞和完全心肌细胞的eQTL位点进行比较,发现发育历程中的eQTL与iPSC相关性逐渐降低,而与心肌细胞则逐渐增高(下图A)。而对16个时间点本身的eQTL进行交叉对比,也发现任意两个时间点之间的eQTL差异随时间距离缩短而减小(下图B)。为了更加系统性地证实eQTL的变动特征是与分化进程紧密关联的,作者对高维度eQTL矩阵做了隐藏因子数为3的稀疏约束的矩阵因子分解(sparse non-negative matrix factorization),发现隐藏因子权重与时间序列呈显著相关(下图C)。上述证据很好地证明了利用eQTL表征的遗传特征和基因表达间的关联变动是由分化进程直接决定的。

101f0f.jpg

接着,为了识别出与时间序列具有显著关联的eQTL-基因表达配对,作者同时利用16个时间点的基因表达和序列变异数据构建了一个包含其它多个混杂因素的线性回归模型,从而得到了550个分化动态基因变异,一个例子是rs11124033位点的GG或GA序列变异对FHL2基因的表达水平影响随分化过程而逐渐逆转(下图A)。考虑到eQTL-基因表达互作在时间尺度上可能存在的复杂变化特征,作者还为上述线性方程添加了一个二次项,试图识别出具有非线性变动规律的靶点。经由此方法,作者找到了693个这样的eQTL-基因表达配对,其中一个例子是rs28818910位点的CC/CT/TT序列变异在分化过程中对C15orf39基因表达的影响差异先逐渐增大,随后又逐渐缩小(下图C)

101bfe.jpg

总之,这项研究创新地为eQTL分析添加了时间尺度,使得对基因表达的遗传基础解析具有了更丰富的意义,而这一重要信息在单个时间点下的稳态环境中是不可能被捕获到的。考虑到机体发育、疾病发生、癌症转移等过程均具有时间尺度上的线性或非线性变动规律,在基因调控研究中引入时间序列无疑将极大地扩展人们对这些重要生理病理进程的认知。

原文链接:

https://science.sciencemag.org/content/364/6447/1287

来源:BioGossip BioArt

原文链接:http://mp.weixin.qq.com/s?__biz=MzA3MzQyNjY1MQ==&mid=2652471889&idx=5&sn=dc57a840a745be3127f867cb85064146&chksm=84e211e5b39598f382628d13daee91800da946d88f36f85e60e0dff245d9ea21ece22c30ebb5&scene=27#wechat_redirect

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn