禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者!
文章目录
-
- 介绍
-
- 原理:
- 计算步骤:
- 结果:
- 加载R包
- 准备画图主题
- 数据链接
- 导入数据
- Differential abundance (No BP vs 2BP TA)
-
- 构建`countData`矩阵
- 过滤低丰度物种
- 构建DESeq数据对象
- DESeq2差异分析
- 画图
- Differential abundance (No BP vs 2BP TA, steroids only)
- 系统信息
介绍
DESeq2是一种用于RNA-seq数据差异表达分析的生物信息学工具,它基于负二项分布模型来评估基因表达量的变化。以下是DESeq2的原理、计算步骤以及最终获得的结果的详细解释:
原理:
- 标准化(Size Factors):DESeq2首先计算每个样本的量化因子(size factors),这是一种标准化方法,用于校正不同样本的测序深度差异。量化因子是所有基因在所有样本中的表达几何平均值与每个样本中表达值的比值的中位数。这种方法被称为相对对数表达(RLE)。
- 估计离散度(Dispersions):DESeq2估计每个基因的离散度,即基因表达量的变异性。离散度的估计是后续负二项分布模型拟合的关键参数。
- 负二项分布模型:DESeq2使用负二项分布来模拟基因的表