t-test
1. 算法介绍
-
背景与目标
在基因表达差异分析中,常用两组(实验组 vs. 对照组)的独立样本 t 检验(two-sample t-test)来判断某一基因在两种处理下表达水平的均值是否存在显著差异。核心目标:检验基因在实验组和对照组的平均表达值 μ 1 \mu_1 μ1 与 μ 2 \mu_2 μ2 是否相等,即
H 0 : μ 1 = μ 2 , H A : μ 1 ≠ μ 2 . H_0:\;\mu_1 = \mu_2,\quad H_A:\;\mu_1 \neq \mu_2. H0:μ1=μ2,HA:μ1=μ2.
-
应用场景
- RNA-seq、微阵列等高通量数据的单基因差异表达初步筛选
- 简单实验设计下的小样本差异检测
- 与多重检验校正方法(如 FDR)联合使用
-
核心思路
- 分别计算两组样本的均值和方差;
- 构造 t 统计量,反映两组均值差异相对于组内变异的大小;
- 根据 t 分布计算双侧 p 值,判断差异显著性。
2. 公式及原理
2.1 样本统计量
对照组样本表达值 { x 1 i } i = 1 n 1 \{x_{1i}\}_{i=1}^{n_1} {
x1i}i=1n1,实验组样本表达值 { x 2 j } j = 1 n 2 \{x_{2j}\}_{j=1}^{n_2} {
x2j}j=1n2:
x ˉ 1 = 1 n 1 ∑ i = 1 n 1 x 1 i , x ˉ 2 = 1 n 2 ∑ j = 1 n 2 x 2 j ; \bar{x}_1 = \frac{1}{n_1}\sum_{i=1}^{n_1}x_{1i},\quad \bar{x}_2 = \frac{1}{n_2}\sum_{j=1}^{n_2}x_{2j}; xˉ1=n11i=1∑n1


2612

被折叠的 条评论
为什么被折叠?



