Notes
  • Notes
  • 恒星结构与演化
    • Chapter 7. Equation of State
    • Chapter 3. Virial Theorem
    • Chapter 11. Main Sequence
    • Chapter 4. Energy Conservation
    • Chapter 12. Post-Main Sequence
    • Chapter 2. Hydrostatic Equilibrium
    • Chapter 6. Convection
    • Chapter 9. Nuclear Reactions
    • Chapter 10 Polytrope
    • Chapter 8. Opacity
    • Chapter 14. Protostar
    • Chapter 13. Star Formation
    • Chapter 5. Energy Transport
  • 天体光谱学
    • Chapter 6 气体星云光谱
    • Chapter 5 磁场中的光谱
    • Chapter 7 X-射线光谱
    • Chapter 3 碱金属原子
    • Chapter 1 光谱基础知识
    • Chapter 9 分子光谱
    • Chapter 4 复杂原子
    • Chapter 2 氢原子光谱
  • 物理宇宙学基础
    • Chapter 2 Newtonian Cosmology
    • Chapter 1 Introduction
    • Chapter 5* Monochromatic Flux, K-correction
    • Chapter 9 Dark Matter
    • Chapter 10 Recombination and CMB
    • Chapter 8 Primordial Nucleosynthesis
    • Chapter 7 Thermal History of the Universe
    • Chapter 6 Supernova cosmology
    • Chapter 5 Redshifts and Distances
    • Chapter 4 World Models
    • Chapter 3 Relativistic Cosmology
  • 数理统计
    • Chapter 6. Confidence Sets (Intervals) 置信区间
    • Chapter 1. Data Reduction 数据压缩
    • Chapter 7. Two Sample Comparisons 两个样本的比较
    • Chapter 3. Decision Theory 统计决策
    • Chapter 4. Asymptotic Theory 渐近理论
    • Chapter 5. Hypothesis Testing 假设检验
    • Chapter 9. Linear Models 线性模型
    • Chapter 10 Model Selection 模型选择
    • Chapter 2. Estimation 估计
    • Chapter 11 Mathematical Foundation in Causal Inference 因果推断中的数理基础
    • Chapter 8. Analysis of Variance 方差分析
  • 天体物理动力学
    • Week8: Orbits
    • Week7: Orbits
    • Week6: Orbits
    • Week5: Orbits
    • Week4: Orbits
    • Week3: Potential Theory
    • Week2
    • Week1
  • 天体物理吸积过程
    • Chapter 4. Spherically Symmetric Flow
    • Chapter 2. Fluid Dynamics
    • Chapter 5. Accretion Disk Theory
    • Chapter 3. Compressible Fluid
  • 天文技术与方法
    • Chapter1-7
  • 理论天体物理
    • Chapter 6 生长曲线的理论和应用
    • Chapter 5 线吸收系数
    • Chapter 4 吸收线内的辐射转移
    • Chapter 3 恒星大气模型和恒星连续光谱
    • Chapter 2 恒星大气的连续不透明度
    • Chapter 1 恒星大气辐射理论基础
  • 常微分方程
    • 线性微分方程组
    • 高阶微分方程
    • 奇解
    • 存在和唯一性定理
    • 初等积分法
    • 基本概念
  • 天体物理观测实验
Powered by GitBook
On this page
  • ANOVA
  • One-way ANOVA
  • Tukey’s method
  • 非参方法——Kruskal-Wallis检验
  1. 数理统计

Chapter 8. Analysis of Variance 方差分析

ANOVA

  • 用于两个及两个以上样本均数差别的显著性检验,假定每个总体服从正态分布

  • 如何从更少的观测中得到更多总体的更多信息?

  • 不假设任何参数上的联系

One-way ANOVA

  • 假设样本中的数据 $Y{ij}=\beta { i } + \epsilon _ { i j }$ ,其中 $i=1,\cdots,I$ 为组号,$j=1,\cdots,n_i$ 为第 $i$ 组的样本数,$\theta_i=\beta_i$ 是我们未知的参数,而 $\epsilon_i$ 是误差随机变量

  • 也可以假设 $Y{ij}=\mu+\tau_i + \epsilon { i j }$,$\mu$ 是可以认为是整体的均值,而 $\tau_i$ 是第 $i$ 组处理后的独有效果,实际上我们只能估计 $\mu+\tau_i$ 的值,除非我们规定 $\sum\tau_i=0$

  • 进一步,我们作两个假设: 1. $E \left( \epsilon { i j } \right) = 0$ (从而有 $E \left( Y { i j } \right) = \theta { i }$),$\operatorname { Var } \left( \epsilon { i j } \right) = \sigma { i } ^ { 2 } < \infty$,$\operatorname { Cov } \left( \epsilon { i j } , \epsilon { i ^ { \prime } j } ^ { \prime } \right) = 0$ 若 $(i,j)\neq(i',j')$ 2. $\epsilon{ij}$ 独立且正态分布,$\sigma_i\equiv\sigma$

  • 不假设 $\epsilon_{ij}$ 的分布我们只能作点估计;如果我们假设除了正态分布之外的其他分布,区间估计和检验会非常困难,当然在样本很大的时候可以用中心极限定理;方差相等也很重要

  • 如果数据不满足这两条假设,可以使用一些变换,比如Box-Cox变换

    Box-Cox 变换

    yi(λ)={yiλ−1λ if λ≠0ln⁡yi if λ=0y _ { i } ^ { ( \lambda ) } = \left\{ \begin{array} { l l } { \frac { y _ { i } ^ { \lambda } - 1 } { \lambda } } & { \text { if } \lambda \neq 0 } \\ { \ln y _ { i } } & { \text { if } \lambda = 0 } \end{array} \right.yi(λ)​={λyiλ​−1​lnyi​​ if λ=0 if λ=0​
  • 经典的ANOVA假设:

    H0:θ1=⋯=θl versus H1:θi≠θj for some i≠jH _ { 0 } : \theta _ { 1 } = \cdots = \theta _ { l } \text { versus } H _ { 1 } : \theta _ { i } \neq \theta _ { j } \text { for some } i \neq jH0​:θ1​=⋯=θl​ versus H1​:θi​=θj​ for some i=j
  • 总离差平方和、组间离差平方和、组内离差平方和

    ∑i=1I∑j=1niSSTOT=∑i=11∑j=1nn(Yij−Y‾⋅⋅)2=∑i=1I∑j=1ni(Yij−Y‾i⋅)2+∑i=11ni(Y‾i−Y‾⋅⋅)2≡SSW+SSB\begin{align*} \sum _ { i = 1 } ^ { I } \sum _ { j = 1 } ^ { n _ { i } } S S _ { T O T } &= \sum _ { i = 1 } ^ { 1 } \sum _ { j = 1 } ^ { n _ { n } } \left( Y _ { i j } - \overline { Y } _ {\cdot\cdot } \right) ^ { 2 }\\ &= \sum _ { i = 1 } ^ { I } \sum _ { j = 1 } ^ { n _ { i } } \left( Y _ { i j } - \overline { Y } _ { i \cdot } \right) ^ { 2 } + \sum _ { i = 1 } ^ { 1 } n _ { i } \left( \overline { Y } _ { i } - \overline { Y }_{\cdot\cdot} \right) ^ { 2 }\\ &\equiv S S _ { W } + S S _ { B } \end{align*}i=1∑I​j=1∑ni​​SSTOT​​=i=1∑1​j=1∑nn​​(Yij​−Y⋅⋅​)2=i=1∑I​j=1∑ni​​(Yij​−Yi⋅​)2+i=1∑1​ni​(Yi​−Y⋅⋅​)2≡SSW​+SSB​​

    $SS_W$ 反应组内数据的方差,$SS_B$ 反应不同组均值之间的方差

  • 定理 A

    E(SSW)=∑i=1I(ni−1)σ2E(SSB)=∑i=1IniE(Y‾i⋅−Y‾⋅⋅)2=∑i=1Iniτi2+(I−1)σ2E \left( S S _ { W } \right) = \sum _ { i = 1 } ^ { I } \left( n _ { i } - 1 \right) \sigma ^ { 2 }\\ \begin{aligned} E \left( S S _ { B } \right) & = \sum _ { i = 1 } ^ { I } n _ { i } E \left( \overline { Y } _ { i \cdot } - \overline { Y } _ { \cdot\cdot } \right) ^ { 2 } \\ & = \sum _ { i = 1 } ^ { I } n _ { i } \tau _ { i } ^ { 2 } + ( I - 1 ) \sigma ^ { 2 } \end{aligned}E(SSW​)=i=1∑I​(ni​−1)σ2E(SSB​)​=i=1∑I​ni​E(Yi⋅​−Y⋅⋅​)2=i=1∑I​ni​τi2​+(I−1)σ2​

    据此可以估计方差 $\sigma^2$:

    • 利用 $SS_W$:

      σ^2=SSW∑i=1l(ni−1){\widehat\sigma^2} = \frac { S S _ { W } } { \sum _ { i = 1 } ^ { l } \left( n _ { i } - 1 \right) }σ2=∑i=1l​(ni​−1)SSW​​
    • 利用 $SS_B$ ,并假设 $\tau_i=0$:

      σ^2=SSBI−1{\widehat\sigma^2} =\frac{SS_B}{I-1}σ2=I−1SSB​​

      如果有些 $\tau_i$ 不为 $0$ ,则 $SS_B$ 会偏大,偏离零假设

    接下来就可以构造检验统计量,检验零假设 $\tau_i$ 全部相同(为 $0$ )

  • 定理 B

    不失一般性,假设 $n_i\equiv J$ ,则有:

    • $S S { W } / \sigma ^ { 2 } \sim \chi { I( J - 1 ) } ^ { 2 }$

    • 如果 $\thetai$ 均相等,也即 $\tau_i$ 均相等,$S S { B } / \sigma ^ { 2 } \sim \chi _ { I - 1 } ^ { 2 }$ ,且与 $SS_W$ 独立

  • 定理 C

    统计量

    F=SSB/(I−1)SSW/[I(J−1)]∼F(I−1,N−I)F = \frac { S S _ { B } / ( I - 1 ) } { S S _ { W } / [ I ( J - 1 )] }\sim F(I-1,N-I)F=SSW​/[I(J−1)]SSB​/(I−1)​∼F(I−1,N−I)

    可以用来检验零假设

    • p 值:$P ( X > F )$

    • 在正态分布假设下,F 检验等价于似然比检验

  • One-way ANOVA 表:

    方差的来源

    自由度

    离差平方和

    均值的平方

    F 统计量

    组内

    $k-1$

    $SS_B$

    $MSB=SS_B/(k-1)$

    $MSB/MSW$

    组间

    $N-k$

    $SS_W$

    $MSW=SS_W/(N-k)$

    总和

    $N-1$

    $SS_T=SS_B+SS_W$

  • ANOVA 的不足:

    • F 检验能够提供的信息太少,只能判断多组样本的均值是否相同,不能给出差别的具体表现

    • 一种naive的处理方式是对任意两组进行 level-$\alpha$ t 检验,困难在于当组别很多时,至少得到一组显著结果的概率会变得很大,即总体的 $\alpha$ 会很大,容易犯 Type I 错误

  • Bonferroni Correction:把每一次 t 检验的显著性水平取为 $\alpha/n$ ,$n$ 为 t 检验的个数(即零假设的个数)——太保守,假设了各检验彼此独立

Tukey’s method

  • 用于为各对数据均值的区别构造置信区间,使各个区间同时拥有一个区间概率——定出有显著区别的数据对

  • 如果各组样本容量相同,误差服从正态分布,则 $\overline { Y } {{ i }\cdot} - \mu { i }\sim N(0,\sigma ^ { 2 } / J)$ ,可以用 $s_p^2/J$ 估计

  • Student-Range 统计量

    max⁡i1,i2∣(Y‾i1⋅−μi1)−(Y‾i2⋅,−μi2)∣sp/J\max _ { i _ { 1 } , i _ { 2 } } \frac { \left| \left( \overline { Y } _ { i _ { 1 } \cdot} - \mu _ { i _ { 1 } } \right) - \left( \overline { Y } _ { i _ { 2 }\cdot } , - \mu _ { i _ { 2 } } \right) \right| } { s _ { p } / \sqrt { J } }i1​,i2​max​sp​/J​​(Yi1​⋅​−μi1​​)−(Yi2​⋅​,−μi2​​)​​

    这里的最大值是在所有可能的样本对中取得的,这个分布被称为 Studentized Range Distribution,参数为 $I,I(J-1)$

  • $\mu { i { 1 } } - \mu { i { 2 } }$ 的 $1-\alpha$ 置信区间:

    (Y‾i1⋅−Y‾i2⋅)±qI:I(J−1)(α)spJ\left( \overline { Y } _ { i _ { 1 } \cdot} - \overline { Y } _ { i _ { 2 }\cdot } \right) \pm q _ { I : I( J - 1 ) } ( \alpha ) \frac { s _ { p } } { \sqrt { J } }(Yi1​⋅​−Yi2​⋅​)±qI:I(J−1)​(α)J​sp​​
  • level-$\alpha$ 测试:

    $H0:\mu { i { 1 } } - \mu { i _ { 2 } }=0$ 的拒绝域 $\mathcal{R}$:

    R={(i1,i2)∣∣Y‾i1⋅−Y‾i2⋅∣>qI:I(J−1)(α)spJ}\mathcal{R}=\left\{(i_1,i_2)\bigg |\left| \overline { Y } _ { i _ { 1}\cdot } - \overline { Y } _ { i _ { 2} \cdot } \right| > q _ { I : I( J - 1 ) } ( \alpha ) \frac { s _ { p } } { \sqrt { J } }\right\}R={(i1​,i2​)​​Yi1​⋅​−Yi2​⋅​​>qI:I(J−1)​(α)J​sp​​}

非参方法——Kruskal-Wallis检验

  • 继承自 Mann-Whitney 检验

  • 令 $R{ij}$ 表示 $Y{ij}$ 的秩,$\overline { R } { i \cdot } = \frac { 1 } { J { i } } \sum { j = 1 } ^ { J { i } } R { i j }$ 为第 $i$ 组秩的均值,$\overline R{\cdot\cdot}$ 为总的均值,是定值 $(N+1)/2$

  • 令:

    SSB=∑i=11Ji(R‾i⋅−R‾⋅⋅)2S S _ { B } = \sum _ { i = 1 } ^ { 1 } J _ { i} \left( \overline { R } _ { i\cdot } - \overline { R } _{\cdot\cdot} \right) ^ { 2 }SSB​=i=1∑1​Ji​(Ri⋅​−R⋅⋅​)2

    它可以衡量 $\overline { R } _ { i \cdot } $ 的离散程度,进而检验零假设;$SS_B$ 越大,越不支持零假设

  • 在零假设下,各个组的分布相同,有:

    K=12N(N+1)SSB=12N(N+1)∑i=1IJiR‾i⋅2−3(N+1)K = \frac { 12 } { N ( N + 1 ) } S S _ { B }=\frac { 12 } { N ( N + 1 ) } \sum _ { i = 1 } ^ { I } J _ { i } \overline { R } _ { i \cdot } ^ { 2 } - 3 ( N + 1 )K=N(N+1)12​SSB​=N(N+1)12​i=1∑I​Ji​Ri⋅2​−3(N+1)

    近似是自由度为 $I-1$ 的卡方分布

PreviousChapter 11 Mathematical Foundation in Causal Inference 因果推断中的数理基础Next天体物理动力学

Last updated 4 years ago