Notes
  • Notes
  • 恒星结构与演化
    • Chapter 7. Equation of State
    • Chapter 3. Virial Theorem
    • Chapter 11. Main Sequence
    • Chapter 4. Energy Conservation
    • Chapter 12. Post-Main Sequence
    • Chapter 2. Hydrostatic Equilibrium
    • Chapter 6. Convection
    • Chapter 9. Nuclear Reactions
    • Chapter 10 Polytrope
    • Chapter 8. Opacity
    • Chapter 14. Protostar
    • Chapter 13. Star Formation
    • Chapter 5. Energy Transport
  • 天体光谱学
    • Chapter 6 气体星云光谱
    • Chapter 5 磁场中的光谱
    • Chapter 7 X-射线光谱
    • Chapter 3 碱金属原子
    • Chapter 1 光谱基础知识
    • Chapter 9 分子光谱
    • Chapter 4 复杂原子
    • Chapter 2 氢原子光谱
  • 物理宇宙学基础
    • Chapter 2 Newtonian Cosmology
    • Chapter 1 Introduction
    • Chapter 5* Monochromatic Flux, K-correction
    • Chapter 9 Dark Matter
    • Chapter 10 Recombination and CMB
    • Chapter 8 Primordial Nucleosynthesis
    • Chapter 7 Thermal History of the Universe
    • Chapter 6 Supernova cosmology
    • Chapter 5 Redshifts and Distances
    • Chapter 4 World Models
    • Chapter 3 Relativistic Cosmology
  • 数理统计
    • Chapter 6. Confidence Sets (Intervals) 置信区间
    • Chapter 1. Data Reduction 数据压缩
    • Chapter 7. Two Sample Comparisons 两个样本的比较
    • Chapter 3. Decision Theory 统计决策
    • Chapter 4. Asymptotic Theory 渐近理论
    • Chapter 5. Hypothesis Testing 假设检验
    • Chapter 9. Linear Models 线性模型
    • Chapter 10 Model Selection 模型选择
    • Chapter 2. Estimation 估计
    • Chapter 11 Mathematical Foundation in Causal Inference 因果推断中的数理基础
    • Chapter 8. Analysis of Variance 方差分析
  • 天体物理动力学
    • Week8: Orbits
    • Week7: Orbits
    • Week6: Orbits
    • Week5: Orbits
    • Week4: Orbits
    • Week3: Potential Theory
    • Week2
    • Week1
  • 天体物理吸积过程
    • Chapter 4. Spherically Symmetric Flow
    • Chapter 2. Fluid Dynamics
    • Chapter 5. Accretion Disk Theory
    • Chapter 3. Compressible Fluid
  • 天文技术与方法
    • Chapter1-7
  • 理论天体物理
    • Chapter 6 生长曲线的理论和应用
    • Chapter 5 线吸收系数
    • Chapter 4 吸收线内的辐射转移
    • Chapter 3 恒星大气模型和恒星连续光谱
    • Chapter 2 恒星大气的连续不透明度
    • Chapter 1 恒星大气辐射理论基础
  • 常微分方程
    • 线性微分方程组
    • 高阶微分方程
    • 奇解
    • 存在和唯一性定理
    • 初等积分法
    • 基本概念
  • 天体物理观测实验
Powered by GitBook
On this page
  • 两个样本的比较
  • 引理
  • 参数方法
  • t 检验
  • F 检验
  • 配对的 t 检验
  • 非参方法
  • Mann-Whitney 检验
  • 符号秩检验
  1. 数理统计

Chapter 7. Two Sample Comparisons 两个样本的比较

PreviousChapter 1. Data Reduction 数据压缩NextChapter 3. Decision Theory 统计决策

Last updated 4 years ago

两个样本的比较

在许多实验中,两个样本都被认为是独立的

引理

  • 令 $X { 1 } , \ldots , X { n }$ 是来自正态分布的随机样本,则:

    1. 均值和方差是独立随机样本

    2. $\overline { X } \sim N \left( \mu , \sigma ^ { 2 } / n \right)$

    3. $( n - 1 ) S ^ { 2 } / \sigma ^ { 2 }\sim\chi^2_{n-1}$

参数方法

t 检验

  • 可以利用 t 检验比较两个样本的均值($H_0: \mu_X=\mu_Y$),但必须假设两个样本方差相同

  • 对于两个样本,$\overline { X } \sim N \left( \mu , \sigma ^ { 2 } / n \right)$ ,$\overline { Y } \sim N \left( \mu , \sigma ^ { 2 } / m \right)$ ,$( n - 1 ) S { X } ^ { 2 } / \sigma ^ { 2 }\sim\chi^2{n-1}$,$( m - 1 ) S { Y } ^ { 2 } / \sigma ^ { 2 }\sim\chi^2{m-1}$ ,且互相独立

  • 定义:

    U=X‾−Y‾−(μX−μY)σ1/n+1/m∼N(0,1)U = \frac { \overline { X } - \overline { Y } - \left( \mu _ { X } - \mu _ { Y } \right) } { \sigma \sqrt { 1 / n + 1 / m } }\sim N(0,1)U=σ1/n+1/m​X−Y−(μX​−μY​)​∼N(0,1)
    V=[(n−1)SX2σ2+(m−1)SY2σ2]1m+n−2, where (n−1)SX2σ2+(m−1)SY2σ2∼χ2(m+n−2)V = \sqrt { \left[ \frac { ( n - 1 ) S _ { X } ^ { 2 } } { \sigma ^ { 2 } } + \frac { ( m - 1 ) S _ { Y } ^ { 2 } } { \sigma ^ { 2 } } \right] \frac { 1 } { m + n - 2 } },\\\text{ where } \frac { ( n - 1 ) S _ { X } ^ { 2 } } { \sigma ^ { 2 } } + \frac { ( m - 1 ) S _ { Y } ^ { 2 } } { \sigma ^ { 2 } }\sim\chi^2(m+n-2)V=[σ2(n−1)SX2​​+σ2(m−1)SY2​​]m+n−21​​, where σ2(n−1)SX2​​+σ2(m−1)SY2​​∼χ2(m+n−2)

    构造统计量为:$T=U/V\sim t_{n+m-2}$

  • 置信区间:

    $\mu_X - \mu_Y$ 的一个 $1-\alpha$ 置信区间为:

    X‾−Y‾±S1/n+1/mtn+m−2(1−α/2)\overline { X } - \overline { Y } \pm S \sqrt { 1 / n + 1 / m } t _ { n + m - 2 } ( 1 - \alpha / 2 )X−Y±S1/n+1/m​tn+m−2​(1−α/2)

    这里的 $S$ 相当于总体的标准差:

    S=[(n−1)SX2+(m−1)SY2]1m+n−2S = \sqrt { \left[ { ( n - 1 ) S _ { X } ^ { 2 } } + { ( m - 1 ) S _ { Y } ^ { 2 } } \right] \frac { 1 } { m + n - 2 } }S=[(n−1)SX2​+(m−1)SY2​]m+n−21​​
  • 如果方差相同的假设不成立——Behrens Fisher problem:

    • 大样本情况下,依然可以由中心极限定理和正态分布的性质得到:

      X‾−Y‾≈N(μX−μY,σX2n+σY2m)\overline { X } - \overline { Y } \approx N \left( \mu _ { X } - \mu _ { Y } , \frac { \sigma _ { X } ^ { 2 } } { n } + \frac { \sigma _ { Y }^2 } { m } \right)X−Y≈N(μX​−μY​,nσX2​​+mσY2​​)

      进而给出 $\mu { X } - \mu { Y }$ 的 $1-\alpha$ 置信区间,$S = \sqrt { S { X } ^ { 2 } / n + S { Y } ^ { 2 } / m }$:

      X‾−Y‾±SZ1−α/2\overline { X } - \overline { Y } \pm S Z _ { 1 - \alpha / 2 }X−Y±SZ1−α/2​
    • 如果甚至不满足大样本情况:

      U=X‾−Y‾SX2/n+SY2/m∼t(v)U = \frac { \overline { X } - \overline { Y } } { \sqrt { S_X^2 / n + S_Y^2 / m } }\sim t(v)U=SX2​/n+SY2​/m​X−Y​∼t(v)

      其中 $v$ 为离 $v^*$ 最近的整数:

      v=(SX2/n+SY2/m)2(SX2/n)2/(n+1)+(SY2/m)2/(m+1)−2v = \frac { \left( S _ { X } ^ { 2 } / n + S _ { Y } ^ { 2 } / m \right) ^ { 2 } } { \left( S _ { X } ^ { 2 } / n \right) ^ { 2 } / \left( n + 1 \right) + \left( S _ { Y } ^ { 2 } / m \right) ^ { 2 } / \left( m + 1 \right) } - 2v=(SX2​/n)2/(n+1)+(SY2​/m)2/(m+1)(SX2​/n+SY2​/m)2​−2
  • Fisher’s Fiducial approach

  • Bayesian approach

F 检验

  • 可以用 F 检验比较两个样本的方差($H_0: \sigma_X^2=\sigma_Y^2$)

  • F 统计量表示为样本方差的比,满足 F 分布(两个独立卡方分布之比):

  • $1-\alpha$ 置信区间

    • 双侧($H1: \sigma_X^2\neq\sigma_Y^2$):$F{n-1,m-1;\alpha/2}<F<F_{n-1,m-1;1-\alpha/2}$

      其中 $F{n-1,m-1;\alpha/2}\cdot F{n-1,m-1;1-\alpha/2}=1$

    • 单侧

      • 若 $H1: \sigma_X^2>\sigma_Y^2$:$F<F{n-1,m-1;1-\alpha}$

      • 若 $H1: \sigma_X^2<\sigma_Y^2$:$F>F{n-1,m-1;\alpha}$

配对的 t 检验

  • $Z { i } = \left( X { i } , Y { i } \right)$ 是独立同分布的,检验 $H { 0 } : \mu { X } = \mu { Y }$

  • 等价于对于 $Di=X_i-Y_i$ ,检验 $H { 0 } : \mu { X } - \mu { Y }=\mu_D=0$

  • t 统计量:

非参方法

  • 非参方法不假设数据服从特定的分布,很多都基于对数据顺序的改变

  • 仅仅涉及各数据之间相对大小,对原数据作任何单调变换之后,比较的结果保持不变

  • 减小了离群值的影响

Mann-Whitney 检验

  • $X { 1 } , \ldots , X { n }\sim F$,$Y { 1 } , \ldots , Y { m }\sim G$,$H _ { 0 } : F = G$

  • 零假设下,这 $m+n$ 个观测量的任何一种排列都是等可能的

  • 这里已经假设了不同观测之间两两不等;如果有少量的观测值相等,它们的秩全部取为平均值,对 $\alpha$ 不会有显著影响

第一种视角

  • 定义 $TY$ 为 $Y { 1 } , \ldots , Y _ { m }$ 的秩和

  • 零假设下:

  • 证明:根据抽样调查理论:

    $N=m+n$ ,$\mu,\sigma^2$ 是总体中某一个元素的均值和方差:

    直接代入就证明了上述结果

  • $n$ 足够大时:

    可以据此构造检验

第二种视角

  • 考虑 $\pi=P(X<Y)$, $H_0:\pi=1/2$

  • 定义统计量:

  • 容易证明:

符号秩检验

  • 可以对成对的样本构造符号秩检验

    • 计算 $D_i=Y_i-X_i$ 和 $|D_i|$ 的秩,其中如果有多个 $|D_i|$ 相等,将其秩取为平均——这样的情况不太多的时候,$\alpha$ 受的影响不大,否则要作修正

    • 若 $D_i>0$ ,记秩的符号为正;若 $D_i<0$ ,记秩的符号为为负;若恰好为零,一般把这组数据点丢弃

    • 记符号秩的和为 $W_+$

  • 零假设下 $D_i$ 对称分布在零点两侧,可以证明:

  • 证明:

    • 将 $W_+$ 写成:

      $k$ 是第 $k$ 大的 $|D_i|$ 的下标

    • 零假设下,$I_k\sim Bernoulli(1/2)​$ ,有:

      推出:

F=SX2SY2∼Fn−1,m−1F = \frac { S _ { X } ^ { 2 } } { S _ { Y } ^ { 2 } } \sim F _ { n - 1 , m - 1 }F=SY2​SX2​​∼Fn−1,m−1​
t=D‾n−μDSD‾n∼tn−1t = \frac { \overline { D } _ { n } - \mu _ { D } } { S _ { \overline { D } _ { n } } } \sim t _ { n - 1 }t=SDn​​Dn​−μD​​∼tn−1​
E(TY)=m(m+n+1)2,Var⁡(TY)=mn(m+n+1)12E \left( T _ { Y } \right) = \frac { m ( m + n + 1 ) } { 2 } , \operatorname { Var } \left( T _ { Y } \right) = \frac { m n ( m + n + 1 ) } { 12 }E(TY​)=2m(m+n+1)​,Var(TY​)=12mn(m+n+1)​
E(TY)=mμ,Var⁡(TY)=mσ2N−mN−1E \left( T _ { Y } \right) = m \mu , \operatorname { Var } \left( T _ { Y } \right) = m \sigma ^ { 2 } \frac { N - m } { N - 1 }E(TY​)=mμ,Var(TY​)=mσ2N−1N−m​
μ=1N∑k=1Nk=N+12\mu=\frac{1}{N}\sum_{k=1}^N k=\frac{N+1}{2}μ=N1​k=1∑N​k=2N+1​
σ2=1N∑k=1N(k−μ)2=1N∑k=1Nk2−μ2=(N+1)(2N+1)6−(N+1)24=(N+1)(N−1)12\begin{align*} \sigma^2&=\frac{1}{N}\sum_{k=1}^N (k-\mu)^2=\frac{1}{N}\sum_{k=1}^N k^2-\mu^2\\ &=\frac{(N+1)(2N+1)}{6}-\frac{(N+1)^2}{4}\\& =\frac{(N+1)(N-1)}{12} \end{align*}σ2​=N1​k=1∑N​(k−μ)2=N1​k=1∑N​k2−μ2=6(N+1)(2N+1)​−4(N+1)2​=12(N+1)(N−1)​​
TY−E(TY)Var⁡(TY)∼N(0,1)\frac { T _ { Y } - E \left( T _ { Y } \right) } { \sqrt { \operatorname { Var } \left( T _ { Y } \right) } } \sim N ( 0,1 )Var(TY​)​TY​−E(TY​)​∼N(0,1)
π^=1mn∑i=1n∑j=1nZij≡1mn∑i=1n∑j=1nI(Xi<Xj)\widehat { \pi } = \frac { 1 } { m n } \sum _ { i = 1 } ^ { n } \sum _ { j = 1 } ^ { n } Z _ { i j }\equiv\frac { 1 } { m n } \sum _ { i = 1 } ^ { n } \sum _ { j = 1 } ^ { n } I(X_i<X_j)π=mn1​i=1∑n​j=1∑n​Zij​≡mn1​i=1∑n​j=1∑n​I(Xi​<Xj​)
∑i=1n∑j=1mZij=∑i=1n∑j=1mVij≡∑i=1n∑j=1mI(X(1)<X(j))\sum _ { i = 1 } ^ { n } \sum _ { j = 1 } ^ { m } Z _ { i j } = \sum _ { i = 1 } ^ { n } \sum _ { j = 1 } ^ { m } V _ { i j }\equiv \sum _ { i = 1 } ^ { n } \sum _ { j = 1 } ^ { m } I(X_{(1)}<X_{(j)})i=1∑n​j=1∑m​Zij​=i=1∑n​j=1∑m​Vij​≡i=1∑n​j=1∑m​I(X(1)​<X(j)​)
∑j=1mVij=TY−m(m+1)2\sum _ { j = 1 } ^ { m } V _ { i j } = T _ { Y } - \frac { m ( m + 1 ) } { 2 }j=1∑m​Vij​=TY​−2m(m+1)​
⇒π^=1mn(TY−m(m+1)2)\Rightarrow \widehat { \pi }=\frac{1}{mn}\left(T _ { Y } - \frac { m ( m + 1 ) } { 2 }\right)⇒π=mn1​(TY​−2m(m+1)​)
E(W+)=n(n+1)4,Var⁡(W+)=n(n+1)(2n+1)24E \left( W _ { + } \right) = \frac { n ( n + 1 ) } { 4 } , \operatorname { Var } \left( W _ { + } \right) = \frac { n ( n + 1 ) ( 2 n + 1 ) } { 24 }E(W+​)=4n(n+1)​,Var(W+​)=24n(n+1)(2n+1)​
W+=∑k=1nkIk≡∑k=1nkI(Dk>0)W _ { + } = \sum _ { k = 1 } ^ { n } k I _ { k }\equiv\sum _ { k = 1 } ^ { n } k I(D_k>0)W+​=k=1∑n​kIk​≡k=1∑n​kI(Dk​>0)
E(lk)=1/2,Var⁡(Ik)=1/4E \left( l _ { k } \right) = 1 / 2 , \operatorname { Var } \left( I _ { k } \right) = 1 / 4E(lk​)=1/2,Var(Ik​)=1/4
E(W+)=12∑k=1nk=n(n+1)4Var⁡(W+)=14∑k=1nk2=n(n+1)(2n+1)24{ E \left( W _ { + } \right) = \frac { 1 } { 2 } \sum _ { k = 1 } ^ { n } k = \frac { n ( n + 1 ) } { 4 } } \\ { \operatorname { Var } \left( W _ { + } \right) = \frac { 1 } { 4 } \sum _ { k = 1 } ^ { n } k ^ { 2 } = \frac { n ( n + 1 ) ( 2 n + 1 ) } { 24 } }E(W+​)=21​k=1∑n​k=4n(n+1)​Var(W+​)=41​k=1∑n​k2=24n(n+1)(2n+1)​