Notes
  • Notes
  • 恒星结构与演化
    • Chapter 7. Equation of State
    • Chapter 3. Virial Theorem
    • Chapter 11. Main Sequence
    • Chapter 4. Energy Conservation
    • Chapter 12. Post-Main Sequence
    • Chapter 2. Hydrostatic Equilibrium
    • Chapter 6. Convection
    • Chapter 9. Nuclear Reactions
    • Chapter 10 Polytrope
    • Chapter 8. Opacity
    • Chapter 14. Protostar
    • Chapter 13. Star Formation
    • Chapter 5. Energy Transport
  • 天体光谱学
    • Chapter 6 气体星云光谱
    • Chapter 5 磁场中的光谱
    • Chapter 7 X-射线光谱
    • Chapter 3 碱金属原子
    • Chapter 1 光谱基础知识
    • Chapter 9 分子光谱
    • Chapter 4 复杂原子
    • Chapter 2 氢原子光谱
  • 物理宇宙学基础
    • Chapter 2 Newtonian Cosmology
    • Chapter 1 Introduction
    • Chapter 5* Monochromatic Flux, K-correction
    • Chapter 9 Dark Matter
    • Chapter 10 Recombination and CMB
    • Chapter 8 Primordial Nucleosynthesis
    • Chapter 7 Thermal History of the Universe
    • Chapter 6 Supernova cosmology
    • Chapter 5 Redshifts and Distances
    • Chapter 4 World Models
    • Chapter 3 Relativistic Cosmology
  • 数理统计
    • Chapter 6. Confidence Sets (Intervals) 置信区间
    • Chapter 1. Data Reduction 数据压缩
    • Chapter 7. Two Sample Comparisons 两个样本的比较
    • Chapter 3. Decision Theory 统计决策
    • Chapter 4. Asymptotic Theory 渐近理论
    • Chapter 5. Hypothesis Testing 假设检验
    • Chapter 9. Linear Models 线性模型
    • Chapter 10 Model Selection 模型选择
    • Chapter 2. Estimation 估计
    • Chapter 11 Mathematical Foundation in Causal Inference 因果推断中的数理基础
    • Chapter 8. Analysis of Variance 方差分析
  • 天体物理动力学
    • Week8: Orbits
    • Week7: Orbits
    • Week6: Orbits
    • Week5: Orbits
    • Week4: Orbits
    • Week3: Potential Theory
    • Week2
    • Week1
  • 天体物理吸积过程
    • Chapter 4. Spherically Symmetric Flow
    • Chapter 2. Fluid Dynamics
    • Chapter 5. Accretion Disk Theory
    • Chapter 3. Compressible Fluid
  • 天文技术与方法
    • Chapter1-7
  • 理论天体物理
    • Chapter 6 生长曲线的理论和应用
    • Chapter 5 线吸收系数
    • Chapter 4 吸收线内的辐射转移
    • Chapter 3 恒星大气模型和恒星连续光谱
    • Chapter 2 恒星大气的连续不透明度
    • Chapter 1 恒星大气辐射理论基础
  • 常微分方程
    • 线性微分方程组
    • 高阶微分方程
    • 奇解
    • 存在和唯一性定理
    • 初等积分法
    • 基本概念
  • 天体物理观测实验
Powered by GitBook
On this page
  • Adjusted $R^2$
  • 线性模型潜在的问题
  • 非线性性
  • 残差项不独立
  • 残差项方差不同
  • 离群值
  • High Leverage Points
  • 共线性
  1. 数理统计

Chapter 9. Linear Models 线性模型

Adjusted $R^2$

对于简单的线性回归:

  • 样本的 $R^2$

  • 是总体 $R^2$ 的估计量:

    1−var⁡(Y∣X)var⁡(Y)1 - \frac { \operatorname { var } ( Y | X ) } { \operatorname { var } ( Y ) }1−var(Y)var(Y∣X)​

    $Var(Y)$ :人群中的方差;$ Var(X|Y)$ :回归后的方差

  • 这是一个比例, $R_2$ 是有偏的 although the bias is not large unless the sample size is small or the number of covariates is large.

  • Adjusted $R_2$ 是一个近似的对于总体 $R^2$ 的无偏估计量:

线性模型潜在的问题

  • 固有的非线性性

  • $X$ 和 $\epsilon$ 不独立

  • 方差不一定是常数

  • Outliers:离群数(Y),对参数估计影响大

  • High-leverage point:X差别很大,对参数估计影响大

  • Collinearity:多参数时,X之间不线性独立

非线性性

  • Residual Plots:

    ϵ=Y−X′β=Y−(β0+⋯+βpXp)\epsilon=Y-X'\beta=Y-(\beta_0+\cdots+\beta_pX_p)ϵ=Y−X′β=Y−(β0​+⋯+βp​Xp​)
    ei≡ϵ^i=yi−xi′β^e_i\equiv \hat{\epsilon}_i=y_i-x_i'\hat{\beta}ei​≡ϵ^i​=yi​−xi′​β^​

    作出 $e_i-\hat{y}_i$ (简单线性模型) 或 $e_i-\hat{y}_i$ (多元线性模型) 图,如果线性模型正确,$e_i$ 应该在 $0$ 附近波动 (正态分布)

  • 如果线性模型不正确,考虑作变换 (非常行♂为♂艺♂术)

残差项不独立

  • 对于时间序列,比如 $\epsiloni$ 和 $\epsilon{i+1}$ 的符号好像有难♂分♂难♂解的关系 (同样可以由Residual Plots看出来),独立性就成问题了

  • 可以假设:

    corr(ϵt,ϵt+q)=ρqcorr(\epsilon_t,\epsilon_{t+q})=\rho^qcorr(ϵt​,ϵt+q​)=ρq

    距离越大,相关性越小;这样的假设下依然可以用极大似然法估计

  • 对于一些非时间序列,比如Family Study,考查饮食对高血压的影响,选择一百个家庭作为样本——家庭饮食习惯相似:Clustered data (Multi-level data)

残差项方差不同

  • Funnel Plots (Residual Plots 呈现烟囱型) ——对 $Y$ 作变换 (对数变换,Box-Cox变换)

离群值

  • 离群值:一个远离模型估计值的 $y_i$

  • 来源:可能数据收集时出错,也可能是真值——不能随便去掉

  • Residual Plots可以用来分辨离群值

High Leverage Points

  • $x_i$ 的离群值,对最小二乘法有很大影响

  • $\beta$ 的LSE可以被写成:

    y^=Hy\hat{y}=Hyy^​=Hy

    其中 $H=X(X'X)^{-1}X'$ 是一个 $n\times n$ 矩阵,可以证明:

    • $H'=H$ :对称矩阵

    • $H^2=H$ :幂等矩阵

  • $H=(h{ij})$ ,较大的 $h{ij}$ 对 $\hat{y}$ 的影响也大

  • 由对称性和幂等性,对角元同时代表 $i$ 行和 $i$ 列的数值:

    hii=hi′hi=∑j=1nhij2h_{ii}=h_i'h_i=\sum_{j=1}^n h_{ij}^2hii​=hi′​hi​=j=1∑n​hij2​

共线性

  • 两个或更多的predictor variables彼此密切相关,即 $X_i​$ 之间线性相关

PreviousChapter 5. Hypothesis Testing 假设检验NextChapter 10 Model Selection 模型选择

Last updated 4 years ago