「データ解析のための統計モデリング入門」を読む ~第1章~ (original) (raw)

本書の構成

本書の構成は以下の通りである。

1 データを理解するために統計モデルを作る
2 確率分布と統計モデルの最尤推定
3 一般化線形モデル(GLM)
4 GLMのモデル選択
5 GLMの尤度比検定と検定の非対称性
6 GLMの応用範囲をひろげる
7 一般化線形混合モデル(GLMM)
マルコフ連鎖モンテカルロMCMC)法とベイズ統計モデル
9 GLMのベイズモデル化と事後分布の推定
10 階層ベイズモデル
11 空間構造のある階層ベイズモデル
文献・索引

第1章 データを理解するために統計モデルを作る

本章は,本書全体の流れや本書の目的について説明している。

https://kuboweb.github.io/-kubo/log/2012/img05/iwanami20ab.jpg
出典 : 生態学データ解析 - 本/データ解析のための統計モデリング入門

一般化線形モデル(GLM)

本書における大きなテーマは,一般化線形モデル(GLM)である。
統計モデルは,観測されたデータをにうまく当てはめられるような数理モデルである。統計モデルの代表的なものに
線形モデル
があり,これは正規分布を前提としているが,観測対象によっては正規分布では妥当でない場合がある。
一般化線形モデルでは,扱う確率分布を他の確率分布(ポアソン分布など)に拡張したものである。

モデル選択の規準 : AIC

モデル化をする際には,様々なモデルを作ることが出来る(例えば,モデル化に用いる変数を変えれば様々なモデルを作ることが出来る)。
そのため,モデルの良し悪しを判定するための基準が必要になるが,そのような基準として**AIC**を紹介している。AICは,観測データへの当てはまりだけでなく,予測の良いモデルが良いモデルである,という規準である。

まとめと感想

数理統計学を学んだ際に出てきた各種確率分布や尤度比検定,またこの時は簡単にしか触れられていなかったベイズ統計について学ぶことが出来そうで興味深い教科書である。
緑本」と呼ばれる本書は,多くのデータ分析者に読まれた本なので,実用上でも有益と考えられるので,しっかり読み込んでいきたい。

本記事を最後まで読んでくださり,どうもありがとうございました。