『松原望 統計学』 目次

 総合案内サイトへどうぞ(関連サイト多数!)


更新を再開しました。下記8.2をご覧ください。[2015/7]

制作者松原望は上智大学を定年退職し、聖学院大学大学院政治政策学研究科教授に就任いたしました。今後も一般の方のいっそうの有効利用をめざして充実を図っていくつもりですので、従来にもまして皆様のご活用を歓迎致します。今後もよろしく。[2008/4]

制作者松原望は、東京大学を定年退官し、上智大学教授となりましたが、本サイトはすでに事実上全国的利用となっていました。今後、上智大学の授業を念頭において作成を続けますが、一般の方の利用は従来通り歓迎致します。今後もよろしく。[2004/4]

東京大学教養学部総合科目F

担当者 松原 望(Nozomu Matsubara, Ph.D.)
東京大学大学院新領域創成科学研究科教授・
総合文化研究科及経済学研究科教授(兼)、
放送大学客員教授
専攻:相関社会科学、統計学
メールアドレス


基礎さえあればもう安心(2013.9.8)

各章への案内

『統計学』 格言

  物有本末、事有終始、知所先後則矣近道矣          朱子『大学』

   −物に本末あり、事に終始あり、先後する所を知れば則ち道に近し

 事実を用いて科学を築くのは石を用いて家を築くようなものである。しかし、山積みの石が家でないのと同様、事実の寄せ集めが科学というわけではない。           アンリ・ポアンカレ

 正しい問題に対する近似的な解を持つほうが、間違った問題に対する正確な解を持つよりもはるかに価値がある。   J.テューキー

  第九戒 あなたは隣人について、偽証してはならない      旧約聖書

       

 ※目次は案内文の次

重点強調付き

@統計学のガイダンス すべて偉大な物語が「始まり」なく自然に始まるように、統計学も統計学以前の人の知恵と良識から始まる。

Aデータの取り方 なぜ統計分析をするかといえば、多くはデータがそこにあるからである。これからデータを取る場合もある。データから情報を取り出すまず第一歩を考えよう。

B統計学と確率の関係 確率の考えを取り入れることによって、統計学は信頼できる推論、確かな結論を導くことができるようになった。その考え方を学ぶ。

C母集団とサンプル データから何が読めるか言えるのか、何が含まれているのか。それを探るしくみが母集団とサンプルの関係である。原因なくして結果は生じない。

D推論の基礎 データがあれば統計的――なければ統計的でない――と思っている人は多い。だが、統計学では表れたデータがそのまま信じられることはない。これは意外なことかも知れないが大切なことである。‘信頼できる推論’を目指し、いくつかの範型を通して、統計的推定、仮説検定の道を拓く。統計学が目指す所は、それらの元となっている確率的出方の法則(確率分布)であって、この法則こそが実在である。 

E統計的推定 ここから先がいよいよ統計学の本領である。「推定」は元来データを元にして見積もるという意味である。推定が先か検定が先かという学びの戦略がある。歴史的には検定が先行したが、今日、どちらかといえば推定問題のほうが地味であるものの基礎としての役割が大きい。まず推定の基礎解説から始め、最尤推定法へ進む

F仮説検定 検定とは、データを用いて、用意した仮説さらには理論が成り立つか調べる、検査することで、歴史的には有意性検定から一般的な「仮説検定理論」の体系ができた。内容は心持多く、まずカイ2乗検定とt検定から始めてあとは同じ考え方で進め、検出力を当面の目標とする。いわゆる多重 比較の問題にも応用として触れておこう。

G最小二乗法と回帰分析 推定と検定の2本柱が終わり、登山でいえばようやく中腹に達して見通しはよくなる。そこで回帰分析の前身である最小二乗法を確認して、後続の2章に備える。最小二乗法は実質的に史上初の(概ね19世紀前半)数理的根拠のある統計分析法で、徐々に緻密な論に入ってゆくが、さしあたりはごく初歩の数学で済む。

H一般線形モデル 「一般線形モデル」とは、回帰分析を線形代数と見て’かっこう良く’整備し、多少の発展応用に効く形に仕立てたものである。計算も簡易化することで回帰分析全体の見通しは良くなり、いわゆる多重共線の問題にも手際よく対応できる。固有値問題もあらわれるが、数学的に別領域の課題でほんとうは奥が深い。ここは単発として読んでも有益である。

I重回帰分析の実際と発展 見かけの上で戻った感もあるが、分野によっては、一般線形モデルよりも変数間の相関関係から注意深く個別に見た方がよい(心理学、行動科学の分野など)。個別変数の意味、個別ケースの検討にも備えて、必要な展開を解説するが、式のフォローもこの程度なら努力の範囲であろう。これで回帰分析は閉じられる。

J分散分析 「分散分析」というが実は平均の検定としてt検定の発展であるが、単純な発展ではない。歴史的には実験計画法の後の計算パートであって、進めばその本論にも入るがここでは入らず、今日共有知識化している「繰り返しのある2元配置」までをカバーする。平方和の分解とF分布の理解、そして分散分析表が読めることを目標に置く。

K大標本理論 「サンプル・サイズnが大きいとき」という条件が付く統計的方法は多い。そのとき、大数の弱法則と中心極限定理が働いている。ここで個別の統計的方法を扱うのは程度が高く問題外で(とはいえ各所で結果的には扱っているが)、ここではむしろ確率論的章として現象理解をめざした。

L分布によらない統計的方法 「ノンパラメトリック統計学」とは、まずは多少狭いが「順序統計量」と「順位」に基づく統計的方法と定義される。それでもなお分野は茫漠とした平原のようで個別方法も列挙にいとまがない。ここでは、むしろ方法の意義に焦点を当て簡潔でコンパクトな要点解説とした。ノンパラメトリック検定に対応する「ロバスト推定」も、初学者にはコトバさえ聞きなれないであろうから、順序統計量にもとずく典型的統計量の辞典的 紹介のみとしても若干のメリットはあろう。

Mベイズ統計学の基礎 「ベイジアン」とは、母集団の母数は動くのみならず確率分布を持ち「ベイズの定理」で演算されるとする統計学説の学派をいう。従来よりの多数派統計学説は、母数はその値はわからないが固定されているとして、これを異端としてきた。今日ベイジアンは、その哲学基礎はとにかくも、柔軟な発想と展開が引きつける力が大きく、次第に有力方法論となってきている。ここではその入り口部分だけでそのほんの一端を示そう。

Nシミュレーションによる数理統計学 コンピュータのよる統計学とは、コンピュータを複雑な数学式の「計算用機械」としてでなく、むし本来的に統計的に、サンプリングを理想的にかつ迅速簡便に行う「統計的機械」として用いる。ここでは、ジャックナイフとブートストラップを紹介しよう。

目次

正誤表

  頁  表、図で理解  頁 
1 統計学のガイダンス 1.1 「統計」と「統計学」を考える前に  1    
    1.2 「統計学」とは何か  2 交通事故資料  6
    1.3 統計は方法だが文法でもある  6    
    1.4 統計の有用性と最近の問題点    
2 データの取り方 2.1 分析の始め方  13    
    2.2  各種のデータの取り扱い  16    
3 統計学と確率の関係 3.1 統計データと確率  25  カードの色の確率分布  27
    3.2 ゴルトンのクィンカンクス 28     
    3.3 簡単な二項分布の演算  29  正規乱数の例(訂正後)  36
         正規乱数の誤差(直線関係)  36
母集団とサンプル 4.1 各種の統計量  39  サンプルの理解と要約  40,41
    4.2.母分散の確率分布のしくみ 45  
     4.3重要な確率変数Xの確率分布 50   指数乱数の作成   58
         ガンマ分布に従う乱数  60
    4.4確率分布の演算 66     
5 推論の基礎 5.1 確率分布への適合  73    
    5.2 フィッシャーの有意性検定の基礎  76    
    5.3 F分布  81    
    5.4 十分統計量と統計分析の始まり 81     
統計的推定 6.1 推定論のはじめ  89    
    6.2 最尤推定法  94    
    6.3 信頼区間の考え方 100     
 7 仮説検定 7.1 χ2適合度検定 115     
    7.2 有意性検定 122    
    7.3 統計的仮説検定理論 125     
    7.4 おもな仮説検定の方法 132  スチューデントの2サンプルt検定  135
         同、重要ポイント  136
         2次元乱数の生成  138
    7.5 分散の検定 139     
    7.6 分割表の独立性の検定 142   独立性のχ2検定  144
    7.7 検定の検出力 144   やさしい検出力の計算例  148
    7.8 高い検出力の検定 149     
 8 最小二乗法と回帰分析 8.1 回帰分析とは  153    
    8.2 最小二乗法 155   重回帰分析の中は計算手順付説明  158
         EXCELで計算練習  163
         一般線形モデルでは  173
    8.3 回帰分析のパフォーマンス 164   
 9  一般線形モデル  9.1行列表示 171   一般線形モデルでは  174
    9.2 回帰係数の有意性検定 175     
    9.3 多重共線のトラブル 177   逆行列が存在しない例  178
    9.4 対処法(1) リッジ回帰 181     
    9.5 対処法(2) 主成分回帰 182     
 10 重回帰分析の実際と発展 10.1 回帰分析の理解  195    
    10.2 重回帰分析を使いこなす 200   偏回帰係数を深〜く理解  202
         分散拡大因子で多重共線  209
         ハット行列とクックの距離  210
    10.3 ガウス・マルコフの定理  214    
    10.4 ロジスティック回帰 216     
11 分散分析 11.1 計画された実験のデータ  221    
    11.2 一元配置 224   分散分析一元配置とは  233
    11.3 繰り返しのない二元配置 231   分散分析二元配置とは  234
    11.4 繰り返しのある二元配置 237    同上  
    11.5  多重比較 245     
12 大標本理論 12.1 統計学と大標本理論  253  さいころ4個で正規分布  260
    12.2 統計学への応用  261    
    12.3 最尤推定量の大標本理論 264     
 13 分布によらない統計的方法 13.1 ノンパラメトリック統計学とは何か  257    
    13.2 分布によらない方法  269    
    13.3 順位の不変性 271     
    13.4 順位相関係数  272    
    13.5 順位による検定 278     
    13.6 ロバスト推定  281    
14 ベイズ統計学の基礎 14.1 ちょうど逆  265    
    14.2 平純な計算  287    
    14.3 ベイズ統計学へ 288     
    14.4 正規分布の共役事前分布  200    
    14.5 スタインのパラドクス 293     
 15 シミュレーションによる数理統計学 15.1 「統計的機械」としてのコンピュータ  295    
    15.2 ジャックナイフ法の原理 297     
    15.3  ブートストラップ法の原理  299    

姉妹サイト

 

 計量社会科学ワークショップ
 データバンク
 放送大学『統計の考え方』のためのワークショップ
 確率論の入門基礎
 より進んだ統計分析(整備中)
 『松原望 統計学』、東京図書のページ


作成者情報
Copyright © 2000- 基礎統計ワークショップ. All rights reserved.
最終更新日 : 2014/2/28 .