ここは統計学についての基礎概念を学びます。
ただし、「社会の」統計学についてです。もし一般の基礎入門でしたら、統計分析の基礎入門書を見て下さい。
ことに統計を、単に数学のこととか数字のことと思っている人がいたら、是非ここを読んで下さい。重要なことは「数字」そのものでなく生きた「数字の意味」を見抜く智恵や常識です。これによってあなたの感覚を磨いて下さい。
降伏勧告ビラ アメリカ軍により終戦直前の東京上空に撒かれたもの。統計データを用いて日本人を説得しているのが興味深い。 |
アステカ人のキープ(計数用の組み紐) 人類のどんな時代のどんな民族も、かって生活のための計数法をもたなかったことはない。 |
「データでものを云う」「データから根拠を得る」ということは、日本では江戸時代およびそれ以前、ヨーロッパでも中世にはありませんでした。統計がないということは大変にのどかな時代ともいえますが、逆にまた社会生活や個人生活でも大変な不合理や不都合に耐えねばならなかった(というよりは、あきらめていた)ことは、現代人の想像以上のものでしょう。
昔々は「エンゲル係数」「物価指数」「偏差値」「出生率」などはありませんでした。統計数字に悩まされるということがなかった代りに、生活や暮らし向きが苦しいことひとつ言うのに、言語や身振り手振り体験などすべて動員せざるを得ません。こっちの方が苦しいぞ、と文句が出ても、比べようがないので、けんかや論争が起こっても結論の出しようもありませんでした。結局は声の大きい人や偉い人の勝ちです。試験も点数できめない(第一、筆記試験はありませんでした)ために、いつも先生と生徒の間の親密さで決めていたでしょう。それがふつうの時代でした。
現代社会ではどうでしょうか。「偶然」の中では人は安心して生きてゆけません。「統計」という考え方がなかったら個人は「五里霧中」、社会はバラバラで形をなしません。市況がなかったら生産物の売り買いは不可能です。市長や市の役人がデタラメに税金を課すことは実際上できませんし、弱小では強国と戦争をすることはできませんでした。おおよそ人間と人間の関係が「制度」となるとき、同時に確実さを求めて統計が成立したのです。ヨーロッパ近代社会が本格的に成立したころ、国土と人口、生産と消費、租税と兵役、通貨と交通等々などの統計は「社会」の基本的イメージや認識手段になっていきました。イギリスに「政治算術」が出てきましたが、これが統計学の前身です。統計の成立と近代社会の成立は相当程度重なりますし、その基礎といってもよいでしょう。日本でも明治になって、「ヨーロッパには統計というものがある」と紹介したのは福沢諭吉です。一言でいうと、統計は荒れ狂う「偶然」を飼い慣らし(
I. ハッキング)、人間に「社会」という文明を与えたのです。
このホームページは、データ
アーカイブを整備しています。これを分析しながら、「データで考え、データでディベートする」習慣をつけ、できればこれに会話能力をくみあわせれば皆さんとして最高です。のぞいて見て下さい。
社会の統計的計量的分析には、まず基礎として、東京大学教養学部統計学教室編
『統計学入門』
東京大学出版会 の最初の 3
章が役立ちますので、勉強しておくと大変心強いです。特に、度数分布表・ヒストグラム、代表値(最頻値、中央値、平均値)や散らばりの尺度(レンジ、平均偏差、分散・標準偏差)など基本統計量を学ぶ第二章、相関(係数) や回帰直線のあてはめを扱う第三章は、ざっと目を通しておくだけでもいいでしょう。ついで、やや進みますが、同じく
『人文・社会科学の統計学』
の各章も役に立ちます。第 1, 2 章はデータ分析の基礎、第 3, 6
章は社会調査やサンプリングの基礎、第 4
章はいわゆる経済統計、第 5 章は地域の統計、第 6
章は計量経済分析の基礎となる統計理論、そして第 7
章はやや理論的ですが時系列のデータの分析をカバーしています。そのほか
『知の技法』 の 135 ページ以下も役にたつでしょう。
日本において
「清く正しくくらしたい」という人は現在では何%くらいと思いますか。実はそう答える人の%は
1
割もありません。「総選挙は何をおいても投票」などの質問に対する回答の傾向も、程度の差はあっても、戦後まもなくと比較して似た変化をしています。
日本人は変わったのでしょうか。いや日本人は日本人、表面以外は変わらないのでしょうか。いや、そもそも「日本人」「日本の社会」というものがあるのでしょうか。ないとしたら、日本人と中国人がたしかにいくつかの点で異なることはどうやって説明できるでしょうか。あるとしても、どうやって「日本人の考え方」がわかるのでしょうか。いろいろな日本人(個人)がいるからです。
「人」でなく「人の集まり」について考えること、つまり「統計的認識」について基本的なことを学んでおきましょう。そのために社会学者デュルケームの考え方にしたがっておきましょう。
なお、ここで相関係数ということばを知ってもらうと今後便利です。
ここは、少し、統計学の歴史を入れてみました。ペティー、グラ
ントは国家経済論に統計を発見しましたが、ケトレーの研究は『人間について』
というものでずっと「人間くさい」ものです。確率を体系化したラプラスの考えか
ら、正規分布を取り入れ、当時としては画期的なものでした。皆さんが習う統計学もこの辺からのものです。
ここは統計学の本論です。クロス表(表 4. 7, 4. 8
のようなタテヨコの表)は誰でもいつでも出会うもので、重要ですから中心的に解説しました。統計というと最初から「量」を扱うものと考えている人が多いのですが、クロス表は
1, 2, …
と数えればよいだけですから、質的なもの(賛成・反対、男性・女性、日本人・外国人
etc.)にも使えて、たいへん応用範囲が広いのです。「カイ2乗」が二つの原因(要因)が関連あるか否か、を判定する上で役立ちます。(3.3)
式ですからだれでもできます。あとは、統計数値表が必要ですが。一般化である「対数線形モデル」は割愛しても全くかまいません。
また、質的なものを量的なものに転換する方法として、5
段階尺度の例を出しておきました。アドルノの「権威主義的パーソナリティ」の質問項目は歴史的にも興味深いものです。
ここは、統計的分析では進んだ分析法の一つ多変量解析のうち、「因子分析」についてわかりやすく(社会科学的に)解説しました。「イデオロギー」について話をしていますが、むしろイデオロギーを例にとって、という気持ちです。
まず、相関係数の意味を見ておいて下さい。(『わかりやすい統計学』)
ここの解説は因子分析を用いた研究のごく標準的な解説で、表
4.15 をみると、11 個の概念が 2
つのグループ(「安全保障」、「参加と平等」)におおまかに分類されることがわかりますね。安全保障
の中では 3
個はお互いに近いですね(相関が高い)。「参加と平等」でもそうですね。
つまり様々な問題に対する政治的態度は、2
つのイデオロギ−軸に集約されることが予想されます。ここまでは予想ですが、数学的に証拠立てるのが、因子分析です。147
- 148 頁がその説明です。その結果が表 4.16
で、この表を出すのが手続きの一つです。
「共分散構造分析」はさらに進んだ方法ですが、最初は割愛していいでしょう。
なお、「イデオロギー」ということばは、ここではマルクスの用法でなく、政治学者ダウンズにおける意味、すなわち、政治家が有権者に対して出す自己の政治的信念の情報シグナルという言う意味で用いています。民主党における候補者の「イデオロギー分布」などはその用法です。
有用な統計分析関連のウェブサイト・リスト(統計数理研究所清水信夫氏作成)