印刷教材 8 章までに含まれる重要事項に関する次の文を読み、下記の問に答えなさい。
統計学は平均 (1) の学問といわれる。なるほど平均である程度のことはわかるが、ちらばり(ばらつき)はこれではわからない。データの分散 (2) とか標準偏差 (3) はその尺度である。その様子は図 (a) のようにあらわされる。また、平均には標準誤差 (4) という信頼性の尺度もある。平均を用いるときは、その値がこの程度ばらつくことは予想しなくてはならない。
さらに、データが 2 次元になると関連の考え方が重要になってくる。積率相関係数 (5) は簡単に「相関係数」といわれるが、図 (b) のように、正の相関、負の相関、無相関の程度をあらわしてくれる。
もし、データの数量の大きさが著しく不揃いであったり、直接数量的に測定しにくいものなら、順位相関係数 (6) という量も準備されている。また、相関係数の考え方を時系列データに広げたものとして、自己相関係数 (7) という量もある。これは異なった時点間の相関関係の相関係数である。なおこの「時系列データ」をあつかうとき、あらかじめ移動平均(たとえば、3, 4 期)(8) の操作をほどこしてから見ることがよく行われる。
相関関係には関係の方向性は仮定しないが、一方が他方を決める、影響を与えるというとらえ方もある。この最も簡単なケースは、直線による回帰分析で回帰係数と切片 (9) を計算する手続で行われ、大そう有用である。
さらに、統計データはいわゆる「量」(数量)によってあらわされるものの他に、「分類」「属性」によって表現されるものも多くある。カテゴリー(分類項目)別の度数を表にしたデータがそれであり、それに対しては、オッズ、オッズ比 (10) などを見ていくと、ある程度のことが理解できるものである。この方向で、よりまとまった方法として当てはめの適合度のカイ二乗統計量 (11) あるいは関連のための独立性のカイ二乗統計量 (12) などの分析もよく用いられる。
今日、統計分析には、有意性の検定による推論手続が用意されている。上記のカイ二乗統計量もそれであるが、それと並んであるいはそれ以上によく用いられるのが、t 統計量 (13)、2 標本 t 統計量 (14) である。これらは、「有意性の検定」「仮説検定」としてよく知られるものである。
以上が統計学の最も基本の事項であるが、この基礎の上に発展が考えられる。それをすべて挙げることは当然できないが、最近よく用いられる分析法の一つとして、量から質を推定する問題として、ロジット・モデル (15) を挙げておこう。図 (c) はその説明の図である。
問1. 番号 (1) 〜 (15)
の各事項につき自らのデータを例として(基本事項が示されれば、簡単なものまた単なる数値例でもよい)、その値を筆算、電卓あるいはエクセルなどのコンピュータ・ソフトにより計算しなさい。ただし、データが長大、あるいは計算が複雑にならざるを得ないものは、印刷教材のデータ、結果をコピーして用いてよいが図・表・式番号を明示すること。さらに、図による補助説明があればなおよい。
なお、プロセスすべてを逐一示す必要はないが、中間の重要ポイントについては、適宜書き記すこと。
問2. 図 (a)、(b)、(c) として、自ら適切と思われる概形を示しなさい。
注)1.(3.7) にミスプリントがあり、(11.13)
に習って、分子の 1 を 6 に訂正してください。
2.p.198 中央の式にはミスプリントがあります。(8.13)
に習って訂正してください。
3.(出題者からの連絡事項の伝達)出題者のホーム・ページがあります。参考として下さい。