皆さんは統計分析コンサルタントだといたします。ある日依頼者から次のような統計相談を受け、データ(下記)も示されました。相談は7件ありましたが、それぞれ統計分析の基礎的方法についての内容でした。そこで、コンサルタントとして各依頼者に対し、
(a) 適切な分析方法を提案し、
(b) 方法の要約を式、統計学用語を用いて説明し(定義をあたえること)、
(c) 説明の一環として実際にそのデータの分析を行い、
(d) 結果の解釈について簡潔な説明をすること
で統計相談は終わる方針とします。またわかりやすい説明のために、
(e) 図あるいは表を用いること
にします。
各 3 ページ以内で、(a) – (e) を含むわかりやすい説明資料を作って下さい。
ただし、問題で用いる「データ」は、印刷教材のデータ(下線部)を示したが、これは単に例であって、同趣旨の自らのデータ(印刷教材にある他のデータを含む)に置き換えること。ただしこれは原則である。
問1 「ここに計量ますのデータ(p.9)があるのですが、データのだいたいの様子を散らばりなども含めて、簡潔にまとめておきたいのです。」
問2 「これは私の業界の 2 銘柄の売上データ(表3-4)なのですが、量が 2 つ(以上)あるので、関係はどうなっているか知りたいのです。」
問3 「私は研究でずっとデータをとりつづけてきました。この心臓病のデータ(表3-15)がそうなのですが、数値の上がり下がりがめまぐるしく、全体の変化傾向がわかりません。だいたいの変化の様子がわかる簡易な方法を 2 通りくらい教えてくれませんか。」
問4 「これは金属を熱した場合の位置ごとの温度データ(p.27)ですが、2 つ量が測定されたわけですから、一方の量から他方が予測できる関係式が出ると便利なのです。」
問5 「データの仕事をしていますが、以前統計学を勉強しなかったので苦労しています。データが考えていたとおりに当てはまっているかどうか、比率や%の分布から決めたいのです。予想に合っているかどうか、それから、2 つの要因があるとき、はたして関係があると考えてよいのかよくないのか、比率や%から判断する方法はありませんか。一例として、メンデルのデータ(表7-6)がここにあります。それから同僚が仕事で成績分布のデータ(表7-10)をくれたので、これらを分析してみてくれませんか。」
問6 「よく誤差の範囲内だといって理論どおり、という結論出すことありますね。となれば、誤差の範囲内かそれ以上か科学的に判定する方法が入用です。私のデータでも、2 グループの計量値(表7-5)の間に誤差以上の差があるかどうか、目下それが課題なんですよ。」
問7 「さて困ってしまいました。回帰分析で x から y を決める方法を使おうとしたら、y は数字じゃないのです。つまり、2 つしか結果がなくて、成功失敗、当てはまる当てはまらない、成り立つ成り立たないなど、要するにイエス・ノーいいかえれば 0, 1 なんです。この場合、0, 1 は名目上ですから回帰分析ではダメなことは明らかです。どうしたらいいですか。(データは、と聞かれて)私のデータは、この殺虫効果の有無(表8-13)です。量と結果はどういう関係があるのでしょう。」
注意) 各問は頁の第 1 行から書きはじめてください。また、データは必ず示してください。貼り付けても結構です(EXCEL などの分析結果も同様)。
参考) 本問には直接関係ありませんが、過去年度問題についての解説は
http://www.qmss.ne.jp/statair/
印刷教材所収のデータのいくつかについては
http://www.qmss.ne.jp/databank/
関連話題については
http://www.qmss.ne.jp/portal/
を参照して下さい。