松原望『統計学の眼』

− 東京大学新聞より転載 −

第4章他の話題

関連:統計の実践と倫理


  1. 79 分と 97 分 虚実の間
  2. 消費税絶対反対に反対
  3. 何事も学ばず、何事も忘れず

79 分と 97 分 虚実の間

 昨年十月に開通した長野新幹線「あさま」が七十九分で長野へ着くという言い方が問題になったことがある。最初これに朝日新聞「声」欄でクレームがつき、これに JR が同欄で反論し、さらに同様なクレームが誇大広告として日本広告機構に持ち込まれたという。私も偶然この投書のやりとりを読んで気になっていたが、統計学を専攻する者として、このどうでもいいような論議にも本質的なポイントの一端が含まれるよう思われた。

 問題の発端は JR の「東京=長野、倍速七十九分・新幹線『あさま』十月一日開業」という表示。そこで、これを統計学者の「ハンズ・オン」の精神で調べてみる。後日朝日新聞報道の写真では、東京駅構内の券売機あたりに高さ三メートル位で一見して駅案内表示のように堂々と立てられている。同じ頃同様の表現を JR 車内で「お知らせ」のように読んだ人も多いだろう。ところが、七十九分で到着するのは下り・上り四十五本の「あさま」中たった一本 3 号(下り)だけで、JR 時刻表によれば十時二十分発十一時三十九分着。あさま 551 (下り)にいたっては七時八分発九時四分着でほぼ二時間、五割増の所要時間は私鉄なら特急と各駅停車以上の開きである。実際在来線の信越線と比べてみると何とローカル線の快速と同程度であった。ここまでくると、なるほど議論が起こるのは当然であるといえる。

 公平のためにいえば、中には八十一分というのもあり、ならせば平均九十七分となる。そこで平均九十七分の四十五個の数字(統計学ではサンプル)を、その最小値七十九(統計学では極値という)で表示してよいのか、という問題になる。普通なら許されないだろう。統計理論からは最小値は代表値ではない。客観的には最小値は最も下へ偏った値で、もちろん正しく全体のデータの姿を伝えるものではない。しかし、JR はこれは広告なのだから一番小さい値でいうことは許されるという言い分である。営利企業は最もよい部分で広告する以上、最良の部分が全体でもあるとする(事実というよりも主張)ことがむしろ利益につながる、広告とはそういうものだ、ということである。

 こんな状況であるから、今の規制緩和や情報公開の時代に、例えば企業の不良債権データの公表をせまるというような問題でも、同じことの逆の部分が見えてくる。そもそも営利団体に自己に不利な情報(マイナスの広告)を要求しても、出たデータに客観的正しさが期待できるだろうか。要求は社会的に正当としても、企業がこの JR のような考え方をしている限り、残念ながらないものねだりという他ない。このような期待や社会的要求がすんなり通るためには、何よりも企業が正しい情報を公表するインセンテイヴ(利益・動機)がコストを上回らねばならない。だがそれを保障する社会的約束事(公共性)の成長はむしろこれからの問題となっている。今はやむを得ず世論という権力で強制しているが、ご存じの通り、成果ははかばかしくない。

 この「あさま 3 号」の事件は、情報内容の評価判断はそれを得るよりもずっと難しいことを、端的にもの語ることとなった。それと同時に判断と決定の学問である統計学がこういう公共性の成長に寄与せねばならない時も来ていると言えよう。

 (注)先日東京駅で信州野沢温泉の宣伝広告に接したが、新幹線に七十九分という表現はなく、また見る限り倍速七十九分という表現は JR 自体ももはや用いていないようであった。


消費税絶対反対に反対

 日頃、社会調査で「消費税絶対反対という意見がありますが、あなたはこれに賛成ですか反対ですか」というような質問文に接したことのある人は多いだろう。また「あなたはふつう外食や買い物をどこでしますか」とか、「女性の喫煙は健康によくないので反対だ」「消費税は不公平を生むので反対だ」といった質問に対する答えを尋ねられることもある。

 ところが、これら一見して何の問題もないような質問文が、社会調査では不適切な質問形式とされ、避けねばならない悪文の典型と言われているのである。

 最初の文は「これ」の内容があいまい。「消費税」か「消費税絶対反対」かで回答は逆となる。当然、同一回答にまったく正反対の二意見が混在する可能性が生まれる。次の質問では「外食」と「買物」で場所が異なれば答えようがない。三番目では、女性の喫煙は品が悪いので反対と言う人、あるいは消費税反対でも理由が不公平ではない人、いずれもイエスともノーとも答えられない。これでは、仮に回答を集計しても無内容になることは言うまでもない。

 社会調査はふつうアンケートと呼ばれる質問表を用いていろいろな事項が尋ねられるから、各質問の正確さ、的確さがその調査の命になることは当然である。そこに誘導や操作があってはならないが、それは質問文を見ればたいていはわかるものだ。ところが、実際にはここで述べたような欠陥質問文の多くが見逃されてしまうため、回答の集計が不正確どころか無意味になることも少なくない。こういうことは調査実施に対する安易な態度から起こる。

 それから、サンプル数およびその取り方の問題もある。まずは選挙予想で、投票した候補者の名を投票所出口で尋ねる「出口調査」では、百人の場合で得票率の誤差はプラス・マイナス10%(注)となるが、これでは誤差が大きすぎて使い物にならない。政治評論家の選挙予想が大きく外れるのも当然である。TV の視聴率も、据え付ける発信機は多くて数百台で、この場合の誤差は5%程度になる。視聴者には関係ないが、1%前後の上下で大騒ぎする局の態度はまったく不合理と言うほかない。

 他方、新聞の世論調査は社の威信もかかっているためか、比較的この点での問題は少ない。二千程度なら誤差2%前後で一応は及第といえるが、今後は米国のギャラップ社などのように誤差(%)を明示するフェアネスへの努力が望まれる。

 売れ筋の販売予測などのマーケティング調査ではどうだろうか。近年バーコードの光学読みとり装置が普及し、POS(販売地点情報管理)システムによる流通情報革命が急速に進行している。現在、各店ごとにしかもリアルタイムで全売上データの登録、収集、蓄積、分析が行われ、一昔前までは不可能とされた全数調査はきわめて容易になった。ここではサンプル数の多少の問題は過去のものなり、現在はこの膨大なデータセットでどんな新しい統計予測ができるかが新しい関心なのである。

 サンプル数の問題は調査予算の関係からやむを得ないともいえるが、サンプルの実際の取り方に作為を感じる―統計学的に云うと「サンプルの不偏性」に問題がある―ものも多い。街頭面接調査の TV 実況でも、経済や景気の問題については東京駅丸の内北口(JR 前)などがしばしば選ばれるが、これではサンプルが場所柄ホワイト・カラー、それも比較的高所得者に偏るのではないか、ブルーカラーはどうなのか。さらに十代の若者意識(いわゆる援助交際の意識など)を聞くのに多く渋谷センター街を選ぶのも、予定したステレオタイプにはめ込む興味本位の意図が感じられ、非常に疑問である。実際に結論を本当かと疑う人も多いであろうが、TV 報道の影響は決して小さくない。

 これらは社会調査の科学性、倫理性の問題のほんの一端であるが、少し大きく見れば、日本社会が自らの姿を興味本位でなく正しく見るための方法的な合意が、まだ十分でないことの例と言えるのではないだろうか。

(注) 2 シグマ基準


何事も学ばず、何事も忘れず

 何かパニック映画のごとく「環境ホルモン」の問題がかまびすしい。その主役ダイオキシンの毒性なら、ずいぶん前の熊本かられんこん中毒事件の猛毒ボツリヌス菌などとならんで、従来から毒物学の教科書にも半数致死量(生物個体群の半数が死滅する毒物量)の数字データを添えてきちんと載っているのに。事実その致死量は極めて小さい。

 だから、猛毒性は何も今が初めてと言うわけではないのだ。ただ人間の生殖メカニズムへの悪影響がわかってきてそこに「人類滅亡」(?)の兆しを見るところが問題の新しさだろうか。

 だが、困ることの方面が少々違うようだ。マスコミの扱いをよく調べてみると、他の多くの例でもそうなのだが、大変だ大変だと叫ぶだけで、その対策をどうするのかの議論の深みまでふみこんでいる烽フがほとんどない。要するに騒ぐだけで知恵がない。問題を商売のネタにしている風のものまである。問題が深刻ならその分、それをただ強調することは適当にさっと切り上げて、その社会的次元の対応に移らねばならないのに、なかなかそこまで行かない。われわれはこう云う段になるとあまり賢くないようだ。

 ダイオキシンのような超々微量で悪影響が出る物質なら、社会的な対応法は常識的にはおそらく今となってはただ一つ、新規使用を規制する一方ですでに環境内に蓄積した膨大な量はいわゆる「裾切り」(一定レベル以下は容認)することである。すると問題は社会的に最適な裾切りレベルの決定に還元される。この「裾切り」は我が国ではいつも社会的非難をまきおこすのだが、残念なことにそれ以外に妥協法がない。それでも危機だ危機だと騒ぎ立てるだけより数段ましである。問題は具体的なデータを測定してあるのか、どうやって決定にいたるのか、どのようにして結論の社会的受け入れをはかるのか、となるのだが、察するところ問題に対応できるような測定も蓄積も十分にはないらしい。(*)

 ただし、統計学者からは具体的なデータの有無以前にも問題があるように思える。政治が(学問風にいうと公共的決定が)情緒や感情、希望的観測だけを資源にして運営され、論理の闘いを前提にしないのは我が国の慣習なのだろうか、はたまた美学なのだろうか。

 職業がら,統計の意思決定での使われ方の歴史によく接するのだが、次の昔の事例も若い人には参考になるかも知れない。どうしてアメリカとの勝ち目のない太平洋戦争に突入してしまったのか。海軍が、「半年ぐらいしかもたないが、開戦する以上存分に暴れてみせましょう」と言ったことは,多くの歴史家が言及するよく知られたことである。これに対し陸軍は、アメリカの対日封鎖による経済・軍事物資の逼迫のデータを示し、その打開のため決戦を主張していた。となれば、抽象論から云えば両事実とも開戦「しない」理由でもあった。

 だが、抽象論はもう一歩論理に近づけなかった。最近出版された問題の書『昭和天皇独白録』によると、天皇自身が当時の大本営会議を述懐している。「戦争に反対するものの意見は抽象的であるが、内閣のほうは数字を挙げて戦争を主張するのだから、遺憾ながら戦争論を抑える力がなかった」

 論理を論理で迎えうつ習いが、当時の日本人の言語習慣には十分になかった。だがそれは今でもそうなのではないか。社会を望ましくない流れから救い出すには、このような歴史の出来事から学ばねばならないが、あまり学んでいるようには見えない。日本人は日本人の美学が忘れられない感じもぬぐえないのだが。

(注) 題はフランスの諺
*) 問題に科学的に着実に挑んでいる多くの科学者、専門家がいることは忘れてはならない事実である。