D・カーネマン「ファスト&スロー」(6)第15〜16章 第21章

 第14章と15章は、われわれが統計あるいは確率ということをいかに理解しづらいかを二人の人物像を通して示している。
 一人は「頭はいいが、創造性には欠ける、システム的なものを愛するが書く文章は機械的、SF的なものを愛するが、同情心は薄く、自己中心的で人付き合いは好きでない大学院生」というもの、もう一人は「「31歳の聡明な独身女性、大学では哲学専攻、差別問題に関心があり、かっては反核運動にも参加した」というもの。前者は専攻分野は?、後者の今の職業は? 前者では「コンピュータサイエンス」、後者では「銀行員で、フェミニズムの運動家」という選択肢が選ばれやすい。コンピュータサイエンスを学ぶ学生の数は法学や経済学を学ぶ学生より多いか少ないかということはほとんど考慮されないし、後者では、たんなる「銀行員」よりも「銀行員で、フェミニズムの運動家」のほうを選択してしまうひとが圧倒的に多い。「銀行員で、フェミニズムの運動家」は「銀行員」の部分集合であるから、単なる銀行員である確率のほうが高いことは自明であるが、このような典型的な人物像と思われるような像を提示されると、合理的な判断はどこかにいってしまうのである。しかもそれは数学や統計学に疎い素人においてだけでなく、それらを専攻している学生や、それを教えている専門家でさえもしばしば陥ってしまうのだそうである。
 このようなことを考えるためには、ベイズ統計学が必要になるという。ベイズ統計学については、第16章の「原因と統計」でより詳しく議論されているが、本書を読んで、はじめてそれについてのイメージがつかめたように思った。今までは「事前確率」という概念がうまく理解できないでいた。もしも事前に確率がわかっているのであれば、あらためてあとからでてきた証拠について論じることに意味があるのか、それがピンとこなかったのである。本書を読んで、個々の事例を判断するときに、背景的な知識をどの程度利用するべきかということなのだということは何となくわかってきたが、でも目の前の事例の存在感のほうが圧倒的であるということもよくわかった。カーネマン自身も、目の前の事象にとらわれずに判断することは、具体的な場になると自分でもとても難しいであろうことを認めている。
 第16章の「緑と青タクシー問題」でそれが具体的に示される。「ある市では、緑と青のタクシー2社が営業している。その比率は85:15。ある時ひき逃げ事件があり、目撃者は、それをおこしたのは青タクシーだったといっている。その目撃者は緑か青かを80%正しく識別できる(20%は間違う)。ひき逃げしたのが青タクシーである確率は?」 わたくしは80%と考えてしまった。もっとも多い答えなのだそうである。正解は41%。だって、目撃者は青だといっていて、そのひとは80%正しく識別できるのでしょう」ということになって、その市には緑タクシーが多いことなど忘れてしまう。これが典型的なベイズ統計学なのだそうである。背景因士がわかっていて、そこにあらたな事例が提示された場合、そこに背景因士をどう利用していくか。しかし背景因士というのは抽象的な数字で、目の前にあるのは具体的な目撃証言である。具体的なものの前では抽象的なものは色あせる。
 これは先の第21章「直観対アルゴリズム」にも深くかかわる。ミールというひとの「臨床的予測対統計的予測」という本があるのだそうで、訓練を積んだ専門家の主観的な印象にもとづく臨床的予測と、ルールに基づく数項目の評価・数値化による統計的な予測のどちらの予測が実現率が高いかを論じたもので、後者なのだそうである。たとえば専門的なカウンセラーが新入生と面接をして、高校時代の成績や適性テスト、自己申告書もくわえて一年後の成績をうらなう場合と、高校時代成績と適性テストだけで予測する場合、後者のほうが予測があたる率が高いのだそうである。こういう研究はさらに200以上のさまざまな事例で検討されているとのことだが、人間のほうが優秀という結果はほとんど得られないのだという。よくて引き分け、たいていはアルゴリズムの勝ち。ガン患者の生存期間、入院期間、心臓疾患の診断、赤ちゃんの突然死の可能性、新規事情の成否、銀行の信用リスク評価などなど、さらにはワインの将来価格まで。たとえば、ワインの場合、その年の夏の成長期の平均気温、収穫期の降雨量、前年の冬の降雨量の3つの指標だけでいいのだそうで、予測価格と実際の価格の相関係数は、0.9を上回るというのだから凄い。
 専門的な放射線科医でも、同じ写真を二度みせられると20%で正常と異常が変わる。われわれは複雑な情報を前にすると、どれも優先するかについて一貫性を欠いてしまう。
 さらにいわれているのは、多数の予測因子に複雑な重みづけをした場合と、予測因子に均等な重みづけをした場合でも、重回帰式の精度とさして変わらず、場合によっては重回帰式を上回ることさえあるのだという。だからごく簡単な式でも適切な予測が可能になることも多い。たとえば、「セックスの回数−喧嘩の回数」。これは結婚が続くかどうかの予測式なのだそうで、それがマイナスになると危ない。
 具体的には「アプガー・スコア」。これは生まれたばかりの赤ちゃんが元気か危険な状態かを判定する指数。「心拍数・呼吸状態、刺激に対する反応・筋緊張・皮膚色」の5つを0・1・2の三段階評価し、合計8点以上なら合格、4点以下ではただちに処置が必要。これは医師や助産師の直観的な判断よりもずっと正確で、現在世界中の分娩室で使われており多くの新生児を救ってきた。
 しかし、こういうアルゴリズム優位を主張する論には、多くの反発、異論、反論、反感がある。実際に、臨床医は診察中に勘を働かせ、患者の治療への反応を見、次の事態を予想する。この勘は多くの場合に正しいことが実証されており、臨床経験が有意義であることを示している。しかし、これは短期的な予想に限られる。長期的な予想ではその結果がえられるのは何年も先になるために、うまく臨床医にフィードバックされない。
 そのことは臨床医には十分には理解されておらず、一般的にも統計的手法は「機械的・原子論的・加法的・月並み・人工的・非現実的・恣意的・不完全・無思慮・杓子定規・断片的・瑣末・こじつけ・固定的・表面的・硬直的・非創造的・似非科学的」などなど、ありとあらゆる誹謗の言葉を専門家から投げかけられてきた。
 われわれは、人間と機械が対立すると人間の味方になるってしまう。われわれは人工物よりも自然を愛する。ワイン予測の簡単な式にも、フランスワイン業界は「激怒とヒステリー」で応えた。映画をみないで批評するようなものである、と。
 カーネマンは、もしもアルゴリズムによる診断が誤った場合、人間が誤った場合よりもわれわれは耐えがたい、という。わたくしはむしろ機械あるいはアルゴリズムは責任をとらないということが一番の問題なのだと思う。詳細な問診表、血液検査、レントゲンや心電図などをアルゴリズムで診断して、あなたの病気はこれこれである可能性が高いとし、それに対してはまた別のアルゴリズムからこの薬あるいは治療法を薦めます、ということを一切人間が介入することなく、無人の診断装置が診断から治療までしてしまった場合、多くのひとは納得しないだろうと思う。もっとも現在の医療法のもとでは機械が処方することはできない。医師のサインが必要である。しかし、機械が選択した薬を印刷した処方箋にただ医師が《機械的に》サインをしたとしても、やはり納得が得られないだろう思う。
 わたくしもまた統計的手法には悪口を重ねる人間の方に属しているなあ、と思う。EBM(Evidence based Medicine)「証拠に基づく医療」というのもどうも好きではない。過去に集められた膨大な臨床データを参考に治療することが悪いことであるはずはないのだが、しかしAという治療とBという治療の比較、あるいは治療することと何もしないことの比較をして、その差に意味があるかどうかということについては人間の判断、あるいは価値観が関与してくるはずであって、そこの意味づけがどうも極めて恣意的であるように感じるのである。たとえばAという治療をした場合に何もしない場合よりも2ヶ月延命ができたというEBMがあった場合、その治療を選択するべきであるかはそのデータだけからはでてこないはずであって、その治療の副作用、入院しなくてはできない治療なのか外来で可能な治療なのか、その治療にはどのくらいの費用がかかるのかということをふくめ、考慮に入れなければいけないことはたくさんあって、その《証拠》は多くの考慮すべき因子の一つにすぎなくなってしまうように感じる。
 そしてさらに問題なことは、医者という存在はプラセーボ効果を持つが、おそらく機械にはそれがないだろうということである。しかしプラセーボのことついては後でまた論じる機会があると思う。