84

Open campus-130730 commentary

Embed Size (px)

Citation preview

アナウンサー; ご父母向けオープンキャンパス計数工学科 指定会場の東京大学6号館より生中継でお送りしています。実況は、私、アナウンサーの青森 賢(以下、A)、そして、解説はTVでもおなじみの弁東 英字さんに来ていただいております。

弁東さん、こんにちは。今日はよろしくお願いします。

弁東 英字(以下、B): こんにちは。

A: 弁東さん、いよいよ、夏のご父母向けオープンキャンパス、数理情報第四研究室 はじまりましたね。

B: 昔と違って、私らもね、こういうことをやらんといかんご時世になりましたからね。正直、

こういったいわゆるアウトリーチというのは、やる方も負担が大きいですよ。

A: そうですか、さて、ここでスポンサーからのお知らせです。

本オープンキャンパス実況中継は、次のスポンサーの提供でお送りいたします。

A: 会場の6号館はゴシック調の建物で歴史を感じさせる荘厳な造りとなっております。

そして、そこに今、ぞくぞくと、ご父母の皆様が集まってきております。数理情報サイド、担当の冬田中(ふゆたな)は既に会場入りして、演壇の前で軽く、体をほぐしています。

弁東さん、今日の冬田中、調子はどうなんでしょう。

B: 冬田中だけではないんですが、この時期、大学は期末試験や採点で忙しいですからね、スケジュール的には厳しかったと思いますよ。

A: さあ、誘導されてきた観客が全員席に着いたところで、いよいよスタートです。誘導の学

生が最後に部屋のドアを閉めて端の席に座りました。開始前のなんともいえない空気が会場内に漂っております。

冬田中、ゆっくりと演壇の前に歩いていき、今、スライド用のPCに手をかけました。

メインスクリーンにタイトルが映し出されます。

A: 冬田中、まずは軽く挨拶、それから自己紹介を始めております。安定感のあるしゃべりです。

冬田中、オープンキャンパスは通算5度目、これまでは高校生向けに話してきました。ご父母向けは今回が初ということです。

はたして、今日はどのようなストーリーが繰り広げられるのでしょうか。

今回、事前に公開されているのはこちらのタイトルのみ。我々も内容については一切、知らされておりません。

さあ、冬田中、次のスライドに手をかけました。

A: メインスクリーンに今日の一連の内容が映し出されました。トータルの時間は35分と聞い

て、今回の発表を準備したという冬田中。1つの話題につき約5分という計算だったのでしょうか。6つの項目が並んでおります。

そして、最後にあるのが「連続放火事件」

A: 弁東さん、最後にある「連続放火事件」というのは、これは一体なんなんでしょうね。

B: その前に「ベイズ予測」って単語が見えますよね。あれが、冬田中の専門なんですよ。だから、連続放火事件というのもベイズ予測の応用例を紹介すると、私はみています。

A:なるほど。確かに、手元の資料によると冬田中の専門はベイズ予測。

さあ、次のスライドです。

A: 冬田中、ここで、会場全体を見渡しました。

そして、今、仕事で統計に関わる人がいるか問いかけております。

会場から反応がないことを確認して、ひとりうなずく冬田中。

弁東さん、これはどういった趣旨なんでしょうか。

B: モンティ・ホールみたいな有名な話もありますからね。関係者は答えを知っているわけですよ。冬田中は聴衆に探りを入れてるんじゃないでしょうか。

A: そうですか。軽く探りを入れた冬田中、さあ、ここで次のスライドです。

情報理工学系研究科 数理情報学専攻のホームページより抜粋

工学:

→ モノをつくるイメージ

情報学:

→ どういうイメージ?

数理情報学??

→ 前半ではここを説明

A: 弁東さん、冬田中は数理情報学という単語について語っていますね。

B:はい。やはりね、学術分野の単語というものは、ご父母の方には非常にわかりづらいと思うんですよ。こちらに来る前にね、メイン会場では計数工学科の名前の由来について説明がありましたよね。システム情報は、こうロボットの写真を出してきてね、世界最先端とか言われると、納得するわけですよ。

それに比べるとね、数理情報というのは、なんと申しましょうか、ピンとこないわけですね。

A: 確かにそうですね。

今回のオープンキャンパス、計数工学科全体の説明の後、ご父母が数理情報サイドと、システム情報サイドの二組に分かれての見学となっております。

冬田中は、数理情報サイドの代表として今回の研究紹介を行っています。

さあ、会場では、冬田中、次のスライドに移りました。

A: 冬田中が、ここで会場に挙手を求めています。モンティ・ホール問題を聞いたことがあるかどうか会場に尋ねています。

B:(頭を掻きながら)いやー、直球で来ましたね。

A: 弁東さん、これは意外な展開でしょうか?

B: 冬田中が、公式な場所でモンティを出してくるのは今回が初めてなんですよ。

だから、慎重にすすめている感はあります。モンティは初めてだと、インパクトがあるんだけど、既に知っているとパンチ力は弱くなりますからね。

A: なるほど。そうすると、この後の話は知っている人には容易に想像がつく ということですか。

B: 定番ですからね。多少、アレンジしてくるかもしれない。

A: さあ、次のスライドです。

1. TVのショーで参加者に3つのドアから1つを選んでもらう.

正解のドアが1つだけあり, ドアの向こうには豪華賞品.

2. 参加者が1つ選んだあとで, 司会者は残り2つのうちハズレのドアを開けて見せる. (もし2つともハズレならランダムに1つ選ぶ)

A: スクリーンには、3つの扉が映し出されています。冬田中が今、ルールを解説しています。

会場は真剣そのものです。豪華賞品を狙う参加者のような面持ちでみなさん集中して聞いております。

B:(苦笑しながら)いやはや、オリジナルの問題できましたね。 これは定番ですよ。

A:弁東さんは、よくご存じということですね。モンティは。

B:ええ。

ハズレ

3. 司会者は参加者にドアを選び直してもよいという

もともと選んだドアをそのまま選ぶか

それとも, 残っているもう一つのドアを選ぶか

豪華賞品が当たる確率が高いのはどっち?

A: ここで問題が判明しました。解答は二者択一のようです。さあ、冬田中、ここで再び、会

場に向かって挙手をとっています。今、手が挙がっているのは、もともとのドアをそのまま選ぶ方。

1,2,3・・・

会場では、半分弱の手が挙がっています。そして、次に手が挙がっているのは、もう一つのドアに変える人たち。

1,2,3・・・

こちらの方が若干、少ないように見えます。

B: スライドにはないんですが、どちらを選んでも変わらないという選択肢もありますよ。

A: あ、会場でも、そういった説明がされてますね。手を挙げる人が数名います。

これは、さっきまで手を挙げなかった人たちか

弁東さん、ひょっとして、これが正解ですか?

B:(にやにやしながら)いやあ、すぐに答えがわかりますよ。

A: ここで、冬田中、満を持して解答を出します。私自身も答えが気になるところです。

答え

もうひとつのドアを選ぶ方がよい

豪華賞品を得る確率は

2/3(約66.7パーセント)

A: 「もうひとつのドアを選ぶ方が良い」という解答がスクリーンに映し出されました。

半分以上が不正解であることが判明し会場内がどよめいてます。観客席、手前の方、まだ、納得がいかないといった顔もちらほら見えます。

B: 普通ですと、この場面で確率を計算するんですよ。 ただ、今回はどうなんでしょう、いちから説明すると時間がかかりますからね。

A: 確かにスクリーン横のホワイトボードには、いつでも計算ができるようマーカーが準備されています。冬田中、ここで計算してみせるということでしょうか。

あっ、しかし、冬田中、マーカーには一切手を触れず、そのまま次のスライドに切り替えました!!

1. TVのショーで参加者に 3000のドアから1つを選んでもらう.

正解のドアが1つだけあり, ドアの向こうには豪華賞品.

2. 参加者が1つ選んだあとで, 司会者は残り 2999のうちハズレのドア(2998個)を開けて見せる.

・・・・

A: おーーーーっと、これは、急にドアの数が3から3000に増えたーーーーっ。

弁東さん、これは一体、どういうことなんでしょうか?!

B:なるほど、面白い展開ですね。冬田中らしい運びです。

A:そして、解説は次のスライドへ!!

・・・・ ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

ハズレ

3. 司会者は参加者にドアを選び直してもよいという

もともと選んだドアをそのまま選ぶか

それとも, 残っているもう一つのドアを選ぶか

豪華賞品が当たる確率が高いのはどっち?

A: 弁東さん、これは最初の問題とほとんど設定は同じですね。

B: 会場から感嘆の声が上がってますね。問題の本質に気付いたんでしょう。

A: 冬田中、ここで会場の反応を見渡している。そして、特に挙手はとらないようです。

B: もう答えはわかりましたからね。

答え

もうひとつのドアを選ぶ方がよい

豪華賞品を得る確率は

2999/3000

(約99.97パーセント)

A: 今回は、解答が出ても会場では特に驚く表情はありません。むしろ、冬田中の解説に会場全体がうなずいているのが見えます。

B: 数式を出さないで、観客に納得してもらう。なかなかいいプレーです。

A: 私もわかってきた気がします。

弁東さん、つまり、これは、最初に選んだドアが間違っている確率が高いってことなんですよね。

B: そういうことになりますね。

ドアをあけてもらった

→ 2998個のドアは「ハズレ」という情報が手に入った

→ アタリ(豪華賞品)が2つのドアのどちらにあるかは依然として不明だが付加的な情報を利用できる

数理情報学

このような情報を数値化してとり扱う方法論を探究する学問

次に直観がきかない問題を紹介

A: 冬田中、ここにきて、情報という言葉をしきりに出しています。モンティ・ホール問題を通じて、数理情報学を表現したと言ってます。

我々には最先端のロボットはないんだ、

しかし、正しい選択を与えるための知恵がある

そういったメッセージが会場内にひしひしと伝わってまいります。抽象的なものを対象として研究することの難しさには、相手に伝えることの難しさも含まれるんだ、と冬田中は話しています。

B: 最初の話につながってくるわけですね。

A: さあ、ここで冬田中、

次のスライドです!

A: モンティ・ホール問題を通じて、会場内の熱気がぐんぐん上がっております。

冷房の効いている室内ですが、私もこころなしか、じわっと汗がにじみ出る感覚があります。

おそらく、演壇で話し続ける冬田中はもっと暑いと思われます。

そして、スライドも佳境に入ってまいりました。冬田中、今度はがん診断というタイトルです。

(以下は架空のものです)

がんの有無を95%の確率で判別できる診断法があります

検査を受ける人の中でがんである割合は年間 0.5%

Aさんの診断結果は陽性でした

→ Aさんががんの確率は?

A: 弁東さん、これ、確率は計算できるんですか?

B: はい、スライドに記載された情報から計算できますよ。ただし、値は計算してみないとわからないですね。

A: さっきみたいに簡単にはかけない、そういうことですね?

B: おそらく、数字の入った選択肢、そこで、会場に選ばせるという流れじゃないでしょうか。

A: さあ、ここで冬田中、次のスライド、

弁東さんの言った流れになるのか?

そして、選択肢は来るのか?

1.95%でがんだから, 家族と今後について話し合う

2.所詮は半分半分

3.統計的にはがんの人は0.5%程度だろ?

予想される選択肢

A: あーーーーーーーっ!!!

これは、弁東さんの言ったとおり!!!!

冬田中、この場面、ドンピシャで選択肢を出してきましたね。

B: 非常に自然な流れですよ。

A: あ、今、冬田中が会場に挙手を求めてます。1と3の選択肢が半分弱。

冬田中、最後に2の選択肢を出した。ここは、自信なさそうに数人の手があがります。

B: ・・・・・(考え込む)

A: 弁東さんは、既に答えがわかってるんですよね。有名な話でしたから。

B: ・・・・・(考え込む)

A: 冬田中、今、解答のスライドに手をかけました。さあ、答えはいったい何番か!!

Aさんががんである確率は

約9パーセント

A: 9パーセント?! 9パーセント?!

弁東さん、これ、選択肢を全くはずしてきましたね!!

B: (納得したように)やっぱり、冬田中は裏をかいてきましたね。前のスライドをVTRで見てください。「予想される」選択肢ですからね。正しい選択肢があるとは書いていない。

A: 一見、3つの選択肢のどれかと思わせておいて、全然違う数字が出てきた。

まさに、確率マジック!!

これが、冬田中の確率マジックなのか!?

会場内もどよめいています。

B: 意外な展開でしたね、これは。

A: しかし、会場内、憤る観客は一人もいない。

むしろ、会場は、この9パーセントという謎の数字に飲まれています。

そして、追い打ちをかけるように、冬田中が次のスライドに手をかける!!

(以下は架空のものです) 問

がんの有無を95%の確率で判別できる診断法が2つあります

それらは互いに独立な診断法です

検査を受ける人の中でがんである割合は年間 0.5%

Aさんの診断結果は両方とも陽性でした

→ Aさんががんの確率は?

A: どよめく観客とは対照的に、冷静な冬田中。

次の問としてセカンドオピニオンについて言及しております。

冬田中、非常に時事的な話題を投げてきた。今日のオープンキャンパス、平均年齢は40代から50代。まさに、いつ、自分が遭遇するかもしれない、がんの話題。

そして、今、冬田中は、ゆっくりと説明を始めています。

B: この話は初めてですね。普通のケースですと、さっきの9パーセントでしたっけ? あの数字を計算する所ですよ。

A: 弁東さん、つまり、これは予想に反する展開ということですか。

B: モンティでもそうでしたが、冬田中は、今回、計算を全然出してこないですね。高校生向

けの展開とは違いますよ。かなり、ご父母向けを意識した展開ということです。

1.95%でがんだから, 家族と今後について話し合う

2.先の結果よりちょっと高い10%程度

3.統計的にはがんの人は0.5%程度だろ?

予想される選択肢

A: 冬田中、今度も3つ選択肢を出してきました。

しかし、会場の中には、もう騙されないぞという雰囲気が出てきている。さながら聴衆との心理戦が展開されております。

弁東さん、ずばり言って、正解はあの3つの中にあるんですか?

B: いやあ、ないでしょうね。

A: それでは、正しい確率はどれくらいでしょうか?

B: 私も暗算が苦手ですからね、計算方法はわかりますけども、すぐは出てきませんよ(苦笑)

A; あ、ここで、冬田中、解答を出すようです。今回、冬田中も会場に挙手は求めていない。そのまま解答に進むようです。

Aさんががんである確率は

約64パーセント

A: 64パーセント?! 64パーセント?!

これは、意外に大きいーーーーーーーーっ!!!!

そして、会場は、再び64パーセントという数字に飲みこまれたーーーっ!!

(興奮気味に)弁東さん、最初の9パーセントに比べてかなり大きな数字がでてきましたね!!

B: 非常に面白い展開ですよ、これ。

A: 解説の弁東さんもなるほどという表情を浮かべています。

弁東さん、この結果を踏まえると、やはり、がん診断で2回陽性はアウトと思った方がいいんでしょうか?

B: そうとも限りません。今、冬田中も説明していますが、がんになる人の割合も関係してき

ます。スライドをご覧の方にも注意したいんですが、計算しやすい架空の設定になってますから。

がん診断の例

→ 数値データはあるが, 下手な直観は危険!

→ 数学(確率・統計)をうまく使うことが重要

数理情報学

数理情報学とはこのような方法論を探究する学問

A: 予想以上に大きな数字が出て、興奮冷めやらぬ工学部6号館、オープンキャンパス会場です。新しいスライドには、再び、数理情報学という言葉が掲げられております。

冬田中、会場全体を見渡し、ここで再び、情報という言葉を強調しています。

9パーセントや64パーセントという数字は、きちんと計算しないと出てこない

冬田中、確率・統計の重要性を訴えていますが、一向に計算する気配はありません。

B:本当はベイズの公式を出して計算する場面です。冬田中も内心、出したいんじゃないかと思いますよ。

診断方法の精度

自分たちに

必要な情報

(がんの確率)

ココ

今回は後半で統計モデルとベイズ予測の理論について紹介

がんの割合

実際の診断結果

がん診断の例

A: あ、弁東さん! 先ほどおっしゃられていた「ベイズ」が出てきましたよ。

B: これは、もう名前だけで計算はなさそうですね。

A: そうですか。どうやって計算したか説明はないんですか。なんとなく狐につままれた感じがしますが。

B: ベイズの定理を使った計算を見せるとなると、どうしても、その前にですね、条件付き確

率を説明する必要があるんですね。そうすると確率論の説明になって、初めてやると時間がかかってしまう。

A: なるほど、後半で統計モデルとベイズ予測の話をするためには、時間が足りなくなるんですね。

B: おそらく、そういうね、時間的な読みを彼はしていると思いますよ。基本的にオープンキャンパスの時間は指定されてますからね。

A: 気持ちを切り替えて、冬田中、ここで新しいスライドです。

スライドは既に通算22枚目。華やかに装飾されたスライドからは、日ごろの汗のにじむ苦労や泥臭さが微塵も感じられません。

スライドに記載されていることは、当然、頭に入れて臨む、その上で、聴衆の反応や残り時間に合わせて調整していく、簡単そうに見えてこれは非常に難しい。

アウトリーチでの講演は見た目以上に、かなりの精神力を消耗するんだという冬田中、

翌日に寝込んだことも何回かありました。

しかし、苦しい時も表情には出すな、大学時代からそう言われてきた冬田中、

今日も演壇では余裕の表情を見せております。

危険な食べ物

出典: 西内啓

「統計学が最強の学問である」, ダイヤモンド社, 2013年

・心筋梗塞で死亡した日本人の95%以上が生前ずっとこの食べ物を食べていた

・強盗や殺人などの凶悪犯の70%以上が犯行前24時間以内にこの食べ物を口にしている

→ この食べ物は禁止すべきでしょうか?

A: 冬田中、がんに引き続き、今度は、心筋梗塞を出してきました。

「心筋梗塞で死亡した日本人の95%以上が生前ずっとこの食べ物を食べていた」と説明しています。

日本に特有の食べ物という話ですが・・・、弁東さんわかりますか。

B: (苦笑しながら)これはね、ここ最近、話題になっていますね。青森さん、NHKでも先日、放送されてましたよ。

A: そうでしたか! 割と身近な感じがしますね。私もうっかり食べているんでしょうか。

この食べ物は

ごはん

A: この食べ物は、なんと、ごはん!!

正直、かなり意外な解答でした。再び、会場はどよめいています。

会場の奥の方、夫婦できているんでしょうか、だんなさんの方が、大きく口をあけています。

だましてはいない、でも、だまされた気がする。

そんな意地悪クイズのような問題。

B: この後、彼からも解説があると思うんですが、「比較」の問題なんですね。

病気や犯罪とは無関係な人がどれくらいの割合で食べているか、その割合と比べて判断しないといけない。

・心筋梗塞で死亡した日本人の95%以上が生前ずっとこの食べ物を食べていた

・強盗や殺人などの凶悪犯の70%以上が犯行前24時間以内にこの食べ物を口にしている

・通常の日本人でずっとこの食べ物を食べている割合は?

・通常の日本人が24時間以内にこの食べ物を口にしている割合は?

数値データに対して適切な問いかけをすることが大切

A: 冬田中も同じような解説をはじめていますね。

B: うーん、この話は面白いんだけど、私は、このタイミングでいれるのは反対ですね。

A: 弁東さんから、冬田中にダメだしがでました。

B: 今回の話の流れとしては、おまけ程度ですよ。

URL: http://www.toukei-kentei.jp/

A: おっと、ここで、冬田中、統計検定の宣伝を始めた!!

B: うまく機会を利用していますね。

A: ちなみに弁東さんは、統計検定何級ですか?

B: いや、私は毎回、開催日に手伝っていますから、まだ、一回も受験したことないですよ。

A: そうなんですか。私でも勉強すれば受かるでしょうか

B: やはり、英検なんかと同じでね、低い級から順にステップアップしていくのが望ましいと思いますよ。

A: ここで、ようやく、ベイズ予測のタイトルがメインスクリーンに掲げられました。

さあ、いよいよスライドも後半戦に突入です。

冬田中、得意のベイズ予測を使った構成です。

B: 私も、正直、ここからは全く未知のゾーンですね。ここからは彼のオリジナルの展開になっていくと思いますよ。

A: 弁東さんも楽しみな展開ですね。

B: はい。

統計モデル

将来に関する情報

(予測分布)

ココ

専門家の知識・経験則など

理論自体はすべて数式で記述(数学!)

事前の情報

実データ

A: あっと、これは、先ほどと似たような図が出てまいりました。

さっきは、真ん中に「ベイズの定理」の文字が入っていた。

しかし、今回は大きく「ベイズ予測分布」の文字が刻まれている!!

さあ、ここから、冬田中の快進撃がはじまるのか?!

B: いやあ、彼は、これを狙ってましたね、最初から。

A: 最初からといいますと?

B: この図式を理解してもらうために、ベイズの定理やがん診断の話を前半でやったんでしょうね。緻密な戦略ですよ。

ココ

専門家の知識・経験則など

ギリシャ文字と記号がごちゃごちゃしてて見づらい

d),,|()|(:)( 1 nxxypyp

d)()|,,(

)()|,,(),,|(

1

11

n

nn

xxp

xxpxx

104.2355

56.004

453012

x

|~ ii xpx

1)d(

0)d(

)d(~

1d| xxp

0| xp

})(:{: kypyEk

kEkk Pr:inf:)(*

dyypyY mm )(][E

nnb

n

a

nab xxxxp

xxpxxp

ng dd|,,

|,,|,,1: 11

11

A: おおーーーーーっと!!

ここで、いきなり数式が現れた!!!

図式のそれぞれに、何やら意味不明な記号がずらずらと並んでいる!!

これには会場も困惑している。

いったい、これから何が起ころうとしているのか、

そして、冬田中は、一体何を起こそうとしているのか。

B: 専門の立場からするとね、そんなに難しいことは書いてないんですが、知らない人からすると、難しそうに見えますね。

統計モデル

将来に関する情報

(予測分布)

ココ

専門家の知識・経験則など

以下では, 数式は出さずに活用イメージを紹介

事前の情報

実データ

A: 戻した!!

今の数式は見なかったことにしてね、といわんばかりに戻した!!

冬田中が演壇で笑っています。

「予想通りの反応だ、わかっているよ」

そんな余裕の表情がみてとれます。観客席にも安堵の表情が浮かびます。

B: これは、一種のデモンストレーションなんでしょう。昨日も彼と少し話したんですが、

今日は数式の解説はしないって言ってましたから。

A: そして、いよいよ会場は、最終章へと突入!!

タイトルは「連続放火事件」

まるでクライム・サスペンスのようなタイトル。

冬田中はここで何をやらかす気か!!

弁東さん、予想できますか?

B: 最初にも話しましたが、ベイズ予測に関連した話題としかいえませんね。残り時間も少ないですから、そんなに込み入った話にはならないと思いますよ。

板中橋区ではここ2週間で3件の放火事件が発生している

想定シチュエーション

放火犯は単独であり, ランダムに3ヵ所で放火を起こしている

さいしょに

以下では放火事件を題材に, ベイズ予測の理論の活用方法を紹介

(「板中橋区」など, すべて架空の設定)

A: 板中橋区、架空の場所で、連続放火ですか。

B: 架空のデータでやってみるということなんでしょうね。実際のデータなんて警察関係とコネクションがないと(手に入れるのは)難しいんじゃないでしょうかね。

A: ちなみに、冬田中、現在は板橋区に在住ということで、それをもじったものと思われます。

実データ

-4 -2 0 2 4 6

-4-2

02

46

Crime Location Data

X

Y

これまでの火災現場(3件)

板中橋区の火災現場は3件

2次元データで地図と合わせたのが以下の図

一方, 放火犯の傾向や犯罪心理などから次のような結果(次スライド)が知られている

A: メインスクリーンには、板中橋区という架空の地域での放火場所が映し出されています。

B: まあ、これとは違うんですけどね、犯罪関係の分析では統計的手法が重要なんですよ。

A: と、いいますと?

B: 地図上に犯罪や被害があった場所をマークしていくわけですよ、そうすると、

犯罪が起こりやすい場所がわかってくるんですね。で、そういう場所は、夜は人気がないとかね、狭い路地で街灯がないとかね、理由もわかってくるんですね。

そういったことから、犯罪防止のための対策も見えてくるわけですよ。

現場の経験

犯人は自分の住居から

1~ 5kmはなれた所

のうち, 適当な場所で犯行に及んでいる

ここでは犯行場所の確率分布として

ドーナツモデル(統計モデル)を採用 x

y

Crim

e d

istribution

板中橋区警察署の経験則として, 放火犯には以下の傾向があることが知られている。

統計モデルの設定

A: 弁東さん、このドーナツモデル、これは有名なんでしょうか。

B: いや、これは今日、私も初めて聞きましたよ。ちょっと数式を出してもらわないと、詳しいことはわかりませんね。一様分布でいいと思うんですけどね。

A: 弁東さんも、初めてというドーナツモデル。スクリーンには美味しそうなドーナツが映し出されています。こころなしか、私もおなかがすいてまいりました。

もし, 10件くらい犯行があると

犯行場所が円状にちらばる

→ ドーナツモデルから犯人の住居(ダイヤ印)がある程度推定できる

1.10件も待ってられない! 放火犯を早く見つけたい

2.(1が難しくても)次にどこが狙われそうか知りたい

しかし, 実際には…

-4 -2 0 2 4

-4-2

02

4Crime Location Data

X

Y +

A: 放火が10件もあれば、その中心のあたりに犯人の住居があるということですね。

B: もちろん、犯人は、無意識のうちにドーナツモデルに従って、犯行を繰り返すという前提が入ってますからね。実際の犯罪はそんなに単純でもないと思いますよ。

A: 弁東さん、あまりこのドーナツモデルは役に立たないということですか

B: 私も警察じゃないんで詳しいことはわかりませんね。

点推定の問題 → データが少ないと難しい

-4 -2 0 2 4 6

-4-2

02

46

Crime Location Data

X

Y

犯人の住居の推定

予測分布の問題 → ベイズ予測分布が有効

次に狙われそうな地域をある程度絞り込む

x

y

Baye

sian p

redictive

distrib

ution

ベイズ予測分布 (ドーナツが少しひしゃげた形)

A: 弁東さん、冬田中がここでベイズ予測分布を出してきましたよ!!

B: (スクリーンを熱心に見ながら)なるほどね。

これは面白い。あのピンクの図形、いわゆるベイズ予測分布を目でみてわかる形に表現しましたね。

あれはいいものです。

A: あのピンクの図形、ドーナツを上から押さえつけて、少しつぶしたような形状、

あれが、ベイズ予測分布なんだ と弁東さんも力説しております。

弁東さん、あそこにベイズ予測の真髄があるわけですか。

B: まあ、真髄というと大げさですけども、統計研究者のいう、いわゆる「点推定」と「予測分

布」の違いがはっきり出ているんですね。やっぱりね、最近の若い人は、こういった概念的な違いをね、なかなか理解できてないんですね。

A: なるほど。さあ、ここで次のスライドです。

-4 -2 0 2 4 6

-4-2

02

46

Crime Location Data

X

Y

・3件では犯人の住居を特定するには不十分;

・しかし、4件目の犯行の可能性が高い場所はベイズ予測分布から計算できる!

・右下図の赤が犯行可能性が高い地域

ベイズ予測分布の活用

-4 -2 0 2 4 6

-4-2

02

46

Highly Probable Area of Next Crime

X

Y

+

+ +

以上は, ベイズ予測の活用の一例

B: ここのスライドも非常にうまいですね。先ほどのピンクの図形、あれがベイズ予測分布を

目に見える形で表現したものなんですよ。ただ、ベテランはあれでわかるんだけど、普通の人はわからない。

赤、黄、緑の3色で、次の犯行現場として危険な場所を3段階で表現しているわけですよ。

A: これは架空のデータということですが、犯行を警戒する側からしても役に立ちそうですよね。

B: 彼は、やはり、ベイズ予測分布の活用という点を強調してきましたね。今回の例は、犯罪でしたけれども、他にも様々な応用はあると思います。

統計モデル

将来に関する情報

(予測分布)

ココ

専門家の知識・経験則など

事前の情報

実データ

後半のまとめ

ベイズ予測に限らず, 統計理論には技術的・専門的な課題も多い

→ 大学院生のみなさんの活躍にも期待!!

A: ここで、まとめのスライドに入りました。これは後半戦最初に見せていたスライドとほとんど同じです。

そして、大学院生への期待をこめたメッセージがスクリーン下に掲げられています。

B: 今回のオープンキャンパスは、計数工学科3・4年生のお子さんをお持ちの方が来てい

ますからね。特に3年生は来年の7月には大学院と研究室を選ぶわけですよ。ご両親にも売り込んでおくということでしょうね。

A: なるほど、城を埋めるには堀から、

そして、学生を獲得するには、まずはご両親から

そういった戦略を踏まえての宣伝ですね。

B: 中盤の統計検定もそうでしたけどね、やっぱり、冬田中、数理情報学専攻サイドの代表

としてだけでなくね、統計関係者としてもね、いいプレーしてますね。

A: 最後に、冬田中、有名な一節を掲げていますね。これは私も聞いたことがあります。

B: いわゆるマッキンゼーレポートの一節ですね。ビッグデータ関係の記事でもよく見かけますね。

A: そして、今、冬田中、会場に向かって一礼をしました。どうやらこれでスライドは終了のようです。

あっと、会場からは拍手があがっていますね。

誘導の学生が扉を開けました。観客はこの後、メイン会場へと戻るようです。

A: いやあ、わずか25分という非常に短い時間でしたけれども、

今日の「ご父母向けオープンキャンパス」非常に濃い展開でした。

以上で6号館 オープンキャンパス会場からの中継を終わります。解説の弁東さんも、今日はどうもありがとうございました。

B: はい、どうも。