1
38 39 text by Satoshi Utsugi / photo by Yoshihiro Kamiya 人工知能の研究とは? 国立情報学研究所主催のプロジェクト「ロボットは東大に入れるか。」 (東ロボ)に参加し、 センター試験模試「世界史 B」で高成績を収めた日本ユニシスの石井愛さんを訪ねました! 成績優秀 人工知能 その 研究・開発現場 探 訪! Q2 Q3 Q4 Q1 企業で人工知能の開発をする石井 さん。日本ユニシスはコンピューター システムなど情報通信技術関連の サービスを開発し、提供しています。 石井さんはここで、人間が普段使っ ている言葉「自然言語」をコンピュー ターに処理させる技術や情報を検索 する新しい方法などについて研究。 自然言語処理に関わる大きなコンテ ストで優 勝したことをきっかけに、 「東ロボ」プロジェクトに参加。優れ た成績を収めました。 いし あい さん 日本ユニシス 総合技術研究所 研究員 お話を 聞いた のは… どんな研究を しているんですか? 研究はどのくらい むずかしい? 職場ではどう過 ごしている? どんなアイデアで 試験に取り組んだの? Q2 Q3 Q4 Q1 私はもともと情報検索が専門で、その効率を高める研究をしています。イン ターネットで使うキーワード検索を繰り返すことなく、まるでコンピュー ターが情報の内容を理解するかのように処理して、必要な情報だけを自動的 に集めて整理し、一発で「あなたが求める情報はこれでしょう」と提示したい んです。これを実現するには、人が普通に使う言葉「自然言語」を処理する技 術が必要となります。この研究活動の一環で、私たちはAIロボットが東大入 試の突破を目指す「東ロボ」プロジェクトに参加しました。センター試験模試 「世界史B」を担当し、偏差値は2年連続で66を超えました。 「東ロボ」の場合、試験の問題はかならずしも教科書どおりには書かれていな いので、教科書を丸暗記させて「一致するか」を判断させるだけでは、選択肢 の正誤を当てられないんですね。日本語を理解するかのように処理しないと、 正解を見つけられない。これがむずかしい。そこで、これまでの研究成果を 調べ上げたり、世界史が得意な人に話を聞いたりして、「コンピューターにこ れをさせればいいかも」とアイデアを見つけていくんです。試しても思い通 りにいかないこともよくありますが、うまくいけば「楽しい!」となります。 AIに関する論文を読み込んでいることが多いです。 これまでの研究成果で、いま関わっている研究課題 に役立てられるものはないか調べます。また、ほか の研究員と情報交換もよくやっています。このよ うな作業を地道に進めて、研究課題を解決する方法 が固まったら、実験の計画を立てて実行に移しま す。プログラムは自分で組むことが多いですね。 また、他部署からAIなどについて相談を受けるの で、ともに解決策を考えたり、お客さまのところに 行って説明したりもします。 センター試験模試の「世界史B」 で正解するため、3つほどの手法 をうまく組み合わせてみようと 思いついたんです。その1つ「事 実型質問応答技術」(右図)は、4 つの選択肢から「正しいものを一 つ選べ」という問題があった場 合、それぞれの選択肢の一部を わざと隠して、そこに入るべき言 葉や数字を類推するという手法 です。コンピューターが教科書 やウィキペディアの文章と照ら し合わせて、入るべき言葉や数 字を選び出し、隠した部分の言 葉や数字と合っているかどうか で「正しい」かを評価していくも のです。ほかの手法も組み合わ せて最終的な解答を導き出しま す。こうして高得点が取れるよ うになりました。 石井さんは大学で数学とコンピューターをおもに学んだ とのこと。卒業後、大学院には進学せず、日本ユニシス 株式会社に就職して、5年ほど前から人工知能の研究者 に。「いま思うと、もっと数学や物理を勉強しておけばよ かったですね」と石井さんは言います。人工知能の研究 には物理も大切で、「物理の法則を使いこなせると、AIの 機械学習の理解を深めやすくなるんです」と助言します。 「それと、英語力も高めておいたほうがいいです。英語の 論文をたくさん読むので」とも話していました。 人工知能開発者に 近づくための勉強 下記のような正誤問題では、まず「13」を隠すようにし、コン ピューターが記憶した教科書やウィキペディアを照合。「13 世紀」を多く見つけたら高いスコアを付ける。「チンギス=ハ ン」や「モンゴル帝国」についてもおなじ作業。❷以降も同様に処 理し、最も高い平均スコアの選択肢が「正しい」と判断する。 世紀に、チンギス=ハンが モンゴル帝国を興した。 13世紀に、 モンゴル帝国を興した。 13世紀に、チンギス=ハンが を興した。 いつの こと だろう? 誰が だろう? 何を だろう? 清朝は、270 年余りの長きにわたって東アジアに君臨した大帝国 であった。17 世紀後半に即位した康熙帝は、ネルチンスク条約を 結んでロシアとの国境を定める一方で、 モンゴルからジュンガル・ 回部・チベット・台湾にまで及ぶ広大な領域を支配下に収める礎を 築いていった。 A 問1 下線部①の地域の歴史について述べた文として正しいも のを、次の ❶ ~ ❹ のうちから一つ選べ。 13 世紀に、チンギス=ハンがモンゴル帝国を興した。 Q5 どんな夢を もって いますか? Q5 いま、私たちの会社では、本やインターネットには載ってい ない「常識」をコンピューターに学習させる研究をしていま す。たとえば、多くの人にゲーム感覚で「桜といえば、なにを 思い浮かべる?」といった発想を問うて、「花見」「宴会」「酒」 などという回答を情報としてコンピューターに取り込むよう なしくみをつくりました。こんな常識をたくさん集められれ ば、「コモンセンスAI」ができるはずです。このAIを使えば、 人の話の流れや空気を読んで「桜といえば花見で宴会ですね」 などと情報提供できるようになるかもしれません。 (上)日本ユニシスが、オフィス用品などを扱うイ トーキと共同開発中の「発想支援AI会議室」の試作 を用いて会議。会話から人工知能がキーワードを拾 い、テーブルや壁に示す。(左)デスクではプログラ ミングや論文調査などをする。 ウィキペディア 教科書 ところで、 人工知能の研究者が働いてい る日本ユニシスに向かうと、そ こにはとてもかっこいいビルが そびえ立っていました。職場も、 研 究 装 置が所 狭しと置かれた 研究室のイメージと大きく違い ます。きれいな応接室に登場し た石井愛さんは、「AI を研究し ているからといって、 ロボット をつくっていたり、 コンピュー ターにしがみついていたりする わけではありません」と言いま す。オフィスの机には、パソコ ンとステキな観 葉 植 物が 3 つ。 まわりには女性の研究員もたく さん。 ときどき楽しそうに話し ながら、プログラミングをした り、過去の研究について調べた りしています。

「Rikejo Science『超入門!人工知能』」特集 · 人工知能の研究とは? 国立情報学研究所主催のプロジェクト「ロボットは東大に入れるか。(東」

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 「Rikejo Science『超入門!人工知能』」特集 · 人工知能の研究とは? 国立情報学研究所主催のプロジェクト「ロボットは東大に入れるか。(東」

38 39

text by Satoshi Utsugi / photo by Yoshihiro Kamiya

人工知能の研究とは? 国立情報学研究所主催のプロジェクト「ロボットは東大に入れるか。」(東ロボ)に参加し、センター試験模試「世界史 B」で高成績を収めた日本ユニシスの石井愛さんを訪ねました!

成績優秀な人工知能その研究・開発現場を探訪!

Q2

Q3

Q4

Q1

企業で人工知能の開発をする石井さん。日本ユニシスはコンピューターシステムなど情報通信技術関連のサービスを開発し、提供しています。石井さんはここで、人間が普段使っている言葉「自然言語」をコンピューターに処理させる技術や情報を検索する新しい方法などについて研究。自然言語処理に関わる大きなコンテストで優勝したことをきっかけに、「東ロボ」プロジェクトに参加。優れた成績を収めました。

石いし

井い

愛あい

さん

日本ユニシス総合技術研究所 研究員

お話を聞いたのは…

どんな研究をしているんですか?

研究はどのくらいむずかしい?

職場ではどう過 ごしている?

どんなアイデアで試験に取り組んだの?

Q2

Q3

Q4

Q1私はもともと情報検索が専門で、その効率を高める研究をしています。インターネットで使うキーワード検索を繰り返すことなく、まるでコンピューターが情報の内容を理解するかのように処理して、必要な情報だけを自動的に集めて整理し、一発で「あなたが求める情報はこれでしょう」と提示したいんです。これを実現するには、人が普通に使う言葉「自然言語」を処理する技術が必要となります。この研究活動の一環で、私たちはAIロボットが東大入試の突破を目指す「東ロボ」プロジェクトに参加しました。センター試験模試「世界史B」を担当し、偏差値は2年連続で66を超えました。

「東ロボ」の場合、試験の問題はかならずしも教科書どおりには書かれていないので、教科書を丸暗記させて「一致するか」を判断させるだけでは、選択肢の正誤を当てられないんですね。日本語を理解するかのように処理しないと、正解を見つけられない。これがむずかしい。そこで、これまでの研究成果を調べ上げたり、世界史が得意な人に話を聞いたりして、「コンピューターにこれをさせればいいかも」とアイデアを見つけていくんです。試しても思い通りにいかないこともよくありますが、うまくいけば「楽しい!」となります。

AIに関する論文を読み込んでいることが多いです。これまでの研究成果で、いま関わっている研究課題に役立てられるものはないか調べます。また、ほかの研究員と情報交換もよくやっています。このような作業を地道に進めて、研究課題を解決する方法が固まったら、実験の計画を立てて実行に移します。プログラムは自分で組むことが多いですね。また、他部署からAIなどについて相談を受けるので、ともに解決策を考えたり、お客さまのところに行って説明したりもします。

センター試験模試の「世界史B」で正解するため、3つほどの手法をうまく組み合わせてみようと思いついたんです。その1つ「事実型質問応答技術」(右図)は、4つの選択肢から「正しいものを一つ選べ」という問題があった場合、それぞれの選択肢の一部をわざと隠して、そこに入るべき言葉や数字を類推するという手法です。コンピューターが教科書やウィキペディアの文章と照らし合わせて、入るべき言葉や数字を選び出し、隠した部分の言葉や数字と合っているかどうかで「正しい」かを評価していくものです。ほかの手法も組み合わせて最終的な解答を導き出します。こうして高得点が取れるようになりました。

石井さんは大学で数学とコンピューターをおもに学んだとのこと。卒業後、大学院には進学せず、日本ユニシス株式会社に就職して、5年ほど前から人工知能の研究者に。「いま思うと、もっと数学や物理を勉強しておけばよかったですね」と石井さんは言います。人工知能の研究には物理も大切で、「物理の法則を使いこなせると、AIの機械学習の理解を深めやすくなるんです」と助言します。「それと、英語力も高めておいたほうがいいです。英語の論文をたくさん読むので」とも話していました。

進 路 のイ ロ ハ

人工知能開発者に近づくための勉強

下記のような正誤問題では、まず「13」を隠すようにし、コンピューターが記憶した教科書やウィキペディアを照合。「13世紀」を多く見つけたら高いスコアを付ける。「チンギス=ハン」や「モンゴル帝国」についてもおなじ作業。❷以降も同様に処理し、最も高い平均スコアの選択肢が「正しい」と判断する。

情報源

世紀に、チンギス=ハンがモンゴル帝国を興した。

13世紀に、 がモンゴル帝国を興した。

13世紀に、チンギス=ハンがを興した。

いつのこと

だろう?

誰がだろう?

何をだろう?

 清朝は、270 年余りの長きにわたって東アジアに君臨した大帝国であった。17 世紀後半に即位した康熙帝は、ネルチンスク条約を結んでロシアとの国境を定める一方で、 モンゴルからジュンガル・回部・チベット・台湾にまで及ぶ広大な領域を支配下に収める礎を築いていった。

A

問 1 下線部①の地域の歴史について述べた文として正しいものを、次の❶~❹のうちから一つ選べ。

13 世紀に、チンギス=ハンがモンゴル帝国を興した。❶

Q5 どんな夢を もっていますか?

Q5いま、私たちの会社では、本やインターネットには載っていない「常識」をコンピューターに学習させる研究をしています。たとえば、多くの人にゲーム感覚で「桜といえば、なにを思い浮かべる?」といった発想を問うて、「花見」「宴会」「酒」などという回答を情報としてコンピューターに取り込むようなしくみをつくりました。こんな常識をたくさん集められれば、「コモンセンスAI」ができるはずです。このAIを使えば、人の話の流れや空気を読んで「桜といえば花見で宴会ですね」などと情報提供できるようになるかもしれません。

(上)日本ユニシスが、オフィス用品などを扱うイトーキと共同開発中の「発想支援AI会議室」の試作を用いて会議。会話から人工知能がキーワードを拾い、テーブルや壁に示す。(左)デスクではプログラミングや論文調査などをする。

ウィキペディア

教科書

ところで、

人工知能の研究者が働いている日本ユニシスに向かうと、そこにはとてもかっこいいビルがそびえ立っていました。職場も、研究装置が所狭しと置かれた研究室のイメージと大きく違います。きれいな応接室に登場した石井愛さんは、「AIを研究しているからといって、ロボットをつくっていたり、コンピューターにしがみついていたりするわけではありません」と言います。オフィスの机には、パソコンとステキな観葉植物が3つ。まわりには女性の研究員もたくさん。ときどき楽しそうに話しながら、プログラミングをしたり、過去の研究について調べたりしています。