研究室コラム

くらし+きかい=可能性が見える

「コンピュータビジョン」が
人間の生活にとけ込み、
サポートしてくれる日を夢見て。

大学院 情報科学研究科 システム情報科学専攻
博士(工学) 教授 岡谷 貴之

「視覚」をコンピュータで再現

私が大学生のころ、AIは研究の対象にはなりえなかったといったら、きみは驚くでしょうか。AIは夢物語でしかなかったからです。しかし、いまから7年ほど前、ディープラーニングが登場し、それまで超えられなかった壁が突破され、いまでは夢物語でないと思えるまでになりました。ちなみにディープラーニングとは、人間の脳を構成する神経回路網をコンピュータの中で再現したようなものです。

AIの研究はいくつかに分かれていて、私が手がけるのはコンピュータビジョンと呼ばれる技術です。自動車の自動運転から、スマートフォンのアプリ、ネット通販サイトまで、すでに幅広く応用されています。また今後、家で料理や皿洗い、お年寄りの介護など、さまざまなことをしてくれるサービスロボットなどを実現するのに欠かせない技術です。

人間は自分を取り巻く環境の情報収集の大部分を視覚に頼っていると言われています。そのため、「知能」を考える上で、「視覚」は最初に攻めるべきところであると考えられてきました。私たちはこの人間の「視覚」の働きをコンピュータで再現しようとしています。そのためには、人間が脳を使ってどのようにものごとを理解するのかを分析し、それをディープラーニングによる情報処理に反映させる必要があります。しかしながら本当は、その答えがどのくらい遠いところにあるのかさえよくわからないくらい、難しい問題です。だからこそ、やりがいもあるといえる分野だと思っています。

最新情報はTwitterで

現在のコンピュータビジョンの技術では、コンピュータに見せた1枚の画像に何が写っているのかを判別したり、顔の画像からその人の年齢や感情を推測することなどがかなり正確にできます。ただ、画像や映像の中で起こっているできごとを「理解」して説明することは、完全にはできません。私たち、そして世界中の研究者がこの難問に取り組んでいます。毎日のように新しい論文が発表されるホットな分野なので、競争も激しく、最先端の研究を把握するのにTwitterが欠かせないほどです。少なくとも、いまはバケーションをあきらめているんです(笑)。それだけ研究はやりがいがあるとも言えます。