エヌビディアが主催するGPUを用いたディープラーニングのイベント「NVIDIA Deep Learning Institute 2017」の基調講演に、米国本社NVIDIAの主席研究員を務めるビル・ダリー氏が登壇。ディープラーニングの進化に果たしてきたGPUの役割を強調するとともに、今後もGPUがけん引役になると強調した。

» 2017年01月19日 11時00分公開

[朴尚洙，MONOist]

NVIDIAのビル・ダリー氏

　エヌビディアは2017年1月17日、東京都内でディープラーニングのイベント「NVIDIA Deep Learning Institute（DLI） 2017」を開催。米国本社NVIDIAでチーフサイエンティスト兼主席研究員を務めるビル・ダリー（Bill Dally）氏が登壇し、「Deep Learning and HPC」と題した基調講演を行った。

　ダリー氏はまず、GPUを用いたディープラーニングが発展を遂げた歴史を簡単に紹介した。自身がスタンフォード大学在籍中にかかわったストリームプロセッシングのプログラム言語「Brook」のGPUへの展開から、2006年のNVIDIAによるGPUコンピューティング統合開発環境「CUDA」の発表、2012年にコンピュータによる画像認識コンテスト「ImageNet」でGPUを用いたディープラーニングで優勝したことなどを挙げた。そして同氏は、2016年に起きた大きな、GPUディープラーニングで学習したAI（人工知能）が碁のチャンピオンに勝利するに至った」と語る。

GPUによるコンピューティングの進化の歴史（クリックで拡大）出典：NVIDIA

　つまり、今日のディープラーニング発展の基礎となったCUDAの登場から約10年で、多くのアプリケーションでディープラーニングを用いたAIが人間を上回るようになったわけだ。

　NVIDIAのGPUを用いたスーパーコンピュータもさらなる進化を遂げようとしている。オークリッジ国立研究所に導入されているスーパーコンピュータ「TITAN」は、GPU「Tesla K20X」を1万8688個を搭載しており、ピーク処理性能は27P（ペタ）FLOPSに達する。

　しかし2017年に向けて、オークリッジ国立研究所とローレンスリバモア国立研究所に導入される新たなスーパーコンピュータは、IBMのCPU「Power9」とNVIDIAの次世代GPUアーキテクチャ「Volta」の組み合わせにより、ピーク処理性能は100P～300PFLOPSになるという。

「TITAN」（左）と開発中の「Volta」世代スーパーコンピュータの（右）の性能比較（クリックで拡大）出典：NVIDIA

　またダリー氏は、「GPUを用いたスーパーコンピュータは、処理性能だけでなく、課題とされていた消費電力の低減も進んでいる。『DGX SATURNV』は最も電力効率に優れるスーパーコンピュータとして『GREEN500』のトップに選ばれた。実に、2位に対して2倍の効率を達成している」と述べる。

　この電力効率の高さによって、DARPAのプロジェクト「Exascaleシステム」に採用される可能性が高いという。「現時点ではまだ目標の1E（エクサ）FLOPSあたりの消費電力20MWにはギャップがあるが、4～5年以内に実現できるだろう」（ダリー氏）としている。

スーパーコンピュータSoC「XAVIER」を自動運転用コンピュータに適用

　このように、GPUがこれまでのディープラーニングの進化をけん引してきたことは間違いない。しかし、NVIDIAの競合であるIntelをはじめ、各社がディープラーニングを意識した技術開発を加速させている。NVIDIAは、今後どのような技術開発を進めてくのだろうか。

　ダリー氏は「実質的にムーアの法則は終了しているにもかかわらず、当社が2016年に投入したGPUアーキテクチャ『Pascal』は、前々世代の『Kepler』と比べて65倍ものディープラーニングの性能向上をもたらした」と説明し、Pascalベースの製品群と関連技術の展開を拡大する方針を示した。推論エンジン「TensorRT」の最適化や、インターコネクト技術「NVLINK」を採用したディープラーニング専用スーパーコンピュータ「DGX-1」などである。

「Pascal」の登場によりディープラーニングは大幅な性能向上を果たした（クリックで拡大）出典：NVIDIA

　組み込み用途のPascalベース製品では、ピーク処理性能が1TFLOPSで消費電力が10Wの「JETSON TX1」がある。さらにNVIDIAは、Pascalの次世代アーキテクチャであるVoltaを適用したスーパーコンピュータSoC「XAVIER（ザビエル）」を開発中だ。JETSON TX1は、消費電力1W当たりで1秒間に処理できる画像の枚数が20枚だが、XAVIERはその20倍の4000枚を実現するという。

「JETSON TX1」（左）と「XAVIER」（右）の性能比較（クリックで拡大）出典：NVIDIA

　ダリー氏は「これらの製品に組み込むディープラーニングの用途で最も期待されているのは自動運転車だろう。10兆米ドルにも及ぶといわれている。当社は自動運転用コンピュータとして『DRIVE PX 2』を展開しているが、XAVIERを搭載する世代になれば完全自動運転のためのリアルタイム処理を行う消費電力を、従来の数百Wから20W程度まで抑えられるだろう」と説明する。

　NVIDIAは、自動運転車に最適なGPU関連技術の開発に向けて、自社でも自動運転の試験車両を開発している。「NVIDIA BB8」と名付けられたAIカーは、同社の研究開発拠点の敷地や、カリフォルニア州内などで走行実験を実施している。講演の中では、車両の周囲6方向に設置したカメラなどを使って周辺状況を検知し、高速道路を車線変更を含めて自動運転するNVIDIA BB8の映像を見せた。「われわれの実験でも、定常的な運転操作であれば自動運転が実現できている。しかし、突発的に起こる事象に対応するための非定常的な運転操作にはまだ対応できていない。これからは多くのAIカーが走り、そこから学習を積み重ねることになるので、完全自動運転の実現はそう遠くはないだろう」（ダリー氏）とした。