3D深層学習研究を容易にするライブラリを発表メカ設計ニュース

NVIDIAは、3D深層学習研究を容易にする「Kaolin」を発表した。PyTorchのライブラリとして実装され、3Dモデルを深層学習用に準備する処理を数ステップに削減する。

» 2019年12月05日 13時00分 公開
[MONOist]

 NVIDIAは2019年11月13日、3D深層学習研究を容易にする「Kaolin」を発表した。PyTorchのライブラリとして実装され、3Dモデルを深層学習用に準備する処理を、300行のコードから5行に削減する。Kaolinライブラリは、GitHubでダウンロードできる。

 Kaolinは、表現方法やレンダリング方法にかかわらず、複雑な3Dデータセットを機械学習のフレームワークに読み込める。モジュラーアプローチをとっているため、インタフェースが提供する各コンポーネントを書き換えるだけで、ユーザーは簡単に3D深層学習分野の微分可能なレンダリングができる。

 3Dコンテンツが操作できる効率的なジオメトリ関数のセットで構成され、PyTorchのテンソルに、ポリゴンメッシュ、点群、符号付き距離関数、ボクセルグリッドとして実装された3Dデータセットをラップできる。

 深層学習用の3Dデータセットを用意すれば、ニューラルネットワークモデルをKaolinが提供するコレクションの中から選択できる。このインタフェースは、分類、セグメンテーション、3D再構成、超解像など豊富なレジストリを提供する。

 実世界への応用としては3例あり、「Classification」は、3Dシーン内のアイテムを識別。「3D part segmentation」は、3Dモデルの異なるパーツを自動的に識別し、アニメーション用にキャラクターをリギングしたり、オブジェクトのバリエーションを生成するためモデルをカスタマイズしたりできる。「Image to 3D」は、3Dモデルを学習済みニューラルネットワークが認識した製品の画像から構成する。

photo 「Classification」のイメージ(クリックで拡大) 出典:NVIDIA
photo 「3D part segmentation」のイメージ(クリックで拡大) 出典:NVIDIA
photo 「Image to 3D」のイメージ(クリックで拡大) 出典:NVIDIA

Copyright © ITmedia, Inc. All Rights Reserved.