「Kinect v2」はここがスゴい!新旧比較とKinectによるNUI開発の最前線Kinectしようぜ(1/2 ページ)

「Kinect for Windows v2センサー」のオープンβ販売開始から2カ月が過ぎ、開発者の知見も集まりつつある。東京エレクトロンデバイスが主催したセミナーより、既存モデルとの違いやNUIアプリ開発に際しての留意点などを紹介する。

» 2014年09月29日 11時00分 公開
[渡邊宏,MONOist]
photo

 日本マイクロソフトの「Kinect」は当初、家庭用ゲーム機「Xbox 360」の入力センサーデバイスとして登場した。しかしその後、Windows PCに接続してNUI(Natural User Interface)用入力デバイスとして使える「Kinect for Windows センサー」とSDKも用意され、現在では低価格かつ高性能なNUI入力デバイスとしてさまざまな分野で利用されている。

 そして2014年7月、「Kinect for Windows センサー」の強化版といえる「Kinect for Windows v2センサー」のオープンβ版が販売開始され、同時に対応SDKもリリースされた。βリリースであり市販に際しての最終仕様ではないが、提供開始から2カ月が経過したこともあり、Kinectに携わる開発者の間での知見も集まりつつある。

photo 「Kinect for Windows v2センサー」

 東京エレクトロンデバイスが同年9月24日に開催したKinect for Windows V2の機能解説セミナーより、既存モデルとの違いやNUIアプリ開発に際しての留意点、Kinect for Windows V2を使用したアプリのデモなどを紹介する。

高精度データが取得できる「Kinect for Windows v2」

 まずは最も気になる、Kinect for Windows v2(以下v2)と既存モデルの相違点について確認する。下の表にv2の主な仕様をまとめたが、既にKinectを使っての開発経験がある、あるいは開発を検討したことがあるならばセンサー自体の構成に大きな変更はなく(深度センサーの方式は変更されている)、カラー/深度解像度の向上や深度センサーの視野角向上、骨格検出数の向上など、強化版といえる仕様となっていることが分かるはずだ。これは既存モデルとの連続性を持たせるためでもある。

Kinect for Windows v2の主な仕様
カラー解像度 1920×1080、30fps/15fps(暗所)
深度解像度 512×424、30fps
深度センシング方式 Time of Flight
深度認識範囲 500〜8000mm
水平/垂直視野角 70/60度
検出可能最大人数 6人
検出骨格数 1人当たり25点
手指検出 親指/指先
手のポーズ検出 グー、チョキ、パー
ジェスチャー
マイク 4基
音声入力
チルトモーター ×
セミナーで講演を行った、Microsoft MVP for Kinect for Windowsの中村薫氏(Natural Software)の資料より抜粋

 既存モデルに比べて精度の高い情報検出が可能になったことも大きな変更点だが、より注目なのは検出可能最大人数と、1人当たりの骨格検出数の増加だ。検出可能人数は2人から6人、骨格数検出については20点から25点に増加しており、その5点は「首」「左右手首」「左右の指先」に割り振られている。つまり、この増加によって、対象人物の首の動きと手の動きを検出することが可能になり、結果として、「首をかしげる」「(手首から先の)手を振る」など“感情や意思を表す際に頻度の高い動作”を感知できる。

photo 骨格検出数は5点増加の25点
photo 検出可能人数は最大2人から6人に(写真は5人を同時認識した状態)

 また、ヒトの顔(表情)から情報を得、その「ヒトの状態」を推測することも可能になった。得られるのは「表情(普通か笑顔か)」「集中(集中しているか、リラックスしているか)」「メガネの有無」「左右の目は開いているか(それぞれについて検出)」「口は開いているか、閉じているか」「会話をしているか、していないか」「よそ見はしているか、していないか」と多岐に渡る。顔のパーツ座標、向きなどを取得できるのは、既存モデルと変わらない。

photo 表情などからそのヒトの状態も推測できる

 SDKについては、WinRTやWindowsストアアプリに対応した他、Unity(Unity Proが必要)のサポートが公式化されており、Kinectを入力デバイスとして使用する3Dアプリの作成が容易になった。また、Kinectのセンサーで得られたデータはドライバから「Kinect サービス」とよばれるランタイムサービスを介してAPI、そしてアプリへと渡していく構成に変更されており、複数アプリの同時実行が可能になったのも大きな変化だ。

photo 処理アーキテクチャの変更

 v2は強化版という位置付けとなっており、正式な販売が開始された後も、既存モデルは併売される予定だ。ではどちらの導入を検討すべきか。「間接の向きや表情を基にした推定といった、高精度なデータ取得が必要ならばv2の使用をお勧めする」とセミナーで講演したNatural Softwareの中村薫氏はコメントしたが、あえて既存モデルを使う状況もあり得る。

 1台のPCに複数台のKinectを接続してのセンシングを行いたい、あるいは組み合わせるPCがWindows 7あるいは32bitベースのOSである場合は既存モデルを選択することになる。v2は複数アプリの同時実行が可能となった代わりに接続するPCは1台に限定され、64bitのWindows 8/Windows 8 Embedded環境が必須になったからだ。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.