ニュース
» 2020年11月13日 14時00分 公開

イノベーションのレシピ:音源を自動で文章化するAIレコーダー、ソースネクストの新製品を記者も体験 (1/2)

ソースネクストは2020年11月10日、AI通訳機「POCKETALK」の音声認識エンジンを活用した自動文字起こしボイスレコーダー「AutoMemo(オートメモ)」の予約受付を開始すると発表した。製品発売日は同年12月4日。AIがクラウド上で音源を自動的にテキスト化する。文字起こしの手間を省力化可能だ。

[池谷翼,MONOist]

 ソースネクストは2020年11月10日、AI(人工知能)通訳機「POCKETALK(ポケトーク)」の音声認識エンジンを活用した自動文字起こしボイスレコーダー「AutoMemo(オートメモ)」の予約受付を開始すると発表した。製品発売日は同年12月4日。AIが自動で音源をテキスト化するため、文字起こしの手間を省力化できる。また、難聴者向けのAIボイス筆談機「タブレットmimi」も併せて発売する。

オートメモ(サンプル品)の製品外観[クリックして拡大]

ポケトークのテクノロジーを翻訳分野以外にも展開

ソースネクストの松田憲幸氏

 ソースネクスト 代表取締役社長 松田憲幸氏は、同社の製品開発方針について「当社は、世界中の技術をあらゆる人に届けるというビジョンを掲げて企業活動を行っている。その一環として、現在、ポケトークに使われているテクノロジーを翻訳用途だけでなく、『音声からのテキスト化』など、本来とは異なる分野にも積極的に展開しようと製品開発に取り組んでいる」と説明する。

 その取り組みの一例として松田氏が紹介するのが、2020年8月に発売したAIボイス筆談機「ポケトークmimi」である。ポケトークに搭載したAI音声認識エンジンを活用して、デバイスに向けて話しかけた声をリアルタイムでテキスト化してディスプレイに表示する仕組みを作った。難聴者は文字の表示されたディスプレイを見ることで相手の発言内容が理解できる。これによって難聴者が、会話時の負担やストレスを抑えながらコミュニケーションを図れるようになるという。

ポケトークmimiの製品外観*出典:ソースネクスト[クリックして拡大]

AIが自動的に録音データをテキスト化

 新製品のオートメモも、ポケトークのテクノロジーを他分野に展開する形で開発したものだ。オートメモはAIによる自動文字起こし機能を搭載したボイスレコーダーで、録音データをWi-Fi経由でクラウドに送信し、AIが自動的にテキストデータ化する。テキストデータは専用アプリを通じてスマートフォンへと送信される。会議の議事録作成時など、録音データから文字起こしを行う手間を大幅に省力化可能だ。アプリ上で事前設定をしておけば、メールでテキストデータを受け取って、内容をPCから確認することもできる。

 録音データのクラウド送信は、Wi-Fi接続時に自動で行われる。LTE通信への対応は設計コストの観点から見送ったという。録音データとテキストデータの、クラウド上での保存容量、期間は無制限。ただし、テキスト化可能な分量は後述の料金プランによって差異がある。なお、オートメモのデバイス本体は録音データの再生には対応しないが、アプリを通じてスマートフォン上で再生できる。

 本体サイズは縦130×横41×奥行き12mmで、重量は約86g。クラウド送信前の録音データを保存する本体メモリ容量は8GBである。専用アプリを通じてスマートフォンと接続する際にはBluetoothを使用する。電池容量は1400mAh。接続インタフェースは充電用のUSB type-Cと3極ステレオマイク端子に対応する。

 松田氏は、オートメモはボイスレコーダー使用者の既存の課題感を解決することを目指して開発したと説明する。「当社の実施したアンケートでは、多くの人がボイスレコーダーを『必要な箇所を探して聞き返す』『録音内容を一部でもテキスト化する』といった用途で活用していると回答した。しかし、既存のボイスレコーダーは録音の精度が低い、聞きたいところが探しにくい、ボタンが多すぎて操作が難しいという課題もあったようだ。オートメモにはこうした不便さを解消するための工夫を幾つも搭載した」(松田氏)。

ソースネクストが実施したボイスレコーダーに関するアンケート結果*出典:ソースネクスト[クリックして拡大]
       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.