アドバンスト・メディアは2019年12月3日、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform（アミボイス・クラウド・プラットフォーム）」の一般公開を開始した。第1弾として汎用エンジンを公開、リアルタイム版とバッチ版のAI（人工知能）音声認識APIをラインアップしている。

音声認識APIを提供する「AmiVoice Cloud Platform」（クリックで拡大）出典：アドバンスト・メディア

　AmiVoiceは、日本語に強い音声認識エンジンで、最新の深層学習技術を実装。今回、APIとして提供することで、音声文字化や音声対話、音声制御、音声翻訳などを行うアプリケーションやWebサイトといったサービスに音声認識APIを簡単に組み込めるようになる。

　リアルタイム認識（WebSocket対応API）とバッチ認識（HTTP対応API）を用意。リアルタイム認識は、HTML5でマイク音声が取得可能なWebブラウザなどで、サーバ型リアルタイム処理ができる。バッチ認識は、音声を一括処理できる。どちらも、サンプルプログラムを用意している。

　また、ビジネスユースに強い言語モデルを採用。ビジネスシーンに特化した言語フィルタリングを搭載することで、不要語を省いて誤認識を軽減している。製品名や固有名詞など、単語のカスタマイズ登録ができるので、専門用語などの認識と変換がよりスムーズになる。

　初月は無料（20日以降の申し込みは翌月まで無料）で、翌月以降も毎月60分までは無料で利用できる。それ以上は従量課金制で、発話区間に対する秒あたりの単価で計算する。無音やノイズ区間など、人の声がない区間は料金が発生しない。価格は、音声データのログを保存する場合が0.025円／秒、保存しない場合が0.04円／秒だ（各税別）。

MaaS時代のクルマは視線もインタフェースに、音声と視線認識技術を握るCerence
自動運転やMaaSの社会実装が進む中、クルマが提供する体験価値も変革が求められている。音声認識に強みを持つ車載ソフトウェアベンダーのCerenceもクルマの新たな価値を提案する企業の1社だ。同社は視線検知と音声認識を組み合わせ、乗員とクルマの双方向コミュニケーションを実現するインタフェースを開発している。
ドライバーモニタリング用カメラの用途さまざま、脈拍測定から音声認識まで
三菱電機は「第46回東京モーターショー2019」（会期：2019年10月24日～11月4日、東京ビッグサイト他）において、MaaS（Mobility-as-a-Service、自動車などの移動手段をサービスとして利用すること）用の車両向けの乗員センシング技術を発表した。
小型組み込み機器向け音声合成エンジンの提供を開始
エーアイは、ルネサスエレクトロニクスの「RZ/G Linuxプラットフォーム」向け音声合成エンジン「microAITalk」の提供を開始した。小型ロボット、スマートフォンアプリケーションなど、組み込み機器へ音声読み上げ機能の搭載が可能になる。
オープンソースの音声認識APIを特徴とする車載Linuxの最新版を発表
Automotive Grade Linux（AGL）は、オープンソースの音声認識APIを特徴とする車載Linuxの最新版「Unified Code Base（UCB）7.0」をリリースした。また、AGLに新たに加盟した5社について発表した。
AI通訳機の日本語音声の新エンジンに音声合成ミドルウェアが採用
東芝デジタルソリューションズは、「RECAIUS 音声合成ミドルウェア ToSpeak」がソースネクストのAI通訳機「POCKETALK W」の新たな日本語音声のエンジンとして採用されたことを発表した。
トヨタがLINEとクルマの音声認識で協業、アップルとグーグルへの対抗意識鮮明に
トヨタ自動車とLINEは、LINEが開発を進めるクラウドAIプラットフォーム「Clova」と、トヨタ自動車などが推進する車載情報機器とスマートフォンアプリの連携規格SDLの活用で協業する。2018年をめどに、Clovaの音声エージェント技術を活用した新しいカーサービスの商品化を目指す。