竹内氏　まずは食道発声法を練習する人たちにヒアリングを行いました。多くの方が「もっときれいな声で話したい」「話はしたいけど声に自信が持てないので、だんだん会話をしなくなってしまう」と悩みを抱えていました。また、食道発声法は習得まで半年から1年かかる上、発声時に体力も必要になる。このため途中で習得を諦めてしまう人が少なくありません。

　食道発声法を習得していない方々は、電動式のELを喉に押し当てて声を出します。この機器は喉に振動を与えることで、口の形を変えると、機器から伝わった振動が口から疑似的な音声として出てきます。ただ、口から出る声が機械的な音声に感じられてしまうこと、また、常に携帯しなければならないことを不便に感じて「結局使わなくなる」人もいます。

　そうした喉摘者の「声」を聞いて、開発するデバイスの方向性は決まりました。「ハンズフリーで使えて、より人間の声に近い音声を再現できるデバイス」です。

――試作品はすぐに開発できたのですか。

竹内氏　最初に作った1号機は、リング状のフレームに音を出すELの振動子を取り付けたデバイスでした。ELの研究開発を行っている東京大学名誉教授の伊福部達氏（Syrinxのアドバイザー）に相談しつつ開発しました。ただ、ハンズフリーは実現しましたが、声質は良くありません。一番ネックだったのは重量です。1号機は400g弱あって、首に付けると重さを感じました。

　そのため、最初は振動子の小型化が課題となりました。解決策としてすぐに思い付いたのが、スマホのバイブ機能などに使われているピエゾ振動子を使うことです。2019年11月には2号機が完成しました。より効率よく振動させるために、振動子の上からスポンジや木の板をネジ止めする機構も採用しました。しかし、軽量化には成功したのですが、振動が弱くて声量が小さく、声質も大して向上しませんでした。見た目も悪いので、喉摘者からの評判もいまひとつでした。

人間の音声が持つ、周波数のある特徴

――それでも諦めなかったのですね。

竹内氏　声質の改善手法を探るため、悩む日々が続きました。そんな時、人の声を周波数分析してみると、実に多様な周波数が含まれていることに気付いたのです。

　もう少し詳しく説明すると、人間の声には基本周波数という、ヒトの声の高さを決める周波数成分があります。当初、私たちは、人間の声は周波数のエネルギーのみが大きくなっており、周波数スペクトルで見ると基本周波数のみに値が出る、インパルス応答が生じていると考えていました。しかし、分析したところ、実際には基本周波数の前後に存在する周波数成分にもエネルギーがあり、周波数スペクトルが緩い山の形を形成していると分かりました。

　こうした知見を基に、口腔内の音声と実際に外に出ていく音声の間にある相関性を関数化できれば、より人の声に近い音声が再現できるようになると気付きました。

　母音の発音の仕方や口腔内の大きさには個人差があります。このため、多くの発声データをAI（人工知能）アルゴリズムを用いて関数化することで、幅広い周波数に対応できる振動子を開発しました。声量の問題は、ELに似た振動子を2つ搭載することでクリアしました。こうして2020年2月に完成したのが3号機です。

デザイナーとの出会いで世界大会へ

前のページへ 1|2|3 次のページへ