Appleがアシスタントを呼び出すのに「Hey, Siri」を使う理由

「Hey、Siri」、「Ok、Google」、「Hello Cortana」…各音声アシスタントは、音声によって呼び出される独自の方法を持っています。メーカーは、アシスタントが応答してコマンドを聞き始めるための特別なコマンドを探しました。Sir の場合は、「Hey, Siri」または英語の「Hey, Siri」で十分です。しかし、なぜ他の言葉ではなく「Hey」なのでしょうか？

音声アシスタントをアクティブにするコマンドは、主に 2 つの理由から作成されます。 1 つ目は、アシスタントが何を聞いているかを認識しなければならない時間を制限することであり、起動するフレーズを分析する必要がはるかに少なくなります。2 つ目は、たとえば Siri を例に挙げることができるため、正確に誤検知を回避するためです。他の人との会話の中で、しかしそれはそれをアクティブにしてほしいという意味ではありません。

自然さ、コマンドは可能な限り自然でなければなりません

なぜ Apple が Siri を呼び出すコマンドとして他のコマンドではなくこのコマンドを選択したのか疑問に思ったことがあるなら、その答えは Apple が公開した機械学習に関する最新の記事にあります。エンジニアによると、目標は、Siri を呼び出す簡単で自然かつ快適な方法を選択することでした。

「Hey Siri」というフレーズは、もともとできるだけ自然になるように選ばれました。
実際、この機能が導入される前から、ユーザーはホームボタンを使用して Siri を呼び出し、うっかりリクエストの前に「Hey Siri」を付けてしまうのが自然だったほどです。

そして、スペイン語でもまったく同じことが起こります。「ねえ、[名前]」と言って他の人と会話を始めたことは、きっと一度や二度ではありません。他の人と会話するのは自然な方法です。 「Ok」と「Hello」と同じように、「Ok」はより専門的で現代的ですが、常に「Hello」から会話を始めるのは少し奇妙かもしれません。

誤検知を回避するという困難な作業

Siri が常にローカルでリッスンし、「Hey、Siri」というコマンドで起動するということは、Apple のようなエンジニアのチームにとっては簡単に設定できるもののように思えます。ただし、これはそれほど単純ではなく、より正確な結果を達成するには、多くの開発と人工知能の適用が必要です。他の人の命令ではなく、あなたの命令にのみ応答することを望んでいる場合は、さらにそうです。 Apple は次のように説明しています。

話者認識の一般的な目標は、声を使用してその人の身元を特定することです。私たちは、「何が話されたか」を判断することを目的とする音声認識の問題とは対照的に、「誰が話しているのか」に興味を持っています。

Siri 開発者は、コマンドを実行するたびに Siri がアクティブになるだけでなく、あなたが同じようなコマンドを言ったとき、別の人がそのコマンドを言ったとき、または他のユーザーが同じようなフレーズを言ったときに Siri がアクティブにならないことも保証する必要があります。したがって、Siri は、デバイス自体をトレーニングするようにセットアップするときに、「Hey、Siri」と数回言うように求めます。