L’IA pourrait bientôt être un allié dans la quête pour bannir les mots de réveil des assistants vocaux. Les chercheurs de l’Université Carnegie Mellon ont développé un modèle d’apprentissage automatique qui estime la direction d’où provient une voix, indiquant votre intention sans avoir besoin d’une phrase ou d’un geste spécial. L’approche repose sur les propriétés inhérentes du son lorsqu’il rebondit dans une pièce.

Le système reconnaît que le premier son, le plus fort et le plus clair est toujours celui qui vise directement un sujet donné. Tout le reste a tendance à être plus silencieux, retardé et étouffé. Le modèle sait également que les fréquences vocales humaines varient en fonction de la direction à laquelle vous faites face. Les basses fréquences ont tendance à être plus omnidirectionnelles.

Cette méthode est «légère», basée sur un logiciel et ne nécessite pas l’envoi de données audio vers le cloud, ont ajouté les chercheurs.

Cela peut prendre un certain temps avant que vous ne voyiez la technologie utilisée, bien que l’équipe ait publié du code et des données publiquement pour aider les autres à tirer parti de leur travail. Il est facile de voir où cela pourrait mener, au moins. Vous pouvez dire à un haut-parleur intelligent de lire de la musique sans utiliser de mot de réveil ni déclencher une horde d’autres appareils connectés. Cela peut également contribuer à la confidentialité en exigeant votre présence physique tout en évitant le besoin de caméras de détection du regard. En d’autres termes, ce serait plus proche de cela Star Trek vision d’assistants vocaux qui savent toujours quand vous leur parlez.

Lire aussi  Le pilote Facebook associe les profils d'utilisateurs aux abonnements aux actualités en ligne