Sur son site dédié au Machine learning, Apple revient sur les prémices de Siri en apportant quelques détails sur son fonctionnement.

Apple explique en détail les différents mécanismes derrière Siri et son Deep Neural Network (DNN). La firme précise que l’iPhone et le microphone Apple Watch « transforment votre voix en un flux de formes d’ondes instantanées en un débit de 16 000 ondes par seconde » avant que le détecteur du périphérique décide si l’utilisateur a réellement invoqué Siri. En pratique, l’étape d’analyse du spectre convertit le flux vocal en formes d’ondes, avec un spectre sonore d’environ 0,01 seconde. « Une vingtaine de ces images à la fois (0,2 s audio) sont transmises au modèle acoustique, un réseau neuronal profond (DNN) qui convertit chacun de ces modèles acoustiques en une distribution de probabilité sur un ensemble de classes de sons vocaux : ceux utilisés dans la phrase «Hey Siri », plus le silence et d’autres discours, pour un total d’environ 20 classes de son. »

Apple explique qu’elle utilise un certain nombre de variables pour savoir si l’utilisateur a en effet invoqué Siri : « Nous avons construit tout cela avec une certaine flexibilité pour faciliter l’activation de Siri dans des conditions difficiles et d’éviter les fausses activations au maximum. Il y a un seuil primaire ou normal, puis un seuil inférieur qui normalement n’active pas Siri. Si le score dépasse le seuil inférieur, mais pas le seuil supérieur, l’utilisateur est susceptible d’appeler « Hey Siri ». Lorsque le score se situe dans cette plage, le système entre dans un état plus sensible pendant quelques secondes, de sorte que si l’utilisateur répète la phrase sans effort particulier, il sera certainement reconnu. »

Sur Apple Watch, Hey Siri ne fonctionne seulement si le coprocesseur de mouvement détecte un geste de levage du poignet, par souci d’économie d’énergie.

Enfin, Apple explique pourquoi elle a fait le choix de l’expression « Hey Siri » : « Avant d’activer cette fonction, un petit pourcentage d’utilisateurs ont déjà dit la phrase « Hey Siri » immédiatement après avoir cliqué sur le bouton Home pour afficher l’assistant virtuel. Nous avons donc commencé à faire les premiers tests en anglais avec cette phrase et les résultats ont été positifs. »

