Il devient de plus en plus difficile de croire qu’Apple puisse tenir ses promesses concernant le nouvel assistant Siri.

Un problème désormais corrigé a permis aux chercheurs de contourner les restrictions d’Apple et de forcer le modèle de langage local à exécuter des actions contrôlées par un attaquant. Voici comment ils ont procédé.

Apple renforce ses dispositifs de sécurité

Deux articles publiés sur le blog RSAC détaillent comment les chercheurs ont combiné deux stratégies d’attaque pour faire exécuter des instructions contrôlées par des attaquants au modèle local d’Apple grâce à une injection de prompt. Ils expliquent que le modèle de langage local a été compromis sans qu’ils n’aient la certitude de la manière dont Apple traite les filtres d’entrée et de sortie.

Déroulement de l’attaque

En utilisant un caractère Unicode appelé RIGHT-TO-LEFT OVERRIDE, les chercheurs ont réussi à rendre visible une chaîne nuisible écrite à l’envers, tout en la maintenant inversée dans les entrées et sorties analysées par les filtres d’Apple.

La chaîne nuisible a ensuite été encapsulée dans un second type d’attaque nommé Neural Exec, permettant d’override les instructions du modèle avec celles souhaitées par l’attaquant. Ainsi, ils ont réussi à faire en sorte que le modèle d’Apple agisse de manière incorrecte.

Évaluation de l’efficacité de l’attaque

Les chercheurs ont créé plusieurs pools d’entrée pour générer des prompts appropriés :

  • Prompts système : Une collection de tâches inclues.
  • Chaînes nuisibles : Chaînes conçues pour être considérées comme offensantes.
  • Entrées honnêtes : Paragraphes provenant d’articles Wikipedia, utilisés pour simuler des entrées non adversariales.

Au cours de l’évaluation, ils ont constaté un taux de réussite de 76 % sur 100 prompts choisis aléatoirement.

Après avoir informé Apple de cette faille en octobre 2025, la société a depuis renforcé ses systèmes contre cette attaque, des protections ayant été mises en place dans iOS 26.4 et macOS 26.4.

Pour lire le rapport complet, incluant les aspects techniques de l’attaque, consultez ce lien.

Partager un commentaire