
Lors de la récente WWDC, Apple a annoncé une évolution majeure : pour la première fois, les développeurs tiers pourront accéder directement aux modèles d’IA embarqués grâce au nouveau framework Foundation Models. Cela soulève des questions sur la performance de ces modèles par rapport à la concurrence.
Une évolution marquante pour les développeurs
Le framework Foundation Models permet désormais aux développeurs de tirer parti du même réseau d’IA embarqué utilisé par les applications natives d’Apple. Cela signifie qu’ils pourront intégrer des fonctionnalités d’IA telles que le résumé de documents, l’extraction d’informations clés dans les textes des utilisateurs, ou même la génération de contenu structuré, le tout entièrement hors ligne et sans coût d’API.
Des performances impressionnantes
Selon les évaluations humaines menées par Apple, ces modèles sont assez compétitifs, surtout si l’on considère le bon équilibre entre taille, rapidité et efficacité. Dans les tests d’Apple, son modèle embarqué de près de 3 milliards de paramètres a surpassé des modèles similaires tels que InternVL-2.5 et Qwen-2.5-VL-3B dans des tâches liées aux images, remportant plus de 46 % et 50 % des prompts, respectivement.
Capacités solides en traitement de textes
En ce qui concerne le traitement de textes, le modèle d’Apple s’est montré à la hauteur face à des modèles plus volumineux comme Gemma-3-4B, parvenant même à devancer certains résultats dans des évaluations multilingues, telles que le portugais, le français et le japonais.
Données locales et confidentialité
Le véritable intérêt réside dans le fait que les modèles d’Apple sont intégrés directement sur l’appareil. Grâce au framework Foundation Models, les développeurs n’ont plus besoin d’intégrer des modèles de langage lourds dans leurs applications pour traiter des données hors ligne. Cela permet de réduire la taille des applications et d’éviter de dépendre du cloud pour la plupart des tâches.
Apple précise que ces modèles sont optimisés pour des sorties structurées grâce à un système de « génération guidée » natif à Swift, permettant aux développeurs de cadrer les réponses du modèle directement dans la logique de l’application. Pour des applications dans l’éducation, la productivité et la communication, cela pourrait révolutionner l’expérience utilisateur, offrant les avantages des modèles de langage sans les inconvénients de latence, de coût ou de confidentialité.
En somme, même si les modèles d’Apple ne sont pas les plus puissants au monde, ils ne doivent pas l’être. Ils sont efficaces, rapides, et désormais à disposition de tous les développeurs gratuitement, en local et hors ligne. Cela pourrait bien engendrer une vague de fonctionnalités IA utiles dans les applications iOS tierces, sans nécessité de connexion au cloud.








