La plupart des propriétaires d’iPhone ne voient pour l’instant que peu ou pas de valeur dans l’Apple Intelligence, une situation que la firme de Cupertino souhaite changer. Le mois dernier, Apple a annoncé le report du déploiement de ses fonctionnalités Siri plus personnalisées et puissantes. Alors qu’elle s’efforce de rectifier la situation en vue des futures mises à jour, Bloomberg met en lumière un changement dans la manière dont Apple entraîne ses modèles d’intelligence artificielle.

Selon un article de blog sur le site de recherche en apprentissage automatique d’Apple, la société utilise généralement des données synthétiques pour entraîner ses modèles d’IA. Cependant, cette méthode présente des limites, notamment la difficulté pour des données synthétiques de saisir des tendances dans des outils comme les résumés ou l’écriture de phrases plus longues et de messages d’emails entiers.

Une technologie innovante pour améliorer l’expérience utilisateur

Pour surmonter cette limitation, Apple met en avant une nouvelle technologie qu’elle commencera bientôt à utiliser, comparant les données générées synthétiquement à un petit échantillon d’emails récents d’utilisateurs, tout en préservant leur vie privée :

« Pour améliorer nos modèles, nous devons générer un ensemble d’emails synthétiques qui couvrent les sujets les plus courants dans les messages. Afin de créer un ensemble représentatif, nous commençons par créer un grand nombre de messages synthétiques sur divers sujets. Par exemple, nous pourrions créer un message synthétique : ‘Voulez-vous jouer au tennis demain à 11h30 ?’

Ce processus se fait sans aucune connaissance des emails récents des utilisateurs. Nous déduisons ensuite une représentation, appelée ’embedding’, de chaque message synthétique qui capte certaines dimensions clés comme la langue, le sujet et la longueur. Ces embeddings sont ensuite envoyés à un petit nombre d’appareils utilisateur qui ont choisi d’opter pour l’Analyse des Appareils.

Les appareils participants sélectionnent ensuite un échantillon d’emails récents et calculent leurs embeddings. Chaque appareil décide alors quel embedding synthétique est le plus proche de ces échantillons. Grâce à la confidentialité différentielle, Apple peut alors analyser les embeddings synthétiques les plus souvent sélectionnés à travers tous les appareils, sans savoir quel embedding a été choisi sur un appareil donné.

Vers une amélioration continue des modèles

Les embeddings synthétiques les plus fréquemment sélectionnés peuvent ensuite être utilisés pour générer des données d’entraînement ou de test, ou pour lancer d’autres étapes de curation afin d’affiner davantage l’ensemble de données. Par exemple, si le message sur le tennis est l’un des top embeddings, un message similaire remplaçant ‘tennis’ par ‘football’ ou un autre sport pourrait être créé et ajouté à l’ensemble pour la prochaine étape de curation.

Apple souligne que ces techniques lui permettent de « comprendre les tendances globales, sans apprendre d’informations sur des individus spécifiques ». Bloomberg précise qu’Apple déploiera ce nouveau système dans une future version bêta d’iOS 18.5 et macOS 15.5.

Pour plus de détails, vous pouvez consulter l’article complet sur le site de recherche en apprentissage automatique d’Apple.

Partager un commentaire