Apple utilise déjà son propre chatbot IA en interne, mais un nouveau document interne révèle que le système sera conçu pour permettre à la technologie de type ChatGPT de fonctionner sur l’iPhone.

Apple GPT, ChatGPT

Un deuxième article d’Apple AI examine les moyens de générer des avatars 3D animés à partir d’une vidéo standard, avec une référence évidente au Vision Pro.

L’article lié au chatbot s’intitule LLM in a flash : Efficient Large Language Model Inference with Limited Memory. Le « flash » dans le titre est un jeu de mots, car il s’agit de minimiser la quantité de données qui doivent être transférées de la mémoire flash vers la RAM. LLM est le terme générique désignant les systèmes de chat IA formés sur de grandes quantités de texte.

« Les LLM ont des exigences gourmandes en calcul et en mémoire qui présentent plusieurs défis, en particulier pour les appareils dotés d’une capacité DRAM limitée. Cet article aborde le défi de la gestion efficace des LLM qui dépassent la capacité DRAM disponible en stockant les paramètres du modèle sur la mémoire flash mais en les portant sur la DRAM à la demande.

Notre méthode consiste à construire un modèle qui s’harmonise avec le comportement de la mémoire flash, nous guidant pour optimiser dans deux domaines critiques : réduire le volume de données transférées depuis la mémoire flash et lire les données dans des blocs plus grands et plus contigus. Cette avancée est particulièrement cruciale pour la mise en œuvre de LLM avancés dans des environnements à ressources limitées, élargissant ainsi leur applicabilité et leur accessibilité. »

Cette approche permet aux LLM de s’exécuter jusqu’à 25 fois plus rapidement sur des appareils limités en RAM.

chatgpt 4 apple iphone

Quant aux avatars 3D animés générés à partir de vidéos « plates », Apple suppose que tous les utilisateurs disposent de beaucoup de vidéos « plates » (monoculaires), et souhaite donc développer une méthode pour transformer des vidéos 2D en avatars 3D animés.

Le document indique que, généralement, si vous souhaitez générer un avatar 3D réaliste, vous avez besoin d’une configuration multi-caméras pour capturer des images sous différents angles, en les combinant dans un modèle 3D. Ce qu’Apple souhaite proposer, c’est une méthode pour y parvenir à partir d’une très courte séquence standard.

L’article est profondément technique, avec même le résumé et les conclusions pleins d’acronymes, mais le fait est que la méthode d’Apple est environ cent fois plus rapide que les méthodes existantes pour obtenir le même résultat.

Il est actuellement impossible de savoir quand tout cela sortira, mais il est probable qu’au moins la partie liée au chatbot pourrait arriver avec iOS 18 en 2024.

Partager un commentaire