Récemment, une enquête a révélé qu’Apple et d’autres géants de la technologie utilisaient probablement les sous-titres de YouTube pour entraîner leurs modèles d’IA. Cet ensemble de données comprenait plus de 170 000 vidéos de créateurs comme MKBHD et Mr. Beast. Apple utiliserait cet ensemble de données pour entraîner ses modèles open source OpenELM, publiés en avril. Cependant, Apple a confirmé à 9to5Mac qu’OpenELM n’alimente aucune de ses fonctionnalités d’IA, y compris Apple Intelligence.

Apple a déclaré avoir créé le modèle OpenELM pour contribuer à la communauté de recherche et promouvoir le développement de grands modèles de langage open source. Dans le passé, les chercheurs d’Apple ont décrit OpenELM comme un « modèle de langage ouvert de pointe ». Apple souligne qu’OpenELM a été créé à des fins de recherche uniquement et n’est utilisé pour alimenter aucune fonctionnalité Apple Intelligence. Le modèle est publié en open source et est largement disponible, notamment sur le site de recherche Machine Learning d’Apple.
- Lire aussi : Retards pour Apple Intelligence, iPhone Mirroring et SharePlay en Europe en raison du DMA
Étant donné qu’OpenELM n’est pas utilisé dans le cadre d’Apple Intelligence, cela signifie que l’ensemble de données « Sous-titres YouTube » n’est pas utilisé pour alimenter Apple Intelligence. Dans le passé, Apple a déclaré que les modèles Apple Intelligence étaient formés » sur des données sous licence, y compris des données sélectionnées pour améliorer des fonctionnalités spécifiques, ainsi que des données accessibles au public collectées par notre robot d’exploration Web « .
Enfin, Apple a déclaré qu’elle n’avait pas l’intention de créer de nouvelles versions du modèle OpenELM. Comme le rapporte Wired, plusieurs sociétés telles qu’Anthropic et NVIDIA ont utilisé l’ensemble de données « YouTube Subtitles » pour entraîner leurs modèles d’IA. Cet ensemble de données fait partie d’une collection plus vaste appelée « The Pile », de l’association à but non lucratif EleutherAI.
Cette clarification d’Apple est importante pour dissiper toute inquiétude concernant l’utilisation des données pour entraîner leurs modèles d’IA. Il est intéressant de noter qu’Apple continue de séparer ses efforts de recherche de ceux destinés aux produits commerciaux, garantissant ainsi que la qualité et l’intégrité de leurs services restent intactes. Reste maintenant à voir comment Apple continuera à développer ses capacités d’intelligence artificielle, tout en maintenant des normes élevées de transparence et de qualité.









