
Apple a partagé les détails de sa participation à la conférence IEEE/CVF sur la vision par ordinateur et la reconnaissance des formes (CVPR) de cette année, dont la société est également sponsor.
Cette édition de la CVPR se tiendra du 3 au 7 juin au Colorado Convention Center à Denver, avec la participation d’Apple à travers des présentations par affichage et orales, des conférences invitées, une conférence plénière et des événements affinitaires.
Les recherches présentées par Apple
Voici les études qu’Apple présentera cette année à la CVPR, dont certaines ont déjà été couvertes dans le passé :
- AMUSE : Cadre de référence audio-visuel pour la compréhension multi-locuteur agentique
- AToken : Un tokenizeur unifié pour la vision
- Annonces de langue des signes par modèles de langue des signes
- DSO : Optimisation directionnelle directe pour l’atténuation du biais
- De l’emplacement des objets à leur fonction : Évaluation de l’intelligence spatial-fonctionnelle pour les LLM multimodaux
- Apprentissage d’embeddings de mouvement à long terme pour la génération cinématique efficace
- Pico-Banana-400K : Un ensemble de données à grande échelle pour la retouche d’image guidée par texte
- SO-Bench : Évaluation structurelle des modèles LLM multimodaux
- STARFlow-V : Modélisation générative vidéo de bout en bout avec des flux normalisants
- TrajTok : L’apprentissage des tokens de trajectoire améliore la compréhension vidéo
- UniGen-1.5 : Amélioration de la génération et de la retouche d’images grâce à l’unification des récompenses en apprentissage de renforcement
- Velox : Apprentissage des représentations de la géométrie et de l’apparence 4D
- VSAS-Bench : Évaluation en temps réel des modèles d’assistant visuel en streaming
- Ce qui compte dans la compression d’images apprises en pratique
Conférences et événements
Le chercheur d’Apple, Colin Lea, donnera également une conférence plénière lors de l’atelier sur l’IA générative pour la langue des signes (GenSign), suivie de trois autres conférences invitées avec des ingénieurs d’Apple, entre le 3 et le 4 juin.
Apple a confirmé que les chercheuses Hsin-Ping (Cindy) Huang et Maggie Xiao représenteront la société lors du dîner de mentorat Women in Computer Vision (WiCV).
Pour consulter le programme complet de la participation d’Apple à cette édition de la CVPR, suivez ce lien : Programme d’Apple à la CVPR.








