
MacWhisper est depuis longtemps l’un des moyens les plus efficaces et simples pour transcrire des enregistrements sur Mac. Je m’en sers régulièrement depuis son lancement, et je ne saurais trop le recommander. Aujourd’hui, cette application devient encore plus performante grâce à une mise à jour ajoutant la prise en charge du modèle Parakeet d’Nvidia, connu pour sa rapidité incroyable.
Une avancée remarquée alors qu’OpenAI se tourne vers d’autres horizons
Lorsque OpenAI a présenté sa famille de modèles de transcription Whisper, ils semblaient presque magiques. Leur rapidité et leur précision surpassaient de loin tout ce qui existait, notamment dans le marché open-source. Cependant, avec le recentrage d’OpenAI sur des modèles plus commercialisables comme les modèles gpt-4o-transcribe, Whisper a commencé à montrer des signes de vieillissement.
Parakeet : la nouvelle étoile de la transcription
Le modèle Parakeet d’Nvidia, lancé le mois dernier, a promis de transcrire « 60 minutes d’audio en seulement 1 seconde », à condition d’avoir le matériel adéquat comme les GPUs A100, H100, T4, ou V100. Bien que Parakeet soit disponible via des outils open-source, beaucoup ne sont pas à l’aise avec les interfaces en ligne de commande ou la gestion des déploiements de modèles personnalisés.
Un ajout révolutionnaire pour MacWhisper
Heureusement, cela change aujourd’hui : MacWhisper a ajouté la prise en charge du modèle Parakeet, qui révèle une rapidité incroyable. Selon le développeur de l’application, Jordi Bruin: « Grâce à notre collaboration avec l’équipe d’Argmax, MacWhisper prend désormais en charge les modèles Parakeet. Pour vous montrer l’ampleur de cette innovation, regardez le gif ci-dessous où nous transcrivons et diarisons un podcast de 30 minutes en moins de 8 secondes ! »
J’ai testé cette fonctionnalité sur mon MacBook Pro M2 Pro avec un épisode récent de 3 heures de Happy Hour, et cela a pris seulement 1 minute et 22 secondes, avec reconnaissance des locuteurs incluse.
Il est important de noter que le modèle Parakeet est disponible pour les utilisateurs Pro et prend actuellement en charge uniquement la transcription en anglais. Bruin a mentionné qu’une version multilingue sera bientôt disponible.








