Actualité de l’IA
Mars en bref 🚀
La concurrence fait toujours rage avec des nouveautés à foison… C’est la sortie du modèle Gemini 2.5 Pro qui attire l’attention en prenant la tête des benchmarks… en attendant l’éventuelle sortie de ChatGPT 5 en avril.
Mais les plus grandes nouveautés de mars concernent la génération d’images :
-
Google permet de générer et modifier des images directement en dialoguant avec Gemini 2.0 Flash.
-
OpenAI lui emboîte le pas et crée la surprise avec 4o Image Generation, remplaçant DALL-E avec des capacités bien plus avancées (sa sortie déclenche les « trend » des images façon « Studio Ghibli » et « Starter Pack ».
-
Un nouveau venu, Reve Image 1.0, impressionne avec sa précision de rendu et l’intégration fluide de texte dans les images.
Enfin, côté vidéo, Runway dévoile Gen-4, qui mise sur la cohérence visuelle et narrative, essentiel pour le storytelling.
🔍 Affaire à suivre…
Les AI Overviews de Google
Google commence à déployer en Europe ses résumés générés par intelligence artificielle directement intégrés aux résultats de recherche. Bien que limités à certains pays pour l’instant (Allemagne, Suisse, Italie, Espagne), ces extraits automatiques pourraient bouleverser le référencement naturel. Une étude de Ahref évoque une baisse de 34.5 % du taux de clics sur le premier lien en présence d’un AI Overview. Un point à surveiller de près pour les professionnels du SEO et du marketing digital.
📰 Fait divers…
- Opera intègre un « browser operator », un agent IA autonome local, capable de réaliser des tâches de navigation sans intervention humaine.
- Zendesk Resolution est une nouvelle plateforme IA dédiée au service client, qui permet d’automatiser les réponses tout en maintenant un suivi humain fluide.
- Manus AI, développé par la startup Monica en Chine, attire l’attention pour ses capacités d’agent autonome, ce qui le rapproche du concept d’intelligence artificielle générale.
⏳ Dans l’actualité IA bientôt…
La sortie de Midjourney v7 est très attendue… ainsi que celle de ChatGPT 5 que l’on espère en avril.
Il est probable que nous assistions également à de nouvelles intégrations IA dans les outils de création et les réseaux sociaux.
🤖 Côté bots conversationnels
OpenAI
GPT-4.5 : Le mois de mars marque le lancement de GPT-4.5 en préversion. Ce nouveau modèle d’OpenAI améliore nettement l’expérience utilisateur avec des réponses plus naturelles, une meilleure compréhension des intentions et moins d’hallucinations. Il est accessible via l’abonnement ChatGPT Plus (20 $/mois), avec des limitations d’usages et une fenêtre de contexte de 128 000 tokens. Pour rappel, ce forfait donne également accès aux fonctions vocales et à la génération d’images, ainsi qu’à une utilisation limitée de Sora.
Gemini 2.5 Pro (expérimental) : Google renforce sa présence dans le domaine avec ce modèle, un modèle très performant notamment pour les tâches de raisonnement. Il dispose d’une fenêtre de contexte d’un million de tokens avec une extension à deux millions prévue prochainement. Cette différence peut être significative pour les tâches nécessitant l’analyse de documents très volumineux ou le suivi de longues conversations sans pertes de contexte. Proposé d’abord aux abonnés Gemini Advanced (20 $/mois – 100 requêtes par jour), il est désormais accessible gratuitement sur Google AI Studio avec limitations d’usage (25 requêtes par jour – fenêtre de contexte limitée à 32 000 tokens).
Gemma 3 : Google a aussi lancé ce modèle open source multimodal pour les développeurs, plus léger et conçu pour tourner efficacement sur des appareils à faibles ressources.
🎨 Coté génération d’images & vidéo
Gemini 2.0 Flash : Google propose désormais dans AI Studio une nouvelle fonctionnalité de génération et d’édition d’images via ce modèle. L’utilisateur peut, en langage naturel, demander des ajustements de couleurs, de lumières ou transformer des objets dans l’image.
OpenAI
4o Image Generation : Depuis le 25 mars, DALL-E a été remplacé par ce modèle dans ChatGPT Plus. Ce nouveau modèle permet une génération plus fidèle aux prompts, l’insertion de texte lisible et une meilleure cohérence visuelle. Il peut gérer jusqu’à 20 objets dans une seule image et poursuivre le dialogue pour affiner le rendu. Les utilisateurs gratuits sont limités à quelques générations par jour et contraints par la disponibilité des serveurs. Les abonnés « Plus » disposent d’un quota de 200 images / jour et un accès prioritaire même en période de forte affluence.
Sora : Autre nouveauté, l’outil de génération vidéo d’OpenAI, est enfin accessible en Europe pour les abonnés ChatGPT Plus et Pro. Sora permet de générer des vidéos de grande qualité à partir d’une description textuelle ou d’une image de référence (jusqu’à 20 secondes en Full HD). Il n’est pas accessible gratuitement, mais permet l’édition de 50 vidéos prioritaires avec l’abonnement Plus de ChatGPT (1000 crédits), en 720P, mais malheureusement avec filigrane… Il faudra donc un abonnement « Pro », au prix toujours excessif de 200$ mensuel pour en tirer parti avec 500 vidéos par mois (1080p, jusqu’à 20 secondes et 5 vidéos simultanées. Ce positionnement commercial ne concurrence dont pas vraiment RunwayML.
Reve AI
Reve Image 1.0 : La plateforme Reve AI fait parler d’elle avec ce nouveau modèle. Ce modèle open source se démarque par sa fidélité aux prompts et sa capacité à insérer du texte lisible dans les images. Il surpasse Midjourney v6.1 selon plusieurs classements. Il est accessible gratuitement en version test sur preview.reve.art.
Runway
Gen-4 (certaines fonctionnalités sont toutefois encore en développement) : Lancé le 31 mars, Gen-4 est le dernier modèle de génération vidéo de RunwayML. Il marque une avancée majeure, notamment par sa capacité à maintenir une cohérence visuelle des personnages, objets et décors tout au long d’une séquence. Le modèle fonctionne à partir d’une seule image de référence (appelée « image de départ ») — il n’est pour l’instant pas possible de générer une vidéo à partir de texte seul.
Il simule également des mouvements réalistes et des interactions physiques crédibles. Le contrôle cinématographique est assuré par le prompting, avec des améliorations notables en termes de fluidité et de réalisme. Il est possible de régénérer une scène sous différents angles de caméra et de combiner des séquences filmées avec des contenus générés. L’accès est réservé aux utilisateurs abonnés.
Ideogram
Ideogram 3.0 : Un petit nouveau, lancé le 26 mars. Ideogram se distingue par sa précision dans l’intégration du texte dans les images. Il devient un concurrent sérieux de Reve Image 1.0 et du futur Midjourney v7.
Plan | Prix | Crédits / Mois | Avantages |
---|---|---|---|
Gratuit | 0 € | 40 images / semaine | Format JPG, droits libres |
Basic | 8 $ / mois | 3 200 – 8 000 images | Qualité PNG, génération prioritaire |
Pro | 60 $ / mois | 28 000 images (3 500 crédits) | Génération en masse (CSV), outils avancés |