Actualité de l’IA
Février en bref 🚀
Ce mois-ci, c’est encore (et plus que jamais…) la compétition entre les grands modèles du marché qui rivalisent dans une course effrénée pour décrocher la première place dans les benchmarks.
OpenAI fait grand bruit en début de mois en déployant Deep Research, mais Grok-3 (xAI) vole rapidement la vedette en démontrant des capacités impressionnantes.
En fin de mois, l’appli « Le Chat » de Mistral, présentée avec fierté lors du Salon de Paris et soutenue par les institutions françaises, suscite elle aussi un certain engouement, rappelant que la France sait mettre en place des modèles performants.
C’est finalement la sortie de « Claude 3.7 Sonnet » d’Anthropic, le premier modèle « hybride » (il active sa fonction raisonnement uniquement quand il en a besoin sur des problématiques complexe) qui attire tous les regards.
Ces modèles « Hybrides » semblent l’avenir et c’est également l’angle annoncé par OpenAI pour le futur ChatGPT 5. Bientôt nous en aurons fini avec les modèles séparés selon les tâches que nous effectuons…
Il faut noter aussi que les directives de l’AI Act entrent en vigueur sur le territoire Européen ce mois-ci avec des limites claires à ne pas dépasser en matière d’Intelligence Artificielle.
🌐 Régulation
L’Europe précise son cadre légal et la France débat sur l’Intelligence Artificielle
- AI Act : En vigueur dans l’UE dès février 2025, il impose des règles communes pour le développement et l’utilisation de l’IA, avec un accent sur la transparence et le respect de la vie privée.
- Sommet pour l’action sur l’IA à Paris : Parmi les annonces, la création de la fondation Current AI pour superviser le développement de l’IA, inciter à la collaboration entre acteurs et renforcer la confiance du public dans ces technologies.
- Anthropic publie (et s’engage à mettre à jour régulièrement) un focus sur l’impact économique de l’IA aux USA : The Anthropic Economic Index : Cette étude inédite évalue l’impact social et économique de l’IA sur le marché américain. L’enjeu est d’anticiper la transformation du travail et d’informer les décideurs politiques comme les entreprises
🔍 Faits divers…
Apple (Siri)
Appel fait l’objet de poursuites judiciaires en France et relance les inquiétudes sur la questions de la confidentialité des données :
- Action en justice : La Ligue des Droits de l’Homme française (LDH) a déposé plainte contre Siri pour violation de la vie privée et traitement illicite des données personnelles, à la suite de révélations d’un sous-traitant lanceur d’alerte sur l’écoute potentielle de conversations privées. Il devait traiter 1 300 enregistrements « accidentels » par jour qui lui permettaient d’entendre des contenus privés. Plus d’infos
⏳ Dans l’actualité IA bientôt…
Pour tout dire, OpenAI ne voulant décidemment pas être le dernier de la course, il a également sorti :
– ChatGPT 4.5 le 27 février.
– Sora (son modèle IAG image & Vidéo) qui n’était pas disponible en Europe, le 28 février.
Comme ChatGPT 4.5 n’est disponible que pour les abonnés « Pro » (200 $/mois) et sera dispo pour les autres sans doute en mars… nous parlerons de tout cela dans l’actu de mars.
🤖 Côté bots conversationnels
OpenAI (ChatGPT)
OpenAI implémente la fonctionnalité Deep Research et précise les intentions autour de l’attendu GPT5 :
- Deep Research (3 février) : Cette fonctionnalité ouverte aux abonnés Pro le 3 février (100 à 120 requêtes mensuelles) est en cours de déploiement depuis le 26 février aux abonnés Plus (10 requêtes mensuelles). Elle génère des rapports détaillés sur de multiples sources en parcourant le web de manière autonome, sur une durée allant de 5 à 30 minutes. A terme elle sera disponible également sur l’appli.
- Vers GPT5 : OpenAI prévoit de fusionner ses différents modèles d’IA, l’objectif est de rassembler les meilleures capacités de chaque modèle en seul, afin de faciliter l’accès à l’IA pour le grand public.
- Fonctions vocales avancées : Désormais disponibles pour les abonnés ChatGPT Plus, elles permettent de donner des consignes ou de faire lire des textes par ChatGPT, favorisant un usage mains libres et une meilleure accessibilité. Elles permettent aussi de partager la caméra de son smartphone pour discuter avec ChatGPT de ce qu’on lui montre.
xAI (Grok)
xAI (Elon Musk) lance Grok-3, qui dispose d’un abonnement illimité :
- Grok-3 (17 février) : Cette nouvelle version, disponible pour les abonnés Premium+ de la plateforme X (ex. Twitter), propose un style plus direct et moins filtré. Gratuit mais avec des limitations, Grok-3 a déjà atteint un score historique de 1 402 sur Chatbot Arena. Pendant ce temps, Grok-2 sera progressivement rendu open source.
- SuperGrok : Un abonnement illimité à 30 $/mois est annoncé, promettant un accès sans restriction aux performances avancées de l’IA.
- Positionnement : xAI se distingue par un ton plus libre et moins censuré que certains concurrents, ainsi qu’un lien direct avec la base de données de la plateforme X, ce qui soulève des polémiques.
- Les fonctions vocales (26 février), disposent également parmi les personnalités disponibles (conteur, romantique, sexy et explicite…) d’un mode « désinhibé » capable de hurler et d’insulter…
Google (Bard/Gemini)
Google élargit la gamme de modèles Gemini 2.0 et lance de nouvelles déclinaisons :
- Flash : Édition générale du modèle, offrant une latence réduite et des performances accrues pour les recherches web ou tâches conversationnelles.
- Flash-Lite : Variante conçue pour fonctionner sur des configurations plus modestes, tout en restant plus rapide que la précédente version 1.5 Flash.
- Pro Experimental : Capable de traiter jusqu’à 2 millions de tokens, pratique pour analyser de longs textes ou des bases de données massives.
- Flash Thinking Experimental : Met l’accent sur le raisonnement avancé et la capacité à expliquer la logique des réponses, ce qui rassure les professionnels.
Toutes ces versions sont accessibles via Google AI Studio et Vertex AI, simplifiant l’intégration dans des projets variés.
- Finger printing : Google utilise une technologie de suivi basée sur les données du navigateur. L’objectif affiché est d’améliorer la pertinence et la personnalisation des réponses, tout en soulevant des questions sur la confidentialité.
Mistral (Le Chat)
« Le Chat », l’application smartphone de Mistral est sortie et a été adoptée massivement :
- Sortie à l’occasion du salon de Paris (6 février), elle est massivement adoptée : Proposant des réponses jusqu’à 1 000 mots par seconde, cette appli IA française a déjà séduit plus d’un million d’utilisateurs en deux semaines. Elle mise sur la réactivité et la fluidité, rendant les conversations rapides et personnalisées.
Microsoft (Copilot / Bing Chat)
Microsoft continue l’implémentation des modèles ChatGPT d’OpenAI dans ses outils :
- GPT4.5 dans Copilot : Cette mise à jour dote les outils bureautiques (Word, Excel, PowerPoint) et le navigateur Edge de fonctions IA plus performantes, facilitant la rédaction ou l’assistance au code.
- GPT5 : L’intégration est prévue pour fin mai, promettant une nouvelle évolution majeure des capacités de Copilot.
- Paint (Windows 11) : Grâce à DALL-E, il devient possible de générer des images à partir de simples descriptions textuelles, ouvrant de nouvelles perspectives pour la création et l’illustration.
- Copilot Studio : Offert en mode Pay-as-you-go, il permet à chacun de concevoir et d’ajuster ses propres modèles IA, en profitant de l’infrastructure Microsoft.
Anthropic (Claude)
Anthropic sort un nouveau modèle !
Claude 3.7 Sonnet (24 février) : Anthropic a dévoilé la dernière évolution de son modèle IA, intégrant un « raisonnement hybride » qui permet aux utilisateurs de choisir entre des réponses rapides ou des analyses plus approfondies.
Claude dispose d’un « bloc note » où on accède à sa réflexion, qu’on peut interrompre pour affiner des consignes.
En parallèle, Anthropic a introduit Claude Code, un outil dédié aux développeurs pour automatiser des tâches directement depuis leur terminal.
🎨 Coté génération d’images & vidéo
Adobe (Firefly)
Firefly améliore son workflow de création :
- Mode rapide : Firefly génère d’abord une version basse résolution pour un aperçu instantané, puis passe à une qualité 2K moyennant un crédit, optimisant à la fois vitesse et qualité.
- Traduction audio/vidéo : Les utilisateurs peuvent désormais traduire leur contenu multimédia, simplifiant la localisation de vidéos et de podcasts pour toucher un public international.
- Fonctionnalités à venir : « Optimiser la parole » pour améliorer la clarté ou la tonalité d’un enregistrement vocal, et « Du texte à l’avatar » pour concevoir des personnages virtuels ou modèles 3D à partir d’une simple description.
Midjourney (Midjourney)
Midjourney implémente de nouvelles fonctionnalités et annonce l’arrivée de la vidéo dans la future version :
- Fusion de références stylistiques et de mood boards : Dès février, on peut combiner plusieurs inspirations visuelles pour générer des rendus cohérents et esthétiques, pratique pour le design, la mode ou la conception artistique.
- Version 7 : Prévue en fin de mois, elle devrait proposer des fonctions de création vidéo et de rendu 3D, confirmant l’élargissement de Midjourney au-delà de l’image fixe.