Google affirme que Gemini 2.5 surpasse les meilleurs modèles dOpenAI, DeepSeek et dautres géants de lIA

Google vient de lancer Gemini 2.5, que la société qualifie de « modèle d’IA le plus intelligent à ce jour ». La première version du modèle était le Gemini 2.5 Pro, qui a obtenu des scores de référence impressionnants dans de nombreux tests.

Google affirme que Gemini 2.5 surpasse les meilleurs modèles d'OpenAI, DeepSeek et d'autres géants de la technologie de l'IA

Gemini 2.5 Pro est désormais disponible via Google AI Studio et dans l'application Gemini si vous êtes un utilisateur Gemini Advanced . Le Gemini 2.5 Pro sera également disponible via Vertex AI dans un avenir proche.

Google n'a pas communiqué de prix pour le Gemini 2.5 Pro ou d'autres modèles Gemini 2.5 pour le moment.

Tous les modèles utilisant Gemini 2.5 sont des « modèles de réflexion », ce qui signifie qu'ils peuvent traiter le processus de réflexion avant de générer une réponse. Ces modèles de « raisonnement » constituent la prochaine grande étape dans l’espace de l’IA car ils génèrent des réponses plus complexes et souvent plus précises.

« Maintenant, avec Gemini 2.5, nous avons atteint un nouveau niveau de performance en combinant un modèle de base considérablement amélioré avec une post-formation améliorée », a déclaré Google.

« À l’avenir, nous intégrerons ces capacités de réflexion directement dans tous nos modèles afin qu’ils puissent gérer des problèmes plus complexes et aider les agents à mieux comprendre le contexte . »

Comment Gemini 2.5 se compare-t-il aux modèles OpenAI ?

Google affirme que Gemini 2.5 surpasse les meilleurs modèles d'OpenAI, DeepSeek et d'autres géants de l'IA
Benchmark Google Gemini 2.5

Les modèles Gemini 2.5 Pro de Google surpassent les précédents modèles haut de gamme d'OpenAI et de DeepSeek.

Les scores de référence pour Gemini 2.5 partagés par Google sont assez impressionnants. Gemini 2.5 Pro Experimental a obtenu un score de 18,5 % au dernier examen de l'humanité.

Ce score signifie que, du moins pour l'instant, le Gemini 2.5 Pro Experimental est le meilleur modèle selon cette mesure. Son score surpasse OpenAI 03-mini (14%) et DeepSeek R1 (8,6%).

Ce test particulier est considéré comme difficile, bien qu’il ne soit pas le seul moyen de mesurer les performances d’un modèle d’IA.

Google a également mis en avant les capacités de programmation du Gemini 2.5 Pro et les références du modèle en mathématiques et en sciences. Gemini 2.5 Pro est actuellement leader dans les tests de performances mathématiques et scientifiques tels que mesurés par GPQA et AIME 2025.

Est-il possible de programmer en Gemini 2.5 ?

La programmation est l’objectif principal de Gemini 2.5. Google affirme qu'il s'agit d'un « énorme bond en avant par rapport à la version 2.0 » et laisse entendre que d'autres améliorations sont à venir.

Le nouveau modèle de Google permet de créer des applications Web et des applications de code agentique. Une démo de Google montre le Gemini 2.5 Pro utilisé pour créer un jeu à partir d'une invite de ligne unique.

4 raisons pour lesquelles Gemini 2.5 Pro de Google est important pour l'IA d'entreprise

Voici quatre points clés à garder à l’esprit pour les équipes d’entreprise lors de l’évaluation du Gemini 2.5 Pro.

1. Raisonnement structuré et transparent – ​​une nouvelle norme pour la clarté de la pensée

Ce qui distingue le Gemini 2.5 Pro, ce n'est pas seulement son intelligence : c'est la façon dont cette intelligence démontre clairement son travail. La méthode de formation étape par étape de Google crée un train de pensée structuré (CoT) qui ne ressemble pas à des divagations ou à des conjectures, comme ce que nous avons vu à partir de modèles comme DeepSeek . Ces CoT ne sont pas tronqués en résumés superficiels comme les modèles d'OpenAI. Le nouveau modèle Gemini présente les idées en étapes numérotées, avec des sous-puces et une logique interne extrêmement claire et transparente.

Concrètement, il s’agit d’une avancée majeure en termes de fiabilité et de navigabilité. Les utilisateurs professionnels qui évaluent les résultats de tâches critiques (comme l’examen des implications politiques, le codage de la logique ou la synthèse de recherches complexes) peuvent désormais voir comment le modèle a trouvé la réponse. Cela signifie qu’ils peuvent valider, corriger ou rediriger les réponses avec plus de confiance. Il s’agit d’un grand pas en avant par rapport à la sensation de « boîte noire » qui persiste encore dans de nombreux résultats de grands modèles de langage (LLM) .

Pour un guide plus détaillé sur les performances de ce modèle, consultez la vidéo de présentation où le Gemini 2.5 Pro est testé en direct. Un exemple discuté : lorsqu'on lui a demandé quelles étaient les limites des grands modèles de langage, Gemini 2.5 Pro a fait preuve d'une conscience remarquable. Il décrit les faiblesses courantes et les catégorise en domaines tels que « l’intuition physique », « la synthèse de nouveaux concepts », « la planification à long terme » et « la nuance éthique », fournissant un cadre qui aide les utilisateurs à comprendre ce que le modèle sait et comment aborder le problème.

Les équipes d’ingénierie d’entreprise peuvent exploiter cette capacité pour :

  • Déboguer des chaînes logiques complexes dans des applications critiques
  • Meilleure compréhension des limites des modèles dans des domaines spécifiques
  • Fournir aux parties prenantes des décisions plus transparentes basées sur l'IA
  • Améliorer leur propre esprit critique en étudiant l'approche du modèle

Une limitation notable est que, bien que ce raisonnement structuré soit disponible dans l’application Gemini et Google AI Studio, il n’est actuellement pas accessible via l’API — une lacune pour les développeurs cherchant à intégrer cette capacité dans les applications d’entreprise.

2. Un véritable prétendant à la technologie de pointe – pas seulement en théorie

Le modèle est actuellement en tête du classement Chatbot Arena avec une marge significative – plus de 35 points Elo devant le meilleur modèle suivant, notamment la mise à jour OpenAI 4o lancée le lendemain du lancement de Gemini 2.5 Pro. Et même si la domination des benchmarks est souvent éphémère (car de nouveaux modèles sont lancés chaque semaine), le Gemini 2.5 Pro est vraiment différent.

Google affirme que Gemini 2.5 surpasse les meilleurs modèles d'OpenAI, DeepSeek et d'autres géants de l'IA

Il excelle dans les tâches qui récompensent un raisonnement approfondi : l'encodage, la résolution nuancée de problèmes, la synthèse de documents et même la planification abstraite. Lors des tests internes, il s'est particulièrement bien comporté sur des tests auparavant difficiles comme « Humanity's Last Exam », un test populaire pour détecter les faiblesses des LLM dans des domaines abstraits et nuancés.

Les groupes d’entreprises ne se soucient peut-être pas de savoir quel modèle remporte quel classement académique. Mais ils se soucieront du fait que ce modèle puisse penser – et vous montrer comment il pense. Le test de vibration est très important.

Comme l'a souligné Nathan Lambert, ingénieur en IA respecté : « Google dispose à nouveau des meilleurs modèles, car c'est lui qui aurait dû lancer ce boom de l'IA. La grande erreur a été corrigée. » Les utilisateurs professionnels doivent considérer cela non seulement comme une tentative de Google de rattraper ses concurrents, mais aussi comme une tentative potentielle de les surpasser dans des capacités importantes pour les applications professionnelles.

3. Enfin, le système de cryptage de Google est puissant

Traditionnellement, Google est à la traîne par rapport à OpenAI et Anthropic en termes de support de codage axé sur les développeurs. Le Gemini 2.5 Pro change cela.

Lors de tests pratiques, il a démontré de solides capacités de résolution de problèmes de codage en une seule fois, notamment la création d'un jeu Tetris fonctionnel qui s'est exécuté du premier coup lors de l'exportation vers Replit, sans débogage requis. Plus remarquable encore, il explique clairement la structure du code, étiquette soigneusement les variables et les étapes et présente son approche avant d’écrire une seule ligne de code.

Ce modèle est en concurrence avec Claude 3.7 Sonnet d'Anthropic, considéré comme le leader de la génération de code et l'une des principales raisons du succès d'Anthropic dans l'entreprise. Mais Gemini 2.5 offre un avantage important : une fenêtre de contexte de jeton massive pouvant atteindre 1 million. Claude 3.7 Sonnet ne propose actuellement que 500 000 jetons.

Cette grande fenêtre contextuelle ouvre de nouvelles possibilités de raisonnement sur l'ensemble de la base de code, de lecture de la documentation en ligne et de travail sur plusieurs fichiers interdépendants. L’expérience de l’ingénieur logiciel Simon Willison démontre cet avantage.

Lors de l'utilisation de Gemini 2.5 Pro pour implémenter une nouvelle fonctionnalité dans notre base de code, le modèle a identifié les modifications nécessaires dans 18 fichiers différents et a terminé l'ensemble du projet en environ 45 minutes, avec une moyenne de moins de 3 minutes par fichier modifié. Il s’agit d’un outil sérieux pour les entreprises qui expérimentent des frameworks d’agents ou des environnements de développement basés sur l’IA.

4. Intégration multi-méthodes avec un comportement de type agent

Alors que certains modèles comme le dernier 4o d'OpenAI peuvent afficher plus d'éclat avec une génération d'images accrocheuses, le Gemini 2.5 Pro donne l'impression de redéfinir tranquillement à quoi ressemble le raisonnement multimodal fondé.

Dans un exemple, une expérience pratique menée par Ben Dickson pour VentureBeat a démontré la capacité du modèle à extraire des informations clés d'un article technique sur les algorithmes de recherche et à générer un diagramme de flux SVG correspondant, puis à améliorer ce diagramme de flux lorsqu'une version rendue avec des erreurs visuelles lui est présentée. Ce niveau de raisonnement multimodal permet la création de nouveaux flux de travail qui n’étaient auparavant pas possibles avec des modèles uniquement textuels.

Dans un autre exemple, le développeur Sam Witteveen a téléchargé une simple capture d'écran d'une carte de Las Vegas et a demandé quels événements Google se déroulaient à proximité le 9 avril. Le modèle a identifié l'emplacement, déduit l'intention de l'utilisateur, effectué une recherche en ligne et renvoyé des détails précis sur Google Cloud Next, notamment la date, l'emplacement et la citation. Tout cela est réalisé sans framework d’agent personnalisé, juste le modèle de base et la recherche intégrée.

En fait, ce modèle de raisonnement d’entrée multimodal va au-delà de la simple observation. Il suggère à quoi pourrait ressembler un flux de travail d'entreprise dans 6 mois : téléchargez des documents, des diagrammes et des tableaux de bord, et laissez le modèle synthétiser, planifier ou prendre des mesures significatives en fonction du contenu.

Sign up and earn $1000 a day ⋙

Leave a Comment

Google lance Career Dreamer, son dernier outil dIA pour vous aider à choisir la carrière idéale

Google lance Career Dreamer, son dernier outil dIA pour vous aider à choisir la carrière idéale

Que vous fassiez vos premiers pas sur le marché du travail ou que vous changiez de secteur, le Career Dreamer expérimental de Google est conçu pour vous mettre en relation avec des postes compatibles.

Google développe un outil dachat basé sur lIA qui permet aux utilisateurs dessayer des robes et des chemises à la maison

Google développe un outil dachat basé sur lIA qui permet aux utilisateurs dessayer des robes et des chemises à la maison

L'année dernière, Google a introduit dans la recherche un assistant d'achat basé sur l'IA qui permet aux utilisateurs d'avoir une idée visuelle de l'apparence d'un vêtement sur un type de corps spécifique.

Google développe un algorithme dIA capable de diagnostiquer les maladies de la peau et la tuberculose

Google développe un algorithme dIA capable de diagnostiquer les maladies de la peau et la tuberculose

Google s’intéresse de plus en plus au domaine des applications de l’intelligence artificielle en médecine.

Google confirme un problème avec Chromecast de deuxième génération et Chromecast Audio

Google confirme un problème avec Chromecast de deuxième génération et Chromecast Audio

Après quelques jours de confusion, Google a officiellement confirmé le problème avec le Chromecast de deuxième génération et le Chromecast Audio.

Comment activer et utiliser Google Assistant sur Chrome Android

Comment activer et utiliser Google Assistant sur Chrome Android

Google abandonne progressivement son ancienne technologie de reconnaissance vocale et la remplace par son assistant virtuel Assistant.

ChatGPT Search ou Google est-il meilleur ?

ChatGPT Search ou Google est-il meilleur ?

De nombreuses personnes essaient depuis longtemps de voir s’ils peuvent réellement remplacer Google par l’extension Chrome ChatGPT Search.

Google supprime officiellement les extensions Manifest V2 dans Chrome

Google supprime officiellement les extensions Manifest V2 dans Chrome

Cela a pris du temps et le jour est enfin arrivé. Les utilisateurs signalent que leur ancienne extension Manifest v2 est supprimée de Chrome. Et maintenant ?

Google déploie la mise à jour Pixel de décembre, principalement liée à Gemini

Google déploie la mise à jour Pixel de décembre, principalement liée à Gemini

Cette dernière mise à jour introduit des améliorations liées à l'appareil photo, aux outils audio et visuels et, surtout, à Gemini, l'assistant IA de Google.

9 applications Google utiles qui ne sont pas préinstallées sur les téléphones Android

9 applications Google utiles qui ne sont pas préinstallées sur les téléphones Android

Si vous aimez les services Google, ces applications moins connues peuvent ajouter une valeur surprenante à votre appareil.

Google splits with Qualcomm, opts for MediaTeks 5G modem for Pixel 10 series

Google splits with Qualcomm, opts for MediaTeks 5G modem for Pixel 10 series

Google has decided to end its long-standing partnership with Qualcomm and instead use MediaTeks T900 modem in the Pixel 10 series.

La recherche sociale de Perplexity a besoin de ces 3 fonctionnalités pour concurrencer Google

La recherche sociale de Perplexity a besoin de ces 3 fonctionnalités pour concurrencer Google

Le moteur de recherche habituel de Perplexity est excellent, mais sa fonction de recherche sociale laisse beaucoup à désirer. Avant même que Perplexity puisse penser à concurrencer Google dans ce domaine, il a besoin de ces nouvelles fonctionnalités.

Ce petit changement rendra l’accès à vos mots de passe Google beaucoup plus facile !

Ce petit changement rendra l’accès à vos mots de passe Google beaucoup plus facile !

Bien que le gestionnaire de mots de passe de Google soit une solution fiable, pour y accéder, vous devez fouiller dans les paramètres de Chrome.

La version gratuite de Gemini vient de supprimer une limitation majeure

La version gratuite de Gemini vient de supprimer une limitation majeure

En tant que l'un des modèles d'IA de texte en image les plus puissants, Imagen 3 de Google est déjà disponible sur les applications Gemini, mais seulement dans une certaine mesure.

Le mode IA de Google peut désormais afficher et rechercher des images

Le mode IA de Google peut désormais afficher et rechercher des images

Google ajoute des fonctionnalités multimodales à son chatbot AI Mode axé sur la recherche, lui permettant d'afficher et de répondre à des questions sur les images, tout en élargissant l'accès à AI Mode à des millions d'utilisateurs supplémentaires.

LIA de Google peut concevoir des puces plus rapidement et mieux que les humains

LIA de Google peut concevoir des puces plus rapidement et mieux que les humains

Grâce à une architecture de réseau neuronal complexe basée sur des graphes de bord, le modèle d'IA de Google Brain peut concevoir des plans d'étage en une fraction du temps nécessaire aux humains.

Comment obtenir de beaux ongles rapidement

Comment obtenir de beaux ongles rapidement

Vous souhaitez avoir rapidement de beaux ongles brillants et sains. Ces conseils simples pour de beaux ongles ci-dessous vous seront utiles.

Les secrets de linspiration des couleurs que seuls les designers connaissent

Les secrets de linspiration des couleurs que seuls les designers connaissent

Cet article répertorie des conseils inspirés des couleurs, partagés par les meilleurs designers de la communauté Creative Market, afin que vous puissiez obtenir la combinaison de couleurs parfaite à chaque fois.

Tout ce dont vous avez besoin pour remplacer votre ordinateur portable par un téléphone

Tout ce dont vous avez besoin pour remplacer votre ordinateur portable par un téléphone

Pouvez-vous vraiment remplacer votre ordinateur portable par votre téléphone ? Oui, mais vous aurez besoin des bons accessoires pour transformer votre téléphone en ordinateur portable.

ChatGPT pourra bientôt voir tout ce qui se passe sur votre écran

ChatGPT pourra bientôt voir tout ce qui se passe sur votre écran

Un élément important dans la vidéo complète de l'événement est que la prochaine fonctionnalité de l'application ChatGPT a été présentée, mais aucun détail réel n'a été partagé. C'est la capacité de ChatGPT à voir tout ce qui se passe sur l'écran de l'appareil de l'utilisateur.

LIA apprend à tromper les humains malgré sa formation à être honnête

LIA apprend à tromper les humains malgré sa formation à être honnête

De nombreuses IA de haut niveau, bien qu'elles aient été formées à être honnêtes, apprennent à tromper au fil de leur formation et induisent systématiquement les utilisateurs en erreur, révèle une nouvelle étude.

Comment modifier les questions sur ChatGPT

Comment modifier les questions sur ChatGPT

ChatGPT dispose désormais d'une option de modification de question afin que les utilisateurs puissent modifier la question ou le contenu qu'ils échangent avec ChatGPT.

Comment repérer les faux codes QR et protéger vos données

Comment repérer les faux codes QR et protéger vos données

Les codes QR semblent assez inoffensifs jusqu'à ce que vous scanniez un mauvais code QR et que vous receviez quelque chose de désagréable sur votre système. Si vous souhaitez protéger votre téléphone et vos données, il existe plusieurs moyens d’identifier les faux codes QR.

Qualcomm lance le modem 5G X85 avec une série daméliorations notables

Qualcomm lance le modem 5G X85 avec une série daméliorations notables

Sur scène au MWC 2025, Qualcomm a fait sensation en présentant sa huitième génération de modem 5G appelé X85, qui devrait être utilisé dans les smartphones phares lancés plus tard cette année.

La nouvelle technologie permet aux téléphones de changer de couleur de manière flexible

La nouvelle technologie permet aux téléphones de changer de couleur de manière flexible

Vous avez un iPhone 16 « Ultramarine » tendance, mais un beau jour, vous vous ennuyez soudainement de cette couleur ; Que ferez-vous?

Microsoft intègre DeepSeek dans la plateforme PC Copilot+

Microsoft intègre DeepSeek dans la plateforme PC Copilot+

En janvier, Microsoft a annoncé son intention d'apporter des versions optimisées NPU du modèle DeepSeek-R1 directement aux ordinateurs Copilot+ fonctionnant sur des processeurs Qualcomm Snapdragon X.

Différence entre les fonctions SI et Switch dans Excel

Différence entre les fonctions SI et Switch dans Excel

L'instruction SI est une fonction logique courante dans Excel. L'instruction SWITCH est moins connue, mais vous pouvez l'utiliser à la place de l'instruction IF dans certains cas.

Comment ajouter un effet de projecteur derrière votre sujet à laide dAdobe Camera Raw

Comment ajouter un effet de projecteur derrière votre sujet à laide dAdobe Camera Raw

L’ajout d’un effet de projecteur derrière le sujet sur une photo est un excellent moyen de séparer le sujet de l’arrière-plan. L'effet de projecteur peut ajouter de la profondeur aux photos de portrait.

Comment augmenter la taille limite des pièces jointes Outlook

Comment augmenter la taille limite des pièces jointes Outlook

Outlook et d’autres services de messagerie ont des limites sur la taille des pièces jointes aux e-mails. Voici les instructions pour augmenter la limite de taille des pièces jointes Outlook.

Pourquoi Lightroom est-il meilleur que toutes les autres applications de retouche photo ?

Pourquoi Lightroom est-il meilleur que toutes les autres applications de retouche photo ?

Malgré de nombreux concurrents, Adobe Lightroom reste la meilleure application de retouche photo. Oui, vous devez payer pour y accéder, mais les fonctionnalités de Lightroom en valent la peine.

Comment télécharger des vidéos YouTube simplement et rapidement

Comment télécharger des vidéos YouTube simplement et rapidement

Télécharger des vidéos depuis Youtube est désormais très simple, vous n'avez pas besoin de passer par des étapes compliquées pour pouvoir télécharger des vidéos Youtube sur votre ordinateur.