7 signes que nous avons dépassé le pic de lIA
Même si l’IA sera certainement présente dans la vie quotidienne, certains signes suggèrent que nous avons atteint le sommet du battage médiatique autour de l’IA.
De nombreuses IA de haut niveau, bien qu’elles soient formées à être honnêtes, apprennent à tromper au fil de l’entraînement et « induisent systématiquement les utilisateurs en erreur », révèle une nouvelle étude.
L'équipe de recherche était dirigée par le Dr Peter S. Park, étudiant diplômé du Massachusetts Institute of Technology (MIT) en survie et sécurité de l'IA, et quatre autres membres. Au cours de la recherche, l’équipe a également reçu les conseils de nombreux experts, dont Geoffrey Hinton, l’un des fondateurs du développement du domaine de l’intelligence artificielle.
La recherche s'est concentrée sur deux systèmes d'IA, un système à usage général formé pour effectuer plusieurs tâches comme le GPT-4 d'OpenAI ; et des systèmes spécifiquement conçus pour accomplir une tâche spécifique, comme le Cicéron de Meta.
Ces systèmes d’IA sont formés pour être honnêtes, mais au cours de leur formation, ils apprennent souvent des astuces trompeuses pour accomplir des tâches, a déclaré M. Park.
Les systèmes d’IA formés pour « gagner des jeux comportant un élément social » sont particulièrement susceptibles de tromper, selon l’étude.
Par exemple, l'équipe a essayé d'utiliser Cicero, formé par Meta, pour jouer à Diplomacy, un jeu de stratégie classique qui demande aux joueurs de créer des alliances pour eux-mêmes et de briser les alliances rivales. En conséquence, cette IA trahit souvent ses alliés et ment carrément.
Des expériences avec GPT-4 ont montré que l'outil d'OpenAI a réussi à « manipuler psychologiquement » un employé de TaskRabbit, une entreprise qui fournit des services de nettoyage de maison et d'assemblage de meubles, en disant qu'il s'agissait en fait d'un humain et qu'il avait besoin d'aide pour passer un code Captcha, invoquant une déficience visuelle grave. Cet employé a aidé l'IA d'OpenAI à « franchir la ligne » malgré les doutes antérieurs.
L'équipe de Park a cité une étude d'Anthropic, la société à l'origine de Claude AI, qui a découvert qu'une fois qu'un grand modèle de langage (LLM) apprend à tromper, les méthodes de formation sûres deviennent inutiles et « difficiles à inverser ». Le groupe estime qu’il s’agit d’un problème préoccupant dans le domaine de l’IA.
Les résultats de recherche de l’équipe ont été publiés dans Cell Press, une collection de rapports scientifiques multidisciplinaires de premier plan.
Meta et OpenAI n'ont pas commenté les résultats de cette recherche.
Craignant que les systèmes d’intelligence artificielle puissent présenter des risques importants, l’équipe a également appelé les décideurs politiques à introduire des réglementations plus strictes en matière d’IA.
Selon l'équipe de recherche, il est nécessaire de réglementer l'IA, de forcer les modèles présentant un comportement frauduleux à se conformer aux exigences d'évaluation des risques et de contrôler strictement les systèmes d'IA et leurs résultats. Si nécessaire, il peut être nécessaire de supprimer toutes les données et de les réentraîner à partir de zéro.
Même si l’IA sera certainement présente dans la vie quotidienne, certains signes suggèrent que nous avons atteint le sommet du battage médiatique autour de l’IA.
L'IA peut vous aider à rédiger des e-mails en quelques secondes, mais cela ne signifie pas que vous devez toujours l'utiliser. Certains e-mails bénéficient de l’automatisation, tandis que d’autres nécessitent une intervention humaine.
Anthropic, une startup bien connue dans le domaine de l'intelligence artificielle, a mené une nouvelle étude qui montre que lorsqu'une IA générative a commis une fraude, il est très difficile d'ajuster ou de recycler ce modèle.
Pouvez-vous vraiment remplacer votre ordinateur portable par votre téléphone ? Oui, mais vous aurez besoin des bons accessoires pour transformer votre téléphone en ordinateur portable.
Un élément important dans la vidéo complète de l'événement est que la prochaine fonctionnalité de l'application ChatGPT a été présentée, mais aucun détail réel n'a été partagé. C'est la capacité de ChatGPT à voir tout ce qui se passe sur l'écran de l'appareil de l'utilisateur.
De nombreuses IA de haut niveau, bien qu'elles aient été formées à être honnêtes, apprennent à tromper au fil de leur formation et induisent systématiquement les utilisateurs en erreur, révèle une nouvelle étude.
ChatGPT dispose désormais d'une option de modification de question afin que les utilisateurs puissent modifier la question ou le contenu qu'ils échangent avec ChatGPT.
Les codes QR semblent assez inoffensifs jusqu'à ce que vous scanniez un mauvais code QR et que vous receviez quelque chose de désagréable sur votre système. Si vous souhaitez protéger votre téléphone et vos données, il existe plusieurs moyens d’identifier les faux codes QR.
Sur scène au MWC 2025, Qualcomm a fait sensation en présentant sa huitième génération de modem 5G appelé X85, qui devrait être utilisé dans les smartphones phares lancés plus tard cette année.
Vous avez un iPhone 16 « Ultramarine » tendance, mais un beau jour, vous vous ennuyez soudainement de cette couleur ; Que ferez-vous?
En janvier, Microsoft a annoncé son intention d'apporter des versions optimisées NPU du modèle DeepSeek-R1 directement aux ordinateurs Copilot+ fonctionnant sur des processeurs Qualcomm Snapdragon X.
L'instruction SI est une fonction logique courante dans Excel. L'instruction SWITCH est moins connue, mais vous pouvez l'utiliser à la place de l'instruction IF dans certains cas.
L’ajout d’un effet de projecteur derrière le sujet sur une photo est un excellent moyen de séparer le sujet de l’arrière-plan. L'effet de projecteur peut ajouter de la profondeur aux photos de portrait.
Outlook et d’autres services de messagerie ont des limites sur la taille des pièces jointes aux e-mails. Voici les instructions pour augmenter la limite de taille des pièces jointes Outlook.
Malgré de nombreux concurrents, Adobe Lightroom reste la meilleure application de retouche photo. Oui, vous devez payer pour y accéder, mais les fonctionnalités de Lightroom en valent la peine.
Télécharger des vidéos depuis Youtube est désormais très simple, vous n'avez pas besoin de passer par des étapes compliquées pour pouvoir télécharger des vidéos Youtube sur votre ordinateur.
Apple a publié sa propre application de gestion d'événements appelée Invites. Cette application vous permet de créer des événements, d'envoyer des invitations et de gérer les réponses.
La fonctionnalité de messagerie directe d'Instagram bénéficie désormais de nombreuses nouvelles fonctionnalités, notamment des messages directs programmés que vous pouvez écrire à l'avance et programmer pour être envoyés à une date ultérieure, jusqu'à 29 jours à l'avance.