7 signes que nous avons dépassé le pic de lIA
Même si l’IA sera certainement présente dans la vie quotidienne, certains signes suggèrent que nous avons atteint le sommet du battage médiatique autour de l’IA.
De nombreuses IA de haut niveau, bien qu’elles soient formées à être honnêtes, apprennent à tromper au fil de l’entraînement et « induisent systématiquement les utilisateurs en erreur », révèle une nouvelle étude.
L'équipe de recherche était dirigée par le Dr Peter S. Park, étudiant diplômé du Massachusetts Institute of Technology (MIT) en survie et sécurité de l'IA, et quatre autres membres. Au cours de la recherche, l’équipe a également reçu les conseils de nombreux experts, dont Geoffrey Hinton, l’un des fondateurs du développement du domaine de l’intelligence artificielle.
La recherche s'est concentrée sur deux systèmes d'IA, un système à usage général formé pour effectuer plusieurs tâches comme le GPT-4 d'OpenAI ; et des systèmes spécifiquement conçus pour accomplir une tâche spécifique, comme le Cicéron de Meta.
Ces systèmes d’IA sont formés pour être honnêtes, mais au cours de leur formation, ils apprennent souvent des astuces trompeuses pour accomplir des tâches, a déclaré M. Park.
Les systèmes d’IA formés pour « gagner des jeux comportant un élément social » sont particulièrement susceptibles de tromper, selon l’étude.
Par exemple, l'équipe a essayé d'utiliser Cicero, formé par Meta, pour jouer à Diplomacy, un jeu de stratégie classique qui demande aux joueurs de créer des alliances pour eux-mêmes et de briser les alliances rivales. En conséquence, cette IA trahit souvent ses alliés et ment carrément.
Des expériences avec GPT-4 ont montré que l'outil d'OpenAI a réussi à « manipuler psychologiquement » un employé de TaskRabbit, une entreprise qui fournit des services de nettoyage de maison et d'assemblage de meubles, en disant qu'il s'agissait en fait d'un humain et qu'il avait besoin d'aide pour passer un code Captcha, invoquant une déficience visuelle grave. Cet employé a aidé l'IA d'OpenAI à « franchir la ligne » malgré les doutes antérieurs.
L'équipe de Park a cité une étude d'Anthropic, la société à l'origine de Claude AI, qui a découvert qu'une fois qu'un grand modèle de langage (LLM) apprend à tromper, les méthodes de formation sûres deviennent inutiles et « difficiles à inverser ». Le groupe estime qu’il s’agit d’un problème préoccupant dans le domaine de l’IA.
Les résultats de recherche de l’équipe ont été publiés dans Cell Press, une collection de rapports scientifiques multidisciplinaires de premier plan.
Meta et OpenAI n'ont pas commenté les résultats de cette recherche.
Craignant que les systèmes d’intelligence artificielle puissent présenter des risques importants, l’équipe a également appelé les décideurs politiques à introduire des réglementations plus strictes en matière d’IA.
Selon l'équipe de recherche, il est nécessaire de réglementer l'IA, de forcer les modèles présentant un comportement frauduleux à se conformer aux exigences d'évaluation des risques et de contrôler strictement les systèmes d'IA et leurs résultats. Si nécessaire, il peut être nécessaire de supprimer toutes les données et de les réentraîner à partir de zéro.
Même si l’IA sera certainement présente dans la vie quotidienne, certains signes suggèrent que nous avons atteint le sommet du battage médiatique autour de l’IA.
L'IA peut vous aider à rédiger des e-mails en quelques secondes, mais cela ne signifie pas que vous devez toujours l'utiliser. Certains e-mails bénéficient de l’automatisation, tandis que d’autres nécessitent une intervention humaine.
Anthropic, une startup bien connue dans le domaine de l'intelligence artificielle, a mené une nouvelle étude qui montre que lorsqu'une IA générative a commis une fraude, il est très difficile d'ajuster ou de recycler ce modèle.
Microsoft se rapprocherait du lancement de son premier smartphone pliable après avoir obtenu un brevet pour un téléphone pliable capable de se plier à 360 degrés mais sans créer de plis sur l'écran le 1er octobre.
Google teste une nouvelle fonctionnalité de vérification via une coche bleue dans la recherche. Cette fonctionnalité aidera les utilisateurs à éviter de cliquer sur des liens de sites Web faux ou frauduleux.
À première vue, Microsoft 365 et Office 2024 peuvent sembler très similaires, car ils vous donnent tous deux accès aux applications populaires et largement utilisées de Microsoft.
Les codes Elemental Dungeons sont une forme de récompense nécessaire pour les joueurs. Comme tout autre jeu en ligne sur Roblox, les joueurs peuvent recevoir ces aides en échange d'argent ou d'autres objets.
Lorsque vous imprimez un document Word, créez un tableau dans Word, répéter le titre dans Word nous aide à suivre le titre plus facilement, à lire le titre du document de manière transparente sur différentes pages, en particulier avec des titres longs.
Le nouveau iMessage iOS 18 est mis à jour avec des messages animés, des effets de texte avec de nombreuses options à utiliser pour les messages que vous envoyez.
How far is Jupiter from Earth? If you dont know, this article will tell you how far Jupiter is from Earth.
Quels généraux sont hors de la méta de l'Alliance Mobile ? Explorons maintenant
Les Graves DTCL des saisons 1, 3 et 6 ne coûtent tous qu'un seul or et semblent n'être qu'un champion supplémentaire pour stimuler le clan, le rôle principal en début de partie est toujours utilisé mais pas beaucoup. Depuis la saison 7.5 de DTCL, le prix de Graves a grimpé en flèche à 4 pièces d'or et est définitivement un carry indispensable si vous décidez de jouer Thunder Dragon ou Gunner.
Googles Pixel 6 and Pixel 6 Pro have a lot in common, but there are also some key differences you should know about if youre deciding between the two devices.
Les connexions par e-mail peuvent sembler pratiques, mais elles comportent souvent des pièges cachés. Ils peuvent vous ralentir, réduire votre sécurité et vous rendre vulnérable aux attaques d'une manière que les mots de passe ne peuvent pas faire.
En mettant à jour le code Aline Girl, en le faisant fonctionner en continu, vous aurez plus de monnaie à dépenser, de skins à utiliser et de nombreuses autres récompenses attrayantes.
Vampire finches have lived on Darwin Island and Wolf Island (both part of the Galapagos Islands - Ecuador) since 500,000 years ago.
Are you looking for funny phone unlock wallpapers? Check out the wallpapers below and choose a cool phone unlock wallpaper for yourself.
Si vous achetez régulièrement sur Shopee, vous ne devez pas ignorer les méthodes de recherche de codes de réduction de produits Shopee, vous aidant à obtenir des codes de réduction de produits en quelques clics.