3 nouvelles fonctionnalités du modèle Meta AI Llama 4

Début avril 2025, Meta a lancé Llama 4 , la dernière série de modèles d'IA conçus pour faire passer l'entreprise au niveau supérieur. Chaque nouveau modèle Llama 4 présente des améliorations significatives par rapport à ses prédécesseurs, et voici les nouvelles fonctionnalités remarquables à essayer.

3. Architecture mixte d'experts (MoE)

L’une des caractéristiques les plus remarquables des modèles Llama 4 est la nouvelle architecture MoE, une première pour la série Llama, qui utilise une approche différente des modèles précédents. Dans la nouvelle architecture, seule une petite fraction des paramètres du modèle est activée pour chaque jeton, contrairement aux modèles de transformateurs denses traditionnels comme Llama 3 et inférieurs, où tous les paramètres sont activés pour chaque tâche.

Par exemple, Llama 4 Maverick n'utilise que 17 milliards de paramètres actifs sur 400 milliards, avec 128 experts routés et un expert partagé. Llama 4 Scout, le plus petit de la série, possède un total de 109 milliards de paramètres, n'en activant que 17 milliards avec 16 experts.

La plus grande version du trio, Llama 4 Behemoth, utilise 288 milliards de paramètres actifs (avec 16 experts) sur un total de près de deux mille milliards de paramètres. Grâce à cette nouvelle architecture, seuls deux spécialistes sont affectés à chaque tâche.

Grâce au changement architectural, les modèles de la série Llama 4 sont plus efficaces en termes de calcul lors de la formation et de l'inférence. L'activation d'une petite partie seulement des paramètres réduit les coûts de service et la latence. Grâce à l'architecture MoE, Meta affirme que Llama peut fonctionner sur un seul GPU Nvidia H100, un exploit impressionnant compte tenu du nombre de paramètres. Bien qu'il n'existe pas de mesures spécifiques, on pense que chaque requête adressée à ChatGPT utilise plusieurs GPU Nvidia, ce qui crée une surcharge plus importante dans presque toutes les mesures mesurables.

2. Capacités de traitement multimodales natives

Une autre mise à jour importante des modèles d'IA de Llama 4 est le traitement multimodal natif, ce qui signifie que le trio peut comprendre du texte et des images simultanément.

Cela est possible grâce à la combinaison réalisée lors de la phase de formation initiale, où les jetons textuels et visuels sont intégrés dans une architecture unifiée. Les modèles sont formés à l’aide de grandes quantités de données de texte, d’image et de vidéo non étiquetées.

3 nouvelles fonctionnalités du modèle Meta AI Llama 4

Ça ne peut pas être mieux que ça. Si vous vous en souvenez, la mise à niveau Llama 3.2 de Meta , sortie en septembre 2024, a introduit un certain nombre de nouveaux modèles (10 au total), dont 5 modèles de vision multimodale et 5 modèles de texte. Avec cette génération, l'entreprise n'a pas besoin de publier des modèles de texte et de vision séparés grâce aux capacités de traitement multimodal natives.

De plus, Llama 4 utilise un encodeur visuel amélioré, permettant aux modèles de gérer des tâches d'inférence visuelle complexes et des entrées multi-images, les rendant capables de gérer des applications qui nécessitent une compréhension avancée du texte et des images. Le traitement multimodal permet également d’utiliser les modèles LLama 4 dans une variété d’applications.

1. Fenêtre contextuelle de pointe

Les modèles d'IA de Llama 4 disposent d'une fenêtre contextuelle sans précédent pouvant atteindre 10 millions de jetons. Bien que Llama 4 Behemoth soit encore en développement au moment de la publication, Llama 4 Scout a établi une nouvelle référence dans l'industrie avec sa capacité à prendre en charge jusqu'à 10 millions de jetons en longueur de contexte, vous permettant de saisir du texte de plus de 5 millions de mots.

Cette longueur de contexte étendue représente une augmentation significative par rapport aux 8 000 jetons de Llama 3 lors de son premier lancement et même par rapport à l'extension ultérieure à 128 000 après la mise à niveau de Llama 3.2. Et ce n’est pas seulement la longueur de contexte de 10 millions du Llama 4 Scout qui est intéressante ; Même Llama 4 Maverick, avec sa longueur d'un million de contextes, est un exploit impressionnant.

Llama 3.2 est actuellement l’un des meilleurs chatbots IA pour les conversations prolongées. Cependant, la fenêtre de contexte étendue de Llama 4 place Llama en tête, surpassant la précédente fenêtre de contexte de 2 millions de jetons de Gemini, les 200 000 de Claude 3.7 Sonnet et les 128 000 de GPT-4.5.

3 nouvelles fonctionnalités du modèle Meta AI Llama 4

Avec une grande fenêtre contextuelle, la série Llama 4 peut gérer des tâches qui nécessitent la saisie d'énormes quantités d'informations. Cette grande fenêtre est utile pour des tâches telles que l'analyse de documents longs et multiples, l'analyse détaillée de grandes bases de code et le raisonnement sur de grands ensembles de données.

Il permet également à Llama 4 de mener des conversations prolongées, contrairement aux modèles Llama précédents et aux modèles d'autres sociétés d'IA. Si l’une des raisons pour lesquelles Gemini 2.5 Pro est le meilleur modèle de raisonnement est sa grande fenêtre de contexte, vous pouvez imaginer à quel point une fenêtre de contexte 5x ou 10x est puissante.

Les modèles Llama de la série 3 de Meta font partie des meilleurs LLM du marché. Mais avec la sortie de la série Llama 4, Meta va encore plus loin en se concentrant non seulement sur l'amélioration des performances d'inférence (grâce à la nouvelle fenêtre de contexte à la pointe de l'industrie), mais également en garantissant les modèles les plus efficaces possibles en utilisant une nouvelle architecture MoE pendant la formation et l'inférence.

Les capacités de traitement multimodales natives de Llama 4, son architecture MoE efficace et sa grande fenêtre de contexte le positionnent comme un modèle d'IA ouvert, performant et flexible, pondéré en fonction du poids, capable de rivaliser ou de surpasser les principaux modèles d'inférence, d'encodage et de nombreuses autres tâches.

Sign up and earn $1000 a day ⋙

Leave a Comment

La première personne à avoir implanté ChatGPT dans le cerveau pour laider à manipuler des appareils électroniques

La première personne à avoir implanté ChatGPT dans le cerveau pour laider à manipuler des appareils électroniques

ChatGPT est testé par Synchron, l'un des pionniers des puces d'implant cérébral (BCI) pour aider les patients à manipuler des appareils électroniques.

Comment les générateurs dart IA améliorent vos photos quotidiennes

Comment les générateurs dart IA améliorent vos photos quotidiennes

Vous souhaitez changer l’apparence de vos photos de tous les jours ? Les outils de création artistique basés sur l’IA peuvent ajouter une touche unique et créative que vous ne pourriez pas obtenir avec l’édition manuelle.

5 raisons pour lesquelles lIA Aria dOpera est utile

5 raisons pour lesquelles lIA Aria dOpera est utile

Beaucoup de gens n’aiment pas l’IA parce qu’ils veulent lire les données brutes et les analyser eux-mêmes. Cependant, essayez Aria AI d'Opera lorsque vous êtes confronté à une tâche fastidieuse et que vous avez besoin d'idées. Voici pourquoi l’IA Aria d’Opera est utile !

En savoir plus sur le code derreur 0xc00000e et comment le corriger

En savoir plus sur le code derreur 0xc00000e et comment le corriger

Le redoutable code d'erreur 0xc00000e de l'écran bleu de la mort (BSOD), qui apparaît souvent au démarrage de Windows 10, peut être déroutant.

Espace Jouer Ensemble, nommez lespace Jouer Ensemble

Espace Jouer Ensemble, nommez lespace Jouer Ensemble

De nombreuses personnes utilisent des espaces dans leurs noms Play Together ou utilisent de petits traits de soulignement pour créer des espaces entre les lettres que vous écrivez dans votre nom.

Comment télécharger Black Beacon sur PC

Comment télécharger Black Beacon sur PC

Bien qu'il soit tout à fait possible de découvrir Black Beacon sur PC, le jeu n'est pas officiellement optimisé pour cette plateforme pour le moment.

Formule de calcul de la surface et du volume dune sphère

Formule de calcul de la surface et du volume dune sphère

L'aire de surface d'une sphère est quatre fois l'aire d'un grand cercle, qui est quatre fois la constante Pi multipliée par le carré du rayon de la sphère.

Instructions pour jouer à Zuka Lien Quan Mobile saison S1 2023

Instructions pour jouer à Zuka Lien Quan Mobile saison S1 2023

Zuka est un assassin connu pour être une terreur pour les champions à faible santé. Apprenez à utiliser Zuka efficacement dans la saison 23.

Ways music stimulates the brain

Ways music stimulates the brain

Most people know that music is not just for entertainment but has many benefits. Here are some ways music stimulates our brain development.

Comment obtenir de beaux ongles rapidement

Comment obtenir de beaux ongles rapidement

Vous souhaitez avoir rapidement de beaux ongles brillants et sains. Ces conseils simples pour de beaux ongles ci-dessous vous seront utiles.

Les secrets de linspiration des couleurs que seuls les designers connaissent

Les secrets de linspiration des couleurs que seuls les designers connaissent

Cet article répertorie des conseils inspirés des couleurs, partagés par les meilleurs designers de la communauté Creative Market, afin que vous puissiez obtenir la combinaison de couleurs parfaite à chaque fois.

Tout ce dont vous avez besoin pour remplacer votre ordinateur portable par un téléphone

Tout ce dont vous avez besoin pour remplacer votre ordinateur portable par un téléphone

Pouvez-vous vraiment remplacer votre ordinateur portable par votre téléphone ? Oui, mais vous aurez besoin des bons accessoires pour transformer votre téléphone en ordinateur portable.

ChatGPT pourra bientôt voir tout ce qui se passe sur votre écran

ChatGPT pourra bientôt voir tout ce qui se passe sur votre écran

Un élément important dans la vidéo complète de l'événement est que la prochaine fonctionnalité de l'application ChatGPT a été présentée, mais aucun détail réel n'a été partagé. C'est la capacité de ChatGPT à voir tout ce qui se passe sur l'écran de l'appareil de l'utilisateur.

LIA apprend à tromper les humains malgré sa formation à être honnête

LIA apprend à tromper les humains malgré sa formation à être honnête

De nombreuses IA de haut niveau, bien qu'elles aient été formées à être honnêtes, apprennent à tromper au fil de leur formation et induisent systématiquement les utilisateurs en erreur, révèle une nouvelle étude.

Comment modifier les questions sur ChatGPT

Comment modifier les questions sur ChatGPT

ChatGPT dispose désormais d'une option de modification de question afin que les utilisateurs puissent modifier la question ou le contenu qu'ils échangent avec ChatGPT.