3 nouvelles fonctionnalités du modèle Meta AI Llama 4

Début avril 2025, Meta a lancé Llama 4 , la dernière série de modèles d'IA conçus pour faire passer l'entreprise au niveau supérieur. Chaque nouveau modèle Llama 4 présente des améliorations significatives par rapport à ses prédécesseurs, et voici les nouvelles fonctionnalités remarquables à essayer.

3. Architecture mixte d'experts (MoE)

L’une des caractéristiques les plus remarquables des modèles Llama 4 est la nouvelle architecture MoE, une première pour la série Llama, qui utilise une approche différente des modèles précédents. Dans la nouvelle architecture, seule une petite fraction des paramètres du modèle est activée pour chaque jeton, contrairement aux modèles de transformateurs denses traditionnels comme Llama 3 et inférieurs, où tous les paramètres sont activés pour chaque tâche.

Par exemple, Llama 4 Maverick n'utilise que 17 milliards de paramètres actifs sur 400 milliards, avec 128 experts routés et un expert partagé. Llama 4 Scout, le plus petit de la série, possède un total de 109 milliards de paramètres, n'en activant que 17 milliards avec 16 experts.

La plus grande version du trio, Llama 4 Behemoth, utilise 288 milliards de paramètres actifs (avec 16 experts) sur un total de près de deux mille milliards de paramètres. Grâce à cette nouvelle architecture, seuls deux spécialistes sont affectés à chaque tâche.

Grâce au changement architectural, les modèles de la série Llama 4 sont plus efficaces en termes de calcul lors de la formation et de l'inférence. L'activation d'une petite partie seulement des paramètres réduit les coûts de service et la latence. Grâce à l'architecture MoE, Meta affirme que Llama peut fonctionner sur un seul GPU Nvidia H100, un exploit impressionnant compte tenu du nombre de paramètres. Bien qu'il n'existe pas de mesures spécifiques, on pense que chaque requête adressée à ChatGPT utilise plusieurs GPU Nvidia, ce qui crée une surcharge plus importante dans presque toutes les mesures mesurables.

2. Capacités de traitement multimodales natives

Une autre mise à jour importante des modèles d'IA de Llama 4 est le traitement multimodal natif, ce qui signifie que le trio peut comprendre du texte et des images simultanément.

Cela est possible grâce à la combinaison réalisée lors de la phase de formation initiale, où les jetons textuels et visuels sont intégrés dans une architecture unifiée. Les modèles sont formés à l’aide de grandes quantités de données de texte, d’image et de vidéo non étiquetées.

3 nouvelles fonctionnalités du modèle Meta AI Llama 4

Ça ne peut pas être mieux que ça. Si vous vous en souvenez, la mise à niveau Llama 3.2 de Meta , sortie en septembre 2024, a introduit un certain nombre de nouveaux modèles (10 au total), dont 5 modèles de vision multimodale et 5 modèles de texte. Avec cette génération, l'entreprise n'a pas besoin de publier des modèles de texte et de vision séparés grâce aux capacités de traitement multimodal natives.

De plus, Llama 4 utilise un encodeur visuel amélioré, permettant aux modèles de gérer des tâches d'inférence visuelle complexes et des entrées multi-images, les rendant capables de gérer des applications qui nécessitent une compréhension avancée du texte et des images. Le traitement multimodal permet également d’utiliser les modèles LLama 4 dans une variété d’applications.

1. Fenêtre contextuelle de pointe

Les modèles d'IA de Llama 4 disposent d'une fenêtre contextuelle sans précédent pouvant atteindre 10 millions de jetons. Bien que Llama 4 Behemoth soit encore en développement au moment de la publication, Llama 4 Scout a établi une nouvelle référence dans l'industrie avec sa capacité à prendre en charge jusqu'à 10 millions de jetons en longueur de contexte, vous permettant de saisir du texte de plus de 5 millions de mots.

Cette longueur de contexte étendue représente une augmentation significative par rapport aux 8 000 jetons de Llama 3 lors de son premier lancement et même par rapport à l'extension ultérieure à 128 000 après la mise à niveau de Llama 3.2. Et ce n’est pas seulement la longueur de contexte de 10 millions du Llama 4 Scout qui est intéressante ; Même Llama 4 Maverick, avec sa longueur d'un million de contextes, est un exploit impressionnant.

Llama 3.2 est actuellement l’un des meilleurs chatbots IA pour les conversations prolongées. Cependant, la fenêtre de contexte étendue de Llama 4 place Llama en tête, surpassant la précédente fenêtre de contexte de 2 millions de jetons de Gemini, les 200 000 de Claude 3.7 Sonnet et les 128 000 de GPT-4.5.

3 nouvelles fonctionnalités du modèle Meta AI Llama 4

Avec une grande fenêtre contextuelle, la série Llama 4 peut gérer des tâches qui nécessitent la saisie d'énormes quantités d'informations. Cette grande fenêtre est utile pour des tâches telles que l'analyse de documents longs et multiples, l'analyse détaillée de grandes bases de code et le raisonnement sur de grands ensembles de données.

Il permet également à Llama 4 de mener des conversations prolongées, contrairement aux modèles Llama précédents et aux modèles d'autres sociétés d'IA. Si l’une des raisons pour lesquelles Gemini 2.5 Pro est le meilleur modèle de raisonnement est sa grande fenêtre de contexte, vous pouvez imaginer à quel point une fenêtre de contexte 5x ou 10x est puissante.

Les modèles Llama de la série 3 de Meta font partie des meilleurs LLM du marché. Mais avec la sortie de la série Llama 4, Meta va encore plus loin en se concentrant non seulement sur l'amélioration des performances d'inférence (grâce à la nouvelle fenêtre de contexte à la pointe de l'industrie), mais également en garantissant les modèles les plus efficaces possibles en utilisant une nouvelle architecture MoE pendant la formation et l'inférence.

Les capacités de traitement multimodales natives de Llama 4, son architecture MoE efficace et sa grande fenêtre de contexte le positionnent comme un modèle d'IA ouvert, performant et flexible, pondéré en fonction du poids, capable de rivaliser ou de surpasser les principaux modèles d'inférence, d'encodage et de nombreuses autres tâches.

Sign up and earn $1000 a day ⋙

Leave a Comment

Why doesnt the freezer have a light but the refrigerator does?

Why doesnt the freezer have a light but the refrigerator does?

Refrigerators are familiar appliances in families. Refrigerators usually have 2 compartments, the cool compartment is spacious and has a light that automatically turns on every time the user opens it, while the freezer compartment is narrow and has no light.

2 Ways to Fix Network Congestion That Slows Down Wi-Fi

2 Ways to Fix Network Congestion That Slows Down Wi-Fi

Wi-Fi networks are affected by many factors beyond routers, bandwidth, and interference, but there are some smart ways to boost your network.

Comment rétrograder diOS 17 à iOS 16 sans perte de données avec Tenorshare Reiboot

Comment rétrograder diOS 17 à iOS 16 sans perte de données avec Tenorshare Reiboot

Si vous souhaitez revenir à la version stable d'iOS 16 sur votre téléphone, voici le guide de base pour désinstaller iOS 17 et rétrograder d'iOS 17 à 16.

Que se passe-t-il dans le corps lorsque vous mangez du yaourt tous les jours ?

Que se passe-t-il dans le corps lorsque vous mangez du yaourt tous les jours ?

Le yaourt est un aliment merveilleux. Est-il bon de manger du yaourt tous les jours ? Si vous mangez du yaourt tous les jours, comment votre corps va-t-il changer ? Découvrons-le ensemble !

Quel type de riz est le meilleur pour la santé ?

Quel type de riz est le meilleur pour la santé ?

Cet article présente les types de riz les plus nutritifs et comment maximiser les bienfaits pour la santé du riz que vous choisissez.

Comment se réveiller à lheure le matin

Comment se réveiller à lheure le matin

Établir un horaire de sommeil et une routine de coucher, changer votre réveil et ajuster votre alimentation sont quelques-unes des mesures qui peuvent vous aider à mieux dormir et à vous réveiller à l’heure le matin.

Latest Bathroom Tower Defense Codes and How to Enter Codes

Latest Bathroom Tower Defense Codes and How to Enter Codes

Get Bathroom Tower Defense Roblox game codes and redeem them for exciting rewards. They will help you upgrade or unlock towers with higher damage.

4 façons dont lIA améliore les téléviseurs intelligents

4 façons dont lIA améliore les téléviseurs intelligents

De la meilleure qualité d’image et de son au contrôle vocal et bien plus encore, ces fonctionnalités alimentées par l’IA rendent les téléviseurs intelligents bien meilleurs !

Pourquoi ChatGPT est meilleur que DeepSeek

Pourquoi ChatGPT est meilleur que DeepSeek

Au début, les gens avaient de grands espoirs pour DeepSeek. En tant que chatbot IA commercialisé comme un concurrent sérieux de ChatGPT, il promet des capacités et des expériences de chat intelligentes.

Découvrez Fireflies.ai : le secrétaire IA gratuit qui vous fait gagner des heures de travail

Découvrez Fireflies.ai : le secrétaire IA gratuit qui vous fait gagner des heures de travail

Il est facile de manquer des détails importants lorsque l’on note d’autres éléments essentiels, et essayer de prendre des notes tout en discutant peut être distrayant. Fireflies.ai est la solution.

Comment élever un axolotl dans Minecraft et apprivoiser une salamandre dans Minecraft

Comment élever un axolotl dans Minecraft et apprivoiser une salamandre dans Minecraft

Axolot Minecraft sera un excellent assistant pour les joueurs lorsqu'ils opèrent sous l'eau s'ils savent comment les utiliser.

DeceptionAds Warning: New Malicious Ad Type Exploits Legitimate Services to Display Fake CAPTCHAs

DeceptionAds Warning: New Malicious Ad Type Exploits Legitimate Services to Display Fake CAPTCHAs

DeceptionAds is a new form of malvertising, where scammers use legitimate advertising platforms and make sure their malicious sites avoid censorship as much as possible.

What to do when you see the “AirTag Found Moving With You” warning?

What to do when you see the “AirTag Found Moving With You” warning?

Wondering what the Airtag Found Moving With You warning is? Its a safety feature on AirTags designed to prevent them from being used to track you.

Le pouvoir mystérieux du nombre 33 en numérologie

Le pouvoir mystérieux du nombre 33 en numérologie

En numérologie, le nombre 33 est souvent considéré comme un nombre puissant et mystique. Voici ce que vous devez savoir sur le nombre 33 en numérologie.

What is dark energy?

What is dark energy?

Dark energy is driving the accelerating expansion of the universe, but its nature remains a complete mystery. Heres what you need to know about dark energy.