Meta lance Llama 4 : le LLM multimodal ultime
Cette série comprend trois versions : Llama 4 Scout, Llama 4 Maverick et Llama 4 Behemoth.
Début avril 2025, Meta a lancé Llama 4 , la dernière série de modèles d'IA conçus pour faire passer l'entreprise au niveau supérieur. Chaque nouveau modèle Llama 4 présente des améliorations significatives par rapport à ses prédécesseurs, et voici les nouvelles fonctionnalités remarquables à essayer.
3. Architecture mixte d'experts (MoE)
L’une des caractéristiques les plus remarquables des modèles Llama 4 est la nouvelle architecture MoE, une première pour la série Llama, qui utilise une approche différente des modèles précédents. Dans la nouvelle architecture, seule une petite fraction des paramètres du modèle est activée pour chaque jeton, contrairement aux modèles de transformateurs denses traditionnels comme Llama 3 et inférieurs, où tous les paramètres sont activés pour chaque tâche.
Par exemple, Llama 4 Maverick n'utilise que 17 milliards de paramètres actifs sur 400 milliards, avec 128 experts routés et un expert partagé. Llama 4 Scout, le plus petit de la série, possède un total de 109 milliards de paramètres, n'en activant que 17 milliards avec 16 experts.
La plus grande version du trio, Llama 4 Behemoth, utilise 288 milliards de paramètres actifs (avec 16 experts) sur un total de près de deux mille milliards de paramètres. Grâce à cette nouvelle architecture, seuls deux spécialistes sont affectés à chaque tâche.
Grâce au changement architectural, les modèles de la série Llama 4 sont plus efficaces en termes de calcul lors de la formation et de l'inférence. L'activation d'une petite partie seulement des paramètres réduit les coûts de service et la latence. Grâce à l'architecture MoE, Meta affirme que Llama peut fonctionner sur un seul GPU Nvidia H100, un exploit impressionnant compte tenu du nombre de paramètres. Bien qu'il n'existe pas de mesures spécifiques, on pense que chaque requête adressée à ChatGPT utilise plusieurs GPU Nvidia, ce qui crée une surcharge plus importante dans presque toutes les mesures mesurables.
2. Capacités de traitement multimodales natives
Une autre mise à jour importante des modèles d'IA de Llama 4 est le traitement multimodal natif, ce qui signifie que le trio peut comprendre du texte et des images simultanément.
Cela est possible grâce à la combinaison réalisée lors de la phase de formation initiale, où les jetons textuels et visuels sont intégrés dans une architecture unifiée. Les modèles sont formés à l’aide de grandes quantités de données de texte, d’image et de vidéo non étiquetées.
Ça ne peut pas être mieux que ça. Si vous vous en souvenez, la mise à niveau Llama 3.2 de Meta , sortie en septembre 2024, a introduit un certain nombre de nouveaux modèles (10 au total), dont 5 modèles de vision multimodale et 5 modèles de texte. Avec cette génération, l'entreprise n'a pas besoin de publier des modèles de texte et de vision séparés grâce aux capacités de traitement multimodal natives.
De plus, Llama 4 utilise un encodeur visuel amélioré, permettant aux modèles de gérer des tâches d'inférence visuelle complexes et des entrées multi-images, les rendant capables de gérer des applications qui nécessitent une compréhension avancée du texte et des images. Le traitement multimodal permet également d’utiliser les modèles LLama 4 dans une variété d’applications.
1. Fenêtre contextuelle de pointe
Les modèles d'IA de Llama 4 disposent d'une fenêtre contextuelle sans précédent pouvant atteindre 10 millions de jetons. Bien que Llama 4 Behemoth soit encore en développement au moment de la publication, Llama 4 Scout a établi une nouvelle référence dans l'industrie avec sa capacité à prendre en charge jusqu'à 10 millions de jetons en longueur de contexte, vous permettant de saisir du texte de plus de 5 millions de mots.
Cette longueur de contexte étendue représente une augmentation significative par rapport aux 8 000 jetons de Llama 3 lors de son premier lancement et même par rapport à l'extension ultérieure à 128 000 après la mise à niveau de Llama 3.2. Et ce n’est pas seulement la longueur de contexte de 10 millions du Llama 4 Scout qui est intéressante ; Même Llama 4 Maverick, avec sa longueur d'un million de contextes, est un exploit impressionnant.
Llama 3.2 est actuellement l’un des meilleurs chatbots IA pour les conversations prolongées. Cependant, la fenêtre de contexte étendue de Llama 4 place Llama en tête, surpassant la précédente fenêtre de contexte de 2 millions de jetons de Gemini, les 200 000 de Claude 3.7 Sonnet et les 128 000 de GPT-4.5.
Avec une grande fenêtre contextuelle, la série Llama 4 peut gérer des tâches qui nécessitent la saisie d'énormes quantités d'informations. Cette grande fenêtre est utile pour des tâches telles que l'analyse de documents longs et multiples, l'analyse détaillée de grandes bases de code et le raisonnement sur de grands ensembles de données.
Il permet également à Llama 4 de mener des conversations prolongées, contrairement aux modèles Llama précédents et aux modèles d'autres sociétés d'IA. Si l’une des raisons pour lesquelles Gemini 2.5 Pro est le meilleur modèle de raisonnement est sa grande fenêtre de contexte, vous pouvez imaginer à quel point une fenêtre de contexte 5x ou 10x est puissante.
Les modèles Llama de la série 3 de Meta font partie des meilleurs LLM du marché. Mais avec la sortie de la série Llama 4, Meta va encore plus loin en se concentrant non seulement sur l'amélioration des performances d'inférence (grâce à la nouvelle fenêtre de contexte à la pointe de l'industrie), mais également en garantissant les modèles les plus efficaces possibles en utilisant une nouvelle architecture MoE pendant la formation et l'inférence.
Les capacités de traitement multimodales natives de Llama 4, son architecture MoE efficace et sa grande fenêtre de contexte le positionnent comme un modèle d'IA ouvert, performant et flexible, pondéré en fonction du poids, capable de rivaliser ou de surpasser les principaux modèles d'inférence, d'encodage et de nombreuses autres tâches.
Refrigerators are familiar appliances in families. Refrigerators usually have 2 compartments, the cool compartment is spacious and has a light that automatically turns on every time the user opens it, while the freezer compartment is narrow and has no light.
Wi-Fi networks are affected by many factors beyond routers, bandwidth, and interference, but there are some smart ways to boost your network.
Si vous souhaitez revenir à la version stable d'iOS 16 sur votre téléphone, voici le guide de base pour désinstaller iOS 17 et rétrograder d'iOS 17 à 16.
Le yaourt est un aliment merveilleux. Est-il bon de manger du yaourt tous les jours ? Si vous mangez du yaourt tous les jours, comment votre corps va-t-il changer ? Découvrons-le ensemble !
Cet article présente les types de riz les plus nutritifs et comment maximiser les bienfaits pour la santé du riz que vous choisissez.
Établir un horaire de sommeil et une routine de coucher, changer votre réveil et ajuster votre alimentation sont quelques-unes des mesures qui peuvent vous aider à mieux dormir et à vous réveiller à l’heure le matin.
Get Bathroom Tower Defense Roblox game codes and redeem them for exciting rewards. They will help you upgrade or unlock towers with higher damage.
De la meilleure qualité d’image et de son au contrôle vocal et bien plus encore, ces fonctionnalités alimentées par l’IA rendent les téléviseurs intelligents bien meilleurs !
Au début, les gens avaient de grands espoirs pour DeepSeek. En tant que chatbot IA commercialisé comme un concurrent sérieux de ChatGPT, il promet des capacités et des expériences de chat intelligentes.
Il est facile de manquer des détails importants lorsque l’on note d’autres éléments essentiels, et essayer de prendre des notes tout en discutant peut être distrayant. Fireflies.ai est la solution.
Axolot Minecraft sera un excellent assistant pour les joueurs lorsqu'ils opèrent sous l'eau s'ils savent comment les utiliser.
DeceptionAds is a new form of malvertising, where scammers use legitimate advertising platforms and make sure their malicious sites avoid censorship as much as possible.
Wondering what the Airtag Found Moving With You warning is? Its a safety feature on AirTags designed to prevent them from being used to track you.
En numérologie, le nombre 33 est souvent considéré comme un nombre puissant et mystique. Voici ce que vous devez savoir sur le nombre 33 en numérologie.
Dark energy is driving the accelerating expansion of the universe, but its nature remains a complete mystery. Heres what you need to know about dark energy.