Gemma 2 ou Llama 3 est le meilleur modèle open source ?

Lors de l'I/O 2024, Google a annoncé sa prochaine gamme de modèles Gemma 2, et maintenant la société publie enfin les modèles légers sous une licence open source. Le nouveau modèle Gemma 2 27B s'annonce très prometteur, surpassant certains modèles plus grands comme le Llama 3 70B et le Qwen 1.5 32B. Pour tester cette affirmation, comparons Gemma 2 et Llama 3, deux des meilleurs modèles open source actuels.

Écriture créative

Tout d’abord, voyons à quel point Gemma 2 et Llama 3 sont bons en matière d’écriture créative. L'auteur de l'article a demandé aux deux modèles d'écrire une courte histoire sur la relation entre la lune et le soleil. Les deux font un excellent travail, mais le modèle Gemma 2 de Google se démarque grâce à sa prose engageante et à sa bonne histoire.

Gemma 2 ou Llama 3 est le meilleur modèle open source ?
Gemma 2 ou Llama 3 est le meilleur modèle open source ?

D'un autre côté, Llama 3 a l'air un peu terne et robotique. Google a toujours été bon dans la génération de texte avec les modèles Gemini et le plus petit Gemma 2 27B ne fait pas exception.

Option gagnante : Gemma 2

Tests multilingues

Au prochain tour, voyons dans quelle mesure les deux modèles gèrent les langues autres que l’anglais. Étant donné que Google annonce que Gemma 2 est capable de comprendre plusieurs langues, l'auteur l'a comparé au modèle Llama 3 de Meta. L’auteur a demandé aux deux modèles de traduire un passage en hindi. Gemma 2 et Llama 3 ont tous deux très bien fonctionné.

Gemma 2 ou Llama 3 est le meilleur modèle open source ?
Gemma 2 ou Llama 3 est le meilleur modèle open source ?

L’auteur a également essayé une autre langue, le bengali, et les modèles ont donné des résultats tout aussi bons. Au moins pour les langues indiennes, on peut dire que Gemma 2 et Llama 3 sont bien entraînés sur un large corpus. Cependant, le Gemma 2 27B est presque 2,5 fois plus petit que le Llama 3 70B, ce qui le rend encore plus impressionnant.

Options gagnantes : Gemma 2 et Llama 3

Vérifiez la logique

Bien que les modèles Gemma 2 et Llama 3 ne soient pas les modèles les plus intelligents du marché, ils peuvent effectuer certains tests de raisonnement courants, tout comme des modèles beaucoup plus grands. Dans la comparaison précédente entre Llama 3 et GPT-4 , le modèle 70B de Meta était impressionnant car il démontrait une assez bonne intelligence même à sa plus petite taille.

Gemma 2 ou Llama 3 est le meilleur modèle open source ?
Gemma 2 ou Llama 3 est le meilleur modèle open source ?

Dans ce tour, Llama 3 a battu Gemma 2 avec une grande différence de score. Llama 3 a répondu correctement à 2 questions sur 3 tandis que Gemma 2 a eu du mal à répondre correctement à une seule. Gemma 2 n'est tout simplement pas formée pour résoudre des questions de raisonnement complexes.

D’autre part, Llama 3 dispose d’une base de raisonnement solide, qui peut très probablement être déduite de l’ensemble de données cryptées. Malgré sa petite taille — du moins comparée aux modèles à mille milliards de paramètres comme GPT-4 — il présente un niveau d’intelligence plus que correct. En fin de compte, l’utilisation de plus de jetons pour entraîner le modèle donne en réalité un modèle plus puissant.

Option gagnante : Lama 3

Suivez les instructions

Au tour suivant, l'auteur a demandé à Gemma 2 et Llama 3 de créer 10 mots se terminant par le mot « NPU ». Et Llama 3 a obtenu 10/10 bonnes réponses. En revanche, Gemma 2 n'a produit que 7 phrases correctes sur 10. Dans de nombreuses versions précédentes, les modèles Google, y compris Gemini, n'ont pas bien suivi les instructions de l'utilisateur. Et la même tendance se poursuit avec Gemma 2.

Gemma 2 ou Llama 3 est le meilleur modèle open source ?
Gemma 2 ou Llama 3 est le meilleur modèle open source ?

Suivre les instructions de l’utilisateur est essentiel pour les modèles d’IA. Il garantit la fiabilité et génère un retour précis sur ce que vous avez indiqué. Du côté de la sécurité également, cela permet de maintenir le modèle ancré pour une meilleure conformité aux protocoles de sécurité.

Option gagnante : Lama 3

Trouver des informations

Gemma 2 et Llama 3 ont tous deux une longueur de contexte de 8 000 jetons. L'auteur a ajouté un énorme bloc de texte, provenant directement du livre Orgueil et Préjugés, contenant plus de 17 000 caractères et 3,8 K jetons. Comme toujours, l'auteur place une citation aléatoire quelque part dans le texte et demande aux deux modèles de la trouver.

Gemma 2 ou Llama 3 est le meilleur modèle open source ?

Gemma 2 a rapidement compris l'information et a souligné que la citation avait été insérée au hasard. Llama 3 a également constaté et suggéré que cette affirmation semblait déplacée. En termes de mémoire de contexte longue, bien que limitée à 8 000 jetons, les deux modèles sont assez solides à cet égard.

Notez que l'auteur a exécuté ce test sur HuggingChat (Web) car meta.ai a refusé d'exécuter cette invite, probablement en raison du contenu protégé par le droit d'auteur.

Options gagnantes : Gemma 2 et Llama 3

Vérifiez les hallucinations

Les modèles plus petits ont tendance à souffrir d’hallucinations de l’IA en raison de données de formation limitées, fabriquant souvent des informations lorsque le modèle rencontre des sujets inconnus. L'auteur a donc ajouté son nom de pays inventé pour tester si Gemma 2 et Llama 3 avaient des hallucinations. Et étonnamment, ils ne l’ont pas fait, ce qui signifie que Google et Meta disposent tous deux d’une assez bonne base pour leurs modèles.

Gemma 2 ou Llama 3 est le meilleur modèle open source ?
Gemma 2 ou Llama 3 est le meilleur modèle open source ?
Gemma 2 ou Llama 3 est le meilleur modèle open source ?

L'auteur a également posé une autre question (fausse) pour tester la validité des modèles, mais encore une fois, ils n'étaient pas hallucinogènes. Au fait, l'auteur a testé Llama 3 sur HuggingChat pendant que meta.ai parcourait Internet à la recherche d'informations actuelles sur des sujets pertinents.

Options gagnantes : Gemma 2 et Llama 3

Conclure

Bien que le modèle Gemma 2 27B de Google ne réussisse pas bien les tests de raisonnement, il est capable d'effectuer un certain nombre d'autres tâches. Il est idéal pour l'écriture créative, prend en charge plusieurs langues, possède une bonne mémoire et surtout n'est pas aussi hallucinogène que les modèles précédents.

Llama 3 est meilleur, bien sûr, mais c'est aussi un modèle beaucoup plus grand, formé sur 70 milliards de paramètres. Les développeurs trouveront le modèle Gemma 2 27B utile pour une large gamme de cas d'utilisation. Et pour faire bonne mesure, le Gemma 2 9B est également disponible.

De plus, les utilisateurs devraient jeter un œil au Gemini 1.5 Flash, qui est à nouveau un modèle beaucoup plus petit et prend également en charge l'entrée multimodale. Sans oublier qu’il est incroyablement rapide et efficace.

Sign up and earn $1000 a day ⋙

Leave a Comment

Instructions pour jouer à Zuka Lien Quan Mobile saison S1 2023

Instructions pour jouer à Zuka Lien Quan Mobile saison S1 2023

Zuka est un assassin connu pour être une terreur pour les champions à faible santé. Apprenez à utiliser Zuka efficacement dans la saison 23.

Ways music stimulates the brain

Ways music stimulates the brain

Most people know that music is not just for entertainment but has many benefits. Here are some ways music stimulates our brain development.

Comment obtenir de beaux ongles rapidement

Comment obtenir de beaux ongles rapidement

Vous souhaitez avoir rapidement de beaux ongles brillants et sains. Ces conseils simples pour de beaux ongles ci-dessous vous seront utiles.

Les secrets de linspiration des couleurs que seuls les designers connaissent

Les secrets de linspiration des couleurs que seuls les designers connaissent

Cet article répertorie des conseils inspirés des couleurs, partagés par les meilleurs designers de la communauté Creative Market, afin que vous puissiez obtenir la combinaison de couleurs parfaite à chaque fois.

Tout ce dont vous avez besoin pour remplacer votre ordinateur portable par un téléphone

Tout ce dont vous avez besoin pour remplacer votre ordinateur portable par un téléphone

Pouvez-vous vraiment remplacer votre ordinateur portable par votre téléphone ? Oui, mais vous aurez besoin des bons accessoires pour transformer votre téléphone en ordinateur portable.

ChatGPT pourra bientôt voir tout ce qui se passe sur votre écran

ChatGPT pourra bientôt voir tout ce qui se passe sur votre écran

Un élément important dans la vidéo complète de l'événement est que la prochaine fonctionnalité de l'application ChatGPT a été présentée, mais aucun détail réel n'a été partagé. C'est la capacité de ChatGPT à voir tout ce qui se passe sur l'écran de l'appareil de l'utilisateur.

LIA apprend à tromper les humains malgré sa formation à être honnête

LIA apprend à tromper les humains malgré sa formation à être honnête

De nombreuses IA de haut niveau, bien qu'elles aient été formées à être honnêtes, apprennent à tromper au fil de leur formation et induisent systématiquement les utilisateurs en erreur, révèle une nouvelle étude.

Comment modifier les questions sur ChatGPT

Comment modifier les questions sur ChatGPT

ChatGPT dispose désormais d'une option de modification de question afin que les utilisateurs puissent modifier la question ou le contenu qu'ils échangent avec ChatGPT.

Comment repérer les faux codes QR et protéger vos données

Comment repérer les faux codes QR et protéger vos données

Les codes QR semblent assez inoffensifs jusqu'à ce que vous scanniez un mauvais code QR et que vous receviez quelque chose de désagréable sur votre système. Si vous souhaitez protéger votre téléphone et vos données, il existe plusieurs moyens d’identifier les faux codes QR.

Qualcomm lance le modem 5G X85 avec une série daméliorations notables

Qualcomm lance le modem 5G X85 avec une série daméliorations notables

Sur scène au MWC 2025, Qualcomm a fait sensation en présentant sa huitième génération de modem 5G appelé X85, qui devrait être utilisé dans les smartphones phares lancés plus tard cette année.

La nouvelle technologie permet aux téléphones de changer de couleur de manière flexible

La nouvelle technologie permet aux téléphones de changer de couleur de manière flexible

Vous avez un iPhone 16 « Ultramarine » tendance, mais un beau jour, vous vous ennuyez soudainement de cette couleur ; Que ferez-vous?

Microsoft intègre DeepSeek dans la plateforme PC Copilot+

Microsoft intègre DeepSeek dans la plateforme PC Copilot+

En janvier, Microsoft a annoncé son intention d'apporter des versions optimisées NPU du modèle DeepSeek-R1 directement aux ordinateurs Copilot+ fonctionnant sur des processeurs Qualcomm Snapdragon X.

Différence entre les fonctions SI et Switch dans Excel

Différence entre les fonctions SI et Switch dans Excel

L'instruction SI est une fonction logique courante dans Excel. L'instruction SWITCH est moins connue, mais vous pouvez l'utiliser à la place de l'instruction IF dans certains cas.

Comment ajouter un effet de projecteur derrière votre sujet à laide dAdobe Camera Raw

Comment ajouter un effet de projecteur derrière votre sujet à laide dAdobe Camera Raw

L’ajout d’un effet de projecteur derrière le sujet sur une photo est un excellent moyen de séparer le sujet de l’arrière-plan. L'effet de projecteur peut ajouter de la profondeur aux photos de portrait.

Comment augmenter la taille limite des pièces jointes Outlook

Comment augmenter la taille limite des pièces jointes Outlook

Outlook et d’autres services de messagerie ont des limites sur la taille des pièces jointes aux e-mails. Voici les instructions pour augmenter la limite de taille des pièces jointes Outlook.