Foxconn annonce un modèle de langage étendu (LLM) amélioré à partir de Llama 3.1 de Meta

Foxconn, l'entreprise la plus connue pour la fabrication d'iPhones et d'autres produits matériels Apple, vient de surprendre tout le monde en annonçant son premier grand modèle de langage (LLM), appelé FoxBrain, qui est destiné à être utilisé pour améliorer la gestion de la fabrication et de la chaîne d'approvisionnement.

Le fabricant taïwanais affirme que FoxBrain a été formé avec seulement 120 GPU H100 de Nvidia. Ce LLM est essentiellement développé sur la base de l'architecture Llama 3.1 de Meta, avec 70 milliards de paramètres via la distillation. Le concept de raffinement LLM implique l’utilisation d’un modèle « parent » et la formation d’un modèle « enfant » en fonction de ses réponses. Foxconn a également admis que son LLM n'est pas aussi bon que le modèle raffiné de DeepSeek (Chine), mais les performances globales sont très proches des normes de classe mondiale.

À propos de cette réussite, le Dr Yung-Hui Li, directeur du Centre de recherche en intelligence artificielle de l'Institut de recherche Hon Hai (Foxconn), a déclaré :

Ces derniers mois, l’amélioration des capacités de raisonnement et l’utilisation efficace des GPU sont progressivement devenues une tendance majeure dans le domaine de l’IA. Notre modèle FoxBrain a adopté une stratégie de formation très efficace, axée sur l’optimisation du processus de formation plutôt que sur l’accumulation aveugle de puissance de calcul.

« Grâce à des méthodes de formation soigneusement conçues et à l'optimisation des ressources, nous avons réussi à construire un modèle d'IA local doté de fortes capacités de raisonnement. »

Foxconn annonce un modèle de langage étendu (LLM) amélioré à partir de Llama 3.1 de Meta

Foxconn n'assemble pas seulement les produits Apple, mais fabrique également les serveurs d'IA de Nvidia. Avec 120 GPU H100, FoxBrain est mis à l'échelle à l'aide du réseau Quantum-2 InfiniBand de Nvidia, et la formation ne prend qu'environ 4 semaines (pour un coût de calcul total de 2 688 jours GPU). Foxconn a généré 98 milliards de jetons de données de pré-formation de haute qualité en chinois traditionnel avec une longueur de fenêtre contextuelle allant jusqu'à 128 000 jetons.

Le partenariat entre Foxconn et Nvidia n'est pas nouveau, et les deux sociétés travaillent également sur d'autres projets, notamment la construction de la plus grande usine de fabrication de GPU Blackwell au monde.

Nvidia a également fourni à Foxconn le supercalculateur Taipei-1 pour compléter le processus de pré-formation du modèle. Foxconn a déclaré que FoxBrain deviendrait un « moteur clé » pour mettre à niveau les trois principales plateformes de l'entreprise : Smart Manufacturing, Smart Electric Vehicles et Smart Cities.

Sign up and earn $1000 a day ⋙

Leave a Comment

Comment obtenir de beaux ongles rapidement

Comment obtenir de beaux ongles rapidement

Vous souhaitez avoir rapidement de beaux ongles brillants et sains. Ces conseils simples pour de beaux ongles ci-dessous vous seront utiles.

Les secrets de linspiration des couleurs que seuls les designers connaissent

Les secrets de linspiration des couleurs que seuls les designers connaissent

Cet article répertorie des conseils inspirés des couleurs, partagés par les meilleurs designers de la communauté Creative Market, afin que vous puissiez obtenir la combinaison de couleurs parfaite à chaque fois.

Tout ce dont vous avez besoin pour remplacer votre ordinateur portable par un téléphone

Tout ce dont vous avez besoin pour remplacer votre ordinateur portable par un téléphone

Pouvez-vous vraiment remplacer votre ordinateur portable par votre téléphone ? Oui, mais vous aurez besoin des bons accessoires pour transformer votre téléphone en ordinateur portable.

ChatGPT pourra bientôt voir tout ce qui se passe sur votre écran

ChatGPT pourra bientôt voir tout ce qui se passe sur votre écran

Un élément important dans la vidéo complète de l'événement est que la prochaine fonctionnalité de l'application ChatGPT a été présentée, mais aucun détail réel n'a été partagé. C'est la capacité de ChatGPT à voir tout ce qui se passe sur l'écran de l'appareil de l'utilisateur.

LIA apprend à tromper les humains malgré sa formation à être honnête

LIA apprend à tromper les humains malgré sa formation à être honnête

De nombreuses IA de haut niveau, bien qu'elles aient été formées à être honnêtes, apprennent à tromper au fil de leur formation et induisent systématiquement les utilisateurs en erreur, révèle une nouvelle étude.

Comment modifier les questions sur ChatGPT

Comment modifier les questions sur ChatGPT

ChatGPT dispose désormais d'une option de modification de question afin que les utilisateurs puissent modifier la question ou le contenu qu'ils échangent avec ChatGPT.

Comment repérer les faux codes QR et protéger vos données

Comment repérer les faux codes QR et protéger vos données

Les codes QR semblent assez inoffensifs jusqu'à ce que vous scanniez un mauvais code QR et que vous receviez quelque chose de désagréable sur votre système. Si vous souhaitez protéger votre téléphone et vos données, il existe plusieurs moyens d’identifier les faux codes QR.

Qualcomm lance le modem 5G X85 avec une série daméliorations notables

Qualcomm lance le modem 5G X85 avec une série daméliorations notables

Sur scène au MWC 2025, Qualcomm a fait sensation en présentant sa huitième génération de modem 5G appelé X85, qui devrait être utilisé dans les smartphones phares lancés plus tard cette année.

La nouvelle technologie permet aux téléphones de changer de couleur de manière flexible

La nouvelle technologie permet aux téléphones de changer de couleur de manière flexible

Vous avez un iPhone 16 « Ultramarine » tendance, mais un beau jour, vous vous ennuyez soudainement de cette couleur ; Que ferez-vous?

Microsoft intègre DeepSeek dans la plateforme PC Copilot+

Microsoft intègre DeepSeek dans la plateforme PC Copilot+

En janvier, Microsoft a annoncé son intention d'apporter des versions optimisées NPU du modèle DeepSeek-R1 directement aux ordinateurs Copilot+ fonctionnant sur des processeurs Qualcomm Snapdragon X.

Différence entre les fonctions SI et Switch dans Excel

Différence entre les fonctions SI et Switch dans Excel

L'instruction SI est une fonction logique courante dans Excel. L'instruction SWITCH est moins connue, mais vous pouvez l'utiliser à la place de l'instruction IF dans certains cas.

Comment ajouter un effet de projecteur derrière votre sujet à laide dAdobe Camera Raw

Comment ajouter un effet de projecteur derrière votre sujet à laide dAdobe Camera Raw

L’ajout d’un effet de projecteur derrière le sujet sur une photo est un excellent moyen de séparer le sujet de l’arrière-plan. L'effet de projecteur peut ajouter de la profondeur aux photos de portrait.

Comment augmenter la taille limite des pièces jointes Outlook

Comment augmenter la taille limite des pièces jointes Outlook

Outlook et d’autres services de messagerie ont des limites sur la taille des pièces jointes aux e-mails. Voici les instructions pour augmenter la limite de taille des pièces jointes Outlook.

Pourquoi Lightroom est-il meilleur que toutes les autres applications de retouche photo ?

Pourquoi Lightroom est-il meilleur que toutes les autres applications de retouche photo ?

Malgré de nombreux concurrents, Adobe Lightroom reste la meilleure application de retouche photo. Oui, vous devez payer pour y accéder, mais les fonctionnalités de Lightroom en valent la peine.

Comment télécharger des vidéos YouTube simplement et rapidement

Comment télécharger des vidéos YouTube simplement et rapidement

Télécharger des vidéos depuis Youtube est désormais très simple, vous n'avez pas besoin de passer par des étapes compliquées pour pouvoir télécharger des vidéos Youtube sur votre ordinateur.