Deepseek publie un modèle de langage v3 gratuit qui fonctionne bien sur les configurations matérielles courantes

La startup chinoise d'IA DeepSeek vient de publier officiellement son dernier modèle de langage à grande échelle (LLM), DeepSeek-V3-0324. Avec une capacité allant jusqu'à 641 Go, ce modèle a été annoncé sur la plateforme AI Hugging Face sans que beaucoup d'informations ne soient révélées, conformément au style secret sur les nouveaux produits que l'entreprise a toujours appliqué jusqu'à présent.

La particularité de ce modèle est la licence MIT, qui permet une utilisation gratuite à des fins commerciales. Les premiers résultats de référence montrent que DeepSeek-V3-0324 est capable de fonctionner sur des configurations matérielles courantes, telles que le Mac Studio d'Apple avec la puce M3 Ultra. Le scientifique en IA Awni Hannun a rapporté qu'il était possible d'atteindre des vitesses de traitement de plus de 20 jetons par seconde en utilisant cette configuration. Cette capacité à exécuter un modèle de langage volumineux sur du matériel standard sur site contraste fortement avec l’approche traditionnelle consistant à utiliser une infrastructure de centre de données massive pour prendre en charge des modèles d’IA avancés.

Deepseek publie un modèle de langage v3 gratuit qui fonctionne bien sur les configurations matérielles courantes

Selon les informations de DeepSeek, les premiers tests ont montré des améliorations significatives par rapport aux versions précédentes. Ce modèle a été rigoureusement testé par des parties prenantes internes et a démontré d'excellentes performances, surpassant même tous les autres modèles concurrents et battant le Claude Sonnet 3.5 d'Anthropic dans les tâches qui ne nécessitent pas de réflexion approfondie. Cependant, contrairement aux modèles de type Sonnet qui nécessitent un abonnement payant, DeepSeek-V3-0324 est entièrement gratuit à télécharger et à utiliser.

Techniquement, DeepSeek-V3-0324 utilise une architecture mixte d'experts (MoE). Il se distingue par sa capacité à utiliser de manière sélective environ 37 milliards des 685 milliards de paramètres par tâche, augmentant ainsi l'efficacité en réduisant les exigences de calcul tout en maintenant les performances. Ce modèle applique également les technologies Multi-Head Latent Attention (MLA) et Multi-Token Prediction (MTP), qui contribuent à améliorer la mémoire contextuelle et à accélérer la sortie.

Les utilisateurs peuvent accéder à DeepSeek-V3-0324 via Hugging Face, l'interface de chat et l'API d'OpenRouter, ainsi que la plate-forme de chat de DeepSeek s'ils le souhaitent. Le fournisseur de services d'inférence Hyperbolic Labs fournit également l'accès au modèle.

Avec la sortie de DeepSeek-V3-0324, la société continue d'affirmer sa position dans la course au développement de grands modèles de langage, tout en offrant une option puissante et accessible à la communauté de recherche et développement en IA. La possibilité de fonctionner sur du matériel standard associé à une licence gratuite ouvrira certainement de nombreuses possibilités d’application pratique pour ce modèle dans un avenir proche.

Sign up and earn $1000 a day ⋙

Leave a Comment

Microsoft intègre DeepSeek dans la plateforme PC Copilot+

Microsoft intègre DeepSeek dans la plateforme PC Copilot+

En janvier, Microsoft a annoncé son intention d'apporter des versions optimisées NPU du modèle DeepSeek-R1 directement aux ordinateurs Copilot+ fonctionnant sur des processeurs Qualcomm Snapdragon X.

Comment enregistrer rapidement un compte DeepSeek

Comment enregistrer rapidement un compte DeepSeek

L'application d'IA DeepSeek, basée en Chine, est actuellement en tête des classements de l'App Store.

Les escrocs utilisent Deepseek pour voler les données des utilisateurs

Les escrocs utilisent Deepseek pour voler les données des utilisateurs

Les méchants créent des milliers de sites Web de type DeepSeek dans l’espoir que des utilisateurs sans méfiance leur donneront leurs informations personnelles.

Ces fausses publicités DeepSeek propagent des logiciels malveillants dangereux

Ces fausses publicités DeepSeek propagent des logiciels malveillants dangereux

Une série d'annonces frauduleuses DeepSeek sur Google fournit des logiciels malveillants dangereux volant des informations aux utilisateurs de DeepSeek sans méfiance.

DeepSeek invite les utilisateurs à explorer les coulisses de lIA open source de lentreprise

DeepSeek invite les utilisateurs à explorer les coulisses de lIA open source de lentreprise

La startup d'intelligence artificielle basée en Chine DeepSeek prévoit d'être plus « transparente » sur la technologie derrière ses modèles d'IA open source, tels que le modèle de raisonnement R1.

Huawei lance le téléphone pliable Pura X avec lassistant IA DeepSeek

Huawei lance le téléphone pliable Pura X avec lassistant IA DeepSeek

Huawei se lance dans une ère totalement sans Android avec le Pura X, un nouveau téléphone pliable qui exécute le logiciel HarmonyOS 5 de la société et n'inclut pas d'option permettant aux utilisateurs d'utiliser le système d'exploitation de Google.

4 raisons pour lesquelles vous devriez abandonner ChatGPT et commencer à utiliser DeepSeek

4 raisons pour lesquelles vous devriez abandonner ChatGPT et commencer à utiliser DeepSeek

DeepSeek est le nom d'une société chinoise d'intelligence artificielle et de son chatbot du même nom. Les modèles phares de la société, DeepSeek-V3 et DeepSeek-R1, ont fait des vagues car ils sont moins chers à former et à utiliser que leurs homologues.

Alibaba dévoile QwQ-32b, un concurrent de taille pour DeepSeek

Alibaba dévoile QwQ-32b, un concurrent de taille pour DeepSeek

Il reste à voir si les affirmations d'Alibaba se réaliseront, mais il semble que ChatGPT et DeepSeek aient désormais un nouveau concurrent digne de ce nom.

Les moniteurs externes peuvent avoir un impact négatif sur les batteries des ordinateurs portables.

Les moniteurs externes peuvent avoir un impact négatif sur les batteries des ordinateurs portables.

L’utilisation d’un ordinateur portable avec un écran externe est une excellente combinaison pour la productivité et vous aider à accomplir votre travail. Mais au fil du temps, vous constaterez que votre ordinateur portable se retrouve soudainement à court de batterie et que sa durée de vie commence à diminuer.

8 inconvénients majeurs des téléphones à écran pliable auxquels vous ne vous attendiez pas

8 inconvénients majeurs des téléphones à écran pliable auxquels vous ne vous attendiez pas

Il est indéniable que les téléphones pliables sont plutôt cool. Mais après un certain temps d'utilisation, cet appareil présente quelques bizarreries. Voici 5 inconvénients majeurs des téléphones à écran pliable auxquels vous ne vous attendriez pas !

Adobe apporte la technologie de création vidéo IA à Premiere Pro

Adobe apporte la technologie de création vidéo IA à Premiere Pro

Adobe a apporté la technologie de création de vidéos IA au grand public d'une nouvelle manière, même si elle n'a pas encore créé de film fini en utilisant cette technologie.

Derniers codes Genshin Impact (avril 2025)

Derniers codes Genshin Impact (avril 2025)

Le code Genshin Impact 5.5 vous aide à échanger contre des pierres primordiales, des minéraux magiques, de l'expérience et de nombreuses autres récompenses.

Comment transformer votre iPad en écran Mac supplémentaire

Comment transformer votre iPad en écran Mac supplémentaire

macOS Catalina et iPadOS incluent la prise en charge d'une nouvelle fonctionnalité appelée Sidecar, conçue pour vous permettre d'utiliser votre iPad comme écran secondaire pour votre Mac.

Fond décran 1280, magnifique fond décran pour téléphone Nokia 1280

Fond décran 1280, magnifique fond décran pour téléphone Nokia 1280

Il s'agit d'un ensemble de fonds d'écran Nokia 1280, si vous avez déjà envoyé un SMS pour obtenir des fonds d'écran 1280, des fonds d'écran de téléphone en brique, essayez de regarder ces fonds d'écran.

Eating bananas for breakfast helps you reduce bloating

Eating bananas for breakfast helps you reduce bloating

Bloating can happen to anyone. The good news is that breakfast is a great time to add a few ingredients to your meal that can help reduce bloating. That ingredient is bananas.

OpenAI annonce une mise à jour majeure de la génération dimages IA dans ChatGPT

OpenAI annonce une mise à jour majeure de la génération dimages IA dans ChatGPT

OpenAI vient de présenter officiellement une mise à niveau remarquable de la capacité de génération d'images IA dans ChatGPT, une étape importante en avant au lieu d'utiliser un modèle de génération d'images séparé comme le précédent DALL-E.

Deepseek publie un modèle de langage v3 gratuit qui fonctionne bien sur les configurations matérielles courantes

Deepseek publie un modèle de langage v3 gratuit qui fonctionne bien sur les configurations matérielles courantes

La startup chinoise d'IA DeepSeek vient de publier officiellement son dernier modèle de langage à grande échelle (LLM), DeepSeek-V3-0324.

Vœux de week-end doux et romantiques pour les amoureux

Vœux de week-end doux et romantiques pour les amoureux

Envoyez des vœux de week-end doux et romantiques à votre amoureux. Même s’il ne s’agit que de mots ou de messages, ils constitueront des cadeaux spirituels significatifs, contribuant à renforcer votre relation.

La série télévisée Harry Potter a besoin des éléments suivants pour réussir

La série télévisée Harry Potter a besoin des éléments suivants pour réussir

Le remake de Harry Potter de HBO devrait être diffusé en 2026. Voici ce qui fait le succès de la série télévisée Harry Potter.

De superbes photos de la super lune du monde entier

De superbes photos de la super lune du monde entier

Les belles photos de la lune ne sont pas rares sur Internet. L'article résumera pour vous les plus belles photos de lune au monde.

Les utilisateurs dAMD Ryzen devraient installer cette mise à jour du BIOS pour une amélioration gratuite des performances

Les utilisateurs dAMD Ryzen devraient installer cette mise à jour du BIOS pour une amélioration gratuite des performances

AMD a désormais répondu aux problèmes de sa gamme de processeurs phares sous-performants avec une nouvelle mise à jour qui pourrait fournir quelques images par seconde supplémentaires.

La valeur de X chute de 44 milliards de dollars à moins de 10 milliards de dollars

La valeur de X chute de 44 milliards de dollars à moins de 10 milliards de dollars

En octobre 2022, Elon Musk a dépensé 44 milliards de dollars pour acquérir X, mais à ce jour, la valeur de la plateforme a chuté de 78,6 % pour atteindre environ 9,4 milliards de dollars.

Comment le vaisseau spatial Orion est protégé des radiations extrêmes

Comment le vaisseau spatial Orion est protégé des radiations extrêmes

Lorsque la mission Artemis I de la NASA sera lancée avec succès dans l'espace et commencera son voyage autour de la Lune en 2022, il n'y aura pas d'astronautes à bord - à la place, il y aura deux mannequins de taille adulte.