Deepseek publie un modèle de langage v3 gratuit qui fonctionne bien sur les configurations matérielles courantes

La startup chinoise d'IA DeepSeek vient de publier officiellement son dernier modèle de langage à grande échelle (LLM), DeepSeek-V3-0324. Avec une capacité allant jusqu'à 641 Go, ce modèle a été annoncé sur la plateforme AI Hugging Face sans que beaucoup d'informations ne soient révélées, conformément au style secret sur les nouveaux produits que l'entreprise a toujours appliqué jusqu'à présent.

La particularité de ce modèle est la licence MIT, qui permet une utilisation gratuite à des fins commerciales. Les premiers résultats de référence montrent que DeepSeek-V3-0324 est capable de fonctionner sur des configurations matérielles courantes, telles que le Mac Studio d'Apple avec la puce M3 Ultra. Le scientifique en IA Awni Hannun a rapporté qu'il était possible d'atteindre des vitesses de traitement de plus de 20 jetons par seconde en utilisant cette configuration. Cette capacité à exécuter un modèle de langage volumineux sur du matériel standard sur site contraste fortement avec l’approche traditionnelle consistant à utiliser une infrastructure de centre de données massive pour prendre en charge des modèles d’IA avancés.

Deepseek publie un modèle de langage v3 gratuit qui fonctionne bien sur les configurations matérielles courantes

Selon les informations de DeepSeek, les premiers tests ont montré des améliorations significatives par rapport aux versions précédentes. Ce modèle a été rigoureusement testé par des parties prenantes internes et a démontré d'excellentes performances, surpassant même tous les autres modèles concurrents et battant le Claude Sonnet 3.5 d'Anthropic dans les tâches qui ne nécessitent pas de réflexion approfondie. Cependant, contrairement aux modèles de type Sonnet qui nécessitent un abonnement payant, DeepSeek-V3-0324 est entièrement gratuit à télécharger et à utiliser.

Techniquement, DeepSeek-V3-0324 utilise une architecture mixte d'experts (MoE). Il se distingue par sa capacité à utiliser de manière sélective environ 37 milliards des 685 milliards de paramètres par tâche, augmentant ainsi l'efficacité en réduisant les exigences de calcul tout en maintenant les performances. Ce modèle applique également les technologies Multi-Head Latent Attention (MLA) et Multi-Token Prediction (MTP), qui contribuent à améliorer la mémoire contextuelle et à accélérer la sortie.

Les utilisateurs peuvent accéder à DeepSeek-V3-0324 via Hugging Face, l'interface de chat et l'API d'OpenRouter, ainsi que la plate-forme de chat de DeepSeek s'ils le souhaitent. Le fournisseur de services d'inférence Hyperbolic Labs fournit également l'accès au modèle.

Avec la sortie de DeepSeek-V3-0324, la société continue d'affirmer sa position dans la course au développement de grands modèles de langage, tout en offrant une option puissante et accessible à la communauté de recherche et développement en IA. La possibilité de fonctionner sur du matériel standard associé à une licence gratuite ouvrira certainement de nombreuses possibilités d’application pratique pour ce modèle dans un avenir proche.

Sign up and earn $1000 a day ⋙

Leave a Comment

Pourquoi ChatGPT est meilleur que DeepSeek

Pourquoi ChatGPT est meilleur que DeepSeek

Au début, les gens avaient de grands espoirs pour DeepSeek. En tant que chatbot IA commercialisé comme un concurrent sérieux de ChatGPT, il promet des capacités et des expériences de chat intelligentes.

Microsoft intègre DeepSeek dans la plateforme PC Copilot+

Microsoft intègre DeepSeek dans la plateforme PC Copilot+

En janvier, Microsoft a annoncé son intention d'apporter des versions optimisées NPU du modèle DeepSeek-R1 directement aux ordinateurs Copilot+ fonctionnant sur des processeurs Qualcomm Snapdragon X.

Comment enregistrer rapidement un compte DeepSeek

Comment enregistrer rapidement un compte DeepSeek

L'application d'IA DeepSeek, basée en Chine, est actuellement en tête des classements de l'App Store.

Les escrocs utilisent Deepseek pour voler les données des utilisateurs

Les escrocs utilisent Deepseek pour voler les données des utilisateurs

Les méchants créent des milliers de sites Web de type DeepSeek dans l’espoir que des utilisateurs sans méfiance leur donneront leurs informations personnelles.

Ces fausses publicités DeepSeek propagent des logiciels malveillants dangereux

Ces fausses publicités DeepSeek propagent des logiciels malveillants dangereux

Une série d'annonces frauduleuses DeepSeek sur Google fournit des logiciels malveillants dangereux volant des informations aux utilisateurs de DeepSeek sans méfiance.

DeepSeek invite les utilisateurs à explorer les coulisses de lIA open source de lentreprise

DeepSeek invite les utilisateurs à explorer les coulisses de lIA open source de lentreprise

La startup d'intelligence artificielle basée en Chine DeepSeek prévoit d'être plus « transparente » sur la technologie derrière ses modèles d'IA open source, tels que le modèle de raisonnement R1.

Huawei lance le téléphone pliable Pura X avec lassistant IA DeepSeek

Huawei lance le téléphone pliable Pura X avec lassistant IA DeepSeek

Huawei se lance dans une ère totalement sans Android avec le Pura X, un nouveau téléphone pliable qui exécute le logiciel HarmonyOS 5 de la société et n'inclut pas d'option permettant aux utilisateurs d'utiliser le système d'exploitation de Google.

4 raisons pour lesquelles vous devriez abandonner ChatGPT et commencer à utiliser DeepSeek

4 raisons pour lesquelles vous devriez abandonner ChatGPT et commencer à utiliser DeepSeek

DeepSeek est le nom d'une société chinoise d'intelligence artificielle et de son chatbot du même nom. Les modèles phares de la société, DeepSeek-V3 et DeepSeek-R1, ont fait des vagues car ils sont moins chers à former et à utiliser que leurs homologues.

Alibaba dévoile QwQ-32b, un concurrent de taille pour DeepSeek

Alibaba dévoile QwQ-32b, un concurrent de taille pour DeepSeek

Il reste à voir si les affirmations d'Alibaba se réaliseront, mais il semble que ChatGPT et DeepSeek aient désormais un nouveau concurrent digne de ce nom.

Why doesnt the freezer have a light but the refrigerator does?

Why doesnt the freezer have a light but the refrigerator does?

Refrigerators are familiar appliances in families. Refrigerators usually have 2 compartments, the cool compartment is spacious and has a light that automatically turns on every time the user opens it, while the freezer compartment is narrow and has no light.

2 Ways to Fix Network Congestion That Slows Down Wi-Fi

2 Ways to Fix Network Congestion That Slows Down Wi-Fi

Wi-Fi networks are affected by many factors beyond routers, bandwidth, and interference, but there are some smart ways to boost your network.

Comment rétrograder diOS 17 à iOS 16 sans perte de données avec Tenorshare Reiboot

Comment rétrograder diOS 17 à iOS 16 sans perte de données avec Tenorshare Reiboot

Si vous souhaitez revenir à la version stable d'iOS 16 sur votre téléphone, voici le guide de base pour désinstaller iOS 17 et rétrograder d'iOS 17 à 16.

Que se passe-t-il dans le corps lorsque vous mangez du yaourt tous les jours ?

Que se passe-t-il dans le corps lorsque vous mangez du yaourt tous les jours ?

Le yaourt est un aliment merveilleux. Est-il bon de manger du yaourt tous les jours ? Si vous mangez du yaourt tous les jours, comment votre corps va-t-il changer ? Découvrons-le ensemble !

Quel type de riz est le meilleur pour la santé ?

Quel type de riz est le meilleur pour la santé ?

Cet article présente les types de riz les plus nutritifs et comment maximiser les bienfaits pour la santé du riz que vous choisissez.

Comment se réveiller à lheure le matin

Comment se réveiller à lheure le matin

Établir un horaire de sommeil et une routine de coucher, changer votre réveil et ajuster votre alimentation sont quelques-unes des mesures qui peuvent vous aider à mieux dormir et à vous réveiller à l’heure le matin.

Latest Bathroom Tower Defense Codes and How to Enter Codes

Latest Bathroom Tower Defense Codes and How to Enter Codes

Get Bathroom Tower Defense Roblox game codes and redeem them for exciting rewards. They will help you upgrade or unlock towers with higher damage.

4 façons dont lIA améliore les téléviseurs intelligents

4 façons dont lIA améliore les téléviseurs intelligents

De la meilleure qualité d’image et de son au contrôle vocal et bien plus encore, ces fonctionnalités alimentées par l’IA rendent les téléviseurs intelligents bien meilleurs !

Pourquoi ChatGPT est meilleur que DeepSeek

Pourquoi ChatGPT est meilleur que DeepSeek

Au début, les gens avaient de grands espoirs pour DeepSeek. En tant que chatbot IA commercialisé comme un concurrent sérieux de ChatGPT, il promet des capacités et des expériences de chat intelligentes.

Découvrez Fireflies.ai : le secrétaire IA gratuit qui vous fait gagner des heures de travail

Découvrez Fireflies.ai : le secrétaire IA gratuit qui vous fait gagner des heures de travail

Il est facile de manquer des détails importants lorsque l’on note d’autres éléments essentiels, et essayer de prendre des notes tout en discutant peut être distrayant. Fireflies.ai est la solution.

Comment élever un axolotl dans Minecraft et apprivoiser une salamandre dans Minecraft

Comment élever un axolotl dans Minecraft et apprivoiser une salamandre dans Minecraft

Axolot Minecraft sera un excellent assistant pour les joueurs lorsqu'ils opèrent sous l'eau s'ils savent comment les utiliser.

DeceptionAds Warning: New Malicious Ad Type Exploits Legitimate Services to Display Fake CAPTCHAs

DeceptionAds Warning: New Malicious Ad Type Exploits Legitimate Services to Display Fake CAPTCHAs

DeceptionAds is a new form of malvertising, where scammers use legitimate advertising platforms and make sure their malicious sites avoid censorship as much as possible.

What to do when you see the “AirTag Found Moving With You” warning?

What to do when you see the “AirTag Found Moving With You” warning?

Wondering what the Airtag Found Moving With You warning is? Its a safety feature on AirTags designed to prevent them from being used to track you.

Le pouvoir mystérieux du nombre 33 en numérologie

Le pouvoir mystérieux du nombre 33 en numérologie

En numérologie, le nombre 33 est souvent considéré comme un nombre puissant et mystique. Voici ce que vous devez savoir sur le nombre 33 en numérologie.

What is dark energy?

What is dark energy?

Dark energy is driving the accelerating expansion of the universe, but its nature remains a complete mystery. Heres what you need to know about dark energy.