DeepSeek, l'entreprise chinoise à l'origine du modèle d'IA gratuit qui a secoué le monde de la technologie, fait face à un certain nombre d'allégations négatives, notamment l'utilisation de GPU Nvidia de contrebande pour former et exécuter son modèle d'IA éponyme.
En conséquence, le ministère américain du Commerce envisage d’enquêter pour savoir si DeepSeek a illégalement accédé et collecté des GPU Nvidia par l’intermédiaire d’intermédiaires à Singapour. Ces dernières années, les États-Unis ont maintenu des restrictions strictes sur l’exportation de puces avancées vers la Chine, dans le but de maintenir leur position de leader en matière de technologie et de freiner le développement rapide de leur rival.
DeepSeek a récemment fait la une des journaux pour la publication de son modèle d'inférence R1. Ce modèle aurait des performances proches de celles du modèle o1 d'OpenAI, qui n'est disponible que dans le plan d'abonnement ChatGPT Pro qui nécessite un abonnement payant. Ce qui rend DeepSeek si précieux, c'est que non seulement il a des performances similaires, mais il est également publié en open source et gratuit pour tous. Ceux qui n'ont jamais eu la chance de découvrir le modèle d'inférence de pointe d'OpenAI ont désormais DeepSeek R1 comme alternative intéressante.
DeepSeek a été si populaire que l'application s'est hissée à la première place des classements de l'App Store américain, provoquant la chute du marché boursier américain, avec 2 000 milliards de dollars de capitalisation boursière anéantis en quelques jours seulement.
Notamment, DeepSeek affirme avoir réalisé tout cela avec seulement 2 000 GPU Nvidia H800 et un coût d'investissement estimé à 6 millions de dollars, un petit chiffre comparé aux énormes investissements consacrés à OpenAI et à de nombreux autres modèles d'IA similaires.
Selon Citigroup, les géants technologiques américains tels que Microsoft, Meta, Amazon et Alphabet ont dépensé au total environ 209 milliards de dollars en infrastructures de données l'année dernière, dont 80 % pour les centres de données. Cela a amené de nombreuses personnes à se demander si DeepSeek fait réellement quelque chose de différent d’OpenAI et d’autres sociétés d’IA américaines, et s’il est vraiment possible de former des modèles d’IA avec autant de ressources en moins.

David Sacks, ancien responsable de l’intelligence artificielle sous la présidence de Donald Trump, a déclaré dans une récente interview qu’il existe des « preuves substantielles » que DeepSeek a distillé les résultats d’OpenAI pour former son propre modèle. Ce processus de distillation implique un « modèle enfant » (DeepSeek) imitant le raisonnement du « modèle parent » (OpenAI), de la même manière que les humains apprennent, en posant des millions de questions. Microsoft et OpenAI ont également lancé leurs propres enquêtes sur la question, principalement pour clarifier si DeepSeek a accédé de manière inappropriée aux données d'OpenAI.
DeepSeek a déclaré qu'il utilise la puce H800, un chipset d'IA que Nvidia a développé spécifiquement pour le marché chinois après l'imposition des premiers contrôles à l'exportation. On ne sait pas comment DeepSeek a acquis les Nvidia H800, mais la société pourrait les acheter fin 2022 ou 2023.
Il n’existe actuellement aucune preuve que DeepSeek ait utilisé des puces de contrebande. Mais de nombreuses entreprises chinoises d’IA auraient fait de même. La contrebande organisée de puces d’IA vers la Chine a été observée dans plusieurs pays, dont la Malaisie, Singapour et les Émirats arabes unis.