Alibaba vient d’annoncer officiellement son dernier modèle de raisonnement, et il semble que DeepSeek et OpenAI aient des raisons de s’inquiéter – si tout le « battage médiatique » d’Alibaba est vrai. Ce modèle est open source, donc tout le monde peut y accéder et en faire l'expérience gratuitement.
Baptisé QwQ-32b (Quan-with-Questions), le nouveau modèle d'IA d'Alibaba fonctionne avec beaucoup moins de paramètres que presque tous les principaux modèles de langage actuels, ce qui signifie qu'il nécessite moins de ressources. Alibaba affirme que QwQ-32b fonctionne au même niveau que DeepSeek ou o1-mini d'OpenAI.
Le modèle de langage large (LLM) DeepSeek-R1 a fait des vagues lors de son lancement début février, défiant la norme d'or établie par ChatGPT, mais à un coût d'exploitation bien inférieur. Avec le QwQ-32b, il semble qu’Alibaba veuille repousser encore plus loin cette limite.
Techniquement, DeepSeek-R1 nécessite 671 milliards de paramètres pour fonctionner, avec 37 milliards de paramètres activés. Pendant ce temps, le QwQ-32b d'Alibaba n'a besoin que de 32 milliards de paramètres. Ces chiffres peuvent sembler abstraits pour beaucoup, mais ils font une énorme différence en termes de puissance de calcul : alors que DeepSeek-R1 nécessitait 1600 Go de VRAM pour fonctionner, QwQ-32b n'a besoin que de 24 Go de VRAM. Dans la plupart des cas, cela nécessitera une carte graphique comme la Nvidia H100 ou équivalente, mais même la RTX 4090, adaptée aux joueurs, dispose de 24 Go de VRAM. La dernière RTX 5090 porte ce nombre à 32 Go.
Il est même avancé que même avec seulement 32 milliards de paramètres, QwQ-32B offre toujours des performances égales ou supérieures à R1 dans des domaines tels que les mathématiques, la programmation et la résolution générale de problèmes. Alibaba a également déclaré que le QwQ-32B surpasse le o1-mini d'OpenAI, qui est construit avec 100 milliards de paramètres. QwQ-32B est disponible sur Hugging Face, la plus grande communauté de modèles d'IA open source au monde.

Le QwQ-32b d'Alibaba est disponible sous la licence Apache 2.0, ce qui signifie que les entreprises et les chercheurs peuvent l'utiliser librement. Plus important encore, nous pouvons l'essayer via Qwen Chat d'Alibaba. Comme DeepSeek, QwQ-32b présente certaines limitations en termes de limites de sujet. Par exemple, lorsqu'on vous pose des questions sur des questions politiques, Qwen Chat affichera un message indiquant qu'il s'agit d'un sujet inapproprié. Mais il y a aussi quelques avantages qui sont immédiatement apparents.
Le QwQ-32b semble donner des réponses assez détaillées même à des questions rapides et simples. Cela peut être une bonne chose, mais d’une certaine manière, c’est assez ennuyeux car cela fournit beaucoup d’informations inutiles que vous n’avez pas demandées. L’un des avantages de QwQ-32b est qu’il peut afficher l’intégralité du processus de raisonnement, de manière similaire à la fonction Deep Thinking de ChatGPT, mais avec moins de profondeur.
Il reste à voir si les affirmations d'Alibaba se réaliseront, mais il semble que ChatGPT et DeepSeek aient désormais un nouveau concurrent digne de ce nom.