Le géant chinois du commerce électronique Alibaba a continué de faire la une des journaux en lançant un nouveau modèle d'IA qui, selon lui, est capable de lire les émotions humaines. Le modèle, appelé « R1-Omni », a été développé par une équipe d'ingénieurs du Tongyi Lab d'Alibaba. Avec la lecture des émotions au cœur de l'interaction utilisateur, Alibaba affirme avec confiance que R1-Omni peut complètement surpasser des concurrents tels que ChatGPT d'OpenAI et de nombreux autres modèles LLM actuellement sur le marché en termes d'expérience réelle.
Notamment, R1-Omni est proposé en open source. Lors de démonstrations, ce modèle d’IA a pu comprendre les émotions humaines à partir de vidéos, ainsi que décrire leurs vêtements et leur environnement. Le nouveau modèle d'IA d'Alibaba porte la vision par ordinateur à un niveau supérieur, en s'appuyant sur un modèle précédemment publié appelé HumanOmni, également créé par le chercheur Jiaxing Zhao et ses collègues du Tongyi Lab.
Techniquement, R1-Omni peut être considéré comme le premier modèle de langage multimodal complet qui applique l'apprentissage par renforcement avec des récompenses vérifiables (RLVR) - une technologie qui promet d'améliorer la capacité de l'IA à raisonner et à analyser les émotions. En conséquence, R1-Omni peut analyser rapidement et comprendre plus précisément comment les informations visuelles et auditives soutiennent la reconnaissance des émotions, et identifier clairement quels facteurs jouent un rôle plus important dans l’évaluation de chaque type d’émotion.
Alibaba investit massivement dans les outils et applications d’IA. Le géant technologique chinois a récemment signé un partenariat avec Apple pour apporter des fonctionnalités d'IA aux iPhones en Chine et a défié OpenAI en proposant R1-Omni gratuitement sur sa plateforme Hugging Face.
L’objectif ultime qu’Alibaba souhaite atteindre est « l’intelligence artificielle générale » (AGI). Le PDG Eddie Wu a clairement indiqué aux analystes en février que l'AGI était une priorité absolue pour l'entreprise. Et les derniers développements dans le domaine de l’IA montrent les efforts d’Alibaba pour affirmer sa position d’acteur majeur dans la course mondiale à l’IA.
D’un autre côté, OpenAI est également conscient de la concurrence croissante des plateformes d’IA rivales. La société a publié un modèle GPT-4.5 mis à jour plus tôt cette année, capable de détecter des nuances subtiles dans les invites des utilisateurs. Cependant, ce modèle n'est pas proposé gratuitement, mais uniquement aux abonnés premium avec un tarif assez élevé de 200 USD/mois.