au sommaire


    DeepSeek est une IAIA générative conversationnelle, qui du jour au lendemain, est devenu un concurrent majeur de ChatGPTChatGPT, Claude et Perplexity, les stars américaines du domaine.

    Sa puissance est jugée comparable aux modèles mis en œuvre par OpenAI pour ChatGPT sur l'année 2024 (soit o1), ou Anthropic pour Claude 3.5 Sonnet (lancé en octobre 2024).

    Fin janvier 2025, DeepSeek est devenu l'applicationapplication la plus téléchargée sur l'App StoreStore d'AppleApple aux USA. Elle est gratuite car open source, ce qui a contribué à sa popularité immédiate, là où ChatGPT et ses principaux concurrents reposent principalement sur des formules payantes.

    L’interface de DeekSeek reprend celle de ChatGPT. © DeepSeek

    Ce qui distingue DeepSeek des modèles américains

    Le point fort essentiel de DeepSeek est que le coût de son développement a été incroyablement peu élevé. La création et l'entraînement de son modèle open source DeepSeek-V3, aurait requis 6 millions de dollars soit une fraction de la somme supérieure à 100 millions de dollars évoquée par Sam Altman, PDG d'OpenAI, pour le développement de GPT-4.  La révélation de cette information a créé un véritable choc dans la Silicon Valley.

    De plus, dans son usage quotidien, DeepSeek consomme moins de mémoire que ses concurrents, ce qui entraîne là encore une réduction des coûts. 

     

     

    Qui a fondé DeepSeek

    DeepSeek a été fondé en 2023 par Liang Wenfeng, à Hangzhou, une ville du sud-est de la Chine. 

    Quadragénaire, Lian Wenfeng a obtenu un diplôme en ingénierie de l'information et électronique, à l'université de Zhejiang.

    A la différence de la plupart des entrepreneurs de la Silicon Valley, Wenfeng dispose d'une expertise dans le domaine de la finance. Il dirige le fonds spéculatif High-Flyer, qui utilise l'IA pour optimiser le trading de données financières. En 2019, High-Flyer a levé plus de 100 milliards de yuans (soit environ 13 milliards d'euros).

    DeepSeek a été fondée en décembre 2023 et le développement du chatbot a démarré dans la foulée. 

    Wenfeng aurait constitué un stock important de puces Nvidia A100 - lesquelles ont été interdites d'exportation vers la Chine à partir de septembre 2022.  Ce stock, estimé à quelques 50 000 unités aurait été mis à contribution pour créer DeepSeek. Or, il ne s'agit pas du dernier modèle de Nvidia - les sociétés californiennes ont accès à des puces plus puissantes comme la Blackwell B200. La prouesse réalisée par DeepSeek n'en a été que plus impressionnante.

    Comment DeepSeek-R1 accomplit-il sa tâche tout en requérant bien moins de puissance ? L'une des approches du modèle d'IA utilisé repose sur des experts dédiés. Si l'on pose une question sur la science, c'est un expert lié à ce domaine qui prend en charge à la question. DeepSeek peut donc répondre efficacement tout en nécessitant moins de temps de calcul.

    Interrogé sur la surprise causée par l'apparition de DeepSeek-R1 dans la Silicon Valley, Wenfeng a déclaré : 

    « Leur surprise est venue du fait qu'une entreprise chinoise est entrée dans leur jeu en tant qu'innovateur, et non plus comme un simple suiveur - ce que la plupart des entreprises chinoises sont habituées à être. »

    Image du site Futura Sciences
    Liang Wenfeng imaginé dans son bureau de DeekSeek. © Grok

     

    L’impact de DeepSeek sur la tech américaine

    L'apparition de DeepSeek R1 a eu pour effet de provoquer une chute majeure des valeurs technologiques américaines - moins de 3 % - le 27 janvier 2025. Nvidia, entreprise la plus valorisée au monde en termes de capitalisation boursière, a perdu plus d'un sixième de sa valeur : son action a plongé de de 16,9 %, tandis que son rival Broadcom a plongé de 17,4 %.  Des entreprises comme MicrosoftMicrosoft et GoogleGoogle ont pareillement vu leurs valeurs boursières chuter.  Il est vrai que l'apparition de DeepSeek-R1 faisait suite à une annonce spectaculaire du président Donald Trump sur un investissement de 500 milliards de dollars pour créer le "plus grand projet d'infrastructure en IA de l'histoire".

    Il se trouve que  l'apparition de DeepSeek-R1 fait ressortir qu'il serait possible de développer des IA bien moins coûteuses que celles qui ont le ventvent en poupe depuis 2022.

    La version de DeepSeek publiée en janvier ne sait pas générer d'images mais il semble que la société de Liang Wenfeng soit sur le qui vive : dès le 28 janvier 2025, le modèle DeepSeek Janus-Pro a été dévoilé, comme concurrent potentiel de Midjourney, Stable DiffusionDiffusion ou Dall.e.

     

     

    Limitations

    Comme d'autres modèles d'IA chinois - tels Ernie de Baidu ou Doubao de ByteDance - DeepSeek semble programmé pour éviter les questions sensibles.  Si nous lui tentons de lui évoquer certains épisodes de l'histoire de la Chine, il nous répond de façon polie qu'il n'est pas habilité à traiter de tels sujets.