La communication de DeepSeek, startup chinoise de l’IA générative sème le doute sur le leadership américain en matière d’IA générative représenté jusqu’alors par Nvidia et OpenAI. La startup annonce également qu’elle parvient à entrainer des modèles d’IA malgré de fortes limitations en matière de puissance de calcul.
DeepSeek emploie les mêmes méthodes de diffusion de son IA conversationnelle qu’OpenAI. DeepSeek a été fondé en mai 2023 par Liang Wenfeng, 40 ans, cofondateur du fonds High-Flyer. Liang Wenfeng a été formé à l’Université du Zhejiang. Il possède une maîtrise en ingénierie de l’information et de la communication obtenue en 2010.
V3, une IA conversationnelle gratuite
Depuis la fin de l’année dernière, DeepSeek propose gratuitement son application d’IA conversationnelle DeepSeek V3, fonctionnant dans les principales langues dont le français et dont les données d’actualité s’arrêtent à juillet 2024. On peut utiliser très facilement DeepSeek V3 à l’adresse http://chat.deepseek.com
A ce stade, les réponses fournies par cette IA apparaissent de bon niveau. On peut même voir la manière dont l’IA réfléchit car son raisonnement s’affiche (en anglais) avant de donner la réponse. Son raisonnement est intéressant notamment lorsqu’on lui demande combien de « r » il y a dans le mot « strawberry » ou de calculer combien d’argent ont en tout cinq personnes, si chacune d’elle possède 5 €. L’accès via API (interface informatique) pour sa part est facturé à 0,07 $ pour 1 million de tokens (accès au cache), 0,27 $ pour 1 million de tokens (absence du cache) et 1,10 $ pour 1 million de tokens en sortie.
Un concurrent pour o1 d’OpenAI
DeepSeek propose depuis le 20 janvier une IA plus évoluée à prix concurrentiel pour la version suivante DeepSeek-R1 (« Reasoner 1 »), et décrite comme le concurrent de o1, le modèle d’IA le plus avancé d’OpenAI. R1 serait à la hauteur de o1 sur les tâches mathématiques, de codage informatique et de raisonnement.
Les IA conversationnelles de DeepSeek sont conçues et délivrées avec des processeurs moins coûteux que les firmes américaines et ces IA sont distribuées en Open Source. Le site Web et l’API sont en ligne. L’agence Reuters relève que l’émergence de DeepSeek a fait reculer les valeurs technologiques en bourse car la popularité croissante de ce modèle chinois d’intelligence artificielle à prix réduit ébranle la confiance des investisseurs dans la rentabilité de l’IA et dans la forte demande pour des puces de haute technologie.
Usage de processeurs Nvidia moins coûteux
Deepseek est issu d’une startup de Hangzhou (ville à 180 km de Shanghai). Son assistant conversationnel est devenue l’application gratuite la mieux notée sur l’app store d’Apple aux Etats-Unis. Les chercheurs de DeepSeek ont décrit le mois dernier que leur modèle DeepSeek-V3, lancé le 10 janvier 2025, utilise les puces H800 de Nvidia pour sa formation, dépensant moins de 6 millions de dollars, les puces H800 n’étant pas du haut de gamme.
DeepSeek indique les tarifs de son modèle R1 : 0,14 $ américain pour 1 million de jetons d’entrée (accès au cache), 0,55 $ pour 1 million de jetons d’entrée (non présents en cache) et 2,19 $ pour 1 million de jetons de sortie (Guide de l’API : https://api-docs.deepseek.com/guides/reasoning_model…)
L’application DeepSeek animée par DeepSeek-V3 est officiellement disponible sur l’App Store, Google Play et les principaux marchés Android. L’app est à télécharger maintenant sur https://download.deepseek.com/app/