La startup chinoise DeepSeek défie les géants de l’intelligence artificielle en revendiquant un modèle économique novateur. Avec une infrastructure massive de 50 000 unités de traitement graphique (GPU) Nvidia, l’entreprise aurait investi 1,6 milliard d’euros dans son développement, remettant en question ses prétendues prouesses d’efficacité.
Un investissement colossal derrière les chiffres annoncés
DeepSeek a récemment attiré l’attention mondiale en affirmant avoir développé son modèle d’IA R1 avec seulement 2 048 GPU et un budget de 6 millions d’euros. Cependant, cette déclaration ne représente qu’une partie des coûts. Selon le cabinet d’analyse SemiAnalysis, l’entreprise a engagé près de 1,6 milliard d’euros en matériel, incluant l’achat de 50 000 GPU Nvidia, pour son infrastructure répartie sur plusieurs sites.
Ce chiffre englobe également les coûts opérationnels, estimés à 944 millions d’euros. SemiAnalysis souligne que, contrairement à de nombreuses startups qui dépendent de fournisseurs de cloud externes, DeepSeek gère ses propres centres de données, ce qui lui confère une indépendance précieuse pour optimiser ses modèles IA et mener ses expériences.
La stratégie de DeepSeek : efficacité et indépendance
En se concentrant sur l’amélioration algorithmique plutôt que sur une simple augmentation de puissance, DeepSeek a réussi à se démarquer. La société utilise des méthodes comme l’attention latente multi-tête pour maximiser l’efficacité de ses modèles. Cette approche a permis de réduire la demande en GPU haut de gamme, ce qui pourrait avoir un impact significatif sur des entreprises comme Nvidia.
Les recrutements de DeepSeek se concentrent exclusivement en Chine, attirant des talents de grandes institutions comme l’Université de Pékin. Les salaires proposés atteignent parfois 1,3 million d’euros, surpassant ceux de nombreux concurrents chinois. Ces talents ont permis à DeepSeek de développer des innovations majeures dans le domaine de l’IA.
Implications pour le marché de l’IA et au-delà
La montée en puissance de DeepSeek pourrait redéfin er le paysage de l’intelligence artificielle. Le modèle R1, ouvert et économique, remet en question le statu quo établi par des géants comme OpenAI et Meta. Cette ouverture pourrait accélérer le développement de nouvelles applications IA, entraînant une demande accrue de ressources de calcul, notamment pour Nvidia, malgré une apparente concurrence initiale.
Plusieurs experts estiment que l’approche de DeepSeek pourrait transformer le marché, en rendant l’IA plus accessible et en incitant les entreprises à revoir leurs stratégies en matière de technologies de pointe. Satya Nadella, PDG de Microsoft, évoque le “paradoxe de Jevons”, selon lequel une IA plus efficace et accessible accroîtra son utilisation, nécessitant davantage de processeurs et de capacités de calcul.
Alors que le débat continue, la question reste ouverte: la stratégie de DeepSeek pourrait-elle précipiter une nouvelle vague de démocratisation de l’IA, ou s’agit-il simplement d’une étape dans la compétition mondiale pour la suprématie technologique? Les prochains développements nous le diront.