DeepSeek explose les compteurs : 294 000 dollars pour défier OpenAI et Nvidia
Imaginez créer un modèle d’intelligence artificielle de pointe avec un budget qui ferait pâlir de jalousie le responsable des achats de votre entreprise… DeepSeek, une startup chinoise jusque-là peu connue, a annoncé à la planète IA que son modèle R1 a été entraîné pour la modique somme de 294 000 dollars. À côté, les coûts mirobolants évoqués par OpenAI ou Nvidia ressemblent à un ticket de loto perdant.
Mais comment DeepSeek a-t-elle réalisé cet exploit qui fait trembler la Silicon Valley ?
Tout commence avec un plan (et des puces H800)
DeepSeek n’a pas sorti sa martingale d’un chapeau magique. Le secret derrière ce tour de force budgétaire réside dans une stratégie bien ficelée et un contexte géopolitique inattendu :
- Utilisation de 512 puces Nvidia H800 : Ces puces sont spécialement conçues pour le marché chinois, suite aux restrictions américaines portant sur l’exportation des versions H100 et A100, plus puissantes. Adieu le bling-bling technologique hors de prix, bonjour la frugalité performante !
- Un pipeline multi-étapes : Après avoir fait chauffer des GPU A100 pour préparer un petit modèle (parce qu’il faut bien s’échauffer avant le marathon), l’entraînement s’est poursuivi sur les H800, culminant à 80 heures. Et hop, le bébé R1 était né !
Quand Sam Altman, patron d’OpenAI, évoque des factures à 9 chiffres pour ses modèles, on se dit que DeepSeek a trouvé le coffre-fort que personne n’a pensé à ouvrir.
Le mythe du monopole américain sur l’IA prend l’eau
Jusqu’ici, la technologie IA semblait l’apanage quasi exclusif des poids lourds américains : OpenAI, Nvidia, Google, Anthropic… Mais voilà qu’en un rien de temps (moins de deux ans, oui, vous avez bien lu), DeepSeek s’est invitée à la table des grands… en cassant la tirelire !
Leur stratégie ? Oser l’open source, collaborer allègrement, et miser sur la transparence. Résultat ? DeepSeek est devenue l’application gratuite la plus téléchargée… aux États-Unis ! Le choc culturel ne s’arrête pas là : avec un modèle annoncé à 5,6 millions de dollars en puissance de calcul (quand ses homologues américains réclament des centaines de millions), la startup chinoise met tout le monde devant le fait accompli.
Un vrai coup dans la fourmilière du marché mondial de l’IA, qui s’est même traduit par un accès de panique chez les investisseurs tech, certains se débarrassant en toute hâte d’actions d’entreprises dominantes, dont Nvidia. Oups !
DeepSeek V3.1 : le Robin des bois du machine learning ?
Non contente de son premier exploit, DeepSeek a remis le couvert avec son modèle V3.1, révélé quelques semaines à peine après GPT-5 et Claude 4.1. Là où les mastodontes sortaient l’artillerie lourde et les promesses, DeepSeek s’est contentée… de performances similaires, à une fraction du coût.
Cerise sur le gâteau, le modèle R1 et ses petits camarades open source remettent en question le modèle économique américain, où la puissance de feu financière semblait faire la loi.
Et pendant que GPT-5 se prenait les pieds dans le tapis aux yeux du public, de nombreux utilisateurs seraient tentés de changer d’écurie pour rejoindre la team DeepSeek. Qui a dit que David ne pouvait pas chatouiller Goliath ?
Controverses et coups d’œil dans le rétro : « distillation », open source et mini-budget
DeepSeek aime la transparence mais suscite aussi la polémique. La Maison Blanche et certains experts de l’IA affirment que R1 serait en fait une « distillation » de modèles d’OpenAI (entendez : on copie et on condense, façon expresso).
DeepSeek, de son côté, ne bronche qu’à demi-mot : oui, la distillation permet d’améliorer les performances tout en réduisant les coûts… et d’élargir l’accès à la technologie IA. La startup a reconnu s’être appuyée sur le modèle open source Llama de Meta pour certaines versions, tout en insistant sur le caractère fortuit d’une partie de l’apprentissage à partir de pages web — parmi lesquelles des contenus générés par OpenAI se seraient glissés en douce.
Bref, on s’inspire, on apprend par osmose, mais on se défend de toute manœuvre intentionnelle.
Le regard des géants : Microsoft, Nvidia et consorts
Même les big boss américains s’inclinent devant la performance. Satya Nadella, le PDG de Microsoft, a publiquement désigné DeepSeek comme le nouveau canevas d’excellence à suivre. En mars dernier, il déclarait que la startup chinoise — forte d’une équipe d’à peine 200 personnes — représente le critère de réussite pour sa firme !
Côté Nvidia, le flou règne parfois… Si des voix s’élèvent pour affirmer que DeepSeek aurait en réalité accès à d’importantes quantités de puces H100 (malgré les restrictions), la société et Nvidia mentionnent officiellement les acquisitions légales de puces H800 et A100, notamment pour les phases préparatoires.
Cela n’empêche pas certains médias d’estimer que le coût réel des investissements en matériel irait bien au-delà du chiffre officiel… jusqu’à évoquer plus de 500 millions de dollars dépensés en cartes Nvidia. Comme quoi, la magie des chiffres, c’est aussi une question d’angles.
DeepSeek, fer de lance d’un mouvement open source global
Au-delà des performances techniques, DeepSeek s’impose comme le symbole d’un nouveau rapport à l’intelligence artificielle, prônant l’ouverture et la résistance à l’hégémonie des GAFAM. Certains n’hésitent pas à parler de « Linux de l’IA » : un projet fédérateur et communautaire, qui inspire de plus petites équipes à oser affronter les géants, sans pour autant vider leur compte en banque.
Au passage, l’irruption de DeepSeek a montré qu’il existait d’autres chemins vers le sommet de l’innovation technologique, en particulier lorsqu’il s’agit de démocratiser l’accès aux modèles IA puissants.
Les points faibles du modèle R1 : tout n’est pas rose chez DeepSeek
À ceux qui pensent que DeepSeek est la panacée, rappelons que certains chercheurs (notamment de Cisco) pointent du doigt la sécurité des chatbots DeepSeek, jugés plus faciles à manipuler pour délivrer des contenus inappropriés… Les défis restent nombreux, et l’avenir nous dira si une IA à budgets serrés peut aussi devenir la plus responsable du marché !
Par ailleurs, la transparence officielle sur les investissements et les méthodes exactes de DeepSeek laisse toujours place à débat. Difficile de tirer un trait définitif entre le storytelling habile et la pure réalité industrielle, surtout dans la guerre d’influence qui secoue l’univers IA.
Pourquoi cette annonce va changer la donne dans l’IA ?
- La fin du mythe du « plus on paie, mieux c’est » ! Si DeepSeek a pu entraîner un modèle performant avec un budget de startup, la course à l’armement informatique perd de sa superbe…
- Un accès plus équitable à la technologie IA : Grâce au mouvement open source illustré par DeepSeek, le rêve d’une IA au service de tous gagne du terrain.
- Une redistribution des cartes : Entre les restrictions américaines et la ténacité de l’innovation chinoise, le jeu n’a jamais été aussi ouvert.
Reste pour DeepSeek à prouver que la magie opère aussi sur le long terme, face aux exigences croissantes de sécurité, de qualité et de fiabilité. Mais une chose est sûre : le marché de l’IA ne sera plus jamais la chasse gardée d’une poignée de géants américains.
Prochaine étape ? Peut-être entraîner une IA sur le même budget qu’un bon resto en centre-ville. Bon, on exagère… Quoique !
Pour aller plus loin
Vous aussi, tentez l’aventure IA à petit prix ! Pour tous ceux qui cherchent à industrialiser leurs propres automatisations ou déployer sans se ruiner des workflows boostés à l’IA, des plateformes comme Make.com rendent plus que jamais accessible l’automatisation avancée, sans vendre un rein (ni même un dixième de rein).
Alors, cette révolution DeepSeek… génie chinois ou poudre aux yeux ? À vous de juger, et surtout, de garder un œil sur le ping-pong géopolitique et technologique qui s’annonce plus intense qu’une finale olympique.
Source : DeepSeek : l’IA chinoise qui prévoit de ruiner la Silicon Valley (avec seulement 294 000 dollars !)
