Réaction du marché aux nouvelles de DeepSeek: à la recherche des profondeurs

Karen Kharmandarian & Alexandre Zilliox, Thematics Asset Management

2 minutes de lecture

Les incertitudes grandissantes entourant la capacité et le délai nécessaires aux grands acteurs technologiques pour récupérer leurs investissements substantiels pèsent sur les esprits.

Que s’est-il passé?

Le marché a réagi très négativement suite à l'annonce d'un nouveau modèle qui aurait coûté seulement 6 millions de dollars à entraîner, utilisant des puces deux générations en arrière, avec des coûts d'inférence projetés à plus de dix fois inférieurs à ceux des modèles d'OpenAl1.

Raisons de la réaction: cette réaction découle des inquiétudes du marché concernant la future demande en puissance de calcul. S'il est effectivement possible de créer des modèles aussi efficaces que les plus connus (tels que Lia ma de Meta ou CPT d'OpenAI) en utilisant un matériel moins avancé et des coûts opérationnels considérablement réduits, cela soulève des questions sur la nécessité d'accélérateurs d'IA hautes performances. Cela pourrait finalement entraîner une diminution de la demande pour les équipements de production, ce qui s'est reflété dans la chute des actions d'ASM et d'ASML.

Vue actuelle

La réaction du marché est compréhensible dans un contexte de valorisations élevées, surtout avec l'imminence des résultats trimestriels. Les incertitudes grandissantes entourant la capacité et le délai nécessaires aux grands acteurs technologiques pour récupérer leurs investissements substantiels pèsent sur les esprits. Nous évaluons nos expositions au cas par cas mais considérons globalement qu'il s'agit d'une opportunité pour renforcer certaines positions fondamentalement peu impactées.

- Estimations des coûts: il n'y a que très peu d'éléments sur l'estimation précise des coûts d'entraînement du modèle de DeepSeek, certaines voix sur le marché mettant en avant que l'entreprise aurait un cluster de S0K Hl00 de chez Nvidia ce qui porterait l'investissement à plusieurs milliards de dollars ... sans même compter les salaires des ingénieurs travaillant sur le projet, ce chiffre de 6 millions de dollars est pour le moins imprécis2.

- Types de modèles: la majorité des modèles de DeepSeek sont «distillés» (une méthode de transfert de connaissances d'un modèle large à un modèle plus petit), ce qui implique que le modèle original a probablement nécessité des ressources de calcul significativement plus importantes pour sa construction. La transparence concernant les opérations de l'entreprise reste limitée.

- Avantages de l'architecture ouverte: étant donné que DeepSeek opère sur un modèle d'architecture ouverte, les améliorations architecturales apportées par l'entreprise profitent à l'ensemble de l'écosystème, permettant une analyse plus large des avancées que ces modèles offrent. Cela pourrait finalement s'avérer avantageux pour les acteurs logiciels, facilitant l'adoption de la technologie.

- La demande de puces: Si l'on prend en compte ces affirmations, cela pourrait réduire la demande en puissance de calcul et, par conséquent, en puces. Toutefois, le paradoxe de Jevons suggère qu'à mesure que l'efficacité des modèles augmente, la consommation globale pourrait également croître. En d'autres termes, ces avancées pourraient favoriser l'adoption par des moyens économiques en abaissant les coûts tant de l'entraînement que de l'inférence. Ainsi, nous ne sommes pas convaincus que la demande de puces s'effondrera; au contraire, elle pourrait demeurer vigoureuse.

- Evaluation des risques: historiquement, nous avons considéré que les fournisseurs de modèles de fondation étaient les plus exposés au sein de la chaîne de valeur, en croyant que certains modèles pourraient rapidement devenir des «commodités». Par conséquent, notre portefeuille est peu exposé à ce segment.

Considérations supplémentaires: Les facteurs géopolitiques ne sauraient être négligés à l'égard de ces annonces. Les entités chinoises pourraient chercher à rééquilibrer les rapports de force en démontrant que les restrictions à l'exportation ont un impact limité sur leur capacité à rivaliser avec les Etats-Unis dans le domaine de l'intelligence artificielle, notamment en proposant leur modèle en open source (un système collaboratif et décentralisé) alors que la majorité des modèles américains demeurent en closed source (un système propriétaire et monétisé).

En résumé, bien que la réaction du marché repose sur des préoccupations légitimes concernant l'avenir des besoins computationnels et des retours sur investissement, les implications complètes de ces développements nécessiteront une surveillance attentive et une compréhension nuancée.

 


1 Source: https://www.reuters.com/technology/artificial-intelligence/big-tech-faces-heat-chinas-deepseek-sows-doubts-billion-dollar-spending-2025-01-27/
2 Source: https://www.reuters.com/technology/artificial-intelligence/what-is-deepseek-why-is-it-disrupting-ai-sector-2025-01-27/

A lire aussi...