International, Politique et Social

DeepSeek, la Chine et l’IA : un défi géopolitique

Traduction ML, publié dans Nueva Sociedad.

Des hypothèses scientifiques et politiques a étudier suite au séisme provoqué par DeepSeek dans la Tech américaine. ML

FÉVRIER 2025

Le bond de la Chine dans l’intelligence artificielle a provoqué un séisme majeur dans sa compétition avec les États-Unis, mais il donne aussi des pistes pour réfléchir aux modèles de souveraineté technologique, voire d’IA publique, dans le reste du monde.

Cecilia Rikap


600 milliards de dollars (près d’un PIB de l’Argentine ou presque deux fois celui du Chili) : c’est la chute de la valorisation boursière du géant Nvidia le 26 janvier dernier. Le week-end précédent, l’application d’intelligence artificielle (IA) de la start-up chinoise DeepSeek est devenue l’application gratuite la plus téléchargée aux États-Unis. La capitalisation boursière de Nvidia n’a pas été la seule à dégringoler lundi suite au développement chinois. Tous les géants américains de la technologie ont subi des plongeons importants, quoique nettement moins spectaculaires, pour une perte totale de mille milliards de dollars en une journée.

Cette réaction excessive des marchés boursiers – partiellement corrigée au fil des jours – ne s’explique pas par le fait que le modèle R1 de DeepSeek est meilleur que les modèles existants. En fait, R1 n’est pas significativement différent des autres modèles d’IA générative de frontière, en particulier ChatGPT. Mais qu’un modèle chinois soit considéré comme aussi bon que ChatGPT et les autres modèles d’entreprises américaines est certainement une nouveauté. C’est aussi une raison géopolitique suffisante pour ébranler la valeur boursière des plus grandes entreprises américaines – qui sont aussi les plus grandes du monde.

Le fait que DeepSeek soit chinois n’est qu’une partie de l’explication. La raison centrale pour laquelle, outre la bourse, Donald Trump et l’ensemble du modèle mondial de développement de l’IA générative dirigé par les États-Unis ont tremblé est que DeepSeek-R1 était beaucoup moins cher à produire et, comme si cela ne suffisait pas, il est partiellement disponible en libre accès pour que d’autres personnes puissent le télécharger et l’utiliser pour développer leurs propres applications. Il est également proposé à un coût inférieur à ce que Meta facture pour son modèle Llama – également en accès semi-ouvert – lorsqu’il est acheté sur les clouds des autres géants de la tech.

L’IA à bas prix

DeepSeek-R1 est moins cher à tous points de vue. C’est le premier modèle frontière qui a nécessité une fraction de la capacité de calcul – et donc du coût – utilisée par les autres modèles de pointe pour l’entraînement. Cela s’explique par le fait que la start-up chinoise a utilisé une technique d’apprentissage pour les modèles d’IA appelée distillation. Dans ce contexte, « distiller » signifie extraire l’apprentissage des modèles existants de manière automatisée. Sur cette base, la formation qui reste à faire est plus courte et chaque cycle de formation nécessite moins d’investissement car on ne part pas de zéro, mais de processus d’apprentissage déjà réalisés par d’autres entreprises.

La nouveauté n’est pas la méthode elle-même, car la technique était déjà utilisée auparavant, mais les résultats, jusqu’à présent, étaient des modèles à plus petite échelle qui n’étaient pas aussi bons que les modèles originaux. DeepSeek est plus petit en termes de nombre de paramètres (c’est pourquoi il est également moins cher lorsqu’il est utilisé) et en même temps, il concourt en  » première division ».

Bien que nous ne puissions pas faire de comparaison directe avec le coût de modèles de formation comme GPT d’OpenAI ou Llama de Meta, car pour cela il faudrait connaître le coût de production total de DeepSeek-R1 et cette information est gardée secrète, il est clair que DeepSeek produit une IA à faible coût, étant donné que le dernier cycle de formation n’a nécessité que 5,6 millions de dollars. C’est là que la start-up chinoise frappe au cœur du paradigme de développement de l’IA générative imposé par les géants américains de la tech.

Qui perd et qui gagne – toujours ?

Découvrir qu’il est possible de développer des modèles de pointe sans concentrer d’énormes quantités de puces d’IA dernier cri pour l’entraînement, avec des quantités de données tout aussi énormes, met à mal les affaires de Nvidia, une entreprise presque entièrement dédiée à la conception de ces puces. D’où la chute de sa capitalisation boursière.

La perte de la valeur boursière d’Amazon, Microsoft et Google, en revanche, ne marque pas la fin de leur règne. Au contraire, leur activité ne consiste pas en premier lieu à vendre des modèles d’IA – bien qu’ils en développent et en vendent également – mais à contrôler le cloud, c’est-à-dire le supermarché où ces modèles et d’autres technologies sont développés, utilisés et commercialisés. Ces entreprises bénéficient de l’expansion constante de l’adoption de l’IA, qui s’accélère encore avec l’arrivée de DeepSeek.

Le cloud est une sorte d’espace de coworking ou d’usine virtuelle permettant de produire et de consommer des services numériques que l’on utilise en téléchargeant ses propres données. Dans un contexte de méfiance envers la Chine, il est peu probable que les entreprises et les États du monde entier adoptent DeepSeek pour analyser leurs données. Le marché des utilisateurs qui l’utilisent gratuitement, dont des milliers de développeurs qui cherchent à améliorer leur code ou à créer des applications, n’est pas le même que celui qui utilise l’IA dans le cloud en tant que service personnalisé aux besoins des entreprises et des États.

Dans ce scénario, la dépendance à l’égard des start-ups occidentales spécialisées dans l’IA, qu’il s’agisse d’OpenAI ou d’Anthropic, basées aux États-Unis, ou de la société française Mistral, est exacerbée. S’il était autrefois improbable pour ces entreprises d’opérer en dehors du cloud d’Amazon, de Microsoft ou de Google, c’est désormais impossible. Non seulement ces géants sont les principaux investisseurs en capital-risque dans les start-ups d’ IA générative en Occident, mais leurs clouds sont également de plus en plus demandés par ceux qui paient pour l’IA. Les entreprises, les gouvernements, les universités, etc. considèrent le cloud comme une arène unique à partir de laquelle ils peuvent répondre à tous leurs besoins en matière de services numériques.

Pour OpenAI et les autres, il ne semble pas judicieux de quitter cet écosystème de services. En fait, c’est l’intégration transparente à cet écosystème qui constitue la principale différence avec DeepSeek. En faisant partie du cloud, les services proposés par la start-up s’intègrent parfaitement à tous les autres services qu’un utilisateur du cloud consomme déjà. Cette compatibilité est le résultat du contrôle exercé par Amazon, Microsoft et Google sur toutes les start-ups de leurs écosystèmes, qui les oblige à payer une sorte d’impôt privé pour pouvoir proposer des services dans leurs clouds. Aujourd’hui plus que jamais, développer des modèles sans la protection des géants technologiques – surtout si cela signifie continuer à utiliser des techniques de développement qui partent de zéro et sont donc plus coûteuses que DeepSeek – n’est pas une affaire.

L’échiquier géopolitique numérique

Dans ce cadre, OpenAI accuse la start-up chinoise d’avoir utilisé ses modèles – protégés par les règles de la propriété intellectuelle – pour distiller des apprentissages afin de lancer DeepSeek-R1. Bien qu’un voleur qui vole un voleur ait 100 ans de pardon – n’oublions pas qu’OpenAI a utilisé des millions de documents protégés par le droit d’auteur pour entraîner ses modèles de langage – Trump est loin d’épargner la vie de DeepSeek. En effet, une constante depuis l’administration de Barack Obama est qu’à mesure que l’avantage des États-Unis sur la Chine se réduit, la pression américaine sur le reste du monde pour bloquer le concurrent asiatique s’accentue.

Les États-Unis ont cherché à entraver le développement technologique de la Chine en matière d’IA sous prétexte qu’elle pourrait utiliser ses avancées dans le domaine militaire, en interdisant aux entreprises américaines et à celles qui cherchent à faire des affaires avec les États-Unis de vendre des éléments clés de la chaîne de valeur des semi-conducteurs – y compris les puces elles-mêmes – à la Chine. Mais avant que cette politique n’entre en vigueur et face à la montée des tensions géopolitiques entre les deux pays, la Chine a constitué un important stock de semi-conducteurs d’IA. Il en a été de même pour le fonds d’investissement qui finance DeepSeek. Bien que la quantité de puces ne soit pas suffisante pour suivre le paradigme actuel et qu’il ne s’agisse plus des semi-conducteurs les plus avancés sur le marché, la start-up a trouvé un moyen d’obtenir des résultats avec les semi-conducteurs dont elle disposait.

Une question ouverte est donc de savoir comment les États-Unis vont réagir. Un scénario probable est qu’ils renforceront la pression sur l’adoption des technologies chinoises dans le monde entier et que DeepSeek subira le même sort que Huawei avec la 5G. Huawei a été le premier à développer cette technologie, mais Washington a bloqué une à une ses activités en Occident, ce qui a donné aux rivaux le temps d’imiter la technologie et a limité la croissance du marché du géant chinois de la téléphonie.

Souveraineté numérique

Quoi qu’il arrive dans le conflit entre les deux puissances mondiales, l’émergence de DeepSeek-R1 ouvre une fenêtre d’opportunité pour développer une IA publique dans le reste du monde non alignée sur les modèles dominants de contrôle et de concentration qui prévalent. La possibilité de développer des modèles moins chers et à la pointe de la technologie est l’occasion de travailler à l’échelle internationale pour un projet de développement technologique qui met au premier plan les besoins sociaux et les contraintes planétaires. Le caractère central de ces technologies dans tous les domaines de la vie appelle une solution publique et commune, qui sera utilisée, par exemple, par les écoles, les hôpitaux et d’autres organismes publics.

Le développement de modèles d’IA publics favorise également leur vérification démocratique. L’IA dominante d’aujourd’hui est développée dans une optique de profit économique. Sans une réorientation visant à créer des modèles publics, ouverts et vérifiables, le développement technologique risque de continuer à favoriser des applications allant de l’utilisation militaire ou pour le contrôle et la surveillance à l’intérieur et à l’extérieur du lieu de travail, à l’IA qui remplace les tâches créatives au lieu de rendre l’espace de travail plus stimulant.

Nous sommes quotidiennement témoins des effets de la perte d’espaces de délibération publique sur Internet. Les réseaux sociaux sont pilotés par des algorithmes d’IA qui ordonnent quels posts sont montrés où et quand, et lesquels ne le sont pas. À partir de là, une poignée d’entreprises influencent l’opinion publique (et le bon sens). En adoptant les techniques utilisées par DeepSeek, il est économiquement possible de développer une IA publique, ouverte et vérifiable pour l’État, la santé et l’éducation.