, ,

Les sanctions américaines, catalyseur involontaire de la rupture technologique chinoise en IA

Le paradoxe des restrictions d’exportation

Depuis octobre 2022, les États-Unis ont imposé des restrictions d’exportation de plus en plus sévères sur les semi-conducteurs de haute performance destinés à la Chine, dans le but explicite d’« affaiblir la capacité » de Pékin à développer des puces avancées pour sa « modernisation militaire ». L’administration Biden, puis l’administration Trump, ont progressivement étendu ces mesures : interdiction de vente des puces A100 et H100 de Nvidia (2022), blocage des versions dégradées H800/A800 (octobre 2023), puis interdiction totale du H20 nécessitant désormais une licence d’exportation (avril 2025). Résultat : Nvidia est passée de 95% de part de marché en Chine pour les puces IA à 0% en octobre 2025, selon les propres déclarations de son PDG Jensen Huang : « Nous sommes aujourd’hui à 100% hors de Chine ».[1][2][3][4]

Or, loin de paralyser l’écosystème chinois de l’IA, ces restrictions ont déclenché une dynamique d’innovation sans précédent. Comme l’a résumé Brian Colello, analyste chez Morningstar : « Les contraintes mènent à la créativité ». Un article académique publié en février 2025 (SSRN) parle même d’une « lean innovation » — une innovation frugale — directement catalysée par les barrières américaines.[5][6]

Le phénomène DeepSeek : l’innovation algorithmique sous contrainte

De la finance quantitative à l’IA de pointe
DeepSeek est une filiale de High-Flyer Capital Management, un fonds spéculatif quantitatif chinois spécialisé dans le trading algorithmique par deep learning. Cofondée en 2015 par Liang Wenfeng, High-Flyer possédait déjà plus de 10 000 puces Nvidia A100 dès mi-2022 et avait investi plus de 1,2 milliard de yuans (~180 millions de dollars) dans deux centres de données. Cette obsession pour l’optimisation des infrastructures de calcul a fourni les bases techniques et financières de DeepSeek.[7]

Des performances de pointe à un coût dérisoire
Le modèle DeepSeek-V3, lancé fin décembre 2024, est un Mixture-of-Experts (MoE) de 671 milliards de paramètres (37 milliards activés par token), entraîné sur seulement 2,788 millions d’heures GPU H800, soit environ 5,6 millions de dollars — une fraction de ce que dépensent les géants américains. Le modèle DeepSeek-R1, sorti le 20 janvier 2025, a dépassé ChatGPT en nombre de téléchargements sur l’App Store américain en une semaine, provoquant une chute de plus de 600 milliards de dollars de la capitalisation de Nvidia en une seule journée.[8][7]

Les innovations clés de DeepSeek sont exclusivement algorithmiques et architecturales :

  • Multi-Head Latent Attention (MLA) : compression adaptative pour des contextes de 128 000 tokens
  • Routing MoE sans perte auxiliaire : routage dynamique des experts avec biais adaptatifs
  • Reinforcement Learning (GRPO) pour le raisonnement auto-réflexif dans R1
  • Prédiction multi-tokens pour accélérer la génération[9][8]

DeepSeek V4 : le prochain séisme annoncé

Mi-février 2026, DeepSeek s’apprête à lancer son modèle V4, un mastodonte de 1 trillion de paramètres avec une fenêtre de contexte d’1 million de tokens. Les tests internes revendiquent plus de 80% sur SWE-bench Verified, surpassant Claude 3.5 Sonnet et GPT-4o, à un coût d’inférence de 0,27 $/million de tokens — soit 10 à 40 fois moins cher que la concurrence. Ce lancement illustre la cadence d’innovation accélérée de l’entreprise.[10][11][12]

L’écosystème IA chinois en ébullition (2025-2026)
L’effet catalyseur des sanctions ne se limite pas à DeepSeek. L’ensemble de l’écosystème chinois connaît une accélération spectaculaire :

  • Alibaba a dévoilé Qwen 3.5 le 15 février 2026, conçu pour « l’ère des agents IA », avec un engagement d’investissement de 380 milliards de yuans (50,6 milliards €) dans le cloud et l’IA sur trois ans.[13][14]
  • ByteDance a lancé Doubao 2.0 et SeeDance 2.0, intégrant raisonnement complexe et génération vidéo.[14]
  • Zhipu AI a publié GLM-5 en open source, entièrement entraîné sur puces Huawei Ascend, garantissant une « indépendance totale vis-à-vis des matériels américains ».[14]
  • L’adoption mondiale des modèles d’IA open source chinois est passée de 13% à près de 30% en 2025.[15]

Huawei et SMIC : construire l’alternative matérielle en semi-conducteurs classiques

L’ascension des puces Ascend
Face à l’exclusion totale de Nvidia du marché chinois, Huawei s’est imposé comme le fournisseur domestique de référence :

Puce Performances Comparaison Nvidia Statut
Ascend 910B ~comparable A100 ~80% A100 en perf. globales En production [16]
Ascend 910C 512 Tflops FP16 ~comparable H100 (combine 2x 910B) Livraisons accélérées depuis mai 2025 [17][18]
Ascend 910D >350 Tflops FP16, gravure 5nm Similaire H100 selon WSJ Lancement prévu fin 2025 [19]

Le système CloudMatrix384 de Huawei, intégrant 384 puces Ascend 910C en cluster, offrirait des performances comparables aux solutions Nvidia de niveau GB200, illustrant la stratégie chinoise de compenser le retard individuel par la mise en cluster massive combinée à une énergie bon marché.[20]

Le triplement de la production de puces IA
La Chine vise un triplement de sa production de puces IA d’ici 2026. Trois nouvelles usines alignées sur le portefeuille Huawei sont prévues. Pékin a imposé une règle obligeant les fabricants à utiliser au minimum 50% d’équipements domestiques pour toute nouvelle installation.[21][22][23]

La rupture électro-optique : le changement de paradigme qui contourne les sanctions

C’est peut-être la dimension la plus stratégique et la moins anticipée de la réponse chinoise aux sanctions. Plutôt que de simplement chercher à rattraper un retard en gravure de semi-conducteurs classiques (EUV, nœuds sub-5nm), la Chine investit massivement dans un changement complet de paradigme technologique : le passage des électrons aux photons pour le calcul IA. Cette approche rend partiellement obsolètes les restrictions portant sur les équipements de lithographie traditionnels.

Meteor-1 : la première puce de calcul optique parallèle au monde (juin 2025)

En juin 2025, des chercheurs de l’Institut d’optique et de mécanique de précision de Shanghai (SIOM) et de l’Université technologique de Nanyang ont présenté Meteor-1, la première puce de calcul optique intégré à ultra-haut parallélisme au monde. Publiée dans la revue eLight le 17 juin 2025, cette avancée constitue un jalon fondamental.[24][25]

Caractéristiques techniques de Meteor-1 :

  • Puissance de calcul théorique : 2 560 TOPS (tera-opérations par seconde) à une fréquence optique de 50 GHz
  • Parallélisme : traitement simultané de plus de 100 tâches grâce à un design multi-longueurs d’onde inédit (première mondiale pour le parallélisme à plus de 100 longueurs d’onde)
  • Performances comparables aux GPU Nvidia RTX 4090 (1 321 TOPS) et approchant la RTX 5090 (3 352 TOPS)[25][24]
  • Système entièrement développé en interne, sans dépendance à des technologies étrangères sanctionnées[25]

L’innovation clé réside dans la troisième voie du calcul optique : plutôt que d’augmenter la taille de la matrice ou la fréquence optique (les deux approches traditionnelles, poussées à leurs limites par TSMC et Caltech), l’équipe chinoise a exploité l’expansion du parallélisme computationnel — la capacité de la puce à effectuer de multiples calculs simultanés sur différentes longueurs d’onde de lumière.[26][24]

LightGen : la première puce 100% optique pour l’IA générative (décembre 2025)

Six mois après Meteor-1, une équipe conjointe de l’Université Jiao Tong de Shanghai (SJTU) et de l’Université Tsinghua a dévoilé LightGen, publiée en article phare dans la revue Science le 19 décembre 2025. Il s’agit de la première puce entièrement optique capable d’exécuter des modèles d’IA générative à grande échelle.[27][28]

Performances mesurées de LightGen :

Métrique LightGen vs. Nvidia A100
Débit de calcul 3,57 × 10⁴ TOPS ~100× plus rapide [29][30]
Efficacité énergétique 6,64 × 10² TOPS/W ~100× plus efficace [29][30]
Densité de calcul 2,62 × 10² TOPS/mm² ~100× plus dense [29]

Avec des modulateurs de lumière spatiale de prochaine génération, l’équipe estime un plafond théorique de 5,69 × 10⁹ TOPS — un chiffre astronomique, bien au-delà de ce que les lois de mise à l’échelle électronique peuvent réalistement atteindre.[29]

Trois percées techniques simultanées :

  1. Intégration massive : plus de 2,1 millions de neurones photoniques sur une seule puce de 136,5 mm² grâce à un packaging 3D et des optiques métasurfaces, permettant le traitement direct d’images 512 × 512 pixels sans décomposition[28][29]
  2. Espace latent optique (OLS) : pour la première fois, les transformations dimensionnelles (texte → espace latent → image) s’effectuent entièrement dans le domaine optique, éliminant les conversions optique-électrique-optique qui constituaient le principal goulot d’étranglement historique[31][29]
  3. Algorithme d’entraînement BOGT (Bayesian-based Optical Generative Training) : méthode d’apprentissage non supervisé permettant à la puce d’apprendre des distributions sémantiques sans labels, rendant LightGen compatible avec des tâches génératives ouvertes et non plus limitée à la simple classification[29]

LightGen a été évalué contre Stable Diffusion, StyleGAN et NeRF, démontrant une qualité de sortie compétitive pour la génération d’images haute résolution, la synthèse de scènes 3D, le transfert de style et le débruitage intelligent.[31][29]

Le professeur Chen Yitong, chercheur principal du projet, a déclaré : « LightGen fournit une nouvelle façon de relier les nouvelles architectures de puces aux tâches d’IA quotidiennes complexes, sans altération des performances, avec une vitesse et une efficacité supérieures de plusieurs ordres de grandeur, pour une IA durable ».[27][28]

CHIPX : la production de masse de puces photoniques (juin 2025)

La Chine ne se contente pas de percées en laboratoire. Le Chip Hub for Integrated Photonics Xplore (CHIPX), affilié à l’Université Jiao Tong de Shanghai, a mis en service en juin 2025 sa première ligne pilote de production de puces photoniques à Wuxi (province du Jiangsu).[32][33]

Spécifications de la ligne de production :

  • Wafers de 6 pouces en niobate de lithium à couche mince (TFLN)
  • Capacité annuelle de 12 000 wafers
  • Modulation dépassant 110 GHz (seuil mondial pour la communication optique haute vitesse)
  • Pertes d’insertion < 3,5 dB, pertes de guidage < 0,2 dB/cm
  • Cycles d’itération hebdomadaires pour un rythme de R&D rapide[33][32]

Le choix du TFLN est stratégique : ce matériau optoélectronique haute performance offre un effet électro-optique ultra-rapide, une large bande passante et une faible consommation d’énergie. Surtout, sa fabrication ne nécessite aucun des équipements EUV sanctionnés par les États-Unis.[33]

Puce quantique photonique CHIPX/Turing Quantum (novembre 2025)

En novembre 2025, la Chine a dévoilé une puce quantique photonique développée conjointement par CHIPX et Turing Quantum, présentée comme l’une des 17 technologies reconnues lors de la Conférence mondiale sur l’Internet de Wuzhen 2025. Cette puce accélère les calculs complexes de « plus de mille fois » et sert de pont entre l’informatique classique et les futurs systèmes quantiques. Elle combine intégration optique dense et une ligne de production pilote capable de produire environ 12 000 plaquettes de 6 pouces par an.[34]

Tantalate de lithium : un matériau insanctionnable (2024)
Dès mai 2024, des chercheurs chinois de l’Université des sciences et technologies de Chine ont publié dans Nature une méthode de production de masse à faible coût de puces photoniques utilisant le tantalate de lithium (LiTaO₃), un matériau déjà utilisé dans la fabrication de composants de smartphones. Ce matériau offre de meilleures performances que le niobate de lithium traditionnel et permet un processus de fabrication plus proche des méthodes commercialisées en silicium — le tout sans aucun composant soumis aux restrictions d’exportation américaines.[35]

L’interconnexion optique : le futur des datacenters IA
Au-delà du calcul pur, la Chine se positionne agressivement dans le domaine des interconnexions optiques co-packagées (CPO) pour les datacenters IA. Le rapport Yole Group 2025 sur la photonique silicium note que « la Chine émerge comme un concurrent clé, expédiant des millions de modules et réduisant l’écart technologique avec les fournisseurs occidentaux ». Des entreprises comme TeraHop (ex-InnoLight), Hisense et Accezlink livrent massivement des modules d’interconnexion optique pour alimenter les clusters IA.[36][37]

Nvidia elle-même a déclaré les optiques co-packagées comme technologie obligatoire pour ses datacenters IA de prochaine génération, reconnaissant implicitement que l’avenir du calcul IA passe inévitablement par la photonique — un domaine où la Chine accumule rapidement les avantages.[38][39]

La dimension stratégique : pourquoi l’électro-optique change les règles du jeu

L’obsolescence partielle du régime de sanctions
Le régime de contrôle des exportations américain repose sur une logique fondamentalement liée à la chaîne de valeur des semi-conducteurs classiques : lithographie EUV (ASML), nœuds de gravure avancés (TSMC), conception de GPU (Nvidia). Or, le calcul photonique contourne structurellement cette chaîne :

  • Les puces photoniques ne nécessitent pas de lithographie EUV
  • Les matériaux clés (niobate de lithium, tantalate de lithium) sont abondants et non sanctionnés
  • La fabrication utilise des procédés compatibles avec des équipements DUV déjà disponibles en Chine
  • Les performances sont intrinsèquement supérieures pour certaines charges de travail IA (inférence, génération)

Comme le résume un chercheur du SCMP : « Les puces optiques que les États-Unis ne peuvent pas sanctionner ».[35]

Les limites actuelles
Il serait prématuré de déclarer la victoire du calcul photonique chinois. Plusieurs obstacles majeurs subsistent :

  • Spécialisation : les puces optiques ne peuvent actuellement traiter que des tâches spécifiques (opérations matricielles linéaires, inférence), pas l’entraînement complet de LLM ni le calcul généraliste[26]
  • Maturité industrielle : la transition du laboratoire à la production à grande échelle reste un défi considérable
  • Écosystème logiciel : il n’existe pas encore d’équivalent photonique de CUDA
  • Précision : le calcul analogique optique offre une précision moindre que le calcul numérique électronique

La stratégie du « dépassement dans le virage »
La stratégie chinoise s’articule autour du concept de « chāo chē » (超车) — dépasser dans le virage. Plutôt que de chercher à rattraper l’Occident sur un terrain où les règles sont défavorables (gravure sub-5nm, EUV), la Chine investit dans un paradigme technologique où :

  1. Les règles sont nouvelles et l’avance occidentale est minimale
  2. Les matériaux et équipements nécessaires sont domestiques
  3. Les performances théoriques sont intrinsèquement supérieures
  4. L’expertise en physique optique et quantique chinoise est de classe mondiale

Analyse géopolitique : la Chine reprend-elle vraiment la tête ?

Les avantages structurels persistants des États-Unis

Dimension États-Unis Chine
Nœud technologique (classique) 2nm et au-delà (Nvidia/TSMC) 7nm, 5nm défectueux (SMIC) [7]
Cluster le plus puissant xAI Colossus : 200 000 H100 Clusters Huawei Ascend ~dizaines de milliers [7]
Écosystème logiciel CUDA (quasi-monopole) CANN Huawei (immature) [40]
Budget IA annuel (big tech) ~250 Mds$ capex 2025 ~50 Mds$ (Alibaba seul) [14]
Calcul photonique Lightmatter, Ayar Labs, Celestial AI Meteor-1, LightGen, CHIPX [36]

La vraie rupture : efficacité + paradigme alternatif
La Chine gagne sur deux terrains simultanés :

  1. L’efficacité algorithmique : DeepSeek a prouvé qu’il est possible de construire des modèles rivaux des meilleurs américains à une fraction du coût.[41]
  2. Le changement de paradigme matériel : les puces photoniques offrent un chemin vers des performances supérieures sans dépendre de la chaîne d’approvisionnement sanctionnée.[42][28]

Le risque d’un écosystème technologique parallèle
Le danger stratégique pour les États-Unis n’est plus seulement que la Chine les rattrape dans le paradigme existant, mais qu’elle construise un écosystème technologique parallèle complet — des puces photoniques aux modèles IA, des interconnexions optiques aux standards de données. Jensen Huang s’inquiète lui-même que les sanctions « ouvrent la voie à Huawei pour devenir une menace ».[40]

Le CSIS conclut que les contrôles à l’exportation ne peuvent au mieux que « ralentir et perturber les efforts chinois, pas les arrêter ». La fenêtre d’avance américaine se mesure désormais en 1 à 2 ans dans le paradigme classique. Dans le paradigme photonique, la Chine pourrait être en avance.[7]

Synthèse prospective : la bifurcation technologique

La trajectoire actuelle dessine un scénario de bifurcation technologique plutôt qu’un simple rattrapage :

  • Axe classique (semi-conducteurs) : les États-Unis maintiennent une supériorité en puissance brute (2nm, EUV) mais la Chine réduit l’écart via Huawei/SMIC et compense par le clustering massif et l’énergie bon marché.
  • Axe algorithmique : la Chine rivalise déjà et domine sur le rapport performance/coût grâce à DeepSeek, Qwen et l’écosystème open source.
  • Axe photonique : la Chine prend potentiellement de l’avance dans un paradigme qui pourrait redéfinir le futur du calcul IA, avec Meteor-1, LightGen et la production industrielle CHIPX.

L’ironie historique est profonde : les sanctions américaines, conçues pour préserver la suprématie technologique dans le paradigme des semi-conducteurs classiques, ont non seulement accéléré l’autonomisation chinoise dans ce même paradigme, mais ont catalysé le développement d’un paradigme alternatif — le calcul photonique — qui pourrait à terme rendre obsolètes les avantages mêmes que les sanctions cherchaient à protéger.