DeepSeek V4 est là : 1,6 trillion de paramètres, 1M de contexte par défaut, et open-source. Silicon Valley doit encore s'inquiéter

Ce qu'il faut retenir

DeepSeek, la startup de Hangzhou qui avait électrisé le secteur tech mondial en janvier 2025 avec son modèle R1, vient de lancer DeepSeek-V4-Pro et DeepSeek-V4-Flash. Les deux modèles sont disponibles dès aujourd'hui en accès public sur chat.deepseek.com et via l'API, et leurs poids sont publiés en open-source sur Hugging Face.

Selon DeepSeek, V4-Pro bat tous les modèles open-source actuels en maths, STEM et coding. Il ne s'incline que face à Gemini 3.1-Pro de Google sur les benchmarks de connaissance générale. L'API est disponible aujourd'hui même.

Les specs techniques

V4-Pro — Paramètres totaux

1,6T

49B paramètres actifs (MoE)

V4-Flash — Paramètres totaux

284B

13B paramètres actifs (MoE)

Fenêtre de contexte

Tokens — standard sur tous les services

Disponibilité

Open

Source — poids publiés sur Hugging Face

L'architecture repose sur deux innovations majeures annoncées par DeepSeek : une compression token-wise couplée à la DSA (DeepSeek Sparse Attention), qui leur permet d'atteindre une efficacité mémoire et de calcul inédite sur les longs contextes. Résultat : le million de tokens de contexte n'est plus une option premium ou un mode expérimental. C'est le défaut pour tous les utilisateurs.

V4-Pro vs V4-Flash : lequel choisir ?

V4-Pro est le modèle de pointe. Il vise les tâches complexes : raisonnement avancé, coding agentic, STEM, génération de contenu long. DeepSeek revendique la première place open-source sur ces benchmarks, derrière uniquement Gemini 3.1-Pro de Google pour la connaissance générale.

V4-Flash est le modèle rapide et économique. Ses capacités de raisonnement approchent celles de V4-Pro, et il performe de manière équivalente sur les tâches agentiques simples. Pour des usages API à fort volume, c'est le choix naturel.

Les deux modèles supportent le mode Thinking / Non-Thinking (raisonnement visible ou non), et prennent en charge les API OpenAI ChatCompletions et Anthropic, ce qui simplifie la migration depuis d'autres modèles.

Intégré à Claude Code dès le lancement

Ce qui sort de l'ordinaire dans ce lancement : DeepSeek-V4 est déjà intégré à Claude Code (l'outil de coding agentic d'Anthropic), ainsi qu'à OpenClaw et OpenCode. DeepSeek affirme également l'utiliser en interne pour son propre développement logiciel. C'est un signal fort sur la maturité du modèle pour les cas d'usage agentic réels, et un paradoxe notable : un modèle chinois qui s'intègre nativement dans l'outil phare d'Anthropic.

Un an après R1 : la Chine remet ça

Janvier 2025

DeepSeek-R1 sort et choque le monde tech. Performances comparables à ChatGPT et Gemini, pour un coût de développement annoncé inférieur à 6 millions de dollars. Marc Andreessen parle de "moment Spoutnik de l'IA".

2025 — Vague de restrictions

Plusieurs États américains, l'Australie, Taïwan, la Corée du Sud, le Danemark et l'Italie bannissent ou restreignent DeepSeek-R1 pour des raisons de sécurité nationale et de protection des données.

Décembre 2025

DeepSeek-V3.2 sort et maintient la pression sur les modèles propriétaires américains.

24 avril 2026

DeepSeek-V4-Pro et V4-Flash : lancement public, open-source, 1M de contexte par défaut. La cadence ne faiblit pas.

Ce qui change avec le 1M de contexte par défaut

La fenêtre de contexte d'un million de tokens n'est pas un simple argument marketing. Elle change concrètement les cas d'usage possibles : analyser une codebase entière en une seule requête, traiter des documents légaux ou financiers volumineux, maintenir une mémoire de conversation sur des sessions très longues. Le fait que ce soit le standard par défaut, et non une option payante, accentue la pression sur les fournisseurs qui le proposent encore comme tier premium.

Note importante sur la migration API

DeepSeek prévient que les anciens modèles deepseek-chat et deepseek-reasoner seront retirés le 24 juillet 2026 (15h59 UTC). Ils pointent actuellement vers V4-Flash en non-thinking / thinking. Les développeurs ont trois mois pour migrer en changeant simplement le nom du modèle dans leurs appels API.

Notre analyse

Un an après R1, DeepSeek prouve que le premier choc n'était pas un coup de chance. La cadence de sortie est soutenue, les benchmarks sont solides et vérifiables, l'open-source est réel. Sur le plan technique, V4-Pro n'est dépassé par aucun modèle open-source existant en maths et coding — c'est factuel.

Ce qui est plus surprenant encore, c'est l'intégration native dans Claude Code dès le jour du lancement. Cela signifie que même Anthropic utilise DeepSeek comme backend optionnel. La guerre des LLM ne se joue plus uniquement entre modèles fermés américains.

Verdict Techoria : Si vous utilisez des modèles open-source en production, V4-Pro devient la référence à battre immédiatement. Si vous cherchez un modèle rapide et économique pour vos pipelines, V4-Flash mérite un test sérieux dès aujourd'hui.

← Retour aux news Publié le 24 avril 2026

DeepSeek V4 vient de sortir : 1,6 trillion de paramètres, 1M de contexte par défaut, open-source. Silicon Valley doit encore s'inquiéter

Ce qu'il faut retenir

Les specs techniques

V4-Pro vs V4-Flash : lequel choisir ?

Intégré à Claude Code dès le lancement

Un an après R1 : la Chine remet ça

Ce qui change avec le 1M de contexte par défaut

Note importante sur la migration API

Notre analyse