Perplexity lance le mode hybride local-cloud : moins cher, plus privé

Une nouvelle approche pour l'IA grand public

Perplexity, le moteur de recherche IA qui cite ses sources, a annoncé le lancement d'un mode hybride local-cloud inédit. L'idée est simple : au lieu d'envoyer toutes les requêtes vers des serveurs cloud distants, une partie du traitement est effectuée localement sur la machine de l'utilisateur. Les tâches simples et rapides sont gérées en local, tandis que les recherches complexes et les calculs lourds restent délégués au cloud. Sources : Perplexity Blog, TechCrunch, The Verge.

Ce mode répond à deux problèmes majeurs de l'IA actuelle : le coût des API cloud (qui pèse sur les abonnements) et la confidentialité des données (chaque requête part sur des serveurs distants). En déportant une partie du calcul sur le poste local, Perplexity réduit sa dépendance aux fournisseurs cloud et offre une meilleure expérience utilisateur.

Comment ça fonctionne ?

Le mode hybride utilise un modèle local léger intégré à l'application Perplexity (desktop ou mobile). Ce modèle local est capable de traiter les requêtes simples : reformulation, résumé court, réponses factuelles basiques. Les requêtes plus complexes (recherche approfondie, analyse de documents longs, génération de contenu élaboré) sont envoyées au cloud Perplexity, qui utilise ses modèles les plus puissants.

Le passage du local au cloud est totalement transparent pour l'utilisateur. L'application décide automatiquement du meilleur mode en fonction de la requête. Un indicateur visuel permet de savoir si la réponse vient du local ou du cloud.

Local

Requêtes simples et rapides

Cloud

Recherches complexes, longs documents

Auto

Bascule transparente selon le besoin

Avantages concrets

Confidentialité renforcée : les requêtes simples ne quittent jamais votre machine
Réduction des coûts : moins d'appels API cloud = coûts d'infrastructure réduits, répercutés sur l'abonnement
Réponses plus rapides : pas de latence réseau pour les requêtes locales
Fonctionnement hors ligne : les requêtes locales fonctionnent même sans connexion Internet
Expérience transparente : aucune intervention manuelle requise

Disponibilité et configuration

Le mode hybride est déployé progressivement. Il nécessite l'installation de l'application desktop Perplexity (Windows, macOS, Linux) ou la dernière version de l'application mobile.

Configuration recommandée :

Desktop : 8 Go de RAM minimum, processeur récent (Intel Core i5 / Apple Silicon)
Mobile : iPhone 14 Pro / Android 13+ avec 6 Go de RAM

Le modèle local fait environ 2 Go. Il se télécharge automatiquement lors de la première activation de l'option « Mode hybride » dans les paramètres de l'application.

Analyse rapide

Cette annonce s'inscrit dans une tendance plus large de « edge AI » ou IA en périphérie. Google avec Gemma 4 12B, Apple avec ses modèles on-device, et maintenant Perplexity : l'industrie réalise que tout envoyer vers le cloud n'est ni nécessaire ni souhaitable.

L'approche de Perplexity est particulièrement pragmatique. Au lieu de forcer les utilisateurs vers un modèle 100% local (moins performant) ou 100% cloud (coûteux, peu privé), elle combine le meilleur des deux mondes. Le modèle local gère les requêtes courantes, le cloud s'occupe des tâches avancées.

Reste à voir comment Perplexity monétise ce changement. Moins d'appels cloud signifie moins de coûts pour Perplexity, mais aussi potentiellement moins de valeur à justifier pour les abonnements Pro. Le point d'équilibre sera crucial.

À retenir

Mode hybride Perplexity : traitement local des requêtes simples, cloud pour les tâches complexes.
Confidentialité : les requêtes simples restent sur votre machine, hors ligne possible.
Transparence : bascule automatique et invisible entre local et cloud.
Configuration : 8 Go RAM desktop, application desktop ou mobile récente.
Stratégie : Perplexity réduit sa dépendance cloud tout en gardant la puissance de ses modèles serveur.

← Retour aux news Publié le 4 juin 2026 · Sources : Perplexity Blog, TechCrunch, The Verge

Perplexity lance le mode hybride local-cloud : votre laptop fait une partie du travail pour économiser sur les coûts cloud