Dictée vocale Linux : 7 meilleurs outils open source (2026)

18 juin 2026 · Weesper Team · 23 juin 2026

dictée vocale Linux 2026reconnaissance vocale Linuxdictée open source Linuxdictée hors ligne Linuxsaisie vocale Ubuntu

Dictée vocale open-source Linux 2026 — Whisper, VOXD, outils hors ligne comparés

La dictée vocale sur Linux en 2026 est mieux gérée par des outils open source qui exécutent les modèles Whisper ou VOSK hors ligne. Les options les plus solides sont Vocalinux, VOXD, Handy, OpenWhispr, nerd-dictation, Whispering et LinuxWhispr. Tous traitent l’audio en local — sans cloud, sans abonnement — et la plupart supportent les bureaux X11 et Wayland.

Introduction

Pendant des années, la dictée vocale sur Linux accusait du retard par rapport à macOS et Windows. Les choses ont changé. En 2026, une vague d’outils Linux de reconnaissance vocale basés sur Whisper, entièrement open source, offre une dictée précise et 100 % hors ligne qui rivalise avec les produits commerciaux — sans envoyer le moindre octet vers le cloud.

Ce guide compare les 7 meilleurs outils de dictée vocale open source pour Linux, en couvrant le moteur de reconnaissance utilisé, la compatibilité Wayland et X11, l’accélération GPU et les cas d’usage idéaux. Que vous vouliez une simple commande en une ligne ou une application système soignée sur Ubuntu, il existe désormais une solution libre et solide pour vous.

Qu’est-ce que la dictée vocale sur Linux ?

La dictée vocale est le processus de conversion de la parole en texte à l’aide de la reconnaissance vocale, puis d’insertion de ce texte dans n’importe quelle application. Sur Linux, les outils de dictée open source réalisent cette opération entièrement sur votre propre matériel à l’aide de modèles d’IA locaux.

Contrairement aux services cloud, ces outils téléchargent un modèle de reconnaissance vocale — généralement Whisper.cpp, OpenAI Whisper, NVIDIA Parakeet ou VOSK — et l’exécutent en local. Vos données audio ne quittent jamais la machine, ce qui fait de Linux l’une des plateformes les plus respectueuses de la vie privée pour la dictée. Pour aller plus loin et utiliser whisper.cpp sans application intermédiaire, notre tutoriel d’installation et de configuration de whisper.cpp vous guide de la compilation à la première transcription.

Deux concepts techniques sont importants pour choisir un outil :

Moteur de reconnaissance vocale — le modèle qui transcrit l’audio. Les moteurs basés sur Whisper sont les plus précis ; VOSK est le plus léger.
Backend de saisie — la façon dont le texte est injecté dans les applications. xdotool fonctionne sur X11 ; ydotool, dotool et wtype supportent Wayland.

Comment se comparent les 7 meilleurs outils de dictée Linux ?

Le tableau ci-dessous résume les sept principaux outils de dictée open source pour Linux par moteur, compatibilité avec le serveur d’affichage et licence. Tous fonctionnent hors ligne ; les fonctionnalités cloud sont des options facultatives dans quelques cas.

Outil	Moteur de reconnaissance	Wayland / X11	Interface	Licence
Vocalinux	Whisper.cpp, Whisper, VOSK	Les deux	Barre système	GPL-3.0
VOXD	Whisper.cpp	Les deux	CLI, GUI, barre	MIT
Handy	Whisper, Parakeet V3	Les deux	Barre système	MIT
OpenWhispr	Whisper, Parakeet (+ cloud BYOK)	Les deux	Application bureau	MIT
nerd-dictation	VOSK	Les deux	Ligne de commande	GPL-3.0
Whispering	Whisper.cpp (+ cloud BYOK)	Les deux	Bureau, web	AGPL-3.0
LinuxWhispr	Whisper (+ affinement IA)	Les deux (X11/Wayland)	GTK4 + web	Open source

Chaque outil est détaillé ci-dessous, avec les points forts pratiques qui le distinguent.

Les 7 meilleurs outils de dictée vocale open source pour Linux

1. Vocalinux — l’expérience bureau la plus complète

Vocalinux est l’option la plus aboutie pour la saisie vocale sur Ubuntu et les autres distributions. Il propose une application dans la barre système avec des modes bascule et push-to-talk, une transcription en temps réel et des commandes vocales comme « nouvelle ligne » et « supprimer ça ».

Il supporte trois moteurs — Whisper.cpp (par défaut), OpenAI Whisper et VOSK — et offre une accélération GPU automatique via Vulkan. En juin 2026, il est en version v0.12.0-beta, testé sur Ubuntu 22.04+, Debian 11+, Fedora 39+, Arch Linux et openSUSE Tumbleweed. Il fonctionne 100 % hors ligne et est sous licence GPL-3.0.

Choisissez Vocalinux si vous voulez une expérience graphique complète sans toucher à la ligne de commande.

2. VOXD — un outil flexible et compatible Wayland

VOXD est un outil polyvalent de dictée hors ligne pour Linux basé sur Whisper.cpp. Il s’exécute en arrière-plan, transcrit sur pression d’un raccourci, saisit le texte dans l’application active et le copie dans le presse-papiers. Il supporte plus de 99 langues et ne nécessite pas de GPU.

Il est explicitement testé sur GNOME, KDE, Cinnamon, Hyprland et Sway, en utilisant ydotool pour la saisie sur Wayland. VOXD propose également un post-traitement optionnel par IA via des LLM locaux ou cloud, ainsi que des modes CLI, GUI, barre système et détection d’activité vocale. Il est sous licence MIT.

Choisissez VOXD si vous utilisez un compositeur Wayland et souhaitez plusieurs modes d’interface.

3. Handy — axé sur la confidentialité et multiplateforme

Handy offre un workflow simple « appuyer sur un raccourci, parler, le texte apparaît » sur Linux, macOS et Windows. Il utilise les modèles OpenAI Whisper (Small, Medium, Turbo, Large) avec accélération GPU, ainsi que Parakeet V3, un modèle optimisé pour le CPU avec détection automatique de la langue.

Tout le traitement est local — « votre voix reste sur votre ordinateur ». Il inclut la détection d’activité vocale Silero, des raccourcis configurables et l’insertion directe du texte. Handy est sous licence MIT.

Choisissez Handy si vous voulez un outil propre, axé sur la confidentialité, qui se comporte de manière identique sur tous les systèmes d’exploitation.

4. OpenWhispr — l’alternative open source à Wispr Flow

OpenWhispr se positionne comme une alternative open source et multiplateforme à Wispr Flow. Il offre une transcription locale entièrement privée avec Whisper ou NVIDIA Parakeet, ou des modèles cloud optionnels via votre propre clé API.

Il n’a aucune télémétrie ni collecte de données. La dernière version est la v1.7.2 (mai 2026), activement maintenue et sous licence MIT. Il fonctionne sur Linux, macOS et Windows.

Choisissez OpenWhispr si vous voulez une expérience à la Wispr Flow avec la liberté de basculer entre confidentialité locale et rapidité cloud.

5. nerd-dictation — le choix du minimaliste

nerd-dictation est l’utilitaire de reconnaissance vocale Linux le plus léger de cette liste. C’est un outil en ligne de commande : exécutez nerd-dictation begin pour démarrer et nerd-dictation end pour arrêter. Il utilise le moteur VOSK pour une reconnaissance entièrement hors ligne.

Il supporte quatre backends de saisie — xdotool (X11), plus ydotool, dotool et wtype (Wayland) — et offre un traitement de texte Python configurable par l’utilisateur, la conversion des nombres, ainsi qu’un mode suspension/reprise pour les machines plus lentes. Il est sous licence GPL-3.0.

Choisissez nerd-dictation si vous vivez dans le terminal et souhaitez un contrôle maximal avec une surcharge minimale.

6. Whispering — local par défaut, avec flexibilité cloud

Whispering offre un flux « appuyer sur un raccourci, parler, obtenir du texte » sur Linux, macOS et Windows. Il privilégie le local via Whisper.cpp mais supporte aussi les API cloud (Groq, OpenAI, ElevenLabs) sur la base d’une clé fournie par l’utilisateur.

Notez que le dépôt original a été archivé en février 2026 ; le projet vit désormais au sein de l’écosystème Epicenter et y reste activement développé. La transcription locale est gratuite ; l’utilisation cloud est facturée par votre fournisseur choisi. Il est sous licence AGPL-3.0.

Choisissez Whispering si vous voulez un fonctionnement local par défaut avec la possibilité d’appeler une API cloud rapide lorsque la précision ou la vitesse l’exige.

7. LinuxWhispr — alternative GTK4 native à Wispr Flow

LinuxWhispr est une application de dictée native Linux, axée sur la confidentialité, conçue comme une alternative open source à Wispr Flow. Elle associe la reconnaissance vocale en temps réel à un affinement du texte par IA, une interface GTK4 native et un tableau de bord web.

Elle supporte X11 et Wayland et cible les utilisateurs qui souhaitent une expérience bureau moderne et intégrée plutôt qu’un outil en ligne de commande.

Choisissez LinuxWhispr si vous voulez une application bureau GTK native avec nettoyage IA intégré de votre texte dicté.

Quel outil de dictée Linux choisir ?

Adaptez l’outil à votre flux de travail plutôt que de chercher un hypothétique « meilleur ». Pour une application graphique complète, choisissez Vocalinux. Pour le terminal, choisissez nerd-dictation. Pour la flexibilité Wayland, choisissez VOXD ou Handy.

Utilisez ce guide de décision rapide :

Je veux une application soignée dans la barre système → Vocalinux
Je veux l’outil CLI le plus léger possible → nerd-dictation
J’utilise Hyprland, Sway ou un autre compositeur Wayland → VOXD ou Handy
Je veux une expérience à la Wispr Flow → OpenWhispr ou LinuxWhispr
Je veux du local par défaut avec une option cloud occasionnelle → Whispering
Je bascule entre Linux, macOS et Windows → Handy ou OpenWhispr

Pour une analyse plus large des compromis entre transcription locale et cloud — latence, précision et confidentialité — consultez notre analyse de la transcription sur appareil versus cloud. Les facteurs qui influencent la qualité de la reconnaissance sont détaillés dans notre article approfondi sur la précision de la reconnaissance vocale.

Et pour les utilisateurs de macOS et Windows ?

Si vous travaillez aussi sur macOS ou Windows, les outils Linux open source ci-dessus ne vous suivront pas toujours — moteurs, packaging et backends de saisie diffèrent selon la plateforme. Pour une expérience hors ligne cohérente sur ces systèmes, une application dédiée multiplateforme est souvent plus simple.

Weesper Neon Flow est une telle option pour macOS et Windows (pas Linux). Comme les meilleurs outils Linux, il exécute des modèles de classe Whisper entièrement sur l’appareil, de sorte que vos données audio ne quittent jamais votre machine — avec accélération Metal sur Mac et des prompts de vocabulaire personnalisé pour les termes techniques.

Capacité	Outils open source Linux	Weesper Neon Flow
Plateformes	Linux	macOS, Windows
Traitement	100 % sur l’appareil	100 % sur l’appareil
Moteur	Whisper / VOSK / Parakeet	Whisper local de classe
Coût	Gratuit	5 EUR / mois
Vocabulaire personnalisé	Varie selon l’outil	Oui (prompts personnalisés)
Installation	Manuelle (CLI/compilation)	Installeur en un clic

Pour comprendre comment la dictée sur appareil protège vos travaux sensibles, consultez notre guide sur la dictée vocale hors ligne et la confidentialité. Si vous utilisez actuellement un outil cloud, notre comparatif des alternatives à Wispr Flow compare le paysage hors ligne sur toutes les plateformes.

Si vous êtes sur Mac ou Windows et souhaitez bénéficier de la même confidentialité que les utilisateurs Linux, essayez Weesper gratuitement pendant 15 jours — aucun compte cloud, aucune donnée audio ne quitte votre appareil.

Conclusion

La dictée vocale pour Linux a évolué en 2026 pour former un écosystème véritablement solide, entièrement open source. Que vous vouliez l’application soignée de Vocalinux, le minimalisme terminal de nerd-dictation, ou une expérience à la Wispr Flow avec OpenWhispr ou LinuxWhispr, vous pouvez dicter avec précision et en toute confidentialité, tout en faisant tourner l’ensemble sur votre propre matériel.

Commencez par l’outil qui correspond à votre bureau et à votre flux de travail, choisissez un modèle Whisper que votre matériel peut gérer et confirmez que le backend de saisie fonctionne sur votre session X11 ou Wayland. Pour comparer les performances du traitement local face au cloud, parcourez nos guides de dictée sur notre blog. Et si votre travail s’étend aussi à macOS ou Windows, téléchargez Weesper Neon Flow pour la même approche hors ligne sur ces plateformes.

Un tarif simple, sans surprise

Tous les forfaits incluent 15 jours d'essai gratuit. Aucune carte bancaire nécessaire.

MEILLEURE OFFRE À vie €99 paiement unique Rentabilisé en 20 mois vs mensuel

Annuel €45 / an 3 mois gratuits

Mensuel €5 / mois

Télécharger gratuitement — choisissez votre forfait dans l'application

Abonnez-vous directement depuis l'application après votre essai de 15 jours.

À propos de l'auteur

Weesper Team

L'équipe Weesper développe des logiciels de reconnaissance vocale sur appareil en utilisant Whisper, Metal et CUDA. Nous testons des outils de dictée sur différents systèmes d'exploitation pour aider les utilisateurs à choisir celui qui convient le mieux à leur flux de travail.

FAQ

Quel est le meilleur outil de dictée vocale open source pour Linux en 2026 ?

Il n'existe pas de meilleur outil universel — tout dépend de votre flux de travail. Pour une expérience bureau soignée avec une icône dans la barre système et accélération GPU, Vocalinux est l'option la plus complète. Pour un workflow minimaliste en ligne de commande, nerd-dictation est le plus léger. Sur les bureaux Wayland, VOXD et Handy fonctionnent tous les deux très bien. Tous ces outils exécutent les modèles Whisper ou VOSK entièrement hors ligne, ce qui signifie que vos données audio ne quittent jamais votre machine. La plupart sont gratuits sous des licences open source permissives.

Puis-je utiliser la dictée vocale hors ligne sur Linux ?

Oui. Presque tous les outils de dictée Linux open source fonctionnent entièrement hors ligne par conception. Des outils comme Vocalinux, VOXD, Handy, nerd-dictation et OpenWhispr téléchargent un modèle de reconnaissance vocale local (Whisper.cpp, OpenAI Whisper, NVIDIA Parakeet ou VOSK) et traitent tout l'audio sur votre propre matériel. Aucune connexion Internet n'est requise une fois le modèle téléchargé, et aucun audio n'est envoyé à un serveur cloud. Linux est ainsi l'une des plateformes les plus respectueuses de la vie privée pour la dictée.

La dictée vocale fonctionne-t-elle sur Wayland, ou uniquement sur X11 ?

Les deux, mais cela dépend de l'outil. Les anciens utilitaires reposaient sur xdotool, qui ne fonctionne qu'avec X11. Les outils modernes prennent désormais en charge Wayland via ydotool, dotool ou wtype pour l'injection de frappes. nerd-dictation supporte xdotool, ydotool, dotool et wtype. VOXD est testé sur les compositeurs Wayland Hyprland et Sway. Handy et OpenWhispr livrent des builds compatibles Wayland nativement. Vérifiez le backend de saisie de chaque projet avant de l'installer sur un bureau Wayland.

Existe-t-il une alternative à Wispr Flow pour Linux ?

Oui. Wispr Flow ne supporte pas officiellement Linux, mais plusieurs projets open source comblent ce vide. OpenWhispr, Handy et le projet Linux-natif LinuxWhispr proposent tous un workflow « appuyer sur un raccourci et parler » similaire à Wispr Flow, avec un affinement optionnel du texte par IA. Contrairement à Wispr Flow, ces outils fonctionnent en local et conservent vos données audio sur l'appareil. Si vous travaillez aussi sur macOS ou Windows, Weesper Neon Flow offre une expérience hors ligne comparable sur ces plateformes.

Quel moteur de reconnaissance vocale est le plus précis pour la dictée sur Linux ?

Les moteurs basés sur Whisper sont généralement les plus précis. Whisper.cpp et OpenAI Whisper offrent une excellente précision dans plus de 99 langues et gèrent mieux la ponctuation et les accents que les anciens moteurs. VOSK est plus léger et plus rapide sur le matériel d'entrée de gamme, mais moins précis pour les discours complexes. NVIDIA Parakeet (utilisé par Handy et OpenWhispr) est une option solide optimisée pour le CPU. Pour une meilleure précision, choisissez un modèle Whisper plus grand si votre GPU ou CPU peut le supporter.

Ai-je besoin d'un GPU puissant pour la dictée vocale sur Linux ?

Non, mais un GPU aide. Les modèles Whisper plus petits et VOSK fonctionnent correctement sur CPU seul, ce qui suffit pour une dictée occasionnelle. Pour une transcription en temps réel avec des modèles plus grands et plus précis, l'accélération GPU fait une différence notable. Vocalinux supporte l'accélération GPU Vulkan automatique, et Handy utilise le GPU si disponible. Sur le matériel NVIDIA, Whisper.cpp accéléré par CUDA est le plus rapide. Les configurations sans GPU devraient privilégier les modèles plus petits ou Parakeet pour maintenir une faible latence.