-
Notifications
You must be signed in to change notification settings - Fork 2
fr Home
🌐 Langue : English | Français
Dictée vocale Linux avec reconnaissance vocale locale, traduction optionnelle, et intégration complète KDE Plasma 6 / GNOME. Supporte 4 backends ASR (Parakeet-TDT, Canary, faster-whisper, Vosk) dans 25+ langues.
Ce wiki est le compagnon technique du README. Le README explique ce qu'est dictée, comment l'installer et l'usage typique. Le wiki approfondit la configuration, les internes des backends, le pipeline de post-traitement, le dépannage et la contribution.
Je veux l'installer → Installation · Setup-Wizard · GPU-Setup
Je veux comprendre son fonctionnement → How-It-Works (vue d'ensemble, accessible aux non-développeurs) · ASR-Backends · Post-Processing-Overview · Translation · Configuration
Je veux contribuer ou compiler depuis les sources → Developer-Guide · Building from source · Testing
-
Installation — une ligne,
.deb/.rpm/AUR/tarball, aarch64/Jetson, distros non packagées - Setup-Wizard — assistant guidé en 8 étapes au premier lancement, GIF complet du parcours
- Configuration — référence onglet par onglet de l'interface dictee-setup (tous les backends, PP, options UI)
- Plasmoid-Widget — widget KDE Plasma 6, 5 styles d'animation, réglages avancés
- Tray-Icon — icône systray, thèmes clair/sombre, GNOME/Ubuntu (AppIndicator)
- Keyboard-Shortcuts — capture KDE/GNOME, WM en mosaïque (Sway/i3/Hyprland)
- Voice-Commands — toutes les commandes vocales par langue + l'aide-mémoire flottant (Ctrl+Alt+F9)
- GPU-Setup — prérequis CUDA par distribution, cuDNN, détection GPU, fallback CPU
- ASR-Backends — table comparative, quand choisir chaque backend
-
Parakeet-TDT-Deep-Dive — modèle principal, 25 langues, plafond ~5:20 min en ligne de commande (contourné par
dictee-transcribedepuis v1.3.4) - Canary-1B-Deep-Dive — encoder-decoder avec traduction intégrée, 7 langues, meilleure précision
- Translation — 5 backends comparés (Canary intégré, LibreTranslate, Ollama, Google, Bing)
- Ollama-Setup — installation, modèles recommandés (Gemma 3 4B), prompts structurés
- Post-Processing-Overview — pipeline complet, ordre des étapes, diagramme
- Rules-and-Dictionary — règles regex, dictionnaire, variantes ASR, 7 langues
- LLM-Correction — position Ollama (first/last/hybrid), prompts
- Numbers-Dates-Continuation — cardinaux/ordinaux/versions/décimales/heures + tampon de continuation
- Diarization — Sortformer, jusqu'à 4 locuteurs, pipeline chunked universel (plus de plafond VRAM sur les fichiers longs depuis v1.3.4)
-
CLI-Reference — toutes les commandes :
dictee,dictee-switch-backend, binaires Rust
- Troubleshooting — erreurs communes, OOM GPU, logs, socket daemon
- FAQ — pourquoi Rust ? pourquoi pas Whisper streaming ? multi-utilisateur ?
- Developer-Guide — build, architecture, tests, workflow de contribution
- Changelog — historique des versions (miroir des notes de release GitHub)
- Dépôt : https://github.com/rcspam/dictee
- Dernière version : https://github.com/rcspam/dictee/releases/latest
- Issues : https://github.com/rcspam/dictee/issues
- Discussions : https://github.com/rcspam/dictee/discussions
Getting started / Premiers pas
- Installation · 🇬🇧 · 🇫🇷
- Setup-Wizard · 🇬🇧 · 🇫🇷
- Configuration · 🇬🇧 · 🇫🇷
- Plasmoid-Widget · 🇬🇧 · 🇫🇷
- Tray-Icon · 🇬🇧 · 🇫🇷
- Keyboard-Shortcuts · 🇬🇧 · 🇫🇷
- Voice-Commands · 🇬🇧 · 🇫🇷
- GPU-Setup · 🇬🇧 · 🇫🇷
- Diarization · 🇬🇧 · 🇫🇷
- LLM-Diarization · 🇬🇧 · 🇫🇷
Speech recognition / ASR
Translation / Traduction
Post-processing / Post-traitement
- Overview · 🇬🇧 · 🇫🇷
- Rules-and-Dictionary · 🇬🇧 · 🇫🇷
- LLM-Correction · 🇬🇧 · 🇫🇷
- Numbers-Dates-Continuation · 🇬🇧 · 🇫🇷
CLI
Reference / Référence
🏠 Repo · 📦 Releases · 🐛 Issues