Skip to content

fr Home

rcspam edited this page May 15, 2026 · 8 revisions

🌐 Langue : English | Français

dictée — Wiki

Dictée vocale Linux avec reconnaissance vocale locale, traduction optionnelle, et intégration complète KDE Plasma 6 / GNOME. Supporte 4 backends ASR (Parakeet-TDT, Canary, faster-whisper, Vosk) dans 25+ langues.

Ce wiki est le compagnon technique du README. Le README explique ce qu'est dictée, comment l'installer et l'usage typique. Le wiki approfondit la configuration, les internes des backends, le pipeline de post-traitement, le dépannage et la contribution.

🚀 Trois parcours d'entrée

Je veux l'installerInstallation · Setup-Wizard · GPU-Setup

Je veux comprendre son fonctionnementHow-It-Works (vue d'ensemble, accessible aux non-développeurs) · ASR-Backends · Post-Processing-Overview · Translation · Configuration

Je veux contribuer ou compiler depuis les sourcesDeveloper-Guide · Building from source · Testing

📖 Index complet des pages

Premiers pas

  • Installation — une ligne, .deb/.rpm/AUR/tarball, aarch64/Jetson, distros non packagées
  • Setup-Wizard — assistant guidé en 8 étapes au premier lancement, GIF complet du parcours
  • Configuration — référence onglet par onglet de l'interface dictee-setup (tous les backends, PP, options UI)
  • Plasmoid-Widget — widget KDE Plasma 6, 5 styles d'animation, réglages avancés
  • Tray-Icon — icône systray, thèmes clair/sombre, GNOME/Ubuntu (AppIndicator)
  • Keyboard-Shortcuts — capture KDE/GNOME, WM en mosaïque (Sway/i3/Hyprland)
  • Voice-Commands — toutes les commandes vocales par langue + l'aide-mémoire flottant (Ctrl+Alt+F9)
  • GPU-Setup — prérequis CUDA par distribution, cuDNN, détection GPU, fallback CPU

Reconnaissance vocale (ASR)

  • ASR-Backends — table comparative, quand choisir chaque backend
  • Parakeet-TDT-Deep-Dive — modèle principal, 25 langues, plafond ~5:20 min en ligne de commande (contourné par dictee-transcribe depuis v1.3.4)
  • Canary-1B-Deep-Dive — encoder-decoder avec traduction intégrée, 7 langues, meilleure précision

Traduction

  • Translation — 5 backends comparés (Canary intégré, LibreTranslate, Ollama, Google, Bing)
  • Ollama-Setup — installation, modèles recommandés (Gemma 3 4B), prompts structurés

Pipeline de post-traitement

Diarisation & CLI

  • Diarization — Sortformer, jusqu'à 4 locuteurs, pipeline chunked universel (plus de plafond VRAM sur les fichiers longs depuis v1.3.4)
  • CLI-Reference — toutes les commandes : dictee, dictee-switch-backend, binaires Rust

Référence

  • Troubleshooting — erreurs communes, OOM GPU, logs, socket daemon
  • FAQ — pourquoi Rust ? pourquoi pas Whisper streaming ? multi-utilisateur ?
  • Developer-Guide — build, architecture, tests, workflow de contribution
  • Changelog — historique des versions (miroir des notes de release GitHub)

🔗 Liens externes

📖 dictee Wiki

🇬🇧 Home · 🇫🇷 Accueil


Getting started / Premiers pas

Speech recognition / ASR

Translation / Traduction

Post-processing / Post-traitement

CLI

Reference / Référence


🏠 Repo · 📦 Releases · 🐛 Issues

Clone this wiki locally