Debian Accessibility Project
Summary
Speech Synthesis
Debian Accessibility Speech Synthesis

This metapackage will install packages which are useful for Speech Synthesis and related APIs or applications.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Accessibility to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Accessibility mailing list

Links to other tasks

Debian Accessibility Speech Synthesis packages

Official Debian packages with high relevance

daisy-player
lecteur pour les livres audionumériques DAISY
Versions of package daisy-player
ReleaseVersionArchitectures
bullseye12.1-1amd64,arm64,armhf,i386
sid13.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
forky13.0-5amd64,arm64,armhf,i386,ppc64el,riscv64,s390x
trixie13.0-4amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
bookworm13.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package daisy-player:
interfacetext-mode
roleprogram
scopeutility
soundplayer
uitoolkitncurses
uselearning, playing
works-withaudio
works-with-formatmp3
Popcon: 7 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Daisy-player est un lecteur en ligne de commande pour les livres audio basé sur le protocole DAISY (Digital Accessible Information System). Il est équivalent en caractéristiques, fonctions et facilité d’utilisation aux lecteurs commerciaux, et possède une interface utilisateur simple appropriée aux terminaux braille.

Screenshots of package daisy-player
eflite
serveur vocal pour emacspeak basé sur Festival-Lite
Versions of package eflite
ReleaseVersionArchitectures
bullseye0.4.1-12amd64,arm64,armhf,i386
bookworm0.4.1-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.4.1-13amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
forky0.4.1-14amd64,arm64,armhf,i386,ppc64el,riscv64,s390x
sid0.4.1-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package eflite:
accessibilityspeech
roleplugin
suiteemacs
works-withaudio
Popcon: 4 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

EFlite est un serveur vocal pour Emacspeak et autres lecteurs d’écran qui permet de les interfacer avec Festival Lite, un moteur libre de transformation de texte en parole, développé au centre pour la parole de de l'université de Carnegie Mellon comme déclinaison de Festival.

En raison de limitations héritées du dorsal, EFlite ne fournit qu’une prise en charge de la langue anglaise actuellement.

espeak
logiciel de synthèse vocale polyglotte
Versions of package espeak
ReleaseVersionArchitectures
bullseye1.48.15+dfsg-2amd64,arm64,armhf,i386
sid1.48.15+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
forky1.48.15+dfsg-3amd64,arm64,armhf,i386,ppc64el,riscv64,s390x
trixie1.48.15+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
bookworm1.48.15+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package espeak:
interfacecommandline
roleprogram
soundspeech
works-withaudio
Popcon: 259 users (220 upd.)*
Versions and Archs
License: DFSG free
Git

eSpeak est un logiciel de synthèse vocale pour l'anglais et certaines autres langues.

eSpeak produit des phrases de bonne qualité en anglais. Il utilise une méthode de synthèse différente des autres moteurs open source de texte parlé (TTS), et sonne assez différemment. Il n'est peut-être pas aussi naturel ou «⋅fluide⋅», mais certains trouvent l'articulation plus claire et plus facile à écouter sur de longues durées.

Il peut se lancer comme un programme en ligne de commande pour lire un texte à partir d'un fichier ou à partir de l’entrée standard.

 –⋅Comprend différentes voix, dont les caractéristiques peuvent être
   modifiées.
 –⋅Peut produire une sortie vocale sous forme de fichier WAV.
 –⋅Peut traduire du texte en code phonétique, de sorte à être adapté comme
   interface d'un autre moteur de synthèse vocale.
 –⋅Potentiel pour d'autres langues. Plus de 40 langues incluses.
 –⋅Taille compacte. Le programme et ses données pèsent environ
   350 kilo-octets.
 –⋅Écrit en C++.
flite
petit moteur rapide de synthèse vocale
Versions of package flite
ReleaseVersionArchitectures
bullseye2.2-2amd64,arm64,armhf,i386
sid2.2-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
forky2.2-7amd64,arm64,armhf,i386,ppc64el,riscv64,s390x
trixie2.2-7amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
bookworm2.2-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package flite:
accessibilityspeech
interfacecommandline
roleprogram
scopeutility
works-withaudio
Popcon: 92 users (959 upd.)*
Versions and Archs
License: DFSG free
Git

Flite est un petit moteur rapide de synthèse vocale. Il fait partie d'un ensemble de logiciels libres de synthèse vocale qui comprend : Festival, le système de l'université d’Édimbourg, Festvox, le projet de l'université de Carnegie Mellon, des outils, des scripts et de la documentation pour créer des voix synthétiques. Cependant, Flite ne nécessite aucun de ces systèmes pour fonctionner.

Flite prend actuellement en charge les langues anglaise et indo-aryennes.

Ce paquet fournit les exécutables et la documentation.

speech-dispatcher
interface commune pour les synthétiseurs vocaux
Versions of package speech-dispatcher
ReleaseVersionArchitectures
trixie-backports0.12.1-2~bpo13+1amd64,arm64,armel,armhf,i386,ppc64el,s390x
trixie0.12.0-5amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
bookworm0.11.4-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.10.2-2+deb11u2amd64,arm64,armhf,i386
bookworm-backports0.12.0-4~bpo12+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.12.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
forky0.12.1-2amd64,arm64,armhf,i386,ppc64el,riscv64,s390x
Debtags of package speech-dispatcher:
accessibilityspeech
interfacedaemon
networkserver
roleprogram
works-withaudio
Popcon: 93263 users (18210 upd.)*
Versions and Archs
License: DFSG free
Git

Speech Dispatcher fournit une couche indépendante du périphérique pour la synthèse vocale. Il prend en charge divers synthétiseurs vocaux logiciels et matériels en tant que dorsaux et fournit une couche générique pour la synthèse vocale et la lecture de données PCM avec ces dorsaux vers des applications.

Plusieurs concepts de haut niveau comme mise en file d’attente versus interruption de la parole et des configurations utilisateur spécifiques aux applications sont implémentés de façon indépendante des périphériques, libérant ainsi le programmeur d'application du besoin de réinventer la roue.

Ce paquet fournit Speech Dispatcher lui-même.

The package is enhanced by the following packages: sd-multispeech
speech-tools
Edinburgh Speech Tools –⋅exécutables utilisateur
Versions of package speech-tools
ReleaseVersionArchitectures
bookworm2.5.0-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.5.0-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
forky2.5.0-14amd64,arm64,armhf,i386,ppc64el,riscv64,s390x
trixie2.5.0-13amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
bullseye2.5.0-11amd64,arm64,armhf,i386
Debtags of package speech-tools:
accessibilityspeech
fieldlinguistics
interfacecommandline, text-mode
roleprogram
scopeutility
uitoolkitncurses
useplaying
Popcon: 11 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit plusieurs programmes utilitaires très utiles qui utilisent et accompagnent la bibliothèque Edinburgh Speech Tools (outils vocaux d’Édimbourg). Des programmes audio et de traitement de signal basiques sont inclus dans le paquet.

Les programmes suivants sont disponibles :

 –⋅na_play : programme de lecture générique à utiliser avec net_audio et
             CSTR ao ;
 –⋅ch_wave : programme de conversion de fichier waveform ;
 –⋅ch_lab : programme de conversion d’étiquettes ;
 –⋅ch_track : programme de conversion de fichier de piste ;
 –⋅wagon : programme pour créer et tester des arbres CART.

Lisez /usr/share/doc/speech-tools/README pour une liste détaillée des programmes disponibles.

Official Debian packages with lower relevance

festvox-ru
Russian male speaker for Festival
Versions of package festvox-ru
ReleaseVersionArchitectures
bullseye0.5+dfsg-5all
bookworm0.5+dfsg-6all
trixie0.5+dfsg-6all
forky0.5+dfsg-6all
sid0.5+dfsg-6all
Debtags of package festvox-ru:
accessibilityspeech
culturerussian
roleapp-data
soundspeech
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides Russian support to Festival speech synthesis system.

freetts
système de synthèse vocale
Maintainer: Bdale Garbee
Versions of package freetts
ReleaseVersionArchitectures
bookworm1.2.2-7all
sid1.2.2-8all
forky1.2.2-8all
trixie1.2.2-8all
bullseye1.2.2-7all
Debtags of package freetts:
accessibilityspeech
roleprogram
Popcon: 3 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

FreeTTS est un système de synthèse vocale entièrement écrit en langage de programmation Java™. Il est basé sur Flite, un petit exécutable de moteur de synthèse vocale développé à l'université Carnegie-Mellon. Flite est lui- même dérivé du système de synthèse vocale Festival de l’université d'Edimbourg et du projet FestVox de l'université Carnegie-Mellon.

saytime
Prononce l'heure courante à travers votre carte son
Maintainer: Holger Levsen
Versions of package saytime
ReleaseVersionArchitectures
bullseye1.0-34amd64,arm64,armhf,i386
sid1.0-37amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
forky1.0-36amd64,arm64,armhf,i386,ppc64el,riscv64,s390x
trixie1.0-36amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
bookworm1.0-35amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package saytime:
accessibilityspeech
interfacecommandline
roleprogram
scopeutility
soundplayer
usetimekeeping
works-withaudio
Popcon: 10 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Prononce l'heure courante à travers votre carte son. Vous devez avoir un périphérique audio de sortie disponible.

Screenshots of package saytime
sonic
utilitaire simple d’accélération ou ralentissement de la voix
Versions of package sonic
ReleaseVersionArchitectures
sid0.2.0-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
forky0.2.0-13amd64,arm64,armhf,i386,ppc64el,riscv64,s390x
trixie0.2.0-13amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
bookworm0.2.0-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.2.0-10amd64,arm64,armhf,i386
Debtags of package sonic:
roleprogram
scopeutility
useediting
works-withaudio
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Sonic est un utilitaire très simple qui lit et écrit des fichiers WAV, et qui les accélère ou ralentit avec une légère distorsion. La nouvelle fonctionnalité importante dans Sonic par rapport à d’autres bibliothèques est la très haute qualité à des facteurs d’accélération bien au-dessus de deux.

Screenshots of package sonic
speech-dispatcher-festival
prise en charge par Festival de Speech Dispatcher
Versions of package speech-dispatcher-festival
ReleaseVersionArchitectures
trixie0.12.0-5amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
bookworm0.11.4-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm-backports0.12.0-4~bpo12+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie-backports0.12.1-2~bpo13+1amd64,arm64,armel,armhf,i386,ppc64el,s390x
forky0.12.1-2amd64,arm64,armhf,i386,ppc64el,riscv64,s390x
bullseye0.10.2-2+deb11u2amd64,arm64,armhf,i386
sid0.12.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package speech-dispatcher-festival:
accessibilityspeech
rolemetapackage
works-withaudio
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Speech Dispatcher fournit une couche indépendante du périphérique pour la synthèse vocale. Il prend en charge divers synthétiseurs vocaux logiciels et matériels en tant que dorsaux et fournit une couche générique pour la synthèse vocale et la lecture de données PCM avec ces dorsaux vers des applications.

Plusieurs concepts de haut niveau comme mise en file d’attente versus interruption de la parole et des configurations utilisateur spécifiques aux applications sont implémentés de façon indépendante des périphériques, libérant ainsi le programmeur d'application du besoin de réinventer la roue.

Ce paquet fournit des dépendances sur des paquets nécessaires pour exécuter Speech Dispatcher avec Festival.

Debian packages in contrib or non-free

libttspico-utils
Small Footprint TTS (binaries)
Versions of package libttspico-utils
ReleaseVersionArchitectures
bullseye1.0+git20130326-11 (non-free)amd64,arm64,armhf,i386
bookworm1.0+git20130326-13 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0+git20130326-14.1 (non-free)amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
forky1.0+git20130326-14.1 (non-free)amd64,arm64,armhf,i386,ppc64el,riscv64,s390x
sid1.0+git20130326-14.1 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package libttspico-utils:
roleprogram
Popcon: 37 users (32 upd.)*
Versions and Archs
License: non-free
Git

The SVOX Pico engine is a software speech synthesizer for German, English (GB and US), Spanish, French and Italian.

SVOX produces a clear and distinct speech output made possible by the use of Hidden Markov Model (HMM) algorithms.

This package contains binary files including pico2wave.

mbrola
Multilingual software speech synthesizer
Maintainer: Samuel Thibault
Versions of package mbrola
ReleaseVersionArchitectures
forky3.3+dfsg-9 (contrib)amd64,arm64,armhf,i386,ppc64el,riscv64,s390x
trixie3.3+dfsg-9 (contrib)amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
bookworm3.3+dfsg-9 (contrib)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.3+dfsg-4+deb11u1 (contrib)amd64,arm64,armhf,i386
sid3.3+dfsg-9 (contrib)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package mbrola:
roleprogram
soundspeech
Popcon: 178 users (8 upd.)*
Versions and Archs
License: DFSG free, but needs non-free components
Git

Mbrola is Thierry Dutoit's phonemizer for multilingual speech synthesis. The various diphone databases are distributed on separate packages, but they must be used with and only with Mbrola because of license matters. Read the copyright for details.

Mbrola itself doesn't provide full TTS. It is a speech synthesizer based on the concatenation of diphones. It takes a list of phonemes as input, together with prosodic information (duration of phonemes and a piecewise linear description of pitch), and produces speech samples on 16 bits (linear), at the sampling frequency of the diphone database.

Use Mbrola along with Freephone, cicero or espeak to have a complete text-to-speech in English.

Packaging has started and developers might try the packaging code in VCS

cicero
French and English Text-To-Speech for MBROLA
Versions of package cicero
ReleaseVersionArchitectures
VCS0.7.2-7all
Versions and Archs
License: free
Debian package not available
Git
Version: 0.7.2-7

This Text-To-Speech (TTS) engine speaks French; a preliminary English support is also offered. The engine uses context-sensitive rules to produce phonemes from the text. It relies on MBROLA to generate actual audio output from the phonemes. The TTS engine is implemented using the Python programming language.

The upstream authors have come up with this TTS to try and meet their own needs as blind users. It's designed to be plugged as output to some screen-review software, firstly with BRLTTY. They favor speed and intelligibility over perfect pronunciation. Cicero is aimed to have a quick response time, the ability to quickly shut-up and skip to another utterance, intelligibility where it counts (not perfect pronunciation), the ability to track speech progression, relative simplicity (hackability) and relative small code size.

gespeaker
GTK+ front-end for eSpeak and mbrola
Responsible: Fabio Castelli (Sandro Tosi)
Versions of package gespeaker
ReleaseVersionArchitectures
VCS0.8.6-2all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 0.8.6-2

Gespeaker is a GTK+ frontend for eSpeak and mbrola. It allows one to play a text in many languages with settings for voice, pitch, volume, speed and word gap.

Since version 0.6 it can use mbrola package and voices to obtain a more realistic text reading experience.

*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 267811