Debian Accessibility Project
Summary
Optical Character Recognition (OCR)
Debian Accessibility Optical Character Recognition (OCR)

This metapackage will install packages which are useful for Optical Character Recognition (OCR).

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Accessibility to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Accessibility mailing list

Links to other tasks

Debian Accessibility Optical Character Recognition (OCR) packages

Official Debian packages with high relevance

ebook-speaker
lecteur de livre numérique lisant à voix haute avec une voix synthétique
Versions of package ebook-speaker
ReleaseVersionArchitectures
buster5.0.0-1amd64,arm64,armhf,i386
jessie2.8.1-1+deb8u1amd64,armel,armhf,i386
sid6.2.0-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie6.2.0-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm6.2.0-4+deb12u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye5.5.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch4.1.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package ebook-speaker:
accessibilityspeech
interfacecommandline
roleprogram
scopeutility
soundplayer
works-withfile
works-with-formatepub
Popcon: 17 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit un lecteur en ligne de commande lisant un texte numérique en utilisant la synthèse vocale. Il possède une interface utilisateur simple adaptée pour des terminaux en Braille.

Actuellement, les formats suivants sont pris en charge (certains demandent des paquets supplémentaires suggérés par ce paquet) :

 – AportisDoc ;
 – texte de courriel en ASCII ;
 – texte en ASCII ;
 – livres numériques Broadband (BBeB) ;
 – Composite Document File (Microsoft Office Word) ;
 – DAISY3 DTBook ;
 – données de livres EPUB ;
 – données d’image GIF ;
 – GutenPalm zTXT ;
 – catalogue de messages GNU gettext ;
 – document HTML ;
 – texte en ISO-8859 ;
 – données d’image JPEG ;
 – données de livre Microsoft Reader ;
 – données de Microsoft Windows HtmlHelp ;
 – Microsoft Word 2007+ ;
 – livre Mobipocket ;
 – données de MS Windows HtmlHelp ;
 – données PPM Netpbm ;
 – texte OpenDocument ;
 – document PDF ;
 – PeanutPress PalmOS ;
 – données d’image PNG ;
 – texte de script d’interpréteur POSIX ;
 – document PostScript ;
 – Rich Text Format ;
 – troff ou préprocesseur de text, (par exemple, pages de manuel Linux) ;
 – texte de courriel Unicode UTF-8 ;
 – texte en Unicode UTF-8 ;
 – WordPerfect ;
 – texte de document XML.
Screenshots of package ebook-speaker
gocr
reconnaissance optique de caractères en ligne de commande
Versions of package gocr
ReleaseVersionArchitectures
stretch0.49-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.49-2amd64,armel,armhf,i386
sid0.52-6.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.52-6.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.52-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.52-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.52-1amd64,arm64,armhf,i386
Debtags of package gocr:
accessibilityocr
interfacecommandline
roleprogram
scopeapplication
useconverting
works-withimage, image:raster, text
Popcon: 182 users (170 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un programme de reconnaissance optique de caractères (OCR : « Optical Character Recognition ») multiplateforme.

Il lit les fichiers d'images PNM, PBM, PGM, PPM et de certains PCX et TGA.

Le programme gère les numérisations de bonne qualité avec du texte dans une seule colonne et sans tableau. Les tailles de polices de 20 à 60 sont gérées.

La bibliothèque de développement d'applications de reconnaissance optique de caractères libgocr est fournie dans un paquet séparé, tout comme la documentation et l'interface graphique.

hocr-gtk
frontal en GTK+ pour la ROC hébraïque
Versions of package hocr-gtk
ReleaseVersionArchitectures
jessie0.10.17-2all
buster0.10.18-3all
Debtags of package hocr-gtk:
accessibilityocr
culturehebrew
interfacex11
roleprogram
scopeapplication
uitoolkitgtk
useconverting
works-withimage, image:raster, text
x11application
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Hocr-gtk est une interface graphique basée sur GTK+ pour la bibliothèque libhocr. Elle peut ouvrir de nombreux formats d’image et utilise aspell pour la vérification orthographique interne.

lios
ROC intelligente pour Linux
Maintainer: Samuel Thibault
Versions of package lios
ReleaseVersionArchitectures
stretch2.1-2all
sid2.7.2-8all
trixie2.7.2-8all
bookworm2.7.2-6all
bullseye2.7.2-2all
buster2.7-3all
experimental2.7.2+git20221124-0.1all
Popcon: 68 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Lios fournit une interface graphique basée sur les dorsaux de ROC, Cuneiform et Tesseract, pour faciliter la reconnaissance optique de caractères pour les utilisateurs handicapés, avec des fonctions complètes de rotation automatique, d’optimisation de luminosité, de sélection rectangulaire, de retour vocal, etc.

Screenshots of package lios
tesseract-ocr
outil de ROC en ligne de commande de Tesseract
Versions of package tesseract-ocr
ReleaseVersionArchitectures
sid5.3.4-1.4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm5.3.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.03.03-1amd64,armel,armhf,i386
stretch3.04.01-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch-backports4.0.0-2~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.0.0-2amd64,arm64,armhf,i386
trixie5.3.4-1.4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye4.1.1-2.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream5.5.0
Debtags of package tesseract-ocr:
accessibilityocr
interfacecommandline
roleprogram
Popcon: 2065 users (874 upd.)*
Newer upstream!
License: DFSG free

Tesseract est un moteur de reconnaissance optique de caractères (OCR). Il peut être utilisé directement ou (par les programmeurs) en utilisant l’interface de programmation applicative pour extraire du texte imprimé dans des images. Il prend en charge une large diversité de langues. Ce paquet fournit l’outil en ligne de commande.

Debian packages in contrib or non-free

cuneiform
multi-language OCR system
Versions of package cuneiform
ReleaseVersionArchitectures
buster1.1.0+dfsg-7 (non-free)amd64,arm64,armhf,i386
jessie1.1.0+dfsg-5 (non-free)amd64,i386
sid1.1.0+dfsg-11 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el
trixie1.1.0+dfsg-11 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm1.1.0+dfsg-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye1.1.0+dfsg-8 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Debtags of package cuneiform:
accessibilityocr
interfacecommandline
roleprogram
scopeutility
useconverting
works-withimage, image:raster
Popcon: 43 users (17 upd.)*
Versions and Archs
License: non-free
Git

Cuneiform is an OCR system. In addition to text recognition it also does layout analysis and text format recognition.

The following languages are supported: Bulgarian, Croatian, Czech, Danish, Dutch, English, Estonian, French, German, Hungarian, Italian, Latvian, Lithuanian, Polish, Portuguese, Romanian, Russian, Serbian, Slovenian, Spanish, Swedish, Turkish and Ukrainian.

*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 247531