Summary
Optical Character Recognition (OCR)
Debian Accessibility Optical Character Recognition (OCR)
This metapackage will install packages which are useful for
Optical Character Recognition (OCR).
Description
For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:
If you discover a project which looks like a good candidate for Debian Accessibility
to you, or if you have prepared an unofficial Debian package, please do not hesitate to
send a description of that project to the Debian Accessibility mailing list
Links to other tasks
|
Debian Accessibility Optical Character Recognition (OCR) packages
Official Debian packages with high relevance
ebook-speaker
lecteur de livre numérique lisant à voix haute avec une voix synthétique
|
Versions of package ebook-speaker |
Release | Version | Architectures |
buster | 5.0.0-1 | amd64,arm64,armhf,i386 |
jessie | 2.8.1-1+deb8u1 | amd64,armel,armhf,i386 |
sid | 6.2.0-6 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 6.2.0-6 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 6.2.0-4+deb12u1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bullseye | 5.5.2-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
stretch | 4.1.0-2 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
Debtags of package ebook-speaker: |
accessibility | speech |
interface | commandline |
role | program |
scope | utility |
sound | player |
works-with | file |
works-with-format | epub |
|
License: DFSG free
|
Ce paquet fournit un lecteur en ligne de commande lisant un texte
numérique en utilisant la synthèse vocale. Il possède une interface
utilisateur simple adaptée pour des terminaux en Braille.
Actuellement, les formats suivants sont pris en charge (certains demandent
des paquets supplémentaires suggérés par ce paquet) :
– AportisDoc ;
– texte de courriel en ASCII ;
– texte en ASCII ;
– livres numériques Broadband (BBeB) ;
– Composite Document File (Microsoft Office Word) ;
– DAISY3 DTBook ;
– données de livres EPUB ;
– données d’image GIF ;
– GutenPalm zTXT ;
– catalogue de messages GNU gettext ;
– document HTML ;
– texte en ISO-8859 ;
– données d’image JPEG ;
– données de livre Microsoft Reader ;
– données de Microsoft Windows HtmlHelp ;
– Microsoft Word 2007+ ;
– livre Mobipocket ;
– données de MS Windows HtmlHelp ;
– données PPM Netpbm ;
– texte OpenDocument ;
– document PDF ;
– PeanutPress PalmOS ;
– données d’image PNG ;
– texte de script d’interpréteur POSIX ;
– document PostScript ;
– Rich Text Format ;
– troff ou préprocesseur de text, (par exemple, pages de manuel Linux) ;
– texte de courriel Unicode UTF-8 ;
– texte en Unicode UTF-8 ;
– WordPerfect ;
– texte de document XML.
|
|
gocr
reconnaissance optique de caractères en ligne de commande
|
Versions of package gocr |
Release | Version | Architectures |
stretch | 0.49-2 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
jessie | 0.49-2 | amd64,armel,armhf,i386 |
sid | 0.52-6.1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 0.52-6.1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 0.52-6 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bullseye | 0.52-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
buster | 0.52-1 | amd64,arm64,armhf,i386 |
Debtags of package gocr: |
accessibility | ocr |
interface | commandline |
role | program |
scope | application |
use | converting |
works-with | image, image:raster, text |
|
License: DFSG free
|
Il s’agit d’un programme de reconnaissance optique de caractères (OCR :
« Optical Character Recognition ») multiplateforme.
Il lit les fichiers d'images PNM, PBM, PGM, PPM et de certains PCX et TGA.
Le programme gère les numérisations de bonne qualité avec du texte dans une
seule colonne et sans tableau. Les tailles de polices de 20 à 60 sont gérées.
La bibliothèque de développement d'applications de reconnaissance optique
de caractères libgocr est fournie dans un paquet séparé, tout comme la
documentation et l'interface graphique.
|
|
hocr-gtk
frontal en GTK+ pour la ROC hébraïque
|
Versions of package hocr-gtk |
Release | Version | Architectures |
jessie | 0.10.17-2 | all |
buster | 0.10.18-3 | all |
Debtags of package hocr-gtk: |
accessibility | ocr |
culture | hebrew |
interface | x11 |
role | program |
scope | application |
uitoolkit | gtk |
use | converting |
works-with | image, image:raster, text |
x11 | application |
|
License: DFSG free
|
Hocr-gtk est une interface graphique basée sur GTK+ pour la bibliothèque
libhocr. Elle peut ouvrir de nombreux formats d’image et utilise aspell
pour la vérification orthographique interne.
|
|
lios
ROC intelligente pour Linux
|
Versions of package lios |
Release | Version | Architectures |
stretch | 2.1-2 | all |
sid | 2.7.2-8 | all |
trixie | 2.7.2-8 | all |
bookworm | 2.7.2-6 | all |
bullseye | 2.7.2-2 | all |
buster | 2.7-3 | all |
experimental | 2.7.2+git20221124-0.1 | all |
|
License: DFSG free
|
Lios fournit une interface graphique basée sur les dorsaux de ROC, Cuneiform
et Tesseract, pour faciliter la reconnaissance optique de caractères pour
les utilisateurs handicapés, avec des fonctions complètes de rotation
automatique, d’optimisation de luminosité, de sélection rectangulaire, de
retour vocal, etc.
|
|
tesseract-ocr
outil de ROC en ligne de commande de Tesseract
|
Versions of package tesseract-ocr |
Release | Version | Architectures |
sid | 5.3.4-1.4 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 5.3.0-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
jessie | 3.03.03-1 | amd64,armel,armhf,i386 |
stretch | 3.04.01-5 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
stretch-backports | 4.0.0-2~bpo9+1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
buster | 4.0.0-2 | amd64,arm64,armhf,i386 |
trixie | 5.3.4-1.4 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bullseye | 4.1.1-2.1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
upstream | 5.5.0 |
Debtags of package tesseract-ocr: |
accessibility | ocr |
interface | commandline |
role | program |
|
License: DFSG free
|
Tesseract est un moteur de reconnaissance optique de caractères (OCR). Il
peut être utilisé directement ou (par les programmeurs) en utilisant
l’interface de programmation applicative pour extraire du texte imprimé
dans des images. Il prend en charge une large diversité de langues. Ce
paquet fournit l’outil en ligne de commande.
|
|
Debian packages in contrib or non-free
cuneiform
multi-language OCR system
|
Versions of package cuneiform |
Release | Version | Architectures |
buster | 1.1.0+dfsg-7 (non-free) | amd64,arm64,armhf,i386 |
jessie | 1.1.0+dfsg-5 (non-free) | amd64,i386 |
sid | 1.1.0+dfsg-11 (non-free) | amd64,arm64,armel,armhf,i386,mips64el,ppc64el |
trixie | 1.1.0+dfsg-11 (non-free) | amd64,arm64,armel,armhf,i386,mips64el,ppc64el |
bookworm | 1.1.0+dfsg-9 (non-free) | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el |
bullseye | 1.1.0+dfsg-8 (non-free) | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el |
Debtags of package cuneiform: |
accessibility | ocr |
interface | commandline |
role | program |
scope | utility |
use | converting |
works-with | image, image:raster |
|
License: non-free
|
Cuneiform is an OCR system. In addition to text recognition it also does
layout analysis and text format recognition.
The following languages are supported: Bulgarian, Croatian, Czech, Danish,
Dutch, English, Estonian, French, German, Hungarian, Italian, Latvian,
Lithuanian, Polish, Portuguese, Romanian, Russian, Serbian, Slovenian,
Spanish, Swedish, Turkish and Ukrainian.
|
|