Debian Accessibility Project
Summary
Optical character recognition (ocr)
Debian Accessibility Optical Character Recognition (OCR)

This metapackage will install packages which are useful for Optical Character Recognition (OCR).

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Accessibility to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Accessibility mailing list

Links to other tasks

Debian Accessibility Optical character recognition (ocr) packages

Official Debian packages with high relevance

Ebook-speaker
lettore di eBook che legge ad alta voce con una voce sintetica
Versions of package ebook-speaker
ReleaseVersionArchitectures
jessie2.8.1-1+deb8u1amd64,armel,armhf,i386
stretch4.1.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy2.0-3amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
bookworm6.2.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye5.5.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster5.0.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid6.2.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package ebook-speaker:
accessibilityspeech
interfacecommandline
roleprogram
scopeutility
soundplayer
works-withfile
works-with-formatepub
Popcon: 25 users (29 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto fornisce un e-reader a riga di comando che legge testi elettronici usando la sintesi vocale. Ha un'interfaccia utente semplice adatta per terminali Braille.

Attualmente sono gestiti i seguenti formati (alcuni formati necessitano di pacchetti aggiuntivi suggeriti da questo pacchetto):

 AportisDoc;
 testo di posta ASCII;
 testo ASCII;
 Broadband eBooks (BBeB);
 Composite Document File (Microsoft Office Word);
 DAISY3 DTBook;
 dati ebook EPUB;
 dati immagine GIF;
 GutenPalm zTXT;
 cataloghi di messaggi di GNU gettext;
 documenti HTML;
 testo ISO-8859;
 dati immagine JPEG;
 dati eBook di Microsoft Reader;
 dati HtmlHelp di Microsoft Windows;
 Microsoft Word 2007+;
 Mobipocket E-book;
 dati HtmlHelp di MS Windows;
 dati PPM di Netpbm;
 OpenDocument Text;
 documenti PDF;
 PeanutPress di PalmOS;
 dati immagine PNG;
 testo di script shell POSIX;
 documenti PostScript;
 Rich Text Format;
 testo troff o per pre-elaboratore (es. pagine di manuale di Linux);
 testo di posta in UTF-8 Unicode;
 testo UTF-8 Unicode;
 WordPerfect;
 testo di documenti XML.
Screenshots of package ebook-speaker
Gocr
OCR a riga di comando
Maintainer: Gürkan Myczko
Versions of package gocr
ReleaseVersionArchitectures
bookworm0.52-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
squeeze0.48-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
wheezy0.49-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie0.49-2amd64,armel,armhf,i386
stretch0.49-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.52-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.52-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.52-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package gocr:
accessibilityocr
interfacecommandline
roleprogram
scopeapplication
useconverting
works-withimage, image:raster, text
Popcon: 265 users (62 upd.)*
Versions and Archs
License: DFSG free

Questo è un programma OCR (Optical Character Recognition, riconoscimento ottico dei caratteri) multipiattaforma.

Può leggere file immagine pnm, pbm, pgm, ppm, alcuni pcx e tga.

Attualmente il programma dovrebbe essere in grado di gestire bene scansioni che hanno il testo in un'unica colonna e non hanno tabelle. Sono supportate dimensioni dei caratteri da 20 a 60 pixel.

Se si vuole scrivere il proprio OCR, libgocr è fornita in un pacchetto separato. La documentazione e un wrapper grafico sono anch'essi forniti in pacchetti separati.

Hocr-gtk
interfaccia GTK+ per Hebrew OCR
Versions of package hocr-gtk
ReleaseVersionArchitectures
wheezy0.10.17-1all
jessie0.10.17-2all
buster0.10.18-3all
squeeze0.8.2-6.1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
Debtags of package hocr-gtk:
accessibilityocr
culturehebrew
interfacex11
roleprogram
scopeapplication
uitoolkitgtk
useconverting
works-withimage, image:raster, text
x11application
Popcon: 6 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Hocr-gtk è un'interfaccia grafica basata su GTK+ per la libreria libhocr. È in grado di aprire immagini in molti formati e usa aspell per il controllo ortografico interno.

Lios
soluzione per OCR intelligente per Linux
Maintainer: Samuel Thibault
Versions of package lios
ReleaseVersionArchitectures
sid2.7.2-2all
stretch2.1-2all
buster2.7-3all
bullseye2.7.2-2all
bookworm2.7.2-2all
Popcon: 101 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Lios fornisce un'interfaccia grafica sopra ai backend per OCR Cuneiform e Tesseract per rendere l'elaborazione OCR più facile per gli utenti con disabilità, con rotazione completa automatica, ottimizzazione della luminosità, selezione rettangolare, feedback sonoro, ecc.

Screenshots of package lios
Tesseract-ocr
strumento per OCR a riga di comando Tesseract
Versions of package tesseract-ocr
ReleaseVersionArchitectures
squeeze2.04-2+squeeze1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
stretch-backports4.0.0-2~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.0.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy3.02.01-6amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
stretch3.04.01-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye4.1.1-2.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.1.1-2.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.1.1-2.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.03.03-1amd64,armel,armhf,i386
upstream5.0.0-rc3
Debtags of package tesseract-ocr:
accessibilityocr
interfacecommandline
roleprogram
Popcon: 1736 users (424 upd.)*
Newer upstream!
License: DFSG free
Git

Tesseract è un motore OCR (Optical Character Recognition, riconoscimento ottico dei caratteri) open source. Può essere usato direttamente o (per i programmatori) usando un'API per estrarre testo stampato da immagini. Gestisce un'ampia gamma di lingue. Questo pacchetto include lo strumento a riga di comando.

Screenshots of package tesseract-ocr
Ttf-ocr-a
pacchetto fittizio di transizione
Versions of package ttf-ocr-a
ReleaseVersionArchitectures
squeeze1.0-2all
wheezy1.0-4all
Debtags of package ttf-ocr-a:
accessibilityocr
made-offont
roledata, dummy
x11font
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free

Questo è un pacchetto fittizio di transizione; può essere rimosso senza problemi.

Screenshots of package ttf-ocr-a

Debian packages in contrib or non-free

Cuneiform
multi-language OCR system
Versions of package cuneiform
ReleaseVersionArchitectures
wheezy1.1.0+dfsg-4 (non-free)amd64,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mipsel
jessie1.1.0+dfsg-5 (non-free)amd64,i386
buster1.1.0+dfsg-7 (non-free)amd64,arm64,armhf,i386,mips64el,mipsel
bullseye1.1.0+dfsg-8 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bookworm1.1.0+dfsg-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid1.1.0+dfsg-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Debtags of package cuneiform:
accessibilityocr
interfacecommandline
roleprogram
scopeutility
useconverting
works-withimage, image:raster
Popcon: 67 users (96 upd.)*
Versions and Archs
License: non-free

Cuneiform is an OCR system. In addition to text recognition it also does layout analysis and text format recognition.

The following languages are supported: Bulgarian, Croatian, Czech, Danish, Dutch, English, Estonian, French, German, Hungarian, Italian, Latvian, Lithuanian, Polish, Portuguese, Romanian, Russian, Serbian, Slovenian, Spanish, Swedish, Turkish and Ukrainian.

*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 210019