Debian Accessibility Project
Summary
Optical Character Recognition (OCR)
Debian Accessibility Optical Character Recognition (OCR)

This metapackage will install packages which are useful for Optical Character Recognition (OCR).

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Accessibility to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Accessibility mailing list

Links to other tasks

Debian Accessibility Optical Character Recognition (OCR) packages

Official Debian packages with high relevance

ebook-speaker
lettore di eBook che legge ad alta voce con una voce sintetica
Versions of package ebook-speaker
ReleaseVersionArchitectures
buster5.0.0-1amd64,arm64,armhf,i386
jessie2.8.1-1+deb8u1amd64,armel,armhf,i386
sid6.2.0-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie6.2.0-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm6.2.0-4+deb12u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye5.5.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch4.1.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package ebook-speaker:
accessibilityspeech
interfacecommandline
roleprogram
scopeutility
soundplayer
works-withfile
works-with-formatepub
Popcon: 20 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto fornisce un e-reader a riga di comando che legge testi elettronici usando la sintesi vocale. Ha un'interfaccia utente semplice adatta per terminali Braille.

Attualmente sono gestiti i seguenti formati (alcuni formati necessitano di pacchetti aggiuntivi suggeriti da questo pacchetto):

 AportisDoc;
 testo di posta ASCII;
 testo ASCII;
 Broadband eBooks (BBeB);
 Composite Document File (Microsoft Office Word);
 DAISY3 DTBook;
 dati ebook EPUB;
 dati immagine GIF;
 GutenPalm zTXT;
 cataloghi di messaggi di GNU gettext;
 documenti HTML;
 testo ISO-8859;
 dati immagine JPEG;
 dati eBook di Microsoft Reader;
 dati HtmlHelp di Microsoft Windows;
 Microsoft Word 2007+;
 Mobipocket E-book;
 dati HtmlHelp di MS Windows;
 dati PPM di Netpbm;
 OpenDocument Text;
 documenti PDF;
 PeanutPress di PalmOS;
 dati immagine PNG;
 testo di script shell POSIX;
 documenti PostScript;
 Rich Text Format;
 testo troff o per pre-elaboratore (es. pagine di manuale di Linux);
 testo di posta in UTF-8 Unicode;
 testo UTF-8 Unicode;
 WordPerfect;
 testo di documenti XML.
Screenshots of package ebook-speaker
gocr
OCR a riga di comando
Versions of package gocr
ReleaseVersionArchitectures
stretch0.49-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.49-2amd64,armel,armhf,i386
sid0.52-6.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.52-6.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.52-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.52-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.52-1amd64,arm64,armhf,i386
Debtags of package gocr:
accessibilityocr
interfacecommandline
roleprogram
scopeapplication
useconverting
works-withimage, image:raster, text
Popcon: 193 users (49 upd.)*
Versions and Archs
License: DFSG free
Git

Questo è un programma OCR (Optical Character Recognition, riconoscimento ottico dei caratteri) multipiattaforma.

Può leggere file immagine pnm, pbm, pgm, ppm, alcuni pcx e tga.

Attualmente il programma dovrebbe essere in grado di gestire bene scansioni che hanno il testo in un'unica colonna e non hanno tabelle. Sono supportate dimensioni dei caratteri da 20 a 60 pixel.

Se si vuole scrivere il proprio OCR, libgocr è fornita in un pacchetto separato. La documentazione e un wrapper grafico sono anch'essi forniti in pacchetti separati.

hocr-gtk
interfaccia GTK+ per Hebrew OCR
Versions of package hocr-gtk
ReleaseVersionArchitectures
jessie0.10.17-2all
buster0.10.18-3all
Debtags of package hocr-gtk:
accessibilityocr
culturehebrew
interfacex11
roleprogram
scopeapplication
uitoolkitgtk
useconverting
works-withimage, image:raster, text
x11application
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Hocr-gtk è un'interfaccia grafica basata su GTK+ per la libreria libhocr. È in grado di aprire immagini in molti formati e usa aspell per il controllo ortografico interno.

lios
soluzione per OCR intelligente per Linux
Maintainer: Samuel Thibault
Versions of package lios
ReleaseVersionArchitectures
stretch2.1-2all
sid2.7.2-8all
trixie2.7.2-8all
bookworm2.7.2-6all
bullseye2.7.2-2all
buster2.7-3all
experimental2.7.2+git20221124-0.1all
Popcon: 74 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Lios fornisce un'interfaccia grafica sopra ai backend per OCR Cuneiform e Tesseract per rendere l'elaborazione OCR più facile per gli utenti con disabilità, con rotazione completa automatica, ottimizzazione della luminosità, selezione rettangolare, feedback sonoro, ecc.

Screenshots of package lios
tesseract-ocr
strumento per OCR a riga di comando Tesseract
Versions of package tesseract-ocr
ReleaseVersionArchitectures
sid5.3.4-1.4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm5.3.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.03.03-1amd64,armel,armhf,i386
stretch3.04.01-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch-backports4.0.0-2~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.0.0-2amd64,arm64,armhf,i386
trixie5.3.4-1.4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye4.1.1-2.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream5.5.0
Debtags of package tesseract-ocr:
accessibilityocr
interfacecommandline
roleprogram
Popcon: 2095 users (343 upd.)*
Newer upstream!
License: DFSG free

Tesseract è un motore OCR (Optical Character Recognition, riconoscimento ottico dei caratteri) open source. Può essere usato direttamente o (per i programmatori) usando un'API per estrarre testo stampato da immagini. Gestisce un'ampia gamma di lingue. Questo pacchetto include lo strumento a riga di comando.

Debian packages in contrib or non-free

cuneiform
multi-language OCR system
Versions of package cuneiform
ReleaseVersionArchitectures
buster1.1.0+dfsg-7 (non-free)amd64,arm64,armhf,i386
jessie1.1.0+dfsg-5 (non-free)amd64,i386
sid1.1.0+dfsg-12 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el
trixie1.1.0+dfsg-12 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm1.1.0+dfsg-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye1.1.0+dfsg-8 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Debtags of package cuneiform:
accessibilityocr
interfacecommandline
roleprogram
scopeutility
useconverting
works-withimage, image:raster
Popcon: 36 users (61 upd.)*
Versions and Archs
License: non-free
Git

Cuneiform is an OCR system. In addition to text recognition it also does layout analysis and text format recognition.

The following languages are supported: Bulgarian, Croatian, Czech, Danish, Dutch, English, Estonian, French, German, Hungarian, Italian, Latvian, Lithuanian, Polish, Portuguese, Romanian, Russian, Serbian, Slovenian, Spanish, Swedish, Turkish and Ukrainian.

*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 246295