Debian Accessibility Project
Summary
Optical Character Recognition (OCR)
Debian Accessibility Optical Character Recognition (OCR)

This metapackage will install packages which are useful for Optical Character Recognition (OCR).

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Accessibility to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Accessibility mailing list

Links to other tasks

Debian Accessibility Optical Character Recognition (OCR) packages

Official Debian packages with high relevance

ebook-speaker
eBook-Reader, der laut mit einer synthetischen Stimme vorliest
Versions of package ebook-speaker
ReleaseVersionArchitectures
buster5.0.0-1amd64,arm64,armhf,i386
jessie2.8.1-1+deb8u1amd64,armel,armhf,i386
sid6.2.0-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie6.2.0-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm-proposed-updates6.2.0-4+deb12u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm6.2.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye5.5.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch4.1.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package ebook-speaker:
accessibilityspeech
interfacecommandline
roleprogram
scopeutility
soundplayer
works-withfile
works-with-formatepub
Popcon: 16 users (16 upd.)*
Versions and Archs
License: DFSG free
Git

Dieses Paket bietet einen Befehlszeilen-E-Reader, der elektronische Texte mit einer Sprachsynthese vorlesen kann. Er hat eine einfache Benutzerschnittstelle, die sich für Braille-Terminals eignet.

Derzeit werden die folgenden Formate unterstützt (einige Formate benötigen zusätzliche Pakete, wie von diesem Paket vorgeschlagen).

 AportisDoc
 ASCII mail text
 ASCII-Text
 Broadband eBooks (BBeB)
 Composite Document File (Microsoft Office Word)
 DAISY3 DTBook
 EPUB-eBook-Daten
 GIF-Bilddaten
 GutenPalm zTXT
 »GNU gettext«-Nachrichtenkatalog
 HTML-Dokument
 ISO-8859-Text
 JPEG-Bilddaten
 »Microsoft Reader eBook«-Daten
 »Microsoft Windows HtmlHelp«-Daten
 Microsoft Word 2007+
 Mobipocket E-book
 Netpbm-PPM-Daten
 OpenDocument-Text
 PDF-Dokument
 PeanutPress PalmOS
 PNG-Bilddaten
 POSIX shell script text
 PostScript-Dokument
 Rich Text Format
 troff oder Preprozessortext (z.B. Linux-Handbuchseiten)
 UTF-8 Unicode mail text
 UTF-8 Unicode text
 WordPerfect
 XML
Screenshots of package ebook-speaker
gocr
OCR für die Kommandozeile
Versions of package gocr
ReleaseVersionArchitectures
jessie0.49-2amd64,armel,armhf,i386
sid0.52-6.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.52-6.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.52-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.52-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.52-1amd64,arm64,armhf,i386
stretch0.49-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package gocr:
accessibilityocr
interfacecommandline
roleprogram
scopeapplication
useconverting
works-withimage, image:raster, text
Popcon: 182 users (227 upd.)*
Versions and Archs
License: DFSG free
Git

Dies ist ein plattformübergreifendes Programm für optische Zeichenerkennung (Optical Character Recognition, OCR).

Es kann pnm-, pbm-, pgm-, ppm-, einige pcx- und tga-Bilddateien lesen.

Momentan sollte das Programm Scans gut verarbeiten, deren Text einspaltig und ohne Tabellen ist. Schriftgrößen werden von 20 bis 60 Pixel unterstützt.

Wenn Sie Ihre eigene Schrifterkennung schreiben wollen, verwenden Sie das separate Paket libgocr. Die Dokumentation und ein grafischer Wrapper sind ebenfalls in eigenen Paketen zu finden.

hocr-gtk
GTK+-Oberfläche für hebräische Zeichenerkennung
Versions of package hocr-gtk
ReleaseVersionArchitectures
jessie0.10.17-2all
buster0.10.18-3all
Debtags of package hocr-gtk:
accessibilityocr
culturehebrew
interfacex11
roleprogram
scopeapplication
uitoolkitgtk
useconverting
works-withimage, image:raster, text
x11application
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Hocr-gtk ist eine grafische Schnittstelle auf Basis von GTK+ zur Bibliothek libhocr. Sie kann mehrere Bildformate öffnen und benutzt aspell zur internen Rechtschreibprüfung.

lios
Linux intelligent OCR solution
Maintainer: Samuel Thibault
Versions of package lios
ReleaseVersionArchitectures
sid2.7.2-7all
experimental2.7.2+git20221124-0.1all
trixie2.7.2-7all
bookworm2.7.2-6all
bullseye2.7.2-2all
buster2.7-3all
stretch2.1-2all
Popcon: 72 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Lios provides a graphical interface on top of the Cuneiform and Tesseract OCR backends to make OCR processing easier for impaired users, with full autorotation, brightness optimization, rectangle selection, audio feedback, etc.

Screenshots of package lios
tesseract-ocr
Kommandozeilenwerkzeug für (optische) Zeichenerkennung (OCR)
Versions of package tesseract-ocr
ReleaseVersionArchitectures
sid5.3.4-1.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm5.3.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch3.04.01-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch-backports4.0.0-2~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.0.0-2amd64,arm64,armhf,i386
bullseye4.1.1-2.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.03.03-1amd64,armel,armhf,i386
trixie5.3.4-1.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package tesseract-ocr:
accessibilityocr
interfacecommandline
roleprogram
Popcon: 1834 users (502 upd.)*
Versions and Archs
License: DFSG free

Tesseract ist eine quelloffene Engine für »Optical Character Recognition«. Sie kann direkt verwendet werden, oder (für Programmierer) mit einer API um aus Bildern Text zu extrahieren. Tesseract unterstützt eine Vielzahl von Sprachen. Dieses Paket enthält das Kommandozeilenwerkzeug.

Debian packages in contrib or non-free

cuneiform
multi-language OCR system
Versions of package cuneiform
ReleaseVersionArchitectures
buster1.1.0+dfsg-7 (non-free)amd64,arm64,armhf,i386
jessie1.1.0+dfsg-5 (non-free)amd64,i386
sid1.1.0+dfsg-10 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el
trixie1.1.0+dfsg-10 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm1.1.0+dfsg-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye1.1.0+dfsg-8 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Debtags of package cuneiform:
accessibilityocr
interfacecommandline
roleprogram
scopeutility
useconverting
works-withimage, image:raster
Popcon: 39 users (23 upd.)*
Versions and Archs
License: non-free
Git

Cuneiform is an OCR system. In addition to text recognition it also does layout analysis and text format recognition.

The following languages are supported: Bulgarian, Croatian, Czech, Danish, Dutch, English, Estonian, French, German, Hungarian, Italian, Latvian, Lithuanian, Polish, Portuguese, Romanian, Russian, Serbian, Slovenian, Spanish, Swedish, Turkish and Ukrainian.

*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 238177