Debian Accessibility Project
Summary
Optical character recognition (ocr)
Debian Accessibility Optical Character Recognition (OCR)

This metapackage will install packages which are useful for Optical Character Recognition (OCR).

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Accessibility to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Accessibility mailing list

Links to other tasks

Debian Accessibility Optical character recognition (ocr) packages

Official Debian packages with high relevance

Ebook-speaker
Czytnik eBooków, czytający na głos syntetycznym głosem
Versions of package ebook-speaker
ReleaseVersionArchitectures
jessie2.8.1-1+deb8u1amd64,armel,armhf,i386
stretch4.1.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy2.0-3amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
bookworm6.2.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye5.5.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster5.0.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid6.2.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package ebook-speaker:
accessibilityspeech
interfacecommandline
roleprogram
scopeutility
soundplayer
works-withfile
works-with-formatepub
Popcon: 25 users (29 upd.)*
Versions and Archs
License: DFSG free
Git

Pakiet zawiera e-czytnik pracujący w wierszu poleceń, który odczytuje tekst elektroniczny za pomocą syntezy mowy. Posiada on prosty interfejs użytkownika odpowiedni dla terminali brajlowskich.

Obecnie obsługiwane są następujące formaty (niektóre formaty wymagają zainstalowania dodatkowych pakietów, sugerowanych przez ten pakiet):

 AportisDoc;
 Tekst wiadomości w standardzie ASCII;
 Tekst w standardzie ASCII;
 Broadband eBooks (BBeB);
 Composite Document File (Microsoft Office Word);
 DAISY3 DTBook;
 Dane ebooka EPUB;
 Dane obrazu GIF;
 GutenPalm zTXT;
 Katalogi wiadomości GNU gettext;
 Dokument w formacie HTML;
 Tekst w standardzie ISO-8859;
 Dane obrazu JPEG;
 Dane eBooka Microsoft Reader;
 Dane HtmlHelp używane w Microsoft Windows;
 Microsoft Word 2007+;
 Mobipocket E-book;
 Dane PPM z Netpbm;
 OpenDocument Text;
 Dokument w formacie PDF;
 PeanutPress PalmOS;
 Dane obrazu PNG;
 Tekst skryptu powłoki POSIX;
 Dokument PostScript;
 Rich Text Format;
 Tekst troff lub preprocessora (np. strony podręcznika man w Linuksie);
 Tekst wiadomości w standardzie UTF-8 Unicode;
 Tekst w standardzie UTF-8 Unicode;
 WordPerfect;
 Tekst dokumentu w formacie XML.
Screenshots of package ebook-speaker
Gocr
Program OCR uruchamiany z wiersza poleceń
Maintainer: Gürkan Myczko
Versions of package gocr
ReleaseVersionArchitectures
bookworm0.52-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
squeeze0.48-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
wheezy0.49-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie0.49-2amd64,armel,armhf,i386
stretch0.49-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.52-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.52-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.52-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package gocr:
accessibilityocr
interfacecommandline
roleprogram
scopeapplication
useconverting
works-withimage, image:raster, text
Popcon: 265 users (62 upd.)*
Versions and Archs
License: DFSG free

Jest to wieloplatformowy program OCR (Optical Character Recognition).

Program potrafi odczytywać pliki graficzne w formatach pnm, pbm, pgm, ppm oraz niektóre pliki pcx i tga.

Aktualnie program powinien radzić sobie z plikami z jednokolumnowym tekstem bez tabel. Akceptowany jest rozmiar czcionek w przedziale od 20 do 60 pikseli.

Osoby, które zamierzają tworzyć własne oprogramowanie OCR, powinny użyć biblioteki libgocr zawartej w oddzielnym pakiecie. Dokumentacja i graficzna nakładka również dostarczane są w odrębnych pakietach.

Hocr-gtk
Interfejs do hebrajskiego OCR napisany z użyciem GTK+
Versions of package hocr-gtk
ReleaseVersionArchitectures
wheezy0.10.17-1all
jessie0.10.17-2all
buster0.10.18-3all
squeeze0.8.2-6.1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
Debtags of package hocr-gtk:
accessibilityocr
culturehebrew
interfacex11
roleprogram
scopeapplication
uitoolkitgtk
useconverting
works-withimage, image:raster, text
x11application
Popcon: 6 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Hocr-gtk to graficzny interfejs do biblioteki libhocr napisany z użyciem GTK+. Może otworzyć wiele formatów graficznych i wykorzystywać aspell do wewnętrznego sprawdzania pisowni.

Lios
Inteligentne rozwiązanie OCR w systemie Linux
Maintainer: Samuel Thibault
Versions of package lios
ReleaseVersionArchitectures
sid2.7.2-2all
stretch2.1-2all
buster2.7-3all
bullseye2.7.2-2all
bookworm2.7.2-2all
Popcon: 101 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Lios (Linux intelligent OCR solution - Inteligentne rozwiązanie OCR w systemie Linux) zapewnia interfejs graficzny bazujący na mechanizmach OCR Cuneiform i Tesseract, aby ułatwić przetwarzanie OCR osobom niepełnosprawnym, z pełną autorotacją, optymalizacją jasności, wyborem prostokąta, sprzężeniem akustycznym itp.

Screenshots of package lios
Tesseract-ocr
Tesseract - narzędzie pracujące w wierszu poleceń do OCR
Versions of package tesseract-ocr
ReleaseVersionArchitectures
squeeze2.04-2+squeeze1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
stretch-backports4.0.0-2~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.0.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy3.02.01-6amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
stretch3.04.01-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye4.1.1-2.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.1.1-2.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.1.1-2.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.03.03-1amd64,armel,armhf,i386
upstream5.0.0-rc3
Debtags of package tesseract-ocr:
accessibilityocr
interfacecommandline
roleprogram
Popcon: 1736 users (424 upd.)*
Newer upstream!
License: DFSG free
Git

Tesseract to silnik do optycznego rozpoznawania znaków (OCR) o otwartym kodzie źródłowym. Można go używać bezpośrednio, lub (dla programistów) za pomocą interfejsu API do wyodrębniania wydrukowanego tekstu z obrazów. Obsługuje on szeroki wybór języków. Ten pakiet zawiera narzędzie wiersza poleceń.

Screenshots of package tesseract-ocr
Ttf-ocr-a
transitional dummy package
Versions of package ttf-ocr-a
ReleaseVersionArchitectures
squeeze1.0-2all
wheezy1.0-4all
Debtags of package ttf-ocr-a:
accessibilityocr
made-offont
roledata, dummy
x11font
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free

This package is a dummy transitional package. It can be safely removed.

Screenshots of package ttf-ocr-a

Debian packages in contrib or non-free

Cuneiform
multi-language OCR system
Versions of package cuneiform
ReleaseVersionArchitectures
wheezy1.1.0+dfsg-4 (non-free)amd64,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mipsel
jessie1.1.0+dfsg-5 (non-free)amd64,i386
buster1.1.0+dfsg-7 (non-free)amd64,arm64,armhf,i386,mips64el,mipsel
bullseye1.1.0+dfsg-8 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bookworm1.1.0+dfsg-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid1.1.0+dfsg-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Debtags of package cuneiform:
accessibilityocr
interfacecommandline
roleprogram
scopeutility
useconverting
works-withimage, image:raster
Popcon: 67 users (96 upd.)*
Versions and Archs
License: non-free

Cuneiform is an OCR system. In addition to text recognition it also does layout analysis and text format recognition.

The following languages are supported: Bulgarian, Croatian, Czech, Danish, Dutch, English, Estonian, French, German, Hungarian, Italian, Latvian, Lithuanian, Polish, Portuguese, Romanian, Russian, Serbian, Slovenian, Spanish, Swedish, Turkish and Ukrainian.

*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 210019