Debian Science Project
Summary
Linguistics
paquets pour la linguistique de Debian Science

Ce paquet fait partie du mélange exclusif « Debian Science » et installe les paquets concernant la linguistique.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Science to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Science mailing list

Links to other tasks

Debian Science Linguistics packages

Official Debian packages with high relevance

apertium
système de traduction automatique par correspondances superficielles
Versions of package apertium
ReleaseVersionArchitectures
jessie3.1.0-2amd64,armel,armhf,i386
buster3.5.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.9.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.9.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye3.7.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch3.4.0~r61013-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm3.8.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package apertium:
fieldlinguistics
roleprogram
Popcon: 12 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Apertium est un système de traduction automatique libre par correspondances superficielles, développé à l'origine pour des couples de langues voisines.

Il utilise des convertisseurs (« transducers ») à états finis pour le traitement lexical, des automates de Markov à états cachés pour l'analyse grammaticale et un découpage basé sur les états finis pour les correspondances structurelles.

Ce système s'inspire largement de ceux développés par les groupes « Transducens » de l'université d'Alicante comme « interNOSTRUM » (espagnol‑catalan, http://www.internostrum.com/welcome.php) et « Traductor Universia » (espagnol‑portugais, http://traductor.universia.net)

Il est possible d'utiliser Apertium pour créer des systèmes de traduction automatique pour divers couples de langues proches en fournissant simplement les données linguistiques nécessaires dans le format approprié.

Screenshots of package apertium
apertium-eval-translator
évaluation de sortie de traduction automatique par rapport à une référence
Versions of package apertium-eval-translator
ReleaseVersionArchitectures
trixie1.2.1-3all
bullseye1.2.1-2all
bookworm1.2.1-3all
sid1.2.1-3all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit des scripts Perl destinés à évaluer une sortie de traduction automatique basée sur Apertium par rapport à une référence⋅: WER, PER, TER, BLEU.

apertium-lex-tools
Constraint-based lexical selection module
Versions of package apertium-lex-tools
ReleaseVersionArchitectures
sid0.4.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.4.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.4.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.2.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.2.7-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.1.1~r66150-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 8 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Module for compiling lexical selection rules and processing them in the pipeline.

artha
thésaurus pratique et hors ligne basé sur WordNet
Versions of package artha
ReleaseVersionArchitectures
jessie1.0.3-1amd64,armel,armhf,i386
buster1.0.3-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.5-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.5-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.0.5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.5-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package artha:
fieldlinguistics
interfacex11
roleprogram
uitoolkitgtk
uselearning
x11application
Popcon: 41 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Artha est un thésaurus anglais hors ligne, avec des fonctionnalités comme :

  • recherche de mot par raccourci clavier (sélectionnez un texte sur une fenêtre, puis appuyez sur le raccourci pour rechercher) ;
  • recherche par expressions rationnelles (il est possible d'utiliser des jokers comme *, ?, etc.) ;
  • notifications de bureau passives (pour la définition des mots, de façon à ne pas interrompre le travail).

Une fois lancé, il surveille la touche de raccourci. Lorsqu'une recherche de texte est lancée, il ouvre une fenêtre d'information avec le mot voulu. Si l'utilisateur préfère une notification passive, une option est disponible.

Lorsque le terme recherché est vague ou inconnu, la recherche peut être étendue en utilisant les expressions rationnelles (*, ?, etc.).

Le paquet wordnet-sense-index est nécessaire pour la recherche par expressions rationnelles.

Screenshots of package artha
cg3
outils pour utiliser la troisième édition de Constraint Grammar (CG-3)
Versions of package cg3
ReleaseVersionArchitectures
buster1.1.7-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.3.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.3.9-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.4.6-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.4.6-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.9.9~r11624-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 10 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit du compilateur et de l'applicateur Constraint Grammar pour la troisième édition de CG développée et maintenue par VISL SDU et GrammarSoft ApS.

CG-3 peut servir à la désambiguïsation de morphologie, de syntaxe, de sémantique, etc., le balisage de dépendance, le choix de lemme pour le langage cible pour MT, les systèmes QA et bien plus. L'idée centrale est de laisser l'utilisateur choisir quoi faire en fonction de tout le contexte disponible, par opposition aux n-grammes.

Plus de documentation est disponible à https://visl.sdu.dk/cg3.html.

collatinus
lemmatisation de texte latin
Maintainer: Georges Khaznadar
Versions of package collatinus
ReleaseVersionArchitectures
sid12.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye11-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster11-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch-backports11-1~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch10.2-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie10.2-2amd64,armel,armhf,i386
trixie12.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm12.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package collatinus:
fieldlinguistics
interfacex11
roledummy, program
scopeapplication
uitoolkitgtk
uselearning
x11application
Popcon: 5 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Collatinus peut être utilisé pour lemmatiser des textes latins, c'est à dire extraire des mots et créer un lexique qui indique pour chaque mot sa forme canonique, et comment la forme trouvée effectivement dans le texte peut être dérivée à partir de celle-ci, par exemple en la déclinant. Exemple : rosam donne : rosa-rosae -- acc. sing. Collatinus fournit une interface graphique agréable pour chaque opération.

Collatinus-nouus (pour Collatinus, nouvelle génération) remplace toutes les versions précédentes de Collatinus.

Ce paquet fournit la documentation au format HTML.

Screenshots of package collatinus
dimbl
apprentissage automatique distribué
Versions of package dimbl
ReleaseVersionArchitectures
buster0.15-2.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.15-2.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.15-2.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.15-2.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.15-2.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.12-2amd64,armel,armhf,i386
stretch0.15-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package dimbl:
roleprogram
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Dimbl est une enveloppe autour du classificateur par les k plus proches voisins de TiMBL, proposant une classification parallèle pour les machines à plusieurs CPU. Dimbl divise l’ensemble original d’apprentissage, construit un classificateur Timbl séparé pour chaque sous-ensemble et fusionne leurs ensembles de plus proches voisins par instance classifiée.

Les caractéristiques de Dimbl sont :

 – enveloppe propre autour de TiMBL en conservant toutes les options de
   ligne de commande ;
 – connaissance de ce qui est à réaliser pour deux, quatre ou plusieurs
   cœurs ;
 – utilisation de la spécification d’OpenMP pour la programmation
   parallèle ;
 – possibilité de gains de vitesse superlinéaires comparés à TiMBL
   standard.

Dimbl est un produit du ILK Research Group (Université de Tilbourg, Pays-Bas).

Pour réaliser des recherches scientifiques dans le traitement automatique du langage naturel en utilisant l’apprentissage automatique, Dimbl sera probablement utile.

fasttext
bibliothèque pour l’apprentissage efficace de représentation de mots et de classification de phrases
Versions of package fasttext
ReleaseVersionArchitectures
bookworm0.9.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.9.2+ds-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.9.2+ds-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.9.2-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 8 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

fastText est une bibliothèque pour l’apprentissage efficace de la représentation de mots et de la classification de phrases, qui fait référence à l’information de sous-mots pour nourrir la vectorisation des mots.

frog
tagger and parser for natural languages (runtime)
Versions of package frog
ReleaseVersionArchitectures
jessie0.12.17-7.1amd64,armel,armhf,i386
sid0.20-2.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.15-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0.13.7-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.20-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.20-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Memory-Based Learning (MBL) is a machine-learning method applicable to a wide range of tasks in Natural Language Processing (NLP).

Frog is a modular system integrating a morphosyntactic tagger, lemmatizer, morphological analyzer, and dependency parser for natural languages. It is based upon it's predecessor TADPOLE (TAgger, Dependency Parser, and mOrphoLogical analyzEr). Using Memory-Based Learning techniques, frog tokenizes, tags, lemmatizes, and morphologically segments word tokens in incoming UTF-8 text files, and assigns a dependency graph to each sentence. Frog is particularly targeted at the increasing need for fast, automatic NLP systems applicable to very large (multi-million to billion word) document collections that are becoming available due to the progressive digitization of both new and old textual data. Up to now, frog has only been tested and used using corpora of Dutch natural language (see the frogdata package for samples).

Frog is a product of the Centre of Language and Speech Technology at Radboud University Nijmegen, it subsumes previous work by the ILK Research Group (Tilburg University, The Netherlands) and the CLiPS Research Centre (University of Antwerp, Belgium).

If you do scientific research in NLP, Frog will likely be of use to you.

giella-sme
Giellatekno single language data for North Saami
Versions of package giella-sme
ReleaseVersionArchitectures
buster0.0.20150917~r121176-3all
stretch0.0.20150917~r121176-1all
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Data package providing Giellatekno language resources for North Saami.

hfst
technologie des transducteurs finis Helsinki
Versions of package hfst
ReleaseVersionArchitectures
buster3.15.0-1.1~deb10u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch3.10.0~r2798-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.16.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.16.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.16.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye3.15.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 10 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le logiciel de transducteur à états finis Helsinki est conçu pour la mise en œuvre d’analyseurs morphologiques et d’autres outils basés sur la technologie des transducteurs finis, pondérés ou non.

hfst-ospell
Spell checker library and tool based on HFST
Versions of package hfst-ospell
ReleaseVersionArchitectures
trixie0.5.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.5.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.5.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0.4.0~r4643-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.5.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.5.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Minimal HFST optimized lookup format based spell checker library and a demonstrational implementation of command line based spell checker.

irstlm
boîte à outils de modélisation de langage IRST
Versions of package irstlm
ReleaseVersionArchitectures
buster6.00.05-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch6.00.05-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie6.00.05-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm6.00.05-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid6.00.05-4.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye6.00.05-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

La boîte à outils de modélisation de langage IRST peut être utilisée pour apprendre des modèles de langage à partir de données. Les modèles n-gramme crées peuvent être utilisables sur n’importe quel système prenant en charge le format de modèle de langage ARPA.

Ce paquet fournit les outils en ligne de commande.

libcld2-dev
Compact Language Detector 2, development package
Versions of package libcld2-dev
ReleaseVersionArchitectures
sid0.0.0-git20150806-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie0.0.0-git20150806-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm0.0.0-git20150806-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye0.0.0-git20150806-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster0.0.0-git20150806-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
stretch0.0.0-git20150806-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Detects over 80 languages in UTF-8 text, based largely on groups of four letters. Also tables for 160+ language version.

This is the development package.

link-grammar
analyseur de grammaire de dépendances de l'université Carnegie Mellon
Maintainer: Jonas Smedegaard
Versions of package link-grammar
ReleaseVersionArchitectures
jessie4.7.4-2amd64,armel,armhf,i386
buster5.5.1-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye5.8.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm5.12.0~dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie5.12.3~dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid5.12.3~dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch5.3.14-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package link-grammar:
fieldlinguistics
interfacecommandline
roleprogram
usechecking
works-withdictionary
Popcon: 9 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Dans « Parsing English with a Link Grammar » (1991) de D. Sleator et D. Temperley, les auteurs définissent un nouveau système grammatical formel appelée « link grammar » (sorte de grammaire de dépendances). Une séquence de mots appartient au langage de la grammaire s'il existe une façon d'établir des liens entre les mots de telle façon que les exigences locales de chaque mot soient satisfaites, que les liens ne se croisent pas et que les mots forment un graphe connexe. Les auteurs ont encodé la grammaire anglaise dans ce système et ont écrit ce programme pour analyser l'anglais en utilisant cette grammaire.

Link-grammar peut être utilisé pour l'analyse linguistique d'informations récupérées ou extraites depuis des documents en langage naturel. Il peut également être utilisé comme vérificateur grammatical.

Ce paquet contient l'exécutable utilisateur.

Screenshots of package link-grammar
lttoolbox
modules et outils de traitement lexical d’Apertium
Versions of package lttoolbox
ReleaseVersionArchitectures
buster3.5.0-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.1.0-1.2amd64,armel,armhf,i386
stretch3.3.3~r68466-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.5.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.7.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.7.6-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid3.7.6-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package lttoolbox:
fieldlinguistics
roleprogram
Popcon: 10 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

Ltoolbox fournit les outils de transducteurs finis pour le traitement du langage naturel utilisés par Apertium, une plateforme pour bâtir des systèmes de traduction suivant des règles et la méthode « Hybrid machine translation ». Ce logiciel est aussi utile pour créer des analyses morphologiques et des générateurs pour des applications de traitement de langages naturels.

mbt
générateur d’étiquetage basé sur la mémoire et étiqueteur
Versions of package mbt
ReleaseVersionArchitectures
buster3.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.6-3.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.6-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm3.6-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.2.10-4amd64,armel,armhf,i386
stretch3.2.16-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.6-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package mbt:
fieldlinguistics
roleprogram
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MBT est un générateur d’étiquetage basé sur la mémoire et un étiqueteur réuni. La partie générateur d’étiquetage peut créer un étiqueteur de phrase sur la base d’un ensemble d’apprentissage de phrases étiquetées. La partie étiqueteur peut étiqueter de nouvelles phrases. MBT peut, par exemple, être utilisé pour l’étiquetage morpho-syntaxique ou l’analyse syntaxique de surface pour le traitement de langage naturel. Fonctions :

 – création d’étiquettes : entrée de texte, sortie texte étiqueté ;
 – boucle de retour facultative : réinjection de précédentes décisions
   d’étiquetage dans l’entrée de la nouvelle décision ;
 – représentation de caractéristiques personnalisable, incorporation de
   caractéristiques fournies par l’utilisateur ;
 – création automatique de sous-étiquettes pour des mots connus ou
   inconnus ;
 – utilisation de tous les paramètres algorithmiques de TiMBL.

MBT est un produit du Centre of Language and Speech Technology (Université Radboud de Nimègue, Pas-Bas), du ILK Research Group (Université de Tilbourg, Pays-Bas) et du CLiPS Research Centre (Université d’Anvers, Belgique).

Pour ceux qui font des recherches scientifiques dans le traitement du langage naturel, MBT sera très probablement utile.

mbtserver
extensions de serveur pour l’étiqueteur MBT
Versions of package mbtserver
ReleaseVersionArchitectures
stretch0.11-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.12-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.14-2.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.14-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.7-3amd64,armel,armhf,i386
bullseye0.14-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

MbtServer étend Mbt avec une couche serveur, exécutant un serveur TCP. MBT est un générateur d’étiquetage basé sur la mémoire et un étiqueteur réuni pour le traitement du langage naturel. MbtServer fournit la possibilité d’accéder à un étiqueteur entraîné à partir de plusieurs sessions. Il permet d’accéder et d’exécuter plusieurs étiqueteurs en parallèle.

MBTServer est un produit du Centre of Language and Speech Technology (Université Radboud de Nimègue, Pas-Bas), du ILK Research Group (Université de Tilbourg, Pays-Bas) et du CLiPS Research Centre (Université d’Anvers, Belgique).

Pour des travaux scientifiques dans le traitement du langage naturel, MbtServer devrait probablement être utile.

opennlp
enveloppe pour la boîte à outils basée sur l'apprentissage automatique pour le traitement de textes en langage naturel
Versions of package opennlp
ReleaseVersionArchitectures
bookworm2.1.0-1all
bullseye1.9.3-1all
sid2.3.2-1all
trixie2.3.2-1all
Popcon: 3 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

La bibliothèque OpenNLP d'Apache est une boîte à outils basée sur l'apprentissage automatique pour le traitement de textes en langage naturel. Il prend en charge les tâches communes de NLP, telles que la tokenisation, la segmentation de phrase, l'étiquetage morpho-syntaxique, l'extraction d'entités nommées, la segmentation, l'analyse et la résolution de coréférences. Ces tâches sont généralement nécessaires pour construire des services de traitement de texte plus évolués. OpenNLP comprend également un apprentissage automatique basé sur le principe d'entropie maximale et le perceptron.

Ce paquet fournit l'enveloppe en ligne de commande.

python3-pynlpl
PyNLPl is a library for Natural Language Processing (Python 3 version)
Versions of package python3-pynlpl
ReleaseVersionArchitectures
stretch1.1.2-1all
buster1.1.2-1all
sid1.2.9-1all
trixie1.2.9-1all
bookworm1.2.9-1all
bullseye1.2.9-1all
Popcon: 3 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

PyNLPl, pronounced as 'pineapple', is a Python library for Natural Language Processing. It contains various modules useful for common, and less common, NLP tasks. PyNLPl can be used for basic tasks such as the extraction of n-grams and frequency lists, and to build simple language models. It also contains complex data types and algorithms. Moreover, it includes parsers for file formats common in NLP (e.g. FoLiA/Giza/Moses/ARPA/Timbl/CQL) and clients to interface with various NLP specific servers. PyNLPl most notably features a very extensive library for working with FoLiA XML (Format for Linguistic Annotation).

This is the Python 3 version.

python3-thinc
apprentissage automatique pour le traitement du langage naturel en Python
Versions of package python3-thinc
ReleaseVersionArchitectures
buster6.12.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid8.2.2-1amd64,arm64,armhf,i386,mips64el,riscv64,s390x
bookworm8.1.7-1amd64,arm64,armhf,i386,mips64el,s390x
upstream8.2.3
Popcon: 1 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

Thinc est une bibliothèque d’apprentissage automatique servant de dorsal pour spaCy https://spacy.io. Elle présente un modèle linéaire ayant passé l’épreuve du feu pour de larges problèmes d’apprentissage à vecteurs de support et un modèle de réseau neuronal encore en développement pour spaCy version 2.0 https://spacy.io/usage/v2.

Thinc est une boîte à outils pratique pour mettre en œuvre les modèles qui suivent l’architecture « Embed, encode, attend, predict » (intégrer, encoder, attendre, prédire). Elle est conçue pour être facile à installer, efficace du point de vue utilisation du CPU et optimisée pour le traitement automatique du langage naturel et l’apprentissage profond avec du texte, en particulier, pour une entrée structurée hiérarchiquement.

r-cran-lexrankr
résumé de texte extractif avec l’algorithme LexRank
Versions of package r-cran-lexrankr
ReleaseVersionArchitectures
sid0.5.2-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.5.2-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.5.2-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.5.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.5.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’une implémentation pour R de l’algorithme LexRank mettant en œuvre la méthode stochastique basée sur un graphe pour calculer l’importance d’unités textuelles dans le traitement du langage naturel. La technique du problème de résumé de texte est testée. Le résumé de texte extractif repose sur le concept de l’importance relative de la phrase pour identifier les plus importantes dans un document ou un ensemble de documents. L’importance relative est typiquement définie selon la présence de certains mots importants ou selon la similarité avec une pseudo-phrase centroïde.

Please cite: Güneş Erkan and Dragomir R. Radev: LexRank: Graph-based Lexical Centrality as Salience in Text Summarization. (eprint) Journal of Artific Intelligence Research 22:457-479 (2004)
r-cran-snowballc
Snowball stemmers based on the C libstemmer UTF-8 library
Versions of package r-cran-snowballc
ReleaseVersionArchitectures
buster0.6.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.7.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.7.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.7.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.7.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 10 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

An R interface to the C libstemmer library that implements Porter's word stemming algorithm for collapsing words to a common root to aid comparison of vocabulary. Currently supported languages are Danish, Dutch, English, Finnish, French, German, Hungarian, Italian, Norwegian, Portuguese, Romanian, Russian, Spanish, Swedish and Turkish.

sentencepiece
Unsupervised text tokenizer and detokenizer
Versions of package sentencepiece
ReleaseVersionArchitectures
trixie0.2.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.1.95-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.2.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.1.97-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

SentencePiece is an unsupervised text tokenizer/detokenizer mainly designed for Neural Network-based text generation systems where the vocabulary size is predetermined prior to the neural model training.

timbl
apprentissage automatique – Tilburg Memory Based Learner
Versions of package timbl
ReleaseVersionArchitectures
sid6.5-3.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm6.5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie6.5-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye6.5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie6.4.4-4amd64,armel,armhf,i386
stretch6.4.8-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster6.4.13-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package timbl:
roleprogram
Popcon: 3 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

L’apprentissage automatique (Memory-Based Learning – MBL) est une méthode applicable à une grande diversité de tâches concernant le traitement automatique du langage naturel (Natural Language Processing – NLP).

TiMBL (Tilburg Memory Based Learner) est un outil pour la recherche en NLP, et pour beaucoup d’autres domaines où les tâches de classification sont apprises à partir d’exemples. C’est une implémentation efficace de la classification par la méthode des k plus proches voisins.

Les fonctions de TiMBL sont :

 – implémentation rapide basée sur les arbres de décision de la
   classification par la méthode des k plus proches voisins ;
 – implémentations des algorithmes IB1 et IB2, IGTree, TRIBL et TRIBL2 ;
 – mesures de similarité : Overlap, MVDM, divergence de Jeffrey, produit
   scalaire et cosinus ;
 – métriques de pondération : « information gain », « gain ratio », khi
   carré, variance partagée ;
 – métriques de pondération de distance : inverse, linéaire inverse,
   décroissance exponentielle ;
 – nombreuses options de verbosité pour examiner les ensembles de proches
   voisins ;
 – fonction de serveur et interface de programmation importante ;
 – test rapide de « leave-one-out » et validation croisée interne ;
 – prise en charge de la pondération d’exemple définie par l’utilisateur.

TiMBL est un produit du « Centre of Language and Speech Technology, Radboud University, Nimègue, Pays-Bas », du « ILK Research Group, Tilburg University, Pays-Bas » et du « CLiPS Research Centre, University of Antwerp, Belgique ».

Pour des recherches scientifiques en traitement automatique du langage naturel, timbl sera sûrement utile.

timblserver
extensions de serveur pour TiMBL
Versions of package timblserver
ReleaseVersionArchitectures
sid1.14-3.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.7-4amd64,armel,armhf,i386
bullseye1.14-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.11-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.14-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.12-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.14-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package timblserver:
roleprogram
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Timblserver est une enveloppe pour TiMBL. Il ajoute la fonction de serveur à TiMBL. Il permet à TiMBL de faire de nombreuses expériences comme serveur TCP, facultativement à l’aide d’HTTP.

TiMBL (Tilburg Memory Based Learner) est un outil pour la recherche en NLP, et pour beaucoup d’autres domaines où les tâches de classification sont apprises à partir d’exemples.

TimblServer est un produit du « ILK Research Group, Tilburg University, Pays-Bas » et du « CLiPS Research Centre, University of Antwerp, Belgique ».

Pour des recherches scientifiques en traitement automatique du langage naturel, timbl sera sûrement utile.

ucto
analyseur lexical pour Unicode
Versions of package ucto
ReleaseVersionArchitectures
trixie0.21.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.21.1-2.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.14-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.21.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.21.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.9.6-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.5.3-3.1amd64,armel,armhf,i386
Debtags of package ucto:
roleprogram
Popcon: 6 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ucto produit des unités lexicales à partir d’un fichier texte encodé en UTF-8 (c'est-à-dire, séparer les mots de la ponctuation, scinder les phrases, créer des n-grammes…) et offre plusieurs dispositions de prétraitement basiques pouvant adapter le texte pour un traitement ultérieur tel que l’indexation, le marquage de partie de discours ou une traduction automatique.

Ce paquet fournit l’outil en ligne de commande.

Ucto a été écrit par Maarten van Gompel et Ko van der Sloot. Le travail sur Ucto a été financé par NWO, l’organisation néerlandaise pour la recherche scientifique, sous la conduite du projet « Implicit Linguistics », du programme CLARIN-NL et du projet CLARIAH.

Ucto est un produit du « Centre of Language and Speech Technology » (université Radboud de Nimègue), et antérieurement du « ILK Research Group » (université de Tilbourg, Pays-Bas).

En cas d’intérêt pour une machine analysant des fichiers de texte encodé en UTF-8, par exemple pour faire de la recherche scientifique dans le traitement du langage naturel, Ucto est probablement à utiliser.

uctodata
fichiers de données pour Ucto
Versions of package uctodata
ReleaseVersionArchitectures
buster0.8-2all
stretch0.4-1all
bullseye0.8-2all
bookworm0.8-2all
trixie0.8-2all
sid0.8-2all
Popcon: 6 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ucto produit des unités lexicales à partir d’un fichier texte encodé en UTF-8 (c'est-à-dire, séparer les mots de la ponctuation, scinder les phrases, créer des n-grammes…) et offre plusieurs dispositions de prétraitement basiques pouvant adapter le texte pour un traitement ultérieur tel que l’indexation, le marquage de partie de discours ou une traduction automatique.

Ce paquet fournit les fichiers de données nécessaires et spécifiques aux langues pour utiliser Ucto.

Ucto a été écrit par Maarten van Gompel et Ko van der Sloot. Le travail sur Ucto a été financé par NWO, l’organisation néerlandaise pour la recherche scientifique, sous la conduite du projet « Implicit Linguistics », du programme CLARIN-NL et du projet CLARIAH.

Ucto est un produit du « Centre of Language and Speech Technology » (université Radboud de Nimègue), et antérieurement du « ILK Research Group » (université de Tilbourg, Pays-Bas).

wordnet
base de données lexicale électronique pour la langue anglaise
Versions of package wordnet
ReleaseVersionArchitectures
trixie3.0-37amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster3.0-35amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.0-36amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.0-33amd64,armel,armhf,i386
sid3.0-37amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.0-37amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch3.0-33amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package wordnet:
fieldlinguistics
interfacex11
roleprogram
scopeapplication
uitoolkittk
usechecking
works-withdictionary
x11application
Popcon: 93 users (22 upd.)*
Versions and Archs
License: DFSG free
Git

WordNet© est un système de référence lexicale en ligne dont la conception a été inspirée par les théories psycholinguistiques actuelles de la mémoire lexicale humaine. Les noms, verbes, adjectifs et adverbes anglais sont organisés en ensembles de synonymes, chacun représentant un concept lexical sous-jacent. Différentes relations relient les ensembles de synonymes.

WordNet a été développé par le laboratoire des sciences cognitives à l'université de Princeton sous la direction du Professeur George A. Miller (principal chercheur).

WordNet est considéré comme la plus importante ressource disponible pour les chercheurs en linguistique informatique, analyse de texte et bien d'autres domaines connexes.

Ce paquet fournit les programmes et les pages de manuel de WordNet, ainsi que de la documentation générale.

Please cite: George A. Miller: WordNet: A Lexical Database for English. Communications of the ACM 38(11):39-41 (1995)

Official Debian packages with lower relevance

apertium-af-nl
paquet factice de transition pour apertium-afr-nld
Versions of package apertium-af-nl
ReleaseVersionArchitectures
stretch0.2.0~r58256-1all
sid0.3.0-3all
bullseye0.3.0-2all
trixie0.3.0-3all
buster0.2.0~r58256-2all
bookworm0.3.0-3all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'un paquet factice de transition. Il peut être supprimé en toute sécurité.

apertium-apy
service APY d'Apertium
Versions of package apertium-apy
ReleaseVersionArchitectures
trixie0.11.7-2.1all
stretch0.9.1~r343-2all
bullseye0.11.7-2all
buster0.11.4-2all
bookworm0.11.7-2.1all
sid0.11.7-2.1all
upstream0.12.1
Popcon: 5 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

Ce paquet fournit APY d'Apertium qui est une API simple pour Apertium écrite en Python 3 et conçue pour un remplacement direct de ScaleMT.

apertium-arg
données simples Apertium pour l'aragonais
Versions of package apertium-arg
ReleaseVersionArchitectures
buster0.1.2~r65494-2all
stretch0.1.2~r65494-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'un paquet de données fournissant les ressources linguistiques Apertium pour l'aragonais.

apertium-arg-cat
données Apertium pour les traductions entre l'aragonais et le catalan
Versions of package apertium-arg-cat
ReleaseVersionArchitectures
bookworm0.2.0-3all
stretch0.1.0~r64925-1all
sid0.3.0-2all
bullseye0.2.0-2all
trixie0.3.0-2all
buster0.1.0~r64925-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre l'aragonais et le catalan.

apertium-bel
données d’Apertium pour uniquement le biélorusse
Versions of package apertium-bel
ReleaseVersionArchitectures
buster0.1.0~r81357-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques d’Apertium pour le biélorusse.

apertium-bel-rus
données d’Apertium pour les traductions entre le biélorusse et le russe
Versions of package apertium-bel-rus
ReleaseVersionArchitectures
bullseye0.2.1-1all
trixie0.2.1-2all
bookworm0.2.1-2all
buster0.2.0~r81186-2all
sid0.2.1-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques d’Apertium pour faire des traductions entre le biélorusse et le russe.

apertium-br-fr
données linguistiques Apertium pour les traductions entre le breton et le français
Versions of package apertium-br-fr
ReleaseVersionArchitectures
buster0.5.0~r61325-3all
bullseye0.5.1-1all
bookworm0.5.1-1all
stretch0.5.0~r61325-2all
sid0.5.1-1all
trixie0.5.1-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit un paquet linguistique pour le système de traduction automatique par correspondances superficielles Apertium. Il permet de faire des traductions entre le breton et le français.

apertium-ca-it
paquet factice de transition pour apertium-cat-ita
Versions of package apertium-ca-it
ReleaseVersionArchitectures
bullseye0.2.1-3all
sid1.1.0-1all
trixie1.1.0-1all
stretch0.1.1~r57554-1all
buster0.1.1~r57554-2all
bookworm0.2.2-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'un paquet factice de transition. Il peut être supprimé en toute sécurité.

apertium-cat
données simples Apertium pour le catalan
Versions of package apertium-cat
ReleaseVersionArchitectures
buster2.6.0-1all
stretch1.0.0~r65787-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques Apertium pour le catalan.

apertium-cat-srd
données d'Apertium pour les traductions entre le catalan et le sarde
Versions of package apertium-cat-srd
ReleaseVersionArchitectures
bullseye1.1.0-1all
bookworm1.1.0-2all
trixie1.2.0-1all
sid1.2.0-1all
buster1.0.0~r82995-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques d'Apertium pour faire des traductions entre le catalan et le sarde.

apertium-crh
données d’Apertium pour uniquement le tatar de Crimée
Versions of package apertium-crh
ReleaseVersionArchitectures
buster0.2.0~r83161-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'un paquet de données fournissant les ressources linguistiques d'Apertium pour le tatar de Crimée.

apertium-crh-tur
données Apertium pour les traductions entre le tatar de Crimée et le turc
Versions of package apertium-crh-tur
ReleaseVersionArchitectures
sid0.3.0-2all
bullseye0.3.0-1all
buster0.3.0~r83159-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le tatar de Crimée et le turc.

apertium-cy-en
données linguistiques Apertium pour les traductions entre le gallois et l'anglais
Versions of package apertium-cy-en
ReleaseVersionArchitectures
sid0.1.1~r57554-9all
stretch0.1.1~r57554-3all
buster0.1.1~r57554-4all
bullseye0.1.1~r57554-7all
upstream0.1.1
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

Ce paquet fournit un paquet linguistique pour le système de traduction automatique par correspondances superficielles Apertium. Il permet de faire des traductions entre le gallois et l'anglais.

apertium-dan
données linguistiques simples Apertium pour le danois
Versions of package apertium-dan
ReleaseVersionArchitectures
stretch0.5.0~r67099-1all
buster0.5.0~r67099-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques Apertium pour le danois.

apertium-dan-nor
données Apertium pour les traductions entre le danois et le norvégien
Versions of package apertium-dan-nor
ReleaseVersionArchitectures
sid1.5.0-2all
bookworm1.5.0-2all
trixie1.5.0-2all
bullseye1.4.1-2all
stretch1.3.0~r67099-1all
buster1.3.0~r67099-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le danois et les variantes Nynorsk et Bokmål du norvégien et entre le danois et le norvégien Nynorsk.

apertium-en-ca
paquet factice de transition pour apertium-eng-cat
Versions of package apertium-en-ca
ReleaseVersionArchitectures
jessie0.8.9-1amd64,armel,armhf,i386
trixie1.0.1-5all
sid1.0.1-5all
buster0.9.3~r61328-2all
bullseye1.0.1-4all
bookworm1.0.1-5all
stretch0.9.3~r61328-1all
Debtags of package apertium-en-ca:
culturecatalan
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'un paquet factice de transition. Il peut être supprimé en toute sécurité.

apertium-en-es
Transitional dummy package for apertium-eng-spa
Versions of package apertium-en-es
ReleaseVersionArchitectures
stretch0.8.0~r57502-2all
bookworm0.8.1-2all
trixie0.8.1-2all
sid0.8.1-2all
bullseye0.8.0~r57502-5all
jessie0.6.0-1.1amd64,armel,armhf,i386
buster0.8.0~r57502-4all
Debtags of package apertium-en-es:
culturespanish
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This is a transitional dummy package. It can safely be removed.

apertium-en-gl
données Apertium pour les traductions entre l'anglais et le galicien
Versions of package apertium-en-gl
ReleaseVersionArchitectures
bullseye0.5.2~r57551-3all
bookworm0.5.4-1all
sid0.5.4-2all
buster0.5.2~r57551-2all
stretch0.5.2~r57551-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre l'anglais et le galicien.

apertium-eo-ca
données Apertium pour les traductions entre l'espéranto et le catalan
Versions of package apertium-eo-ca
ReleaseVersionArchitectures
trixie0.9.2-1all
jessie0.9.0-1.1amd64,armel,armhf,i386
sid0.9.2-1all
stretch0.9.1~r60655-1all
bookworm0.9.2-1all
bullseye0.9.2-1all
buster0.9.1~r60655-3all
Debtags of package apertium-eo-ca:
culturecatalan, esperanto
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre l'espéranto et le catalan.

apertium-eo-en
données Apertium pour les traductions entre l'espéranto et l'anglais
Versions of package apertium-eo-en
ReleaseVersionArchitectures
sid1.0.2-1all
stretch1.0.0~r63833-1all
buster1.0.0~r63833-2all
bookworm1.0.2-1all
bullseye1.0.0~r63833-3all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit un paquet linguistique pour le système de traduction automatique par correspondances superficielles Apertium. Il permet de faire des traductions entre l'espéranto et l'anglais.

apertium-eo-es
données Apertium pour les traductions entre l'espéranto et l'espagnol
Versions of package apertium-eo-es
ReleaseVersionArchitectures
stretch0.9.1~r60655-1all
sid0.9.2-1all
buster0.9.1~r60655-3all
trixie0.9.2-1all
jessie0.9.0-1.1amd64,armel,armhf,i386
bookworm0.9.2-1all
bullseye0.9.1~r60655-4all
Debtags of package apertium-eo-es:
cultureesperanto, spanish
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre l'espéranto et l'espagnol.

apertium-eo-fr
données Apertium pour les traductions entre l'espéranto et le français
Versions of package apertium-eo-fr
ReleaseVersionArchitectures
bookworm0.9.1-1all
buster0.9.0~r57551-2all
stretch0.9.0~r57551-1all
sid0.9.1-1all
trixie0.9.1-1all
bullseye0.9.1-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre l'espéranto et le français.

apertium-es-ast
paquet factice de transition pour apertium-spa-ast
Versions of package apertium-es-ast
ReleaseVersionArchitectures
trixie1.1.1-2all
bullseye1.1.0~r51165-3all
buster1.1.0~r51165-2all
stretch1.1.0~r51165-1all
sid1.1.1-2all
bookworm1.1.1-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'un paquet factice de transition. Il peut être supprimé en toute sécurité.

apertium-es-ca
paquet factice de transition pour apertium-spa-cat
Versions of package apertium-es-ca
ReleaseVersionArchitectures
bullseye2.2.0-2all
stretch1.2.1+svn~57448-4all
buster2.1.0~r79717-2all
jessie1.1.0-1.1amd64,armel,armhf,i386
trixie2.2.0-3all
sid2.2.0-3all
bookworm2.2.0-3all
Debtags of package apertium-es-ca:
culturecatalan, spanish
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet factice de transition. Il peut être supprimé en toute sécurité.

apertium-es-gl
données Apertium pour les traductions entre l'espagnol et le galicien
Versions of package apertium-es-gl
ReleaseVersionArchitectures
sid1.0.9-3all
trixie1.0.9-3all
bookworm1.0.9-3all
jessie1.0.7-1amd64,armel,armhf,i386
stretch1.0.8~r57542-2all
buster1.0.8~r57542-3all
bullseye1.0.8~r57542-4all
Debtags of package apertium-es-gl:
culturegalician, spanish
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre l'espagnol et le galicien.

apertium-es-it
paquet factice de transition pour apertium-spa-ita
Versions of package apertium-es-it
ReleaseVersionArchitectures
bookworm0.2.1-3all
sid0.2.1-3all
buster0.2.0~r78826-2all
stretch0.1.0~r51165-1all
bullseye0.2.0~r78826-2.1all
trixie0.2.1-3all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet factice de transition. Il peut être supprimé en toute sécurité.

apertium-es-pt
données Apertium pour les traductions entre l'espagnol et le portugais
Versions of package apertium-es-pt
ReleaseVersionArchitectures
trixie1.1.6-1all
jessie1.0.3-2.1amd64,armel,armhf,i386
sid1.1.6-1all
bookworm1.1.6-1all
bullseye1.1.5+svn~57507-5all
buster1.1.5+svn~57507-4all
stretch1.1.5+svn~57507-3all
Debtags of package apertium-es-pt:
cultureesperanto, portuguese, spanish
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre l'espagnol et le portugais.

apertium-es-ro
données Apertium pour les traductions entre l'espagnol et le roumain
Versions of package apertium-es-ro
ReleaseVersionArchitectures
buster0.7.3~r57551-3all
bookworm0.7.5-1all
sid0.7.5-1all
jessie0.7.1-2.1amd64,armel,armhf,i386
stretch0.7.3~r57551-2all
bullseye0.7.3~r57551-4all
Debtags of package apertium-es-ro:
cultureromanian, spanish
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre l'espagnol et le roumain.

apertium-eu-en
données Apertium pour les traductions entre le basque et l'anglais
Versions of package apertium-eu-en
ReleaseVersionArchitectures
sid0.3.3-1all
stretch0.3.1~r56205-1all
buster0.3.1~r56205-2all
bullseye0.3.1~r56205-3all
bookworm0.3.3-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le basque et l'anglais.

apertium-eu-es
données Apertium pour les traductions entre le basque et l'espagnol
Versions of package apertium-eu-es
ReleaseVersionArchitectures
jessie0.3.1-1amd64,armel,armhf,i386
sid0.3.4-1all
trixie0.3.4-1all
bookworm0.3.4-1all
stretch0.3.3~r56159-2all
buster0.3.3~r56159-3all
bullseye0.3.3~r56159-4all
Debtags of package apertium-eu-es:
culturebasque, spanish
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le basque et l'espagnol.

apertium-fr-ca
paquet factice de transition pour apertium-fra-cat
Versions of package apertium-fr-ca
ReleaseVersionArchitectures
jessie1.0.2-1amd64,armel,armhf,i386
stretch1.1.0~r64309-1all
Debtags of package apertium-fr-ca:
culturecatalan, french
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de transition ; il peut être supprimé en toute sécurité.

apertium-fr-es
données Apertium pour les traductions entre le français et l'espagnol
Versions of package apertium-fr-es
ReleaseVersionArchitectures
trixie0.9.4-1all
buster0.9.2~r61322-3all
bullseye0.9.2~r61322-4all
jessie0.9.0-1amd64,armel,armhf,i386
stretch0.9.2~r61322-2all
sid0.9.4-1all
bookworm0.9.4-1all
Debtags of package apertium-fr-es:
culturefrench, spanish
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le français et l'espagnol.

apertium-fra
données particulières d’Apertium pour le français
Versions of package apertium-fra
ReleaseVersionArchitectures
buster1.5.0-1all
stretch1.0.0~r65786-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'un paquet de données fournissant les ressources linguistiques d’Apertium pour le français.

apertium-fra-cat
données Apertium pour les traductions entre le français et le catalan
Versions of package apertium-fra-cat
ReleaseVersionArchitectures
stretch1.1.0~r64309-1all
buster1.5.0-1all
bullseye1.9.0-1all
bookworm1.10.0-1all
trixie1.10.0-1all
sid1.10.0-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le français et le catalan.

apertium-hbs
données simples Apertium pour le serbo-croate
Versions of package apertium-hbs
ReleaseVersionArchitectures
stretch0.5.0~r68212-2all
buster0.5.0~r68212-3all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques Apertium pour le serbo-croate.

apertium-hbs-eng
données Apertium pour les traductions entre le serbo-croate et l'anglais
Versions of package apertium-hbs-eng
ReleaseVersionArchitectures
bookworm0.5.1-2all
sid0.5.1-2all
bullseye0.5.1-1all
stretch0.1.0~r57598-1all
buster0.1.0~r57598-2all
trixie0.5.1-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le serbo-croate et l'anglais.

apertium-hbs-mkd
données Apertium pour les traductions entre le serbo-croate et le macédonien
Versions of package apertium-hbs-mkd
ReleaseVersionArchitectures
buster0.1.0~r76450-2.1all
sid0.1.1-1all
trixie0.1.1-1all
bookworm0.1.1-1all
stretch0.1.0~r57554-1all
bullseye0.1.0~r76450-4all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le serbo-croate et le macédonien.

apertium-hbs-slv
données Apertium pour les traductions entre le serbo-croate et le slovénien
Versions of package apertium-hbs-slv
ReleaseVersionArchitectures
stretch0.1.0~r59294-1all
bullseye0.5.1-1all
bookworm0.5.1-2all
trixie0.5.1-2all
sid0.5.1-2all
buster0.1.0~r59294-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le serbo-croate et le slovénien.

apertium-hin
données simples Apertium pour le hindi
Versions of package apertium-hin
ReleaseVersionArchitectures
bookworm0.1.0~r59158-4all
sid0.1.0~r59158-4all
bullseye0.1.0~r59158-2.1all
buster0.1.0~r59158-2all
stretch0.1.0~r59158-1all
trixie0.1.0~r59158-4all
upstream0.1.0
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques Apertium pour le hindi.

apertium-id-ms
paquet factice de transition pour apertium-ind-zlm
Versions of package apertium-id-ms
ReleaseVersionArchitectures
trixie0.1.2-3all
bullseye0.1.2-3all
bookworm0.1.2-3all
buster0.1.1~r57551-2all
stretch0.1.1~r57551-1all
sid0.1.2-3all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'un paquet factice de transition. Il peut être supprimé en toute sécurité.

apertium-is-sv
Transitional dummy package for apertium-isl-swe
Versions of package apertium-is-sv
ReleaseVersionArchitectures
bullseye0.1.0~r76450-3all
buster0.1.0~r76450-2all
bookworm0.1.1-2all
trixie0.1.1-2all
sid0.1.1-2all
stretch0.1.0~r56030-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This is a transitional dummy package. It can safely be removed.

apertium-isl
données simples Apertium pour l'islandais
Versions of package apertium-isl
ReleaseVersionArchitectures
stretch0.1.0~r65494-1all
bullseye0.1.0~r65494-2.1all
buster0.1.0~r65494-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques Apertium pour l’islandais.

apertium-isl-eng
données Apertium pour les traductions entre l'islandais et l'anglais
Versions of package apertium-isl-eng
ReleaseVersionArchitectures
buster0.1.0~r66083-2all
stretch0.1.0~r66083-1all
sid0.1.2-1all
bookworm0.1.2-1all
bullseye0.1.0~r66083-3all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre l'islandais et l'anglais.

apertium-ita
données simples Apertium pour l'italien
Versions of package apertium-ita
ReleaseVersionArchitectures
bullseye0.10.0~r82237-2.1all
stretch0.9.0~r72553-1all
buster0.10.0~r82237-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques Apertium pour l’italien.

apertium-kaz
données simples Apertium pour le kazakh
Versions of package apertium-kaz
ReleaseVersionArchitectures
buster0.1.0~r61338-2all
stretch0.1.0~r61338-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'un paquet de données fournissant les ressources linguistiques Apertium pour le kazakh.

apertium-kaz-tat
données Apertium pour les traductions entre le kazakh et le tatar
Versions of package apertium-kaz-tat
ReleaseVersionArchitectures
buster0.2.1~r57554-2all
bullseye0.2.1-1all
sid0.2.1-1all
stretch0.2.1~r57554-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le kazakh et le tatar.

apertium-mk-bg
Transitional dummy package for apertium-mkd-bul
Versions of package apertium-mk-bg
ReleaseVersionArchitectures
trixie0.2.1-2all
buster0.2.0~r49489-2all
stretch0.2.0~r49489-1all
bookworm0.2.1-2all
bullseye0.2.0~r49489-3all
sid0.2.1-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This is a transitional dummy package. It can safely be removed.

apertium-mk-en
Transitional dummy package for apertium-mkd-eng
Versions of package apertium-mk-en
ReleaseVersionArchitectures
sid0.1.3-2all
trixie0.1.3-2all
bullseye0.1.1~r57554-3all
bookworm0.1.3-2all
stretch0.1.1~r57554-1all
buster0.1.1~r57554-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This is a transitional dummy package. It can safely be removed.

apertium-mlt-ara
données Apertium pour les traductions entre le maltais et l'arabe
Versions of package apertium-mlt-ara
ReleaseVersionArchitectures
sid0.2.0~r62623-3all
stretch0.2.0~r62623-1all
bullseye0.2.0~r62623-2.1all
buster0.2.0~r62623-2all
upstream0.2.1
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le maltais et l'arabe.

apertium-nno
données linguistiques simples Apertium pour le norvégien Nynorsk
Versions of package apertium-nno
ReleaseVersionArchitectures
buster0.9.0~r69513-3all
stretch0.9.0~r69513-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques Apertium pour le norvégien Nynorsk.

apertium-nno-nob
données linguistiques Apertium pour les traductions entre le norvégien Nynorsk et le norvégien Bokmål
Versions of package apertium-nno-nob
ReleaseVersionArchitectures
bookworm1.5.0-1all
sid1.5.0-1all
trixie1.5.0-1all
stretch1.1.0~r66076-1all
buster1.1.0~r66076-2all
bullseye1.3.0-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'un paquet de données fournissant les ressources linguistiques Apertium pour les traductions entre le norvégien Nynorsk et le norvégien Bokmål.

apertium-nob
données linguistiques simples Apertium pour le norvégien Bokmål
Versions of package apertium-nob
ReleaseVersionArchitectures
stretch0.9.0~r69513-1all
buster0.9.0~r69513-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques Apertium pour le norvégien Bokmål.

apertium-oc-ca
données Apertium pour les traductions entre l'occitan et le catalan
Versions of package apertium-oc-ca
ReleaseVersionArchitectures
stretch1.0.6~r57551-2all
trixie1.0.7-1all
jessie1.0.5-1.1amd64,armel,armhf,i386
buster1.0.6~r57551-3all
bookworm1.0.7-1all
sid1.0.7-1all
bullseye1.0.6~r57551-4all
Debtags of package apertium-oc-ca:
culturecatalan
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre l'occitan et le catalan.

apertium-oc-es
données Apertium pour les traductions entre l'occitan et l'espagnol
Versions of package apertium-oc-es
ReleaseVersionArchitectures
bullseye1.0.6~r57551-4all
jessie1.0.5-1.1amd64,armel,armhf,i386
bookworm1.0.8-1all
stretch1.0.6~r57551-2all
sid1.0.8-1all
buster1.0.6~r57551-3all
Debtags of package apertium-oc-es:
culturespanish
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre l'occitan et l'espagnol.

apertium-oci
données particulières d’Apertium pour l’occitan
Versions of package apertium-oci
ReleaseVersionArchitectures
buster0.1.0-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques d’Apertium pour l’occitan.

apertium-pol
données particulières d’Apertium pour le polonais
Versions of package apertium-pol
ReleaseVersionArchitectures
buster0.1.1-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques d’Apertium pour le polonais.

apertium-pol-szl
données d’Apertium pour les traductions entre le polonais et le silésien
Versions of package apertium-pol-szl
ReleaseVersionArchitectures
bookworm0.2.1-3all
sid0.2.1-3all
trixie0.2.1-3all
bullseye0.2.1-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques d’Apertium pour faire des traductions entre le polonais et le silésien.

apertium-pt-ca
paquet factice de transition pour apertium-por-cat
Versions of package apertium-pt-ca
ReleaseVersionArchitectures
sid0.10.1-2all
trixie0.10.1-2all
buster0.8.2+svn~57507-4all
bullseye0.10.0-1all
jessie0.8.1-1amd64,armel,armhf,i386
bookworm0.10.1-2all
stretch0.8.2+svn~57507-3all
Debtags of package apertium-pt-ca:
culturecatalan, portuguese
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet factice de transition. Il peut être supprimé en toute sécurité.

apertium-pt-gl
données Apertium pour les traductions entre le portugais et le galicien
Versions of package apertium-pt-gl
ReleaseVersionArchitectures
trixie0.9.3-1all
jessie0.9.1-1amd64,armel,armhf,i386
stretch0.9.2~r57551-2all
buster0.9.2~r57551-3all
bullseye0.9.2~r57551-4all
bookworm0.9.3-1all
sid0.9.3-1all
Debtags of package apertium-pt-gl:
culturegalician, portuguese
fieldlinguistics
roleapp-data
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le portugais et le galicien.

apertium-rus
données d’Apertium pour uniquement le russe
Versions of package apertium-rus
ReleaseVersionArchitectures
buster0.2.0~r82706-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'un paquet de données fournissant les ressources linguistiques d'Apertium pour le russe.

apertium-separable
réordonnancement de multimots séparables ou non contigus
Versions of package apertium-separable
ReleaseVersionArchitectures
bullseye0.3.6-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.6.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.6.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.6.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.3.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit un module Apertium pour réordonner des multimots séparables ou non contigus.

apertium-sme-nob
données Apertium pour les traductions entre le sámi et le bokmål
Versions of package apertium-sme-nob
ReleaseVersionArchitectures
buster0.6.0~r61921-2all
stretch0.6.0~r61921-1all
bullseye0.6.1+ds.1-2all
sid0.6.1+ds.1-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le sámi et le bokmål.

apertium-spa
données simples Apertium pour l'espagnol
Versions of package apertium-spa
ReleaseVersionArchitectures
stretch0.1.0~r65494-1all
bullseye1.1.0~r79716-2.1all
buster1.1.0~r79716-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques Apertium pour l’espagnol.

apertium-spa-arg
données Apertium pour les traductions entre l'espagnol et l'aragonais
Versions of package apertium-spa-arg
ReleaseVersionArchitectures
trixie0.6.0-2all
bookworm0.5.0-2all
sid0.6.0-2all
bullseye0.5.0-1all
buster0.4.0~r64399-2all
stretch0.4.0~r64399-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre l'espagnol et l'aragonais.

apertium-srd
données simples Apertium pour le sarde
Versions of package apertium-srd
ReleaseVersionArchitectures
buster1.2.0~r82994-2all
stretch0.9.0~r72792-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques Apertium pour le sarde.

apertium-srd-ita
données Apertium pour les traductions entre le sarde et l'italien
Versions of package apertium-srd-ita
ReleaseVersionArchitectures
bookworm1.1.0-2all
bullseye1.1.0-1all
buster0.9.5~r82237-2all
stretch0.9.0~r72554-1all
sid1.3.0-1all
trixie1.3.0-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le sarde et l'italien.

apertium-swe
données linguistiques Apertium pour le suédois uniquement
Versions of package apertium-swe
ReleaseVersionArchitectures
stretch0.7.0~r69513-1all
buster0.7.0~r69513-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques Apertium pour le suédois.

apertium-swe-dan
données linguistiques Apertium pour les traductions entre le suédois et le danois
Versions of package apertium-swe-dan
ReleaseVersionArchitectures
stretch0.7.0~r66063-1all
buster0.7.0~r66063-2all
bullseye0.8.1-2all
bookworm0.8.1-3all
trixie0.8.1-3all
sid0.8.1-3all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'un paquet de données fournissant les ressources linguistiques Apertium pour les traductions entre le suédois et le danois.

apertium-swe-nor
données Apertium pour les traductions entre le suédois et le norvégien
Versions of package apertium-swe-nor
ReleaseVersionArchitectures
trixie0.4.0-1all
buster0.2.0~r69544-2all
sid0.4.0-1all
bullseye0.3.1-1all
bookworm0.4.0-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le suédois et le norvégien.

apertium-szl
données particulières d’Apertium pour le silésien
Versions of package apertium-szl
ReleaseVersionArchitectures
buster0.1.0-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques d’Apertium pour le silésien.

apertium-tat
données simples Apertium pour le tatar
Versions of package apertium-tat
ReleaseVersionArchitectures
stretch0.1.0~r60887-1all
buster0.1.0~r60887-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s'agit d'un paquet de données fournissant les ressources linguistiques Apertium pour le tatar.

apertium-tur
données d’Apertium pour uniquement le turc
Versions of package apertium-tur
ReleaseVersionArchitectures
buster0.2.0~r83161-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques d’Apertium pour le turc.

apertium-ukr
données d’Apertium pour uniquement l’ukrainien
Versions of package apertium-ukr
ReleaseVersionArchitectures
buster0.1.0~r82563-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques d’Apertium pour l’ukrainien.

apertium-urd
données simples Apertium pour l’ourdou
Versions of package apertium-urd
ReleaseVersionArchitectures
buster0.1.0~r61311-2all
sid0.1.0~r61311-3all
trixie0.1.0~r61311-3all
bookworm0.1.0~r61311-3all
stretch0.1.0~r61311-1all
bullseye0.1.0~r61311-2.1all
upstream0.1.0
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

Il s’agit d’un paquet de données fournissant les ressources linguistiques Apertium pour l’ourdou.

apertium-urd-hin
données Apertium pour les traductions entre l'ourdou et le hindi
Versions of package apertium-urd-hin
ReleaseVersionArchitectures
trixie0.1.0~r64379-4all
bookworm0.1.0~r64379-4all
stretch0.1.0~r64379-1all
buster0.1.0~r64379-2all
bullseye0.1.0~r64379-2.1all
sid0.1.0~r64379-4all
upstream0.1.0
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre l'ourdou et le hindi.

frogdata
Data files for Frog
Versions of package frogdata
ReleaseVersionArchitectures
bookworm0.18-2all
trixie0.18-2all
sid0.18-2all
stretch0.13-1all
jessie0.4-1all
buster0.16-1all
bullseye0.18-1all
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Frog is a modular system integrating a morphosyntactic tagger, lemmatizer, morphological analyzer, and dependency parser for the Dutch language.

This package provided necessary datafiles for running Frog.

Frog is a product of the ILK Research Group (Tilburg University, The Netherlands) and the CLiPS Research Centre (University of Antwerp, Belgium).

libapache-opennlp-java
boîte à outils basée sur l'apprentissage automatique pour le traitement de textes en langage naturel
Versions of package libapache-opennlp-java
ReleaseVersionArchitectures
trixie2.3.2-1all
bullseye1.9.3-1all
bookworm2.1.0-1all
sid2.3.2-1all
Popcon: 3 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

La bibliothèque OpenNLP d'Apache est une boîte à outils basée sur l'apprentissage automatique pour le traitement de textes en langage naturel. Il prend en charge les tâches communes de NLP, telles que la tokenisation, la segmentation de phrase, l'étiquetage morpho-syntaxique, l'extraction d'entités nommées, la segmentation, l'analyse et la résolution de coréférences. Ces tâches sont généralement nécessaires pour construire des services de traitement de texte plus évolués. OpenNLP comprend également un apprentissage automatique basé sur le principe d'entropie maximale et le perceptron.

libcg3-dev
Headers and shared files to develop using the CG-3 library
Versions of package libcg3-dev
ReleaseVersionArchitectures
sid1.4.6-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.1.7-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0.9.9~r11624-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.4.6-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.3.9-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.3.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Development files to use the CG-3 API.

It is recommended to instrument the CLI tools instead of using this API.

See https://visl.sdu.dk/cg3.html for more documentation

libfasttext-dev
Header files of fastText
Versions of package libfasttext-dev
ReleaseVersionArchitectures
trixie0.9.2+ds-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.9.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.9.2-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.9.2+ds-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

fastText is a library for efficient learning of word representations and sentence classification, which refers subword information to enrich word vectors. This package contains header files for development.

libfolia-dev
Implementation of the FoLiA document format (C++ headers)
Versions of package libfolia-dev
ReleaseVersionArchitectures
sid2.4-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.15-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.4-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.4-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.6-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.10-4.2amd64,armel,armhf,i386
trixie2.4-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package libfolia-dev:
devellibrary
roledevel-lib
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

FoLiA is an XML-based format for Linguistic Annotation suitable for representing written language resources such as corpora. Its goal is to unify a variety of linguistic annotations in one single rich format, without committing to any particular standard annotation set. Instead, it seeks to accommodate any desired system or tagset, and so offer maximum flexibility. This makes FoLiA language independent. see https://proycon.github.io/folia for more information.

libfolia is a product of the Centre of Language and Speech Technology, Radboud University Nijmegen (The Netherlands), it was previously developed at the ILK Research Group, Tilburg University. Work on libfolia is funded by NWO, the Netherlands Organisation for Scientific Research.

This package provides the FoLiA header files required to compile C++ programs that use libfolia and implements FoLiA v2.2.1.

libmbt-dev
memory-based tagger-generator and tagger - development
Versions of package libmbt-dev
ReleaseVersionArchitectures
bookworm3.6-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.6-3.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.6-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.6-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package libmbt-dev:
devellibrary
roledevel-lib
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

MBT is a memory-based tagger-generator and tagger in one. The tagger-generator part can generate a sequence tagger on the basis of a training set of tagged sequences; the tagger part can tag new sequences. MBT can, for instance, be used to generate part-of-speech taggers or chunkers for natural language processing.

MBT is a product of the Centre of Language and Speech Technology (Radboud University Nijmegen, The Netherlands), the ILK Research Group (Tilburg University, The Netherlands) and the CLiPS Research Centre (University of Antwerp, Belgium).

If you do scientific research in natural language processing, MBT will likely be of use to you.

This package provides the header files required to compile C++ programs that use libmbt.

libopennlp-maxent-java
OpenNLP Maximum Entropy Package
Versions of package libopennlp-maxent-java
ReleaseVersionArchitectures
bullseye3.0.0+ds-2all
bookworm3.0.0+ds-2all
trixie3.0.0+ds-2all
sid3.0.0+ds-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Maximum entropy is a powerful method for constructing statistical models of classification tasks, such as part of speech tagging in Natural Language Processing. Several example applications using maxent can be found in the OpenNLP Tools Library.

libsentencepiece-dev
Header files of SentencePiece
Versions of package libsentencepiece-dev
ReleaseVersionArchitectures
bookworm0.1.97-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.2.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.2.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.1.95-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

SentencePiece is an unsupervised text tokenizer/detokenizer mainly designed for Neural Network-based text generation systems where the vocabulary size is predetermined prior to the neural model training.

libticcutils-dev
utility functions used in the context of Natural Language Processing (headers)
Versions of package libticcutils-dev
ReleaseVersionArchitectures
bookworm0.24-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.24-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.24-2.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.20-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.24-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package libticcutils-dev:
devellibrary
roledevel-lib
Popcon: users ( upd.)*
Versions and Archs
License: DFSG free
Git

The TiCC utils C++ library contains useful functions and other goodies for general use in TiMBL and other parts of the TiCC software stack and beyond.

TiCC utils is a product of the Tilburg centre for Cognition and Communication (Tilburg University, The Netherlands). If you do scientific research in Natural Language Processing, TiCC software will likely be of use to you.

This package provides the header files required to compile C++ programs that use libticcutils.

libticcutils2-dev
library for TiCC software - development files
Versions of package libticcutils2-dev
ReleaseVersionArchitectures
stretch0.14-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.4-5.1amd64,armel,armhf,i386
Debtags of package libticcutils2-dev:
devellibrary
roledevel-lib
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

The TiCC utils C++ library contains useful functions and other goodies for general use in TiMBL and other parts of the TiCC software stack and beyond.

TiCC utils is a product of the Tilburg centre for Cognition and Communication (Tilburg University, The Netherlands). If you do scientific research in Natural Language Processing, TiCC software will likely be of use to you.

This package provides the header files required to compile C++ programs that use libticcutils.

libtimbl-dev
Tilburg Memory Based Learner - development
Versions of package libtimbl-dev
ReleaseVersionArchitectures
bookworm6.5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid6.5-3.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye6.5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster6.4.13-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie6.5-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package libtimbl-dev:
devellibrary
roledevel-lib
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

The Tilburg Memory Based Learner, TiMBL, is a tool for Natural Language Processing research, and for many other domains where classification tasks are learned from examples. It is an efficient implementation of k-nearest neighbor classifier.

TiMBL is a product of the Centre of Language and Speech Technology (Radboud University, Nijmegen, The Netherlands), the ILK Research Group (Tilburg University, The Netherlands) and the CLiPS Research Centre (University of Antwerp, Belgium).

This package provides the TiMBL header files required to compile C++ programs that use TiMBL.

libtimblserver-dev
Server extensions for Timbl - development
Versions of package libtimblserver-dev
ReleaseVersionArchitectures
bullseye1.14-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.12-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.14-3.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.14-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.14-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package libtimblserver-dev:
devellibrary
roledevel-lib
Popcon: users ( upd.)*
Versions and Archs
License: DFSG free
Git

timblserver is a TiMBL wrapper; it adds server functionality to TiMBL. It allows TiMBL to run multiple experiments as a TCP server, optionally via HTTP.

The Tilburg Memory Based Learner, TiMBL, is a tool for Natural Language Processing research, and for many other domains where classification tasks are learned from examples.

TimblServer is a product of the ILK Research Group (Tilburg University, The Netherlands) and the CLiPS Research Centre (University of Antwerp, Belgium).

This package provides the header files required to compile C++ programs that use timblserver.

libucto-dev
Unicode Tokenizer - development
Versions of package libucto-dev
ReleaseVersionArchitectures
bullseye0.21.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.14-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.21.1-2.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.9.6-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.21.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.21.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.5.3-3.1amd64,armel,armhf,i386
Debtags of package libucto-dev:
devellibrary
roledevel-lib
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ucto can tokenize UTF-8 encoded text files (i.e. separate words from punctuation, split sentences, generate n-grams), and offers several other basic preprocessing steps that make your text suited for further processing such as indexing, part-of-speech tagging, or machine translation.

This package provides C++ headers for the programming library.

Ucto was written by Maarten van Gompel and Ko van der Sloot. Work on Ucto was funded by NWO, the Netherlands Organisation for Scientific Research, under the Implicit Linguistics project, the CLARIN-NL program, and the CLARIAH project.

Ucto is a product of the Centre of Language and Speech Technology (Radboud University Nijmegen), and previously the ILK Research Group (Tilburg University, The Netherlands).

If you are interested in machine parsing of UTF-8 encoded text files, e.g. to do scientific research in natural language processing, ucto will likely be of use to you.

python3-fasttext
fastText binding for Python3
Versions of package python3-fasttext
ReleaseVersionArchitectures
bullseye0.9.2-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.9.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.9.2+ds-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.9.2+ds-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 5 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

fastText is a library for efficient learning of word representations and sentence classification, which refers subword information to enrich word vectors.

python3-fasttext is its binding for Python3.

python3-gensim
Python framework for fast Vector Space Modelling
Versions of package python3-gensim
ReleaseVersionArchitectures
sid4.3.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm4.2.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.3.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Gensim is a Python library for topic modelling, document indexing and similarity retrieval with large corpora. The target audience is the natural language processing (NLP) and information retrieval (IR) community.

python3-nltk
Python3 libraries for natural language processing
Versions of package python3-nltk
ReleaseVersionArchitectures
trixie3.8.1-1all
sid3.8.1-1all
jessie3.0.0-1all
stretch3.2.1-2all
buster3.4-1all
bullseye3.5-1all
bookworm3.8-1all
Popcon: 2912 users (182 upd.)*
Versions and Archs
License: DFSG free
Git

The Natural Language Toolkit (NLTK) is a leading platform for building Python programs to work with human language data. It provides easy-to-use interfaces to over 50 corpora and lexical resources such as WordNet, along with a suite of text processing libraries for classification, tokenization, stemming, tagging, parsing, and semantic reasoning.

This package contains the modules for Python3.

Please cite: Steven Bird, Ewan Klein and Edward Loper: (2009)
python3-sentencepiece
SentencePiece binding for Python3
Versions of package python3-sentencepiece
ReleaseVersionArchitectures
trixie0.2.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.1.95-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.1.97-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.2.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (17 upd.)*
Versions and Archs
License: DFSG free
Git

SentencePiece is an unsupervised text tokenizer/detokenizer mainly designed for Neural Network-based text generation systems where the vocabulary size is predetermined prior to the neural model training.

python3-sentencepiece is its binding for Python3.

python3-snowballstemmer
Pure Python Snowball stemming library
Maintainer: Stefano Rivera
Versions of package python3-snowballstemmer
ReleaseVersionArchitectures
bookworm2.2.0-2all
sid2.2.0-4all
trixie2.2.0-4all
stretch1.2.1-1all
buster1.2.1-1all
bullseye2.1.0-1all
Popcon: 1611 users (661 upd.)*
Versions and Archs
License: DFSG free
Git

Snowball provides access to efficient algorithms for calculating a "stemmed" form of a word. This is a form with most of the common morphological endings removed; hopefully representing a common linguistic base form. This is most useful in building search engines and information retrieval software; for example, a search with stemming enabled should be able to find a document containing "cycling" given the query "cycles".

Snowball provides algorithms for several (mainly European) languages. It also provides access to the classic Porter stemming algorithm for English: although this has been superseded by an improved algorithm, the original algorithm may be of interest to information retrieval researchers wishing to reproduce results of earlier experiments.

This package contains the pure Python module that implements Snowball algorithms. When python3-stemmer package (which contains the C extension) is installed, it uses that extension instead of the pure Python code.

python3-streamparser
Python library to parse Apertium stream format
Versions of package python3-streamparser
ReleaseVersionArchitectures
trixie5.0.2-2all
bookworm5.0.2-2all
bullseye5.0.2-2all
buster5.0.2-1all
sid5.0.2-2all
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides Python 3 library, streamparser, to parse Apertium stream format.

r-cran-nlp
Natural Language Processing Infrastructure for R
Versions of package r-cran-nlp
ReleaseVersionArchitectures
stretch0.1-9-1all
stretch-backports0.2-0-1~bpo9+1all
buster0.2-0-1all
bullseye0.2-1-1all
bookworm0.2-1-1all
trixie0.2-1-1all
sid0.2-1-1all
Popcon: 19 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Basic classes and methods for Natural Language Processing in R.

r-cran-tm
Text Mining functionality for R
Versions of package r-cran-tm
ReleaseVersionArchitectures
buster0.7-6-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.7-8-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.6-2-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.7-11-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports0.7-6-1~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.7-11-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.7-11-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
upstream0.7-12
Popcon: 16 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

A framework for text mining applications within R.

tfdocgen
TiLP framework documentation generator
Versions of package tfdocgen
ReleaseVersionArchitectures
jessie1.0-1amd64,armel,armhf,i386
sid1.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package tfdocgen:
develdocsystem
roleprogram
Popcon: users ( upd.)*
Versions and Archs
License: DFSG free
Git

The tfdocgen program is a program used by the libti2 libraries to generate their HTML documentation from sources and misc files. You don't need this package unless you want to develop on the libti2 libraries.

Debian packages in experimental

sequitur-g2p
Grapheme to Phoneme conversion tool
Maintainer: Giulio Paci
Versions of package sequitur-g2p
ReleaseVersionArchitectures
experimental0+r1668.r3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: users ( upd.)*
Versions and Archs
License: DFSG free
Git

Sequitur G2P is a data-driven grapheme-to-phoneme converter. It can be applied to any monotonous sequence translation problem, provided the source and target alphabets are small (less than 255 symbols). Data-driven means that you need to train it with example pronunciations. Training takes a pronunciation dictionary and creates a model file. The model file can then be used to transcribe words that where not in the dictionary.

Packaging has started and developers might try the packaging code in VCS

spacy
Industrial-strength Natural Language Processing (NLP)
Versions of package spacy
ReleaseVersionArchitectures
VCS2.2.3-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 2.2.3-1

spaCy is a library for advanced Natural Language Processing in Python and Cython. It’s built on the very latest research, and was designed from day one to be used in real products. spaCy comes with pre-trained statistical models and word vectors, and currently supports tokenization for 30+ languages. It features the fastest syntactic parser in the world, convolutional neural network models for tagging, parsing and named entity recognition and easy deep learning integration.

travatar
tree based machine translation toolkit
Versions of package travatar
ReleaseVersionArchitectures
VCS0.1.0+git20131221-1all
Versions and Archs
License: LGPL-3.0+
Debian package not available
Git
Version: 0.1.0+git20131221-1

Travatar is tree based statistical machine translation system containing Tree-to-String (T2S) and Forest-to-String (F2S).

Tree based translation uses syntax trees of natural language and it's particularly effective for language pairs that require a large amount of reordering, such as English-Japanese translation.

No known packages available but some record of interest (WNPP bug)

python3-timbl - wnpp
Python bindings for the Tilburg Memory Based Learner (Timbl)
Responsible: Maarten van Gompel
License: unknown
Debian package not available

python-timbl is a Python extension module wrapping the full TiMBL C++ programming interface. With this module, all functionality exposed through the C++ interface is also available to Python scripts. Being able to access the API from Python greatly facilitates prototyping TiMBL-based applications.

TiMBL is an open source software package implementing several memory-based learning algorithms, among which IB1-IG, an implementation of k-nearest neighbor classification with feature weighting suitable for symbolic feature spaces, and IGTree, a decision-tree approximation of IB1-IG. All implemented algorithms have in common that they store some representation of the training set explicitly in memory. During testing, new cases are classified by extrapolation from the most similar stored cases.

The Python module offers both a high-level as well as a low-level interface, the former is very Pythonic and easy to use while the latter offers the full API.

No known packages available

wnsqlbuilder
SQL version of WordNet 3.0
License: GPL
Debian package not available

WordNet SQL Builder is a Java utility to generate SQL database from WordNet standard database as released by the WordNet Project (Princeton University)

Features

  • Support for MySql and PostGreSQL.
  • Complete port (however, orphaned morphological forms are dropped, and so are VerbNet/XWordNet data that cannot be linked to WordNet entries).
  • Incremental build support.
  • Retains synset index as primary key allowing easy reference to wordnet original database
  • Includes support for WordNet 3.0
  • Includes support for WordNet 2.0 to 2.1, 2.1 to 3.0, 2.0 to 3.0 sense maps
  • Includes support for VerbNet 2.3
  • Includes support for XWordNet 2.0-1.1
  • Ready-to-use database (see wnsqldatabase package in download section) including
  • WordNet 3.0
  • WordNet 2.0 to 2.1, 2.1 to 3.0, 2.0 to 3.0 sense maps
  • VerbNet 2.3
  • XWordNet 2.0-1.1
  • British National Corpus statistical data (for commonly used-words)
*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 237229