Summary
Linguistics
paquets pour la linguistique de Debian Science
Ce paquet fait partie du mélange exclusif « Debian Science » et installe
les paquets concernant la linguistique.
Description
For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:
If you discover a project which looks like a good candidate for Debian Science
to you, or if you have prepared an unofficial Debian package, please do not hesitate to
send a description of that project to the Debian Science mailing list
Links to other tasks
|
Debian Science Linguistics packages
Official Debian packages with high relevance
apertium
système de traduction automatique par correspondances superficielles
|
Versions of package apertium |
Release | Version | Architectures |
jessie | 3.1.0-2 | amd64,armel,armhf,i386 |
bullseye | 3.7.1-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
sid | 3.9.4-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 3.9.4-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 3.8.3-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
buster | 3.5.2-1 | amd64,arm64,armhf,i386 |
stretch | 3.4.0~r61013-5 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
Debtags of package apertium: |
field | linguistics |
role | program |
|
License: DFSG free
|
Apertium est un système de traduction automatique libre par correspondances
superficielles, développé à l'origine pour des couples de langues voisines.
Il utilise des convertisseurs (« transducers ») à états finis pour le
traitement lexical, des automates de
Markov à états cachés pour l'analyse grammaticale et un découpage basé sur
les états finis pour les correspondances structurelles.
Ce système s'inspire largement de ceux développés par les groupes
« Transducens » de l'université d'Alicante comme « interNOSTRUM »
(espagnol‑catalan, http://www.internostrum.com/welcome.php) et « Traductor
Universia » (espagnol‑portugais, http://traductor.universia.net)
Il est possible d'utiliser Apertium pour créer des systèmes de traduction
automatique pour divers couples de langues proches en fournissant
simplement les données linguistiques nécessaires dans le format approprié.
|
|
apertium-eval-translator
évaluation de sortie de traduction automatique par rapport à une référence
|
Versions of package apertium-eval-translator |
Release | Version | Architectures |
trixie | 1.2.1-3 | all |
bookworm | 1.2.1-3 | all |
bullseye | 1.2.1-2 | all |
sid | 1.2.1-3 | all |
|
License: DFSG free
|
Ce paquet fournit des scripts Perl destinés à évaluer une sortie de traduction automatique basée sur Apertium par rapport à une référence⋅: WER, PER, TER, BLEU.
|
|
apertium-lex-tools
Constraint-based lexical selection module
|
Versions of package apertium-lex-tools |
Release | Version | Architectures |
trixie | 0.4.2-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
buster | 0.2.1-1 | amd64,arm64,armhf,i386 |
sid | 0.4.2-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bullseye | 0.2.7-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
stretch | 0.1.1~r66150-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
bookworm | 0.4.2-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
|
License: DFSG free
|
Module for compiling lexical selection rules and processing
them in the pipeline.
|
|
artha
thésaurus pratique et hors ligne basé sur WordNet
|
Versions of package artha |
Release | Version | Architectures |
buster | 1.0.3-3 | amd64,arm64,armhf,i386 |
stretch | 1.0.3-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
jessie | 1.0.3-1 | amd64,armel,armhf,i386 |
sid | 1.0.5-3 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 1.0.5-3 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 1.0.5-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bullseye | 1.0.5-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
Debtags of package artha: |
field | linguistics |
interface | x11 |
role | program |
uitoolkit | gtk |
use | learning |
x11 | application |
|
License: DFSG free
|
Artha est un thésaurus anglais hors ligne, avec des fonctionnalités comme :
- recherche de mot par raccourci clavier (sélectionnez un texte sur une
fenêtre, puis appuyez sur le raccourci pour rechercher) ;
- recherche par expressions rationnelles (il est possible d'utiliser des
jokers comme *, ?, etc.) ;
- notifications de bureau passives (pour la définition des mots, de
façon à ne pas interrompre le travail).
Une fois lancé, il surveille la touche de raccourci. Lorsqu'une recherche de
texte est lancée, il ouvre une fenêtre d'information avec le mot voulu. Si
l'utilisateur
préfère une notification passive, une option est disponible.
Lorsque le terme recherché est vague ou inconnu, la recherche peut être
étendue en utilisant les expressions rationnelles (*, ?, etc.).
Le paquet wordnet-sense-index est nécessaire pour la recherche par expressions
rationnelles.
|
|
cg3
outils pour utiliser la troisième édition de Constraint Grammar (CG-3)
|
Versions of package cg3 |
Release | Version | Architectures |
buster | 1.1.7-1 | amd64,arm64,armhf,i386 |
stretch | 0.9.9~r11624-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
bullseye | 1.3.2-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bookworm | 1.3.9-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
trixie | 1.4.6-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
sid | 1.4.6-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
|
License: DFSG free
|
Il s'agit du compilateur et de l'applicateur Constraint Grammar pour la
troisième édition de CG développée et maintenue par VISL SDU et
GrammarSoft ApS.
CG-3 peut servir à la désambiguïsation de morphologie, de syntaxe, de
sémantique, etc., le balisage de dépendance, le choix de lemme pour le
langage cible pour MT, les systèmes QA et bien plus. L'idée centrale est de
laisser l'utilisateur choisir quoi faire en fonction de tout le contexte
disponible, par opposition aux n-grammes.
Plus de documentation est disponible à https://visl.sdu.dk/cg3.html.
|
|
collatinus
lemmatisation de texte latin
|
Versions of package collatinus |
Release | Version | Architectures |
buster | 11-1 | amd64,arm64,armhf,i386 |
sid | 12.2-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
stretch | 10.2-2 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
jessie | 10.2-2 | amd64,armel,armhf,i386 |
trixie | 12.2-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 12.1-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bullseye | 11-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
stretch-backports | 11-1~bpo9+1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
Debtags of package collatinus: |
field | linguistics |
interface | x11 |
role | dummy, program |
scope | application |
uitoolkit | gtk |
use | learning |
x11 | application |
|
License: DFSG free
|
Collatinus peut être utilisé pour lemmatiser des textes latins, c'est à dire
extraire des mots et créer un lexique qui indique pour chaque mot sa forme
canonique, et comment la forme trouvée effectivement dans le texte peut
être dérivée à partir de celle-ci, par exemple en la déclinant. Exemple :
rosam donne : rosa-rosae -- acc. sing.
Collatinus fournit une interface graphique agréable pour chaque opération.
Collatinus-nouus (pour Collatinus, nouvelle génération) remplace toutes les
versions précédentes de Collatinus.
Ce paquet fournit la documentation au format HTML.
|
|
dimbl
apprentissage automatique distribué
|
Versions of package dimbl |
Release | Version | Architectures |
buster | 0.15-2.1 | amd64,arm64,armhf,i386 |
bookworm | 0.15-2.1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
trixie | 0.17-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
sid | 0.17-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
jessie | 0.12-2 | amd64,armel,armhf,i386 |
stretch | 0.15-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
bullseye | 0.15-2.1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
Debtags of package dimbl: |
role | program |
|
License: DFSG free
|
Dimbl est une enveloppe autour du classificateur par les k plus proches
voisins de TiMBL, proposant une classification parallèle pour les machines
à plusieurs CPU. Dimbl divise l’ensemble original d’apprentissage,
construit un classificateur Timbl séparé pour chaque sous-ensemble et
fusionne leurs ensembles de plus proches voisins par instance classifiée.
Les caractéristiques de Dimbl sont :
– enveloppe propre autour de TiMBL en conservant toutes les options de
ligne de commande ;
– connaissance de ce qui est à réaliser pour deux, quatre ou plusieurs
cœurs ;
– utilisation de la spécification d’OpenMP pour la programmation
parallèle ;
– possibilité de gains de vitesse superlinéaires comparés à TiMBL
standard.
Dimbl est un produit du ILK Research Group (Université de Tilbourg,
Pays-Bas).
Pour réaliser des recherches scientifiques dans le traitement automatique
du langage naturel en utilisant l’apprentissage automatique, Dimbl sera
probablement utile.
|
|
fasttext
bibliothèque pour l’apprentissage efficace de représentation de mots et de classification de phrases
|
Versions of package fasttext |
Release | Version | Architectures |
bullseye | 0.9.2-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bookworm | 0.9.2+ds-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
sid | 0.9.2+ds-7 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 0.9.2+ds-7 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
|
License: DFSG free
|
fastText est une bibliothèque pour l’apprentissage efficace de la représentation de mots et de la classification de phrases, qui fait référence à l’information de sous-mots pour nourrir la vectorisation des mots.
|
|
frog
analyseur et étiqueteur pour les langages naturels – environnement d’exécution
|
Versions of package frog |
Release | Version | Architectures |
sid | 0.32-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
stretch | 0.13.7-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
bookworm | 0.20-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bullseye | 0.20-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
buster | 0.15-1 | amd64,arm64,armhf,i386 |
trixie | 0.32-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
jessie | 0.12.17-7.1 | amd64,armel,armhf,i386 |
upstream | 0.33 |
|
License: DFSG free
|
L’apprentissage automatique (Memory-Based Learning – MBL) est une méthode
applicable à une grande diversité de tâches concernant le traitement
automatique du langage naturel (Natural Language Processing – NLP).
Frog est un système modulaire intégrant un étiqueteur de morphosyntaxe,
un lemmatiseur, un analyseur morphologique et un analyseur de dépendances
pour les langages naturels. Il est basé sur son prédécesseur TADPOLE
(TAgger, Dependency Parser et mOrphoLogical analyzEr). En utilisant des
techniques basées sur la mémoire, frog sépare en unités lexicales,
étiquette, lemmatise et segmente morphologiquement les unités lexicales
des fichiers textuels d’entrée en UTF-8, et assigne un graphe de
dépendances à chaque phrase. Frog est particulièrement destiné aux besoins
croissants de systèmes rapides et automatiques de traitement du langage
naturel (NLP) pour des collections de documents très grandes (plusieurs
millions à un milliard de mots) qui deviennent disponibles grâce à la
numérisation progressive de données textuelles, anciennes comme nouvelles.
Actuellement, frog a seulement été testé et utilisé en utilisant des
corpus en langage naturel néerlandais (consulter le paquet frogdata pour
des échantillons).
Frog est un produit du centre de technologie du langage et de la parole à
l’université Radboud de Nimègue. Il subsume au précédent travail du groupe
de recherche ILK (université de Tilbourg, Pays-bas) et le centre de
recherche CLiPS (université d’Anvers, Belgique). Il est actuellement entretenu
par le « KNAW Humanities Cluster ».
En cas de recherche scientifique en NLP, Frog sera surement utile.
|
|
giella-sme
Giellatekno single language data for North Saami
|
Versions of package giella-sme |
Release | Version | Architectures |
buster | 0.0.20150917~r121176-3 | all |
stretch | 0.0.20150917~r121176-1 | all |
|
License: DFSG free
|
Data package providing Giellatekno language resources for North Saami.
|
|
hfst
technologie des transducteurs finis Helsinki
|
Versions of package hfst |
Release | Version | Architectures |
bullseye | 3.15.1-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
sid | 3.16.0-5 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
buster | 3.15.0-1.1~deb10u1 | amd64,arm64,armhf,i386 |
bookworm | 3.16.0-5 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
stretch | 3.10.0~r2798-3 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
|
License: DFSG free
|
Le logiciel de transducteur à états finis Helsinki est conçu pour la mise en œuvre d’analyseurs morphologiques et d’autres outils basés sur la technologie des transducteurs finis, pondérés ou non.
|
|
hfst-ospell
Spell checker library and tool based on HFST
|
Versions of package hfst-ospell |
Release | Version | Architectures |
stretch | 0.4.0~r4643-4 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
sid | 0.5.4-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 0.5.4-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bullseye | 0.5.2-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
buster | 0.5.0-2 | amd64,arm64,armhf,i386 |
bookworm | 0.5.3-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
|
License: DFSG free
|
Minimal HFST optimized lookup format based spell checker library and
a demonstrational implementation of command line based spell checker.
|
|
irstlm
boîte à outils de modélisation de langage IRST
|
Versions of package irstlm |
Release | Version | Architectures |
bullseye | 6.00.05-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
trixie | 6.00.05-4.1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
buster | 6.00.05-2 | amd64,arm64,armhf,i386 |
stretch | 6.00.05-2 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
sid | 6.00.05-4.1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 6.00.05-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
|
License: DFSG free
|
La boîte à outils de modélisation de langage IRST peut être utilisée pour
apprendre des modèles de langage à partir de données. Les modèles n-gramme
crées peuvent être utilisables sur n’importe quel système prenant en charge
le format de modèle de langage ARPA.
Ce paquet fournit les outils en ligne de commande.
|
|
libcld2-dev
Compact Language Detector 2, development package
|
Versions of package libcld2-dev |
Release | Version | Architectures |
sid | 0.0.0-git20150806-9 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64 |
bullseye | 0.0.0-git20150806-9 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el |
bookworm | 0.0.0-git20150806-9 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el |
stretch | 0.0.0-git20150806-5 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el |
trixie | 0.0.0-git20150806-9 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64 |
buster | 0.0.0-git20150806-6 | amd64,arm64,armhf,i386 |
|
License: DFSG free
|
Detects over 80 languages in UTF-8 text, based largely on groups
of four letters.
Also tables for 160+ language version.
This is the development package.
|
|
link-grammar
analyseur de grammaire de dépendances de l'université Carnegie Mellon
|
Versions of package link-grammar |
Release | Version | Architectures |
bookworm | 5.12.0~dfsg-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
sid | 5.12.5~dfsg-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bullseye | 5.8.1-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
buster | 5.5.1-6 | amd64,arm64,armhf,i386 |
stretch | 5.3.14-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
trixie | 5.12.5~dfsg-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
jessie | 4.7.4-2 | amd64,armel,armhf,i386 |
Debtags of package link-grammar: |
field | linguistics |
interface | commandline |
role | program |
use | checking |
works-with | dictionary |
|
License: DFSG free
|
Dans « Parsing English with a Link Grammar » (1991) de D. Sleator et
D. Temperley, les auteurs définissent un nouveau système grammatical formel
appelée « link grammar » (sorte de grammaire de dépendances). Une séquence
de mots appartient au langage de la grammaire s'il existe une façon
d'établir des liens entre les mots de telle façon que les exigences locales
de chaque mot soient satisfaites, que les liens ne se croisent pas et que
les mots forment un graphe connexe. Les auteurs ont encodé la grammaire
anglaise dans ce système et ont écrit ce programme pour analyser l'anglais
en utilisant cette grammaire.
Link-grammar peut être utilisé pour l'analyse linguistique d'informations
récupérées ou extraites depuis des documents en langage naturel. Il peut
également être utilisé comme vérificateur grammatical.
Ce paquet contient l'exécutable utilisateur.
|
|
lttoolbox
modules et outils de traitement lexical d’Apertium
|
Versions of package lttoolbox |
Release | Version | Architectures |
trixie | 3.7.6-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 3.7.1-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bullseye | 3.5.3-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
stretch | 3.3.3~r68466-2 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
sid | 3.7.6-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
buster | 3.5.0-3 | amd64,arm64,armhf,i386 |
jessie | 3.1.0-1.2 | amd64,armel,armhf,i386 |
Debtags of package lttoolbox: |
field | linguistics |
role | program |
|
License: DFSG free
|
Ltoolbox fournit les outils de transducteurs finis pour le traitement du
langage naturel utilisés par Apertium, une plateforme pour bâtir des
systèmes de traduction suivant des règles et la méthode « Hybrid machine
translation ». Ce logiciel est aussi utile pour créer des analyses
morphologiques et des générateurs pour des applications de traitement de
langages naturels.
|
|
mbt
générateur d’étiquetage basé sur la mémoire et étiqueteur
|
Versions of package mbt |
Release | Version | Architectures |
bookworm | 3.6-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bullseye | 3.6-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
stretch | 3.2.16-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
jessie | 3.2.10-4 | amd64,armel,armhf,i386 |
sid | 3.10-3 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 3.10-3 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
buster | 3.4-1 | amd64,arm64,armhf,i386 |
Debtags of package mbt: |
field | linguistics |
role | program |
|
License: DFSG free
|
MBT est un générateur d’étiquetage basé sur la mémoire et un étiqueteur
réuni. La partie générateur d’étiquetage peut créer un étiqueteur de phrase
sur la base d’un ensemble d’apprentissage de phrases étiquetées. La partie
étiqueteur peut étiqueter de nouvelles phrases. MBT peut, par exemple, être
utilisé pour l’étiquetage morpho-syntaxique ou l’analyse syntaxique de
surface pour le traitement de langage naturel. Fonctions :
– création d’étiquettes : entrée de texte, sortie texte étiqueté ;
– boucle de retour facultative : réinjection de précédentes décisions
d’étiquetage dans l’entrée de la nouvelle décision ;
– représentation de caractéristiques personnalisable, incorporation de
caractéristiques fournies par l’utilisateur ;
– création automatique de sous-étiquettes pour des mots connus ou
inconnus ;
– utilisation de tous les paramètres algorithmiques de TiMBL.
MBT est un produit du Centre of Language and Speech Technology (Université
Radboud de Nimègue, Pas-Bas), du ILK Research Group (Université de
Tilbourg, Pays-Bas) et du CLiPS Research Centre (Université d’Anvers,
Belgique).
Pour ceux qui font des recherches scientifiques dans le traitement du
langage naturel, MBT sera très probablement utile.
|
|
mbtserver
extensions de serveur pour l’étiqueteur MBT
|
Versions of package mbtserver |
Release | Version | Architectures |
bullseye | 0.14-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
jessie | 0.7-3 | amd64,armel,armhf,i386 |
stretch | 0.11-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
buster | 0.12-1 | amd64,arm64,armhf,i386 |
sid | 0.16-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 0.16-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 0.14-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
|
License: DFSG free
|
MbtServer étend Mbt avec une couche serveur, exécutant un serveur TCP. MBT
est un générateur d’étiquetage basé sur la mémoire et un étiqueteur réuni
pour le traitement du langage naturel. MbtServer fournit la possibilité
d’accéder à un étiqueteur entraîné à partir de plusieurs sessions. Il permet
d’accéder et d’exécuter plusieurs étiqueteurs en parallèle.
MBTServer est un produit du Centre of Language and Speech Technology
(Université Radboud de Nimègue, Pas-Bas), du ILK Research Group
(Université de Tilbourg, Pays-Bas) et du CLiPS Research Centre (Université
d’Anvers, Belgique).
Pour des travaux scientifiques dans le traitement du langage naturel,
MbtServer devrait probablement être utile.
|
|
opennlp
enveloppe pour la boîte à outils basée sur l'apprentissage automatique pour le traitement de textes en langage naturel
|
Versions of package opennlp |
Release | Version | Architectures |
bullseye | 1.9.3-1 | all |
bookworm | 2.1.0-1 | all |
trixie | 2.4.0-1 | all |
sid | 2.4.0-1 | all |
|
License: DFSG free
|
La bibliothèque OpenNLP d'Apache est une boîte à outils basée sur
l'apprentissage automatique pour le traitement de textes en langage
naturel. Il prend en charge les tâches communes de NLP, telles que la
tokenisation, la segmentation de phrase, l'étiquetage morpho-syntaxique,
l'extraction d'entités nommées, la segmentation, l'analyse et la résolution
de coréférences. Ces tâches sont généralement nécessaires pour construire
des services de traitement de texte plus évolués. OpenNLP comprend
également un apprentissage automatique basé sur le principe d'entropie
maximale et le perceptron.
Ce paquet fournit l'enveloppe en ligne de commande.
|
|
python3-pynlpl
PyNLPl is a library for Natural Language Processing (Python 3 version)
|
Versions of package python3-pynlpl |
Release | Version | Architectures |
sid | 1.2.9-1 | all |
bookworm | 1.2.9-1 | all |
bullseye | 1.2.9-1 | all |
buster | 1.1.2-1 | all |
stretch | 1.1.2-1 | all |
trixie | 1.2.9-1 | all |
|
License: DFSG free
|
PyNLPl, pronounced as 'pineapple', is a Python library for Natural Language
Processing. It contains various modules useful for common, and less common,
NLP tasks. PyNLPl can be used for basic tasks such as the extraction of
n-grams and frequency lists, and to build simple language models. It also
contains complex data types and algorithms. Moreover, it includes parsers for
file formats common in NLP (e.g. FoLiA/Giza/Moses/ARPA/Timbl/CQL) and clients
to interface with various NLP specific servers. PyNLPl most notably features a
very extensive library for working with FoLiA XML (Format for Linguistic
Annotation).
This is the Python 3 version.
|
|
python3-thinc
apprentissage automatique pour le traitement du langage naturel en Python
|
Versions of package python3-thinc |
Release | Version | Architectures |
bookworm | 8.1.7-1 | amd64,arm64,armhf,i386,mips64el,s390x |
buster | 6.12.1-1 | amd64,arm64,armhf,i386 |
sid | 9.0.0-2 | amd64,arm64,armhf,i386,mips64el,riscv64,s390x |
|
License: DFSG free
|
Thinc est une bibliothèque d’apprentissage automatique servant de dorsal
pour spaCy https://spacy.io. Elle présente un modèle linéaire ayant
passé l’épreuve du feu pour de larges problèmes d’apprentissage à vecteurs
de support et un modèle de réseau neuronal encore en développement pour
spaCy version 2.0 https://spacy.io/usage/v2.
Thinc est une boîte à outils pratique pour mettre en œuvre les modèles qui
suivent l’architecture « Embed, encode, attend, predict » (intégrer,
encoder, attendre, prédire). Elle est conçue pour être facile à installer,
efficace du point de vue utilisation du CPU et optimisée pour le
traitement automatique du langage naturel et l’apprentissage profond avec
du texte, en particulier, pour une entrée structurée hiérarchiquement.
|
|
r-cran-lexrankr
résumé de texte extractif avec l’algorithme LexRank
|
Versions of package r-cran-lexrankr |
Release | Version | Architectures |
bookworm | 0.5.2-8 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
trixie | 0.5.2-8 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
sid | 0.5.2-8 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
buster | 0.5.0-2 | amd64,arm64,armhf,i386 |
bullseye | 0.5.2-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
|
License: DFSG free
|
Il s’agit d’une implémentation pour R de l’algorithme LexRank mettant en œuvre la méthode stochastique basée sur un graphe pour calculer l’importance d’unités textuelles dans le traitement du langage naturel. La technique du problème de résumé de texte est testée. Le résumé de texte extractif repose sur le concept de l’importance relative de la phrase pour identifier les plus importantes dans un document ou un ensemble de documents. L’importance relative est typiquement définie selon la présence de certains mots importants ou selon la similarité avec une pseudo-phrase centroïde.
|
|
r-cran-snowballc
Snowball stemmers based on the C libstemmer UTF-8 library
|
Versions of package r-cran-snowballc |
Release | Version | Architectures |
buster | 0.6.0-1 | amd64,arm64,armhf,i386 |
bullseye | 0.7.0-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bookworm | 0.7.0-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
trixie | 0.7.1-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
sid | 0.7.1-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
|
License: DFSG free
|
An R interface to the C libstemmer library that implements Porter's word
stemming algorithm for collapsing words to a common root to aid
comparison of vocabulary. Currently supported languages are Danish,
Dutch, English, Finnish, French, German, Hungarian, Italian, Norwegian,
Portuguese, Romanian, Russian, Spanish, Swedish and Turkish.
|
|
sentencepiece
Unsupervised text tokenizer and detokenizer
|
Versions of package sentencepiece |
Release | Version | Architectures |
bullseye | 0.1.95-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
sid | 0.2.0-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 0.1.97-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
trixie | 0.2.0-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
|
License: DFSG free
|
SentencePiece is an unsupervised text tokenizer/detokenizer mainly
designed for Neural Network-based text generation systems where the
vocabulary size is predetermined prior to the neural model training.
|
|
timbl
Tilburg Memory Based Learner
|
Versions of package timbl |
Release | Version | Architectures |
buster | 6.4.13-1 | amd64,arm64,armhf,i386 |
sid | 6.9-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
jessie | 6.4.4-4 | amd64,armel,armhf,i386 |
trixie | 6.9-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
stretch | 6.4.8-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
bookworm | 6.5-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bullseye | 6.5-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
Debtags of package timbl: |
role | program |
|
License: DFSG free
|
Memory-Based Learning (MBL) is a machine-learning method applicable to a wide
range of tasks in Natural Language Processing (NLP).
The Tilburg Memory Based Learner, TiMBL, is a tool for NLP research, and for
many other domains where classification tasks are learned from examples. It
is an efficient implementation of k-nearest neighbor classifier.
TiMBL's features are:
-
Fast, decision-tree-based implementation of k-nearest neighbor
classification;
-
Implementations of IB1 and IB2, IGTree, TRIBL, and TRIBL2 algorithms;
- Similarity metrics: Overlap, MVDM, Jeffrey Divergence, Dot product, Cosine;
-
Feature weighting metrics: information gain, gain ratio, chi squared,
shared variance;
-
Distance weighting metrics: inverse, inverse linear, exponential decay;
- Extensive verbosity options to inspect nearest neighbor sets;
- Server functionality and extensive API;
- Fast leave-one-out testing and internal cross-validation;
- and Handles user-defined example weighting.
TiMBL is a product of the Centre of Language and Speech Technology
(Radboud University, Nijmegen, The Netherlands), the ILK Research Group
(Tilburg University, The Netherlands) and the CLiPS Research Centre
(University of Antwerp, Belgium).
If you do scientific research in NLP, timbl will likely be of use to you.
|
|
timblserver
Server extensions for Timbl
|
Versions of package timblserver |
Release | Version | Architectures |
bookworm | 1.14-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
buster | 1.12-1 | amd64,arm64,armhf,i386 |
stretch | 1.11-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
jessie | 1.7-4 | amd64,armel,armhf,i386 |
sid | 1.18-3 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 1.18-3 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bullseye | 1.14-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
Debtags of package timblserver: |
role | program |
|
License: DFSG free
|
timblserver is a TiMBL wrapper; it adds server functionality to TiMBL. It
allows TiMBL to run multiple experiments as a TCP server, optionally via HTTP.
The Tilburg Memory Based Learner, TiMBL, is a tool for Natural Language
Processing research, and for many other domains where classification tasks are
learned from examples.
TimblServer is a product of the ILK Research Group (Tilburg University, The
Netherlands) and the CLiPS Research Centre (University of Antwerp, Belgium).
If you do scientific research in NLP, TimblServer will likely be of use to you.
|
|
ucto
|
Versions of package ucto |
Release | Version | Architectures |
stretch | 0.9.6-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
trixie | 0.30-3 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
sid | 0.30-3 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
buster | 0.14-2 | amd64,arm64,armhf,i386 |
bullseye | 0.21.1-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bookworm | 0.21.1-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
jessie | 0.5.3-3.1 | amd64,armel,armhf,i386 |
upstream | 0.34 |
Debtags of package ucto: |
role | program |
|
License: DFSG free
|
Ucto can tokenize UTF-8 encoded text files (i.e. separate words from
punctuation, split sentences, generate n-grams), and offers several other
basic preprocessing steps that make your text suited for further processing
such as indexing, part-of-speech tagging, or machine translation.
This package provides the command-line tool itself.
Ucto was written by Maarten van Gompel and Ko van der Sloot. Work on Ucto
was funded by NWO, the Netherlands Organisation for Scientific Research,
under the Implicit Linguistics project, the CLARIN-NL program, and the
CLARIAH project.
Ucto is a product of the Centre of Language and Speech Technology (Radboud
University Nijmegen), and previously the ILK Research Group
(Tilburg University, The Netherlands).
If you are interested in machine parsing of UTF-8 encoded text files, e.g. to
do scientific research in natural language processing, ucto will likely be of
use to you.
|
|
uctodata
|
Versions of package uctodata |
Release | Version | Architectures |
trixie | 0.9.1-1 | all |
stretch | 0.4-1 | all |
sid | 0.9.1-1 | all |
buster | 0.8-2 | all |
bullseye | 0.8-2 | all |
bookworm | 0.8-2 | all |
upstream | 0.11 |
|
License: DFSG free
|
Ucto can tokenize UTF-8 encoded text files (i.e. separate words from
punctuation, split sentences, generate n-grams), and offers several other
basic preprocessing steps that make your text suited for further processing
such as indexing, part-of-speech tagging, or machine translation.
This package provides necessary language-specific datafiles for running Ucto.
Ucto was written by Maarten van Gompel and Ko van der Sloot. Work on Ucto
was funded by NWO, the Netherlands Organisation for Scientific Research,
under the Implicit Linguistics project, the CLARIN-NL program, and the
CLARIAH project.
Ucto is a product of the Centre of Language and Speech Technology (Radboud
University Nijmegen), and previously the ILK Research Group (Tilburg
University, The Netherlands).
|
|
wordnet
electronic lexical database of English language
|
Versions of package wordnet |
Release | Version | Architectures |
sid | 3.0-38 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
jessie | 3.0-33 | amd64,armel,armhf,i386 |
buster | 3.0-35 | amd64,arm64,armhf,i386 |
trixie | 3.0-38 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bullseye | 3.0-36 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bookworm | 3.0-37 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
stretch | 3.0-33 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
Debtags of package wordnet: |
field | linguistics |
interface | x11 |
role | program |
scope | application |
uitoolkit | tk |
use | checking |
works-with | dictionary |
x11 | application |
|
License: DFSG free
|
WordNet(C) is an on-line lexical reference system whose design is
inspired by current psycholinguistic theories of human lexical
memory. English nouns, verbs, adjectives and adverbs are organized
into synonym sets, each representing one underlying lexical
concept. Different relations link the synonym sets.
WordNet was developed by the Cognitive Science Laboratory at Princeton
University under the direction of Professor George A. Miller (Principal
Investigator).
WordNet is considered to be the most important resource available to
researchers in computational linguistics, text analysis, and many
related areas.
Binary and manpages of WordNet as well as general manpages.
|
|
Official Debian packages with lower relevance
apertium-af-nl
paquet factice de transition pour apertium-afr-nld
|
Versions of package apertium-af-nl |
Release | Version | Architectures |
bookworm | 0.3.0-3 | all |
trixie | 0.3.0-3 | all |
sid | 0.3.0-3 | all |
buster | 0.2.0~r58256-2 | all |
bullseye | 0.3.0-2 | all |
stretch | 0.2.0~r58256-1 | all |
|
License: DFSG free
|
Il s'agit d'un paquet factice de transition. Il peut être supprimé en toute sécurité.
|
|
apertium-apy
|
Versions of package apertium-apy |
Release | Version | Architectures |
stretch | 0.9.1~r343-2 | all |
trixie | 0.11.7-2.2 | all |
sid | 0.11.7-2.2 | all |
bookworm | 0.11.7-2.1 | all |
buster | 0.11.4-2 | all |
bullseye | 0.11.7-2 | all |
upstream | 0.12.1 |
|
License: DFSG free
|
Ce paquet fournit APY d'Apertium qui est une API simple pour Apertium
écrite en Python 3 et conçue pour un remplacement direct de ScaleMT.
|
|
apertium-arg
données simples Apertium pour l'aragonais
|
Versions of package apertium-arg |
Release | Version | Architectures |
stretch | 0.1.2~r65494-1 | all |
buster | 0.1.2~r65494-2 | all |
|
License: DFSG free
|
Il s'agit d'un paquet de données fournissant les ressources linguistiques
Apertium pour l'aragonais.
|
|
apertium-arg-cat
données Apertium pour les traductions entre l'aragonais et le catalan
|
Versions of package apertium-arg-cat |
Release | Version | Architectures |
buster | 0.1.0~r64925-2 | all |
bullseye | 0.2.0-2 | all |
bookworm | 0.2.0-3 | all |
trixie | 0.3.0-2 | all |
sid | 0.3.0-2 | all |
stretch | 0.1.0~r64925-1 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre l'aragonais et le catalan.
|
|
apertium-bel
données d’Apertium pour uniquement le biélorusse
|
Versions of package apertium-bel |
Release | Version | Architectures |
buster | 0.1.0~r81357-2 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
d’Apertium pour le biélorusse.
|
|
apertium-bel-rus
données d’Apertium pour les traductions entre le biélorusse et le russe
|
Versions of package apertium-bel-rus |
Release | Version | Architectures |
sid | 0.2.1-2 | all |
trixie | 0.2.1-2 | all |
bookworm | 0.2.1-2 | all |
bullseye | 0.2.1-1 | all |
buster | 0.2.0~r81186-2 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques d’Apertium pour faire des
traductions entre le biélorusse et le russe.
|
|
apertium-br-fr
données linguistiques Apertium pour les traductions entre le breton et le français
|
Versions of package apertium-br-fr |
Release | Version | Architectures |
trixie | 0.5.1-1 | all |
sid | 0.5.1-1 | all |
buster | 0.5.0~r61325-3 | all |
bullseye | 0.5.1-1 | all |
bookworm | 0.5.1-1 | all |
stretch | 0.5.0~r61325-2 | all |
|
License: DFSG free
|
Ce paquet fournit un paquet linguistique pour le système de traduction
automatique par correspondances superficielles Apertium. Il permet de faire
des traductions entre le breton et le français.
|
|
apertium-ca-it
paquet factice de transition pour apertium-cat-ita
|
Versions of package apertium-ca-it |
Release | Version | Architectures |
stretch | 0.1.1~r57554-1 | all |
sid | 1.1.0-1 | all |
buster | 0.1.1~r57554-2 | all |
trixie | 1.1.0-1 | all |
bullseye | 0.2.1-3 | all |
bookworm | 0.2.2-1 | all |
|
License: DFSG free
|
Il s'agit d'un paquet factice de transition. Il peut être supprimé en toute sécurité.
|
|
apertium-cat
données simples Apertium pour le catalan
|
Versions of package apertium-cat |
Release | Version | Architectures |
buster | 2.6.0-1 | all |
stretch | 1.0.0~r65787-1 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
Apertium pour le catalan.
|
|
apertium-cat-srd
données d'Apertium pour les traductions entre le catalan et le sarde
|
Versions of package apertium-cat-srd |
Release | Version | Architectures |
bookworm | 1.1.0-2 | all |
buster | 1.0.0~r82995-2 | all |
bullseye | 1.1.0-1 | all |
trixie | 1.2.0-1 | all |
sid | 1.2.0-1 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques d'Apertium pour faire des
traductions entre le catalan et le sarde.
|
|
apertium-crh
données d’Apertium pour uniquement le tatar de Crimée
|
Versions of package apertium-crh |
Release | Version | Architectures |
buster | 0.2.0~r83161-2 | all |
|
License: DFSG free
|
Il s'agit d'un paquet de données fournissant les ressources linguistiques
d'Apertium pour le tatar de Crimée.
|
|
apertium-crh-tur
données Apertium pour les traductions entre le tatar de Crimée et le turc
|
Versions of package apertium-crh-tur |
Release | Version | Architectures |
bullseye | 0.3.0-1 | all |
buster | 0.3.0~r83159-2 | all |
sid | 0.3.0-2 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre le tatar de Crimée et le turc.
|
|
apertium-cy-en
données linguistiques Apertium pour les traductions entre le gallois et l'anglais
|
Versions of package apertium-cy-en |
Release | Version | Architectures |
buster | 0.1.1~r57554-4 | all |
sid | 0.1.1~r57554-9 | all |
stretch | 0.1.1~r57554-3 | all |
bullseye | 0.1.1~r57554-7 | all |
upstream | 0.1.1 |
|
License: DFSG free
|
Ce paquet fournit un paquet linguistique pour le système de traduction
automatique par correspondances superficielles Apertium. Il permet de faire
des traductions entre le gallois et l'anglais.
|
|
apertium-dan
données linguistiques simples Apertium pour le danois
|
Versions of package apertium-dan |
Release | Version | Architectures |
stretch | 0.5.0~r67099-1 | all |
buster | 0.5.0~r67099-2 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
Apertium pour le danois.
|
|
apertium-dan-nor
données Apertium pour les traductions entre le danois et le norvégien
|
Versions of package apertium-dan-nor |
Release | Version | Architectures |
sid | 1.5.0-2 | all |
bookworm | 1.5.0-2 | all |
bullseye | 1.4.1-2 | all |
buster | 1.3.0~r67099-2 | all |
stretch | 1.3.0~r67099-1 | all |
trixie | 1.5.0-2 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des traductions entre le danois et les variantes Nynorsk et Bokmål du norvégien et entre le danois et le norvégien Nynorsk.
|
|
apertium-en-ca
paquet factice de transition pour apertium-eng-cat
|
Versions of package apertium-en-ca |
Release | Version | Architectures |
bookworm | 1.0.1-5 | all |
sid | 1.0.1-5 | all |
buster | 0.9.3~r61328-2 | all |
trixie | 1.0.1-5 | all |
stretch | 0.9.3~r61328-1 | all |
bullseye | 1.0.1-4 | all |
jessie | 0.8.9-1 | amd64,armel,armhf,i386 |
Debtags of package apertium-en-ca: |
culture | catalan |
field | linguistics |
role | app-data |
|
License: DFSG free
|
Il s'agit d'un paquet factice de transition. Il peut être supprimé en toute sécurité.
|
|
apertium-en-es
Transitional dummy package for apertium-eng-spa
|
Versions of package apertium-en-es |
Release | Version | Architectures |
bookworm | 0.8.1-2 | all |
stretch | 0.8.0~r57502-2 | all |
jessie | 0.6.0-1.1 | amd64,armel,armhf,i386 |
buster | 0.8.0~r57502-4 | all |
sid | 0.8.1-2 | all |
bullseye | 0.8.0~r57502-5 | all |
trixie | 0.8.1-2 | all |
Debtags of package apertium-en-es: |
culture | spanish |
field | linguistics |
role | app-data |
|
License: DFSG free
|
This is a transitional dummy package. It can safely be removed.
|
|
apertium-en-gl
données Apertium pour les traductions entre l'anglais et le galicien
|
Versions of package apertium-en-gl |
Release | Version | Architectures |
sid | 0.5.4-2 | all |
bookworm | 0.5.4-1 | all |
bullseye | 0.5.2~r57551-3 | all |
buster | 0.5.2~r57551-2 | all |
stretch | 0.5.2~r57551-1 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre l'anglais et le galicien.
|
|
apertium-eo-ca
données Apertium pour les traductions entre l'espéranto et le catalan
|
Versions of package apertium-eo-ca |
Release | Version | Architectures |
bookworm | 0.9.2-1 | all |
buster | 0.9.1~r60655-3 | all |
bullseye | 0.9.2-1 | all |
jessie | 0.9.0-1.1 | amd64,armel,armhf,i386 |
stretch | 0.9.1~r60655-1 | all |
sid | 0.9.2-1 | all |
trixie | 0.9.2-1 | all |
Debtags of package apertium-eo-ca: |
culture | catalan, esperanto |
field | linguistics |
role | app-data |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre l'espéranto et le catalan.
|
|
apertium-eo-en
données Apertium pour les traductions entre l'espéranto et l'anglais
|
Versions of package apertium-eo-en |
Release | Version | Architectures |
buster | 1.0.0~r63833-2 | all |
stretch | 1.0.0~r63833-1 | all |
sid | 1.0.2-1 | all |
bullseye | 1.0.0~r63833-3 | all |
bookworm | 1.0.2-1 | all |
|
License: DFSG free
|
Ce paquet fournit un paquet linguistique pour le système de traduction
automatique par correspondances superficielles Apertium. Il permet de faire
des traductions entre l'espéranto et l'anglais.
|
|
apertium-eo-es
données Apertium pour les traductions entre l'espéranto et l'espagnol
|
Versions of package apertium-eo-es |
Release | Version | Architectures |
bookworm | 0.9.2-1 | all |
sid | 0.9.2-1 | all |
trixie | 0.9.2-1 | all |
bullseye | 0.9.1~r60655-4 | all |
buster | 0.9.1~r60655-3 | all |
stretch | 0.9.1~r60655-1 | all |
jessie | 0.9.0-1.1 | amd64,armel,armhf,i386 |
Debtags of package apertium-eo-es: |
culture | esperanto, spanish |
field | linguistics |
role | app-data |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre l'espéranto et l'espagnol.
|
|
apertium-eo-fr
données Apertium pour les traductions entre l'espéranto et le français
|
Versions of package apertium-eo-fr |
Release | Version | Architectures |
buster | 0.9.0~r57551-2 | all |
trixie | 0.9.1-1 | all |
bookworm | 0.9.1-1 | all |
bullseye | 0.9.1-1 | all |
sid | 0.9.1-1 | all |
stretch | 0.9.0~r57551-1 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre l'espéranto et le français.
|
|
apertium-es-ast
paquet factice de transition pour apertium-spa-ast
|
Versions of package apertium-es-ast |
Release | Version | Architectures |
sid | 1.1.1-2 | all |
trixie | 1.1.1-2 | all |
bullseye | 1.1.0~r51165-3 | all |
stretch | 1.1.0~r51165-1 | all |
bookworm | 1.1.1-2 | all |
buster | 1.1.0~r51165-2 | all |
|
License: DFSG free
|
Il s'agit d'un paquet factice de transition. Il peut être supprimé en toute sécurité.
|
|
apertium-es-ca
paquet factice de transition pour apertium-spa-cat
|
Versions of package apertium-es-ca |
Release | Version | Architectures |
sid | 2.2.0-3 | all |
stretch | 1.2.1+svn~57448-4 | all |
jessie | 1.1.0-1.1 | amd64,armel,armhf,i386 |
bullseye | 2.2.0-2 | all |
bookworm | 2.2.0-3 | all |
trixie | 2.2.0-3 | all |
buster | 2.1.0~r79717-2 | all |
Debtags of package apertium-es-ca: |
culture | catalan, spanish |
field | linguistics |
role | app-data |
|
License: DFSG free
|
Il s’agit d’un paquet factice de transition. Il peut être supprimé en toute
sécurité.
|
|
apertium-es-gl
données Apertium pour les traductions entre l'espagnol et le galicien
|
Versions of package apertium-es-gl |
Release | Version | Architectures |
sid | 1.0.9-3 | all |
bookworm | 1.0.9-3 | all |
trixie | 1.0.9-3 | all |
jessie | 1.0.7-1 | amd64,armel,armhf,i386 |
stretch | 1.0.8~r57542-2 | all |
buster | 1.0.8~r57542-3 | all |
bullseye | 1.0.8~r57542-4 | all |
Debtags of package apertium-es-gl: |
culture | galician, spanish |
field | linguistics |
role | app-data |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre l'espagnol et le galicien.
|
|
apertium-es-it
paquet factice de transition pour apertium-spa-ita
|
Versions of package apertium-es-it |
Release | Version | Architectures |
sid | 0.2.1-3 | all |
bookworm | 0.2.1-3 | all |
buster | 0.2.0~r78826-2 | all |
stretch | 0.1.0~r51165-1 | all |
trixie | 0.2.1-3 | all |
bullseye | 0.2.0~r78826-2.1 | all |
|
License: DFSG free
|
Il s’agit d’un paquet factice de transition. Il peut être supprimé en toute
sécurité.
|
|
apertium-es-pt
données Apertium pour les traductions entre l'espagnol et le portugais
|
Versions of package apertium-es-pt |
Release | Version | Architectures |
sid | 1.1.6-1 | all |
trixie | 1.1.6-1 | all |
bookworm | 1.1.6-1 | all |
bullseye | 1.1.5+svn~57507-5 | all |
jessie | 1.0.3-2.1 | amd64,armel,armhf,i386 |
buster | 1.1.5+svn~57507-4 | all |
stretch | 1.1.5+svn~57507-3 | all |
Debtags of package apertium-es-pt: |
culture | esperanto, portuguese, spanish |
field | linguistics |
role | app-data |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre l'espagnol et le portugais.
|
|
apertium-es-ro
données Apertium pour les traductions entre l'espagnol et le roumain
|
Versions of package apertium-es-ro |
Release | Version | Architectures |
stretch | 0.7.3~r57551-2 | all |
buster | 0.7.3~r57551-3 | all |
sid | 0.7.5-1 | all |
bookworm | 0.7.5-1 | all |
jessie | 0.7.1-2.1 | amd64,armel,armhf,i386 |
bullseye | 0.7.3~r57551-4 | all |
Debtags of package apertium-es-ro: |
culture | romanian, spanish |
field | linguistics |
role | app-data |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre l'espagnol et le roumain.
|
|
apertium-eu-en
données Apertium pour les traductions entre le basque et l'anglais
|
Versions of package apertium-eu-en |
Release | Version | Architectures |
sid | 0.3.3-1 | all |
bookworm | 0.3.3-1 | all |
stretch | 0.3.1~r56205-1 | all |
buster | 0.3.1~r56205-2 | all |
bullseye | 0.3.1~r56205-3 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre le basque et l'anglais.
|
|
apertium-eu-es
données Apertium pour les traductions entre le basque et l'espagnol
|
Versions of package apertium-eu-es |
Release | Version | Architectures |
stretch | 0.3.3~r56159-2 | all |
jessie | 0.3.1-1 | amd64,armel,armhf,i386 |
buster | 0.3.3~r56159-3 | all |
bullseye | 0.3.3~r56159-4 | all |
bookworm | 0.3.4-1 | all |
trixie | 0.3.4-1 | all |
sid | 0.3.4-1 | all |
Debtags of package apertium-eu-es: |
culture | basque, spanish |
field | linguistics |
role | app-data |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre le basque et l'espagnol.
|
|
apertium-fr-ca
??? missing short description for package apertium-fr-ca :-(
|
Versions of package apertium-fr-ca |
Release | Version | Architectures |
jessie | 1.0.2-1 | amd64,armel,armhf,i386 |
stretch | 1.1.0~r64309-1 | all |
Debtags of package apertium-fr-ca: |
culture | catalan, french |
field | linguistics |
role | app-data |
|
License: DFSG free
|
|
|
apertium-fr-es
données Apertium pour les traductions entre le français et l'espagnol
|
Versions of package apertium-fr-es |
Release | Version | Architectures |
bookworm | 0.9.4-1 | all |
jessie | 0.9.0-1 | amd64,armel,armhf,i386 |
trixie | 0.9.4-1 | all |
buster | 0.9.2~r61322-3 | all |
stretch | 0.9.2~r61322-2 | all |
bullseye | 0.9.2~r61322-4 | all |
sid | 0.9.4-1 | all |
Debtags of package apertium-fr-es: |
culture | french, spanish |
field | linguistics |
role | app-data |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre le français et l'espagnol.
|
|
apertium-fra
données particulières d’Apertium pour le français
|
Versions of package apertium-fra |
Release | Version | Architectures |
buster | 1.5.0-1 | all |
stretch | 1.0.0~r65786-1 | all |
|
License: DFSG free
|
Il s'agit d'un paquet de données fournissant les ressources linguistiques
d’Apertium pour le français.
|
|
apertium-fra-cat
données Apertium pour les traductions entre le français et le catalan
|
Versions of package apertium-fra-cat |
Release | Version | Architectures |
trixie | 1.10.0-1 | all |
stretch | 1.1.0~r64309-1 | all |
buster | 1.5.0-1 | all |
bullseye | 1.9.0-1 | all |
bookworm | 1.10.0-1 | all |
sid | 1.10.0-1 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre le français et le catalan.
|
|
apertium-hbs
données simples Apertium pour le serbo-croate
|
Versions of package apertium-hbs |
Release | Version | Architectures |
buster | 0.5.0~r68212-3 | all |
stretch | 0.5.0~r68212-2 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
Apertium pour le serbo-croate.
|
|
apertium-hbs-eng
données Apertium pour les traductions entre le serbo-croate et l'anglais
|
Versions of package apertium-hbs-eng |
Release | Version | Architectures |
sid | 0.5.1-2 | all |
bullseye | 0.5.1-1 | all |
stretch | 0.1.0~r57598-1 | all |
bookworm | 0.5.1-2 | all |
buster | 0.1.0~r57598-2 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre le serbo-croate et l'anglais.
|
|
apertium-hbs-mkd
données Apertium pour les traductions entre le serbo-croate et le macédonien
|
Versions of package apertium-hbs-mkd |
Release | Version | Architectures |
buster | 0.1.0~r76450-2.1 | all |
bookworm | 0.1.1-1 | all |
trixie | 0.1.1-1 | all |
sid | 0.1.1-1 | all |
stretch | 0.1.0~r57554-1 | all |
bullseye | 0.1.0~r76450-4 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre le serbo-croate et le macédonien.
|
|
apertium-hbs-slv
données Apertium pour les traductions entre le serbo-croate et le slovénien
|
Versions of package apertium-hbs-slv |
Release | Version | Architectures |
bookworm | 0.5.1-2 | all |
bullseye | 0.5.1-1 | all |
trixie | 0.5.1-2 | all |
sid | 0.5.1-2 | all |
buster | 0.1.0~r59294-2 | all |
stretch | 0.1.0~r59294-1 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre le serbo-croate et le slovénien.
|
|
apertium-hin
données simples Apertium pour le hindi
|
Versions of package apertium-hin |
Release | Version | Architectures |
sid | 0.1.0~r59158-4 | all |
bullseye | 0.1.0~r59158-2.1 | all |
stretch | 0.1.0~r59158-1 | all |
bookworm | 0.1.0~r59158-4 | all |
buster | 0.1.0~r59158-2 | all |
upstream | 0.1.0 |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
Apertium pour le hindi.
|
|
apertium-id-ms
paquet factice de transition pour apertium-ind-zlm
|
Versions of package apertium-id-ms |
Release | Version | Architectures |
bookworm | 0.1.2-3 | all |
trixie | 0.1.2-3 | all |
bullseye | 0.1.2-3 | all |
buster | 0.1.1~r57551-2 | all |
stretch | 0.1.1~r57551-1 | all |
sid | 0.1.2-3 | all |
|
License: DFSG free
|
Il s'agit d'un paquet factice de transition. Il peut être supprimé en toute sécurité.
|
|
apertium-is-sv
Transitional dummy package for apertium-isl-swe
|
Versions of package apertium-is-sv |
Release | Version | Architectures |
stretch | 0.1.0~r56030-1 | all |
buster | 0.1.0~r76450-2 | all |
bullseye | 0.1.0~r76450-3 | all |
bookworm | 0.1.1-2 | all |
trixie | 0.1.1-2 | all |
sid | 0.1.1-2 | all |
|
License: DFSG free
|
This is a transitional dummy package. It can safely be removed.
|
|
apertium-isl
données simples Apertium pour l'islandais
|
Versions of package apertium-isl |
Release | Version | Architectures |
bullseye | 0.1.0~r65494-2.1 | all |
buster | 0.1.0~r65494-2 | all |
stretch | 0.1.0~r65494-1 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
Apertium pour l’islandais.
|
|
apertium-isl-eng
données Apertium pour les traductions entre l'islandais et l'anglais
|
Versions of package apertium-isl-eng |
Release | Version | Architectures |
bookworm | 0.1.2-1 | all |
bullseye | 0.1.0~r66083-3 | all |
stretch | 0.1.0~r66083-1 | all |
sid | 0.1.2-1 | all |
buster | 0.1.0~r66083-2 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre l'islandais et l'anglais.
|
|
apertium-ita
données simples Apertium pour l'italien
|
Versions of package apertium-ita |
Release | Version | Architectures |
bullseye | 0.10.0~r82237-2.1 | all |
stretch | 0.9.0~r72553-1 | all |
buster | 0.10.0~r82237-2 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
Apertium pour l’italien.
|
|
apertium-kaz
données simples Apertium pour le kazakh
|
Versions of package apertium-kaz |
Release | Version | Architectures |
stretch | 0.1.0~r61338-1 | all |
buster | 0.1.0~r61338-2 | all |
|
License: DFSG free
|
Il s'agit d'un paquet de données fournissant les ressources linguistiques
Apertium pour le kazakh.
|
|
apertium-kaz-tat
données Apertium pour les traductions entre le kazakh et le tatar
|
Versions of package apertium-kaz-tat |
Release | Version | Architectures |
sid | 0.2.1-1 | all |
bullseye | 0.2.1-1 | all |
buster | 0.2.1~r57554-2 | all |
stretch | 0.2.1~r57554-1 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre le kazakh et le tatar.
|
|
apertium-mk-bg
Transitional dummy package for apertium-mkd-bul
|
Versions of package apertium-mk-bg |
Release | Version | Architectures |
bullseye | 0.2.0~r49489-3 | all |
buster | 0.2.0~r49489-2 | all |
stretch | 0.2.0~r49489-1 | all |
sid | 0.2.1-2 | all |
bookworm | 0.2.1-2 | all |
trixie | 0.2.1-2 | all |
|
License: DFSG free
|
This is a transitional dummy package. It can safely be removed.
|
|
apertium-mk-en
Transitional dummy package for apertium-mkd-eng
|
Versions of package apertium-mk-en |
Release | Version | Architectures |
sid | 0.1.3-2 | all |
stretch | 0.1.1~r57554-1 | all |
buster | 0.1.1~r57554-2 | all |
bullseye | 0.1.1~r57554-3 | all |
bookworm | 0.1.3-2 | all |
trixie | 0.1.3-2 | all |
|
License: DFSG free
|
This is a transitional dummy package. It can safely be removed.
|
|
apertium-mlt-ara
données Apertium pour les traductions entre le maltais et l'arabe
|
Versions of package apertium-mlt-ara |
Release | Version | Architectures |
stretch | 0.2.0~r62623-1 | all |
bullseye | 0.2.0~r62623-2.1 | all |
buster | 0.2.0~r62623-2 | all |
sid | 0.2.0~r62623-3 | all |
upstream | 0.2.1 |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre le maltais et l'arabe.
|
|
apertium-nno
données linguistiques simples Apertium pour le norvégien Nynorsk
|
Versions of package apertium-nno |
Release | Version | Architectures |
buster | 0.9.0~r69513-3 | all |
stretch | 0.9.0~r69513-1 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
Apertium pour le norvégien Nynorsk.
|
|
apertium-nno-nob
données linguistiques Apertium pour les traductions entre le norvégien Nynorsk et le norvégien Bokmål
|
Versions of package apertium-nno-nob |
Release | Version | Architectures |
stretch | 1.1.0~r66076-1 | all |
sid | 1.5.0-1 | all |
trixie | 1.5.0-1 | all |
bookworm | 1.5.0-1 | all |
bullseye | 1.3.0-1 | all |
buster | 1.1.0~r66076-2 | all |
|
License: DFSG free
|
Il s'agit d'un paquet de données fournissant les ressources linguistiques
Apertium pour les traductions entre le norvégien Nynorsk et le norvégien
Bokmål.
|
|
apertium-nob
données linguistiques simples Apertium pour le norvégien Bokmål
|
Versions of package apertium-nob |
Release | Version | Architectures |
stretch | 0.9.0~r69513-1 | all |
buster | 0.9.0~r69513-2 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
Apertium pour le norvégien Bokmål.
|
|
apertium-oc-ca
données Apertium pour les traductions entre l'occitan et le catalan
|
Versions of package apertium-oc-ca |
Release | Version | Architectures |
stretch | 1.0.6~r57551-2 | all |
bookworm | 1.0.7-1 | all |
trixie | 1.0.7-1 | all |
sid | 1.0.7-1 | all |
buster | 1.0.6~r57551-3 | all |
bullseye | 1.0.6~r57551-4 | all |
jessie | 1.0.5-1.1 | amd64,armel,armhf,i386 |
Debtags of package apertium-oc-ca: |
culture | catalan |
field | linguistics |
role | app-data |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre l'occitan et le catalan.
|
|
apertium-oc-es
données Apertium pour les traductions entre l'occitan et l'espagnol
|
Versions of package apertium-oc-es |
Release | Version | Architectures |
buster | 1.0.6~r57551-3 | all |
stretch | 1.0.6~r57551-2 | all |
bookworm | 1.0.8-1 | all |
sid | 1.0.8-1 | all |
jessie | 1.0.5-1.1 | amd64,armel,armhf,i386 |
bullseye | 1.0.6~r57551-4 | all |
Debtags of package apertium-oc-es: |
culture | spanish |
field | linguistics |
role | app-data |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre l'occitan et l'espagnol.
|
|
apertium-oci
données particulières d’Apertium pour l’occitan
|
Versions of package apertium-oci |
Release | Version | Architectures |
buster | 0.1.0-1 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
d’Apertium pour l’occitan.
|
|
apertium-pol
données particulières d’Apertium pour le polonais
|
Versions of package apertium-pol |
Release | Version | Architectures |
buster | 0.1.1-1 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
d’Apertium pour le polonais.
|
|
apertium-pol-szl
données d’Apertium pour les traductions entre le polonais et le silésien
|
Versions of package apertium-pol-szl |
Release | Version | Architectures |
trixie | 0.2.1-3 | all |
bookworm | 0.2.1-3 | all |
sid | 0.2.1-3 | all |
bullseye | 0.2.1-2 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques d’Apertium pour faire des traductions entre le polonais et le silésien.
|
|
apertium-pt-ca
paquet factice de transition pour apertium-por-cat
|
Versions of package apertium-pt-ca |
Release | Version | Architectures |
jessie | 0.8.1-1 | amd64,armel,armhf,i386 |
trixie | 0.10.1-2 | all |
stretch | 0.8.2+svn~57507-3 | all |
sid | 0.10.1-2 | all |
buster | 0.8.2+svn~57507-4 | all |
bullseye | 0.10.0-1 | all |
bookworm | 0.10.1-2 | all |
Debtags of package apertium-pt-ca: |
culture | catalan, portuguese |
field | linguistics |
role | app-data |
|
License: DFSG free
|
Il sâagit dâun paquet factice de transition. Il peut être supprimé en toute
sécurité.
|
|
apertium-pt-gl
données Apertium pour les traductions entre le portugais et le galicien
|
Versions of package apertium-pt-gl |
Release | Version | Architectures |
jessie | 0.9.1-1 | amd64,armel,armhf,i386 |
stretch | 0.9.2~r57551-2 | all |
buster | 0.9.2~r57551-3 | all |
bullseye | 0.9.2~r57551-4 | all |
sid | 0.9.3-1 | all |
trixie | 0.9.3-1 | all |
bookworm | 0.9.3-1 | all |
Debtags of package apertium-pt-gl: |
culture | galician, portuguese |
field | linguistics |
role | app-data |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre le portugais et le galicien.
|
|
apertium-rus
données d’Apertium pour uniquement le russe
|
Versions of package apertium-rus |
Release | Version | Architectures |
buster | 0.2.0~r82706-1 | all |
|
License: DFSG free
|
Il s'agit d'un paquet de données fournissant les ressources linguistiques
d'Apertium pour le russe.
|
|
apertium-separable
réordonnancement de multimots séparables ou non contigus
|
Versions of package apertium-separable |
Release | Version | Architectures |
bullseye | 0.3.6-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bookworm | 0.6.1-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
sid | 0.6.1-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 0.6.1-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
buster | 0.3.2-1 | amd64,arm64,armhf,i386 |
|
License: DFSG free
|
Ce paquet fournit un module Apertium pour réordonner des multimots
séparables ou non contigus.
|
|
apertium-sme-nob
données Apertium pour les traductions entre le sámi et le bokmål
|
Versions of package apertium-sme-nob |
Release | Version | Architectures |
bullseye | 0.6.1+ds.1-2 | all |
buster | 0.6.0~r61921-2 | all |
stretch | 0.6.0~r61921-1 | all |
sid | 0.6.1+ds.1-2 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre le sámi et le bokmål.
|
|
apertium-spa
données simples Apertium pour l'espagnol
|
Versions of package apertium-spa |
Release | Version | Architectures |
stretch | 0.1.0~r65494-1 | all |
buster | 1.1.0~r79716-2 | all |
bullseye | 1.1.0~r79716-2.1 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
Apertium pour l’espagnol.
|
|
apertium-spa-arg
données Apertium pour les traductions entre l'espagnol et l'aragonais
|
Versions of package apertium-spa-arg |
Release | Version | Architectures |
sid | 0.6.0-2 | all |
stretch | 0.4.0~r64399-1 | all |
buster | 0.4.0~r64399-2 | all |
bullseye | 0.5.0-1 | all |
bookworm | 0.5.0-2 | all |
trixie | 0.6.0-2 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre l'espagnol et l'aragonais.
|
|
apertium-srd
données simples Apertium pour le sarde
|
Versions of package apertium-srd |
Release | Version | Architectures |
stretch | 0.9.0~r72792-1 | all |
buster | 1.2.0~r82994-2 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
Apertium pour le sarde.
|
|
apertium-srd-ita
données Apertium pour les traductions entre le sarde et l'italien
|
Versions of package apertium-srd-ita |
Release | Version | Architectures |
trixie | 1.3.0-1 | all |
bullseye | 1.1.0-1 | all |
bookworm | 1.1.0-2 | all |
buster | 0.9.5~r82237-2 | all |
stretch | 0.9.0~r72554-1 | all |
sid | 1.3.0-1 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre le sarde et l'italien.
|
|
apertium-swe
données linguistiques Apertium pour le suédois uniquement
|
Versions of package apertium-swe |
Release | Version | Architectures |
stretch | 0.7.0~r69513-1 | all |
buster | 0.7.0~r69513-2 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
Apertium pour le suédois.
|
|
apertium-swe-dan
données linguistiques Apertium pour les traductions entre le suédois et le danois
|
Versions of package apertium-swe-dan |
Release | Version | Architectures |
bookworm | 0.8.1-3 | all |
stretch | 0.7.0~r66063-1 | all |
buster | 0.7.0~r66063-2 | all |
sid | 0.8.1-3 | all |
bullseye | 0.8.1-2 | all |
trixie | 0.8.1-3 | all |
|
License: DFSG free
|
Il s'agit d'un paquet de données fournissant les ressources linguistiques
Apertium pour les traductions entre le suédois et le danois.
|
|
apertium-swe-nor
données Apertium pour les traductions entre le suédois et le norvégien
|
Versions of package apertium-swe-nor |
Release | Version | Architectures |
sid | 0.4.0-1 | all |
bookworm | 0.4.0-1 | all |
bullseye | 0.3.1-1 | all |
trixie | 0.4.0-1 | all |
buster | 0.2.0~r69544-2 | all |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre le suédois et le norvégien.
|
|
apertium-szl
données particulières d’Apertium pour le silésien
|
Versions of package apertium-szl |
Release | Version | Architectures |
buster | 0.1.0-1 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
d’Apertium pour le silésien.
|
|
apertium-tat
données simples Apertium pour le tatar
|
Versions of package apertium-tat |
Release | Version | Architectures |
buster | 0.1.0~r60887-2 | all |
stretch | 0.1.0~r60887-1 | all |
|
License: DFSG free
|
Il s'agit d'un paquet de données fournissant les ressources linguistiques
Apertium pour le tatar.
|
|
apertium-tur
données d’Apertium pour uniquement le turc
|
Versions of package apertium-tur |
Release | Version | Architectures |
buster | 0.2.0~r83161-2 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
d’Apertium pour le turc.
|
|
apertium-ukr
données d’Apertium pour uniquement l’ukrainien
|
Versions of package apertium-ukr |
Release | Version | Architectures |
buster | 0.1.0~r82563-2 | all |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
d’Apertium pour l’ukrainien.
|
|
apertium-urd
données simples Apertium pour l’ourdou
|
Versions of package apertium-urd |
Release | Version | Architectures |
stretch | 0.1.0~r61311-1 | all |
buster | 0.1.0~r61311-2 | all |
bullseye | 0.1.0~r61311-2.1 | all |
bookworm | 0.1.0~r61311-3 | all |
sid | 0.1.0~r61311-3 | all |
upstream | 0.1.0 |
|
License: DFSG free
|
Il s’agit d’un paquet de données fournissant les ressources linguistiques
Apertium pour l’ourdou.
|
|
apertium-urd-hin
données Apertium pour les traductions entre l'ourdou et le hindi
|
Versions of package apertium-urd-hin |
Release | Version | Architectures |
stretch | 0.1.0~r64379-1 | all |
sid | 0.1.0~r64379-4 | all |
bookworm | 0.1.0~r64379-4 | all |
bullseye | 0.1.0~r64379-2.1 | all |
buster | 0.1.0~r64379-2 | all |
upstream | 0.1.0 |
|
License: DFSG free
|
Ce paquet fournit les ressources linguistiques Apertium pour faire des
traductions entre l'ourdou et le hindi.
|
|
frogdata
|
Versions of package frogdata |
Release | Version | Architectures |
bullseye | 0.18-1 | all |
sid | 0.22-1 | all |
trixie | 0.22-1 | all |
bookworm | 0.18-2 | all |
jessie | 0.4-1 | all |
buster | 0.16-1 | all |
stretch | 0.13-1 | all |
|
License: DFSG free
|
Frog is a modular system integrating a morphosyntactic tagger, lemmatizer,
morphological analyzer, and dependency parser for the Dutch language.
This package provided necessary datafiles for running Frog.
Frog is a product of the Centre for Language and Speech Technology
(Radboud University, Nijmegen) and prior to that of ILK Research Group
(Tilburg University, The Netherlands) and the CLiPS Research Centre
(University of Antwerp, Belgium). It is currently maintained at the
KNAW Humanities Cluster.
|
|
libapache-opennlp-java
boîte à outils basée sur l'apprentissage automatique pour le traitement de textes en langage naturel
|
Versions of package libapache-opennlp-java |
Release | Version | Architectures |
bookworm | 2.1.0-1 | all |
sid | 2.4.0-1 | all |
trixie | 2.4.0-1 | all |
bullseye | 1.9.3-1 | all |
|
License: DFSG free
|
La bibliothèque OpenNLP d'Apache est une boîte à outils basée sur
l'apprentissage automatique pour le traitement de textes en langage
naturel. Il prend en charge les tâches communes de NLP, telles que la
tokenisation, la segmentation de phrase, l'étiquetage morpho-syntaxique,
l'extraction d'entités nommées, la segmentation, l'analyse et la résolution
de coréférences. Ces tâches sont généralement nécessaires pour construire
des services de traitement de texte plus évolués. OpenNLP comprend
également un apprentissage automatique basé sur le principe d'entropie
maximale et le perceptron.
|
|
libcg3-dev
Headers and shared files to develop using the CG-3 library
|
Versions of package libcg3-dev |
Release | Version | Architectures |
buster | 1.1.7-1 | amd64,arm64,armhf,i386 |
stretch | 0.9.9~r11624-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
sid | 1.4.6-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 1.4.6-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 1.3.9-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bullseye | 1.3.2-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
|
License: DFSG free
|
Development files to use the CG-3 API.
It is recommended to instrument the CLI tools instead of using this API.
See https://visl.sdu.dk/cg3.html for more documentation
|
|
libfasttext-dev
|
Versions of package libfasttext-dev |
Release | Version | Architectures |
sid | 0.9.2+ds-7 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bullseye | 0.9.2-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bookworm | 0.9.2+ds-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
trixie | 0.9.2+ds-7 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
|
License: DFSG free
|
fastText is a library for efficient learning of word representations
and sentence classification, which refers subword information to
enrich word vectors.
This package contains header files for development.
|
|
libfolia-dev
Implementation of the FoLiA document format (C++ headers)
|
Versions of package libfolia-dev |
Release | Version | Architectures |
jessie | 0.10-4.2 | amd64,armel,armhf,i386 |
stretch | 1.6-2 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
buster | 1.15-1 | amd64,arm64,armhf,i386 |
bullseye | 2.4-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bookworm | 2.4-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
trixie | 2.17-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
sid | 2.17-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
upstream | 2.20 |
Debtags of package libfolia-dev: |
devel | library |
role | devel-lib |
|
License: DFSG free
|
FoLiA is an XML-based format for Linguistic Annotation suitable for
representing written language resources such as corpora.
Its goal is to unify a variety of linguistic annotations in one single rich
format, without committing to any particular standard annotation set.
Instead, it seeks to accommodate any desired system or tagset, and so offer
maximum flexibility. This makes FoLiA language independent.
see https://proycon.github.io/folia for more information.
libfolia is a product of the Centre of Language and Speech Technology, Radboud
University Nijmegen (The Netherlands), it was previously developed at the ILK
Research Group, Tilburg University. Work on libfolia is funded by NWO, the
Netherlands Organisation for Scientific Research, in the scope of projects
like CLARIN-NL and CLARIAH.
This package provides the FoLiA header files required to compile C++ programs
that use libfolia and implements FoLiA v2.5.1.
|
|
libmbt-dev
memory-based tagger-generator and tagger - development
|
Versions of package libmbt-dev |
Release | Version | Architectures |
bookworm | 3.6-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bullseye | 3.6-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
buster | 3.4-1 | amd64,arm64,armhf,i386 |
sid | 3.10-3 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 3.10-3 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
Debtags of package libmbt-dev: |
devel | library |
role | devel-lib |
|
License: DFSG free
|
MBT is a memory-based tagger-generator and tagger in one. The tagger-generator
part can generate a sequence tagger on the basis of a training set of tagged
sequences; the tagger part can tag new sequences. MBT can, for instance, be
used to generate part-of-speech taggers or chunkers for natural language
processing.
MBT is a product of the Centre of Language and Speech Technology (Radboud
University Nijmegen, The Netherlands), the ILK Research Group (Tilburg
University, The Netherlands) and the CLiPS Research Centre (University
of Antwerp, Belgium).
If you do scientific research in natural language processing, MBT will
likely be of use to you.
This package provides the header files required to compile C++ programs that
use libmbt.
|
|
libopennlp-maxent-java
OpenNLP Maximum Entropy Package
|
Versions of package libopennlp-maxent-java |
Release | Version | Architectures |
trixie | 3.0.0+ds-2 | all |
bullseye | 3.0.0+ds-2 | all |
bookworm | 3.0.0+ds-2 | all |
sid | 3.0.0+ds-2 | all |
|
License: DFSG free
|
Maximum entropy is a powerful method for constructing statistical models of
classification tasks, such as part of speech tagging in Natural Language
Processing. Several example applications using maxent can be found in the
OpenNLP Tools Library.
|
|
libsentencepiece-dev
Header files of SentencePiece
|
Versions of package libsentencepiece-dev |
Release | Version | Architectures |
bullseye | 0.1.95-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
sid | 0.2.0-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 0.2.0-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 0.1.97-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
|
License: DFSG free
|
SentencePiece is an unsupervised text tokenizer/detokenizer mainly
designed for Neural Network-based text generation systems where the
vocabulary size is predetermined prior to the neural model training.
|
|
libticcutils-dev
utility functions used in the context of Natural Language Processing (headers)
|
Versions of package libticcutils-dev |
Release | Version | Architectures |
bookworm | 0.24-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
trixie | 0.34-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
buster | 0.20-1 | amd64,arm64,armhf,i386 |
sid | 0.34-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bullseye | 0.24-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
upstream | 0.35 |
Debtags of package libticcutils-dev: |
devel | library |
role | devel-lib |
|
License: DFSG free
|
The TiCC utils C++ library contains useful functions and other goodies for
general use in TiMBL and other parts of the TiCC software stack and beyond.
TiCC utils is a product of the Tilburg centre for Cognition and Communication
(Tilburg University, The Netherlands). If you do scientific research in
Natural Language Processing, TiCC software will likely be of use to you.
This package provides the header files required to compile C++ programs
that use libticcutils.
|
|
libticcutils2-dev
??? missing short description for package libticcutils2-dev :-(
|
Versions of package libticcutils2-dev |
Release | Version | Architectures |
jessie | 0.4-5.1 | amd64,armel,armhf,i386 |
stretch | 0.14-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
upstream | 0.35 |
Debtags of package libticcutils2-dev: |
devel | library |
role | devel-lib |
|
License: DFSG free
|
|
|
libtimbl-dev
Tilburg Memory Based Learner - development
|
Versions of package libtimbl-dev |
Release | Version | Architectures |
trixie | 6.9-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 6.5-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
buster | 6.4.13-1 | amd64,arm64,armhf,i386 |
bullseye | 6.5-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
sid | 6.9-2 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
Debtags of package libtimbl-dev: |
devel | library |
role | devel-lib |
|
License: DFSG free
|
The Tilburg Memory Based Learner, TiMBL, is a tool for Natural Language
Processing research, and for many other domains where classification tasks are
learned from examples. It is an efficient implementation of k-nearest neighbor
classifier.
TiMBL is a product of the Centre of Language and Speech Technology
(Radboud University, Nijmegen, The Netherlands), the ILK Research Group
(Tilburg University, The Netherlands) and the CLiPS Research Centre
(University of Antwerp, Belgium).
This package provides the TiMBL header files required to compile C++ programs
that use TiMBL.
|
|
libtimblserver-dev
Server extensions for Timbl - development
|
Versions of package libtimblserver-dev |
Release | Version | Architectures |
trixie | 1.18-3 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 1.14-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bullseye | 1.14-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
sid | 1.18-3 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
buster | 1.12-1 | amd64,arm64,armhf,i386 |
Debtags of package libtimblserver-dev: |
devel | library |
role | devel-lib |
|
License: DFSG free
|
timblserver is a TiMBL wrapper; it adds server functionality to TiMBL. It
allows TiMBL to run multiple experiments as a TCP server, optionally via HTTP.
The Tilburg Memory Based Learner, TiMBL, is a tool for Natural Language
Processing research, and for many other domains where classification tasks are
learned from examples.
TimblServer is a product of the ILK Research Group (Tilburg University, The
Netherlands) and the CLiPS Research Centre (University of Antwerp, Belgium).
This package provides the header files required to compile C++ programs that
use timblserver.
|
|
libucto-dev
Unicode Tokenizer - development
|
Versions of package libucto-dev |
Release | Version | Architectures |
buster | 0.14-2 | amd64,arm64,armhf,i386 |
jessie | 0.5.3-3.1 | amd64,armel,armhf,i386 |
bullseye | 0.21.1-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bookworm | 0.21.1-2 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
trixie | 0.30-3 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
stretch | 0.9.6-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
sid | 0.30-3 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
upstream | 0.34 |
Debtags of package libucto-dev: |
devel | library |
role | devel-lib |
|
License: DFSG free
|
Ucto can tokenize UTF-8 encoded text files (i.e. separate words from
punctuation, split sentences, generate n-grams), and offers several other
basic preprocessing steps that make your text suited for further processing
such as indexing, part-of-speech tagging, or machine translation.
This package provides C++ headers for the programming library.
Ucto was written by Maarten van Gompel and Ko van der Sloot. Work on Ucto
was funded by NWO, the Netherlands Organisation for Scientific Research,
under the Implicit Linguistics project, the CLARIN-NL program, and the
CLARIAH project.
Ucto is a product of the Centre of Language and Speech Technology (Radboud
University Nijmegen), the KNAW Humanities Cluster, and previously the ILK
Research Group (Tilburg University, The Netherlands).
If you are interested in machine parsing of UTF-8 encoded text files, e.g. to
do scientific research in natural language processing, ucto will likely be of
use to you.
|
|
python3-fasttext
fastText binding for Python3
|
Versions of package python3-fasttext |
Release | Version | Architectures |
bullseye | 0.9.2-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bookworm | 0.9.2+ds-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
sid | 0.9.2+ds-7 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 0.9.2+ds-7 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
|
License: DFSG free
|
fastText is a library for efficient learning of word representations
and sentence classification, which refers subword information to
enrich word vectors.
python3-fasttext is its binding for Python3.
|
|
python3-gensim
Python framework for fast Vector Space Modelling
|
Versions of package python3-gensim |
Release | Version | Architectures |
sid | 4.3.3+dfsg-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 4.2.0+dfsg-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
|
License: DFSG free
|
Gensim is a Python library for topic modelling, document indexing
and similarity retrieval with large corpora. The target audience
is the natural language processing (NLP) and information retrieval
(IR) community.
|
|
python3-nltk
bibliothèques de Python pour le traitement automatique des langues
|
Versions of package python3-nltk |
Release | Version | Architectures |
bookworm | 3.8-1 | all |
bullseye | 3.5-1 | all |
trixie | 3.9.1-2 | all |
sid | 3.9.1-2 | all |
stretch | 3.2.1-2 | all |
buster | 3.4-1 | all |
jessie | 3.0.0-1 | all |
|
License: DFSG free
|
NLTK (Natural Language Toolkit – traitement automatique des langues) est
une plateforme éminente pour construire des programmes en Python pour
travailler avec les données de langue humaine. Il fournit des interfaces
conviviales pour plus de 50 agrégats de texte et de ressources lexicales
tels que WordNet, avec une suite de bibliothèques de traitement de texte
pour la classification, l’analyse lexicale, la racinisation, l’étiquetage,
l’analyse syntaxique et le raisonnement sémantique.
Ce paquet fournit les modules pour Python3.
Please cite:
Steven Bird, Ewan Klein and Edward Loper:
(2009)
|
|
python3-sentencepiece
SentencePiece binding for Python3
|
Versions of package python3-sentencepiece |
Release | Version | Architectures |
bullseye | 0.1.95-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bookworm | 0.1.97-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
trixie | 0.2.0-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
sid | 0.2.0-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
|
License: DFSG free
|
SentencePiece is an unsupervised text tokenizer/detokenizer mainly
designed for Neural Network-based text generation systems where the
vocabulary size is predetermined prior to the neural model training.
python3-sentencepiece is its binding for Python3.
|
|
python3-snowballstemmer
Pure Python Snowball stemming library
|
Versions of package python3-snowballstemmer |
Release | Version | Architectures |
stretch | 1.2.1-1 | all |
trixie | 2.2.0-4 | all |
bookworm | 2.2.0-2 | all |
bullseye | 2.1.0-1 | all |
buster | 1.2.1-1 | all |
sid | 2.2.0-4 | all |
|
License: DFSG free
|
Snowball provides access to efficient algorithms for calculating a
"stemmed" form of a word. This is a form with most of the common
morphological endings removed; hopefully representing a common
linguistic base form. This is most useful in building search engines
and information retrieval software; for example, a search with stemming
enabled should be able to find a document containing "cycling" given the
query "cycles".
Snowball provides algorithms for several (mainly European) languages.
It also provides access to the classic Porter stemming algorithm for
English: although this has been superseded by an improved algorithm, the
original algorithm may be of interest to information retrieval
researchers wishing to reproduce results of earlier experiments.
This package contains the pure Python module that implements Snowball
algorithms. When python3-stemmer package (which contains the C extension)
is installed, it uses that extension instead of the pure Python code.
|
|
python3-streamparser
Python library to parse Apertium stream format
|
Versions of package python3-streamparser |
Release | Version | Architectures |
bullseye | 5.0.2-2 | all |
trixie | 5.0.2-2 | all |
sid | 5.0.2-2 | all |
bookworm | 5.0.2-2 | all |
buster | 5.0.2-1 | all |
|
License: DFSG free
|
This package provides Python 3 library, streamparser, to parse
Apertium stream format.
|
|
r-cran-nlp
Natural Language Processing Infrastructure for R
|
Versions of package r-cran-nlp |
Release | Version | Architectures |
stretch | 0.1-9-1 | all |
sid | 0.2-1-1 | all |
trixie | 0.2-1-1 | all |
bookworm | 0.2-1-1 | all |
bullseye | 0.2-1-1 | all |
buster | 0.2-0-1 | all |
stretch-backports | 0.2-0-1~bpo9+1 | all |
upstream | 0.3-0 |
|
License: DFSG free
|
Basic classes and methods for Natural Language Processing in R.
|
|
r-cran-tm
Text Mining functionality for R
|
Versions of package r-cran-tm |
Release | Version | Architectures |
buster | 0.7-6-1 | amd64,arm64,armhf,i386 |
sid | 0.7-14-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
trixie | 0.7-14-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 0.7-11-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bullseye | 0.7-8-1 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
stretch-backports | 0.7-6-1~bpo9+1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
stretch | 0.6-2-3 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
|
License: DFSG free
|
A framework for text mining applications within R.
|
|
tfdocgen
TiLP framework documentation generator
|
Versions of package tfdocgen |
Release | Version | Architectures |
sid | 1.0-4 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
jessie | 1.0-1 | amd64,armel,armhf,i386 |
trixie | 1.0-4 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x |
bookworm | 1.0-4 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
bullseye | 1.0-3 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x |
buster | 1.0-2 | amd64,arm64,armhf,i386 |
stretch | 1.0-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
Debtags of package tfdocgen: |
devel | docsystem |
role | program |
|
License: DFSG free
|
The tfdocgen program is a program used by the libti2 libraries to generate
their HTML documentation from sources and misc files. You don't need this
package unless you want to develop on the libti2 libraries.
|
|
Debian packages in experimental
sequitur-g2p
Grapheme to Phoneme conversion tool
|
Versions of package sequitur-g2p |
Release | Version | Architectures |
experimental | 0+r1668.r3-1 | amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x |
|
License: DFSG free
|
Sequitur G2P is a data-driven grapheme-to-phoneme converter. It can
be applied to any monotonous sequence translation problem, provided
the source and target alphabets are small (less than 255
symbols). Data-driven means that you need to train it with example
pronunciations. Training takes a pronunciation dictionary and
creates a model file. The model file can then be used to transcribe
words that where not in the dictionary.
|
|
Packaging has started and developers might try the packaging code in VCS
spacy
Industrial-strength Natural Language Processing (NLP)
|
Versions of package spacy |
Release | Version | Architectures |
VCS | 2.2.3-1 | all |
|
License: MIT
Debian package not available
Version: 2.2.3-1
|
spaCy is a library for advanced Natural Language Processing in Python
and Cython. It’s built on the very latest research, and was designed
from day one to be used in real products. spaCy comes with pre-trained
statistical models and word vectors, and currently supports tokenization
for 30+ languages. It features the fastest syntactic parser in the
world, convolutional neural network models for tagging, parsing and
named entity recognition and easy deep learning integration.
|
travatar
tree based machine translation toolkit
|
Versions of package travatar |
Release | Version | Architectures |
VCS | 0.1.0+git20131221-1 | all |
|
License: LGPL-3.0+
Debian package not available
Version: 0.1.0+git20131221-1
|
Travatar is tree based statistical machine translation system containing
Tree-to-String (T2S) and Forest-to-String (F2S).
Tree based translation uses syntax trees of natural language and it's
particularly effective for language pairs that require a large amount of
reordering, such as English-Japanese translation.
|
No known packages available but some record of interest (WNPP bug)
Python bindings for the Tilburg Memory Based Learner (Timbl)
|
|
License: unknown
Debian package not available
|
python-timbl is a Python extension module wrapping the full TiMBL C++
programming interface. With this module, all functionality exposed
through the C++ interface is also available to Python scripts. Being
able to access the API from Python greatly facilitates prototyping
TiMBL-based applications.
TiMBL is an open source software package implementing several
memory-based learning algorithms, among which IB1-IG, an
implementation of k-nearest neighbor classification with feature
weighting suitable for symbolic feature spaces, and IGTree, a
decision-tree approximation of IB1-IG. All implemented algorithms have
in common that they store some representation of the training set
explicitly in memory. During testing, new cases are classified by
extrapolation from the most similar stored cases.
The Python module offers both a high-level as well as a low-level
interface, the former is very Pythonic and easy to use while the
latter offers the full API.
|
No known packages available
wnsqlbuilder
SQL version of WordNet 3.0
|
|
License: GPL
Debian package not available
|
WordNet SQL Builder is a Java utility to generate SQL database from
WordNet standard database as released by the WordNet Project (Princeton
University)
Features
- Support for MySql and PostGreSQL.
- Complete port (however, orphaned morphological forms are dropped, and
so are VerbNet/XWordNet data that cannot be linked to WordNet entries).
- Incremental build support.
- Retains synset index as primary key allowing easy reference to wordnet
original database
- Includes support for WordNet 3.0
- Includes support for WordNet 2.0 to 2.1, 2.1 to 3.0, 2.0 to 3.0 sense maps
- Includes support for VerbNet 2.3
- Includes support for XWordNet 2.0-1.1
- Ready-to-use database (see wnsqldatabase package in download section) including
- WordNet 3.0
- WordNet 2.0 to 2.1, 2.1 to 3.0, 2.0 to 3.0 sense maps
- VerbNet 2.3
- XWordNet 2.0-1.1
- British National Corpus statistical data (for commonly used-words)
|
|