Debian Med Project
Help us to see Debian used by medical practitioners and biomedical researchers! Join us on the Salsa page.
Summary
Biology
paquets de bio-informatique de Debian Med

Ce métapaquet installera des paquets Debian utiles en biologie moléculaire, biologie structurale et d’autres sciences biologiques.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Med to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Med mailing list

Links to other tasks

Debian Med Biology packages

Official Debian packages with high relevance

abacas
fermeture d'espaces dans des alignements génomiques depuis des lectures courtes
Versions of package abacas
ReleaseVersionArchitectures
bullseye1.3.1-9all
bookworm1.3.1-9all
sid1.3.1-9all
jessie1.3.1-2all
buster1.3.1-5all
trixie1.3.1-9all
stretch1.3.1-3all
Debtags of package abacas:
roleprogram
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ABACAS (« Algorithm Based Automatic Contiguation of Assembled Sequences ») est un programme qui permet de rapidement « contiguer » (aligner, trier, orienter), visualiser et concevoir des « primers » avec des espaces restreints ou des « contigs » assemblés au fusil à pompe, basé sur des séquences de référence.

ABACAS utilise MUMmer pour trouver les positions d'alignements et pour identifier dans les références les synténies de contigs assemblés. La sortie est ensuite analysée pour générer une pseudomolécule, en prenant en compte le recouvrement et les espaces entre contigs. ABACAS génère un fichier de comparaison qui peut être utilisé pour visualiser les contigs triés et orientés en ACT. La synthénie est représentée par des barres rouges dans lesquelles l'intensité décroit avec le pourcentage de similitude entre les blocs comparables. Les informations sur les contigs comme l'orientation, le pourcentage d'identité, la couverture et le recouvrement d'autres contigs peuvent également être visualisées en chargeant le fichier de fonctionnalité de sortie sur ACT.

The package is enhanced by the following packages: abacas-examples
Please cite: Samuel Assefa, Thomas M. Keane, Thomas D. Otto, Chris Newbold and Matthew Berriman: ABACAS: algorithm-based automatic contiguation of assembled sequences. (PubMed,eprint) Bioinformatics 25(15):1968-1969 (2009)
Topics: Probes and primers
abpoa
adaptive banded Partial Order Alignment
Versions of package abpoa
ReleaseVersionArchitectures
sid1.5.1-1amd64,arm64,ppc64el
trixie1.5.1-1amd64,arm64,ppc64el
bookworm1.4.1-3amd64,arm64,ppc64el
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

abPOA is an extended version of Partial Order Alignment (POA) that performs adaptive banded dynamic programming (DP) with an SIMD implementation. abPOA can perform multiple sequence alignment (MSA) on a set of input sequences and generate a consensus sequence by applying the heaviest bundling algorithm to the final alignment graph.

abPOA can generate high-quality consensus sequences from error-prone long reads and offer significant speed improvement over existing tools.

abPOA supports three alignment modes (global, local, extension) and flexible scoring schemes that allow linear, affine and convex gap penalties. It right now supports SSE2/SSE4.1/AVX2 vectorization.

For more information please refer to the paper1 published in Bioinformatics.

Please cite: Yan Gao, Yongzhuang Liu, Yanmei Ma, Bo Liu, Yadong Wang and Yi Xing: abPOA: an SIMD-based C library for fast partial order alignment using adaptive band. Bioinformatics 37(15):2209–2211 (2021)
abyss
assembleur de séquences de novo parallèles pour les lectures courtes
Versions of package abyss
ReleaseVersionArchitectures
bullseye2.2.5+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.0.2-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1.5-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports2.1.5-7~bpo9+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.5.2-1 (non-free)amd64
bookworm2.3.5+dfsg-2amd64,arm64,mips64el,ppc64el,s390x
trixie2.3.7-3amd64,arm64,mips64el,ppc64el
sid2.3.7-3amd64,arm64,mips64el,ppc64el,riscv64
Debtags of package abyss:
roleprogram
Popcon: 3 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

ABySS est un assembleur de séquences de novo parallèles conçu pour les lectures courtes. Il peut servir à assembler des données de séquences de génome ou de transcriptome. La parallélisation est permise par MPI, OpenMP et pthread.

Please cite: Shaun D. Jackman, Benjamin P. Vandervalk, Hamid Mohamadi, Justin Chu, Sarah Yeo, S. Austin Hammond, Golnaz Jahesh, Hamza Khan, Lauren Coombe, Rene L. Warren and İnanç Birol: "ABySS 2.0: resource-efficient assembly of large genomes using a Bloom filter". (PubMed,eprint) Genome Research 27(5):768-777 (2017)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence assembly
acedb-other
Récupération d'ADN ou de séquences de protéines
Versions of package acedb-other
ReleaseVersionArchitectures
buster4.9.39+dfsg.02-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm4.9.39+dfsg.02-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.9.39+dfsg.02-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.9.39+dfsg.02-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie4.9.39+dfsg.01-5amd64,armel,armhf,i386
stretch4.9.39+dfsg.02-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye4.9.39+dfsg.02-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package acedb-other:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
scopeutility
Popcon: 1 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet rassemble toutes les petites applications qu'acedb regroupe sous la cible « other » de son Makefile.

efetch: vraisemblablement le raccourci pour « entry fetch » (collecteur d'entrées en base de données), assemble les informations de séquence des principales bases de données d'ADN et de protéines.

Please cite: L. D. Stein and J. Thierry-Mieg: AceDB: a genome database management system. Computing in Science and Engineering 1(3):44-52 (1999)
Registry entries: Bio.tools 
adapterremoval
découpe d'adaptateur rapide, identification et fusion de lectures de séquences de gènes
Versions of package adapterremoval
ReleaseVersionArchitectures
bookworm2.3.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.3.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.3.3-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.3.3-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.2.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch2.2.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ce programme recherche et supprime des vestiges de séquences d'adaptateur de données HTS (« High Throughput Sequencing ») et découpe (optionnellement) les bases de mauvaise qualité des extrémités 3' des lectures suivant la suppression de l'adaptateur. AdapterRemoval peut analyser à la fois des données « single end » et « paired end » et peut servir à fusionner des lectures « paired end » se chevauchant en des séquences de consensus (plus longues). De plus, AdapterRemoval peut servir à récupérer une séquence d'adaptateur de consensus pour les données « paired end » pour lesquelles cette information n'est pas disponible.

The package is enhanced by the following packages: multiqc
Please cite: Mikkel Schubert, Stinus Lindgreen and Ludovic Orlando: AdapterRemoval v2: rapid adapter trimming, identification, and read merging. (PubMed,eprint) BMC Research Notes 9:88 (2016)
Registry entries: SciCrunch 
adun-core
simulateur moléculaire
Versions of package adun-core
ReleaseVersionArchitectures
stretch0.81-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.81-13amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.81-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.81-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.81-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.81-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 12 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Adun est un simulateur bio-moléculaire qui inclut aussi une gestion des données et des capacités d'analyse. Il a été développé au « Computational Biophysics and Biochemistry Laboratory », qui fait partie de l'unité de recherche sur l'informatique biomédicale de l'UPF.

Ce paquet fournit le programme AdunCore et le serveur Adun. L'installation du paquet adun.app est nécessaire pour utiliser l'interface graphique.

Please cite: Michael A. Johnston, Ignacio Fdez. Galván and Jordi Villà-Freixa: Framework-based design of a new all-purpose molecular simulation application: The Adun simulator. (PubMed) J. Comp. Chem. 26(15):1647-1659 (2005)
aegean
boîte d’amalgame d’outils d'analyse de génome
Versions of package aegean
ReleaseVersionArchitectures
stretch0.15.2+dfsg-1amd64,arm64,armel,armhf,i386,mipsel,ppc64el,s390x
bookworm0.16.0+dfsg-2amd64,arm64,armel,armhf,i386,mipsel,ppc64el,s390x
trixie0.16.0+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
buster0.16.0+dfsg-1amd64,arm64,armel,armhf,i386,mipsel,ppc64el,s390x
bullseye0.16.0+dfsg-2amd64,arm64,armel,armhf,i386,mipsel,ppc64el,s390x
sid0.16.0+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

La boîte à outils AEGeAn est conçue pour analyser et évaluer des annotations du génome. Elle comprend une variété de programmes d'analyse, par exemple pour comparer des ensembles distincts d'annotations de structure de gènes (ParsEval), le calcul d'emplacement de gènes (LocusPocus) et plus.

Please cite: Daniel S Standage and Volker P Brendel: ParsEval: parallel comparison and analysis of gene structure annotations.. (PubMed,eprint) BMC Bioinformatics 13(1):187 (2012)
Topics: Sequencing
aevol
modèle numérique de génétique pour lancer des expériences d'évolution in silico
Versions of package aevol
ReleaseVersionArchitectures
stretch4.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid5.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie5.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm5.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye5.0+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster5.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie4.4-1amd64,armel,armhf,i386
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Aevol est un modèle numérique de génétique : des populations d'organismes numériques sont assujetties à un processus de sélection et de variation, qui crée une dynamique Darwinienne.

En modifiant les caractéristiques de sélection (par exemple, la taille de la population, le type d'environnement, les variations environnementales) ou de variation (par exemple, les taux de mutation, les taux de réarrangement chromosomique, les types de réarrangement, le transfert horizontal), on peut étudier expérimentalement l'impact de ces paramètres sur la structure d'organismes évolués. En particulier, puisque Aevol intègre un modèle de génome précis et réaliste, il permet l'étude de variations structurelles du génome (par exemple, le nombre de gènes, la synténie, la proportion de séquences de codage).

La plate-forme de simulation est livrée avec un ensemble d'outils pour l'analyse des phylogénies et la mesure de plusieurs caractéristiques des organismes et populations au cours de l'évolution.

Please cite: Dusan Misevic, Antoine Frenoy, David P. Parsons and Francois Taddei: Effects of public good properties on the evolution of cooperation. (eprint) :218-225 (2012)
alien-hunter
Distribution des motifs d'ordre variable (IVOM) pour identifier l'ADN acquis par transfert horizontal
Versions of package alien-hunter
ReleaseVersionArchitectures
jessie1.7-3all
bookworm1.7-10all
trixie1.7-10all
buster1.7-7all
stretch1.7-5all
sid1.7-10all
bullseye1.7-8all
Debtags of package alien-hunter:
fieldbiology, biology:structural
roleprogram
scopeutility
useanalysing
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Alien_hunter est une application pour la détection des gènes acquis par transfert horizontal grâce au programme IVOM (Interpolated Variable Order Motifs). IVOM identifie des biais compositionnels en utilisant la distribution des motifs d’ordre variable et capture la composition d'une séquence locale de manière plus fiable que les méthodes à ordre fixe. Les régions prédites peuvent aussi être analysées dans un HMM (Hidden Markov Model) à deux états et du second ordre, avec un algorithme de détection du points de changement, pour optimiser la localisation des liaisons des régions prédites. Les prédictions (au format embl) peuvent être chargées automatiquement dans l'afficheur de génome Artemis, disponible gratuitement sur : http://www.sanger.ac.uk/Software/Artemis/.

Please cite: Georgios S. Vernikos and Julian Parkhill: Interpolated variable order motifs for identification of horizontally acquired DNA: revisiting the Salmonella pathogenicity islands. (PubMed,eprint) Bioinformatics 22(18):2196-2203 (2006)
Registry entries: SciCrunch 
alter-sequence-alignment
environnement de transformation d'alignements de séquences génomiques
Versions of package alter-sequence-alignment
ReleaseVersionArchitectures
trixie1.3.4-7all
sid1.3.4-7all
bookworm1.3.4-6all
bullseye1.3.4-4all
buster1.3.4-2all
stretch1.3.3+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ALTER (« ALignment Transformation EnviRonment ») est un outil de conversion entre plusieurs formats d'alignement de séquences. ALTER se concentre sur les spécifications des programmes répandus d'alignement et d'analyse plutôt que sur la conversion entre des formats plus ou moins spécifiques.

Please cite: Daniel Glez-Peña, Daniel Gómez-Blanco, Miguel Reboiro-Jato, Florentino Fdez-Riverola and David Posada: ALTER: program-oriented conversion of DNA and protein alignments". (PubMed,eprint) Nucl. Acids Res. 38(suppl 2):W14-W18 (2010)
Registry entries: Bio.tools  SciCrunch 
altree
programme pour faire de l'association basée sur la phylogénétique et l'analyse de localisation
Versions of package altree
ReleaseVersionArchitectures
bullseye1.3.1-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.3.1-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.3.1-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.3.1-2amd64,armel,armhf,i386
sid1.3.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.3.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.3.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package altree:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram, shared-lib
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 3 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

ALTree est conçu pour la détection d'association et de localisation de sites susceptibles en utilisant des arbres phylogénétiques haplotypes : tout d'abord il permet une détection d'une association entre le gène candidat et la maladie, puis de faire des hypothèses sur les loci susceptibles.

Please cite: Claire Bardel, Vincent Danjean and Emmanuelle Genin: ALTree: association detection and localization of susceptibility sites using haplotype phylogenetic trees. (PubMed,eprint) Bioinformatics 22(11):1402-1403 (2006)
Registry entries: SciCrunch 
amap-align
alignement multiple de séquences protéiques par appariement
Versions of package amap-align
ReleaseVersionArchitectures
jessie2.2-4amd64,armel,armhf,i386
stretch2.2-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.2+git20080214.600fc29+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package amap-align:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 27 users (14 upd.)*
Versions and Archs
License: DFSG free
Git

AMAP est un outil en ligne de commande pour effectuer des alignements multiples de séquences peptidiques. Il utilise le décodage a posteriori, et l'alignement par appariement de séquence, au lieu de la méthode traditionnelle d'alignement progressif. C'est le seul programme permettant le contrôle de la sensibilité et de la spécificité. Il est basé sur le code source de ProbCons mais utilise une métrique de précision et élimine la transformation de cohérence.

L'outil Java de visualisation d’AMAP 2.2 n'est pas encore disponible dans Debian.

Please cite: Ariel S. Schwartz and Lior Pachter: Multiple alignment by sequence annealing. (eprint) Bioinformatics 23(2):e24-e29 (2007)
Registry entries: SciCrunch  Bioconda 
Remark of Debian Med team: Dead upstream

The homepage of this project vanished as well as the Download area. An old unmaintained version remained at code.google.com. Please drop the maintainer a note if you have any news of this project.

ampliconnoise
suppression du bruit pour les amplicons PCR séquencés 454
Versions of package ampliconnoise
ReleaseVersionArchitectures
buster1.29-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.29-2amd64,armel,armhf,i386
bullseye1.29-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.29-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.29-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.29-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.29-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package ampliconnoise:
roleprogram
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

AmpliconNoise est un ensemble d'applications pour nettoyer les données de séquences haute fréquence. Il est constitué de trois parties principales :

  • Pyronnoise : rassemble les mauvais points en se basant sur un diagramme de flux ;
  • SeqNoise : enlève les mutations de point PCR ;
  • Perseus : enlève les chimères PCR sans avoir besoin d'un ensemble de séquences de références.
Please cite: Christopher Quince, Anders Lanzen, Russell J Davenport and Peter J Turnbaugh: Removing Noise From Pyrosequenced Amplicons. (PubMed,eprint) BMC Bioinformatics 12:38 (2011)
Registry entries: Bio.tools  SciCrunch 
Topics: Sequencing
andi
estimation efficace de distances d'évolution
Versions of package andi
ReleaseVersionArchitectures
bullseye0.13-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.12-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0.10-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.14-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.14-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.14-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le programme andi sert à estimer la distance évolutionnaire entre des génomes très proches. Ces distances peuvent être utilisées pour inférer rapidement les phylogénies pour de grands ensembles de génomes. Comme andi ne calcule pas d'alignements complets, il est si efficace qu'il fonctionne jusqu'à des milliers de génomes bactériens.

Please cite: Bernhard Haubold, Fabian Klötzl and Peter Pfaffelhuber: andi: Fast and accurate estimation of evolutionary distances between closely related genomes. (PubMed,eprint) Bioinformatics 31(8):1169-1175 (2015)
Registry entries: Bio.tools  Bioconda 
Topics: Phylogenetics
anfo
aligneur/mappeur de lectures courtes à partir de MPG
Versions of package anfo
ReleaseVersionArchitectures
buster0.98-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.98-4amd64,armel,armhf,i386
sid0.98-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.98-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.98-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Anfo est un mappeur dans l'esprit de Soap/Maq/Bowtie, mais sa mise en œuvre relève plus de BLAST/BLAT. Il est plus utile pour l'alignement de séquences de lectures où la séquence ADN est quelque peu modifiée (pensez à de l'ADN ancien ou au traitement au bisulfite) et/ou il existe plus de divergence entre l'échantillon et la référence, que ces mappeurs rapides géreront avec élégance (considérant que le génome de référence est manquant, une variante proche est utilisée en lieu et place).

Registry entries: SciCrunch 
Topics: Sequencing
any2fasta
convert various sequence formats to FASTA
Versions of package any2fasta
ReleaseVersionArchitectures
sid0.4.2-2all
trixie0.4.2-2all
bookworm0.4.2-2all
Popcon: 0 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Established tools like readseq and seqret from EMBOSS, both create mangled IDs containing | or . characters, and there is no way to fix this behaviour. This resultes in inconsitences between .gbk and .fna versions of files in pipelines.

This script uses only core Perl modules, has no other dependencies like Bioperl or Biopython, and runs very quickly.

It supports the following input formats:

 1. Genbank flat file, typically .gb, .gbk, .gbff (starts with LOCUS)
 2. EMBL flat file, typically .embl, (starts with ID)
 3. GFF with sequence, typically .gff, .gff3 (starts with ##gff)
 4. FASTA DNA, typically .fasta, .fa, .fna, .ffn (starts with >)
 5. FASTQ DNA, typically .fastq, .fq (starts with @)
 6. CLUSTAL alignments, typically .clw, .clu (starts with CLUSTAL or MUSCLE)
 7. STOCKHOLM alignments, typically .sth (starts with # STOCKHOLM)
 8. GFA assembly graph, typically .gfa (starts with ^[A-Z]\t)

Files may be compressed with:

 1. gzip, typically .gz
 2. bzip2, typically .bz2
 3. zip, typically .zip
Registry entries: Bioconda 
aragorn
détection ARNt et ARNtm dans les séquences de nucléotides
Versions of package aragorn
ReleaseVersionArchitectures
bullseye1.2.38-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.41-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.41-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie1.2.36-4amd64,armel,armhf,i386
bookworm1.2.38-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.2.38-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.2.38-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le programme utilise des algorithmes heuristiques pour prédire les structures secondaires d'ARNt, basés sur l'homologie avec des séquences consensus d'ARNt reconnues et sur la faculté de former des paires de base en feuille de trèfle. Les gènes ARNtm sont identifiés en utilisant une version modifiée du programme BRUCE.

Please cite: Dean Laslett and Bjorn Canback: ARAGORN, a program to detect tRNA genes and tmRNA genes in nucleotide sequences. (PubMed,eprint) Nucleic Acids Research 32(1):11-16 (2004)
Registry entries: SciCrunch  Bioconda 
Topics: Functional, regulatory and non-coding RNA
arden
contrôle de spécificité pour les alignements de lecture utilisant une référence artificielle
Versions of package arden
ReleaseVersionArchitectures
bullseye1.0-5all
jessie1.0-1amd64,armel,armhf,i386
sid1.0-5all
trixie1.0-5all
stretch1.0-3all
buster1.0-4all
bookworm1.0-5all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ARDEN (estimation de faux positifs dans des données NGS déterminée par référence artificielle) est un étalonnage novateur qui estime les taux d'erreur basés sur des lectures expérimentales réelles et un génome de référence artificiel généré en supplément. Il permet le calcul de taux d'erreur spécifiquement pour un ensemble de données et la construction d'une courbe ROC. Toutefois, il peut être utilisé pour optimiser des paramètres pour des mappeurs de lecture, pour sélectionner des mappeurs de lecture pour un problème spécifique mais aussi pour filtrer des alignements basés sur une estimation de qualité.

Please cite: Sven H. Giese, Franziska Zickmann and Bernhard Y. Renard: Specificity control for read alignments using an artificial reference genome-guided false discovery rate. (PubMed,eprint) Bioinformatics 30(1):9-16 (2013)
Registry entries: SciCrunch 
Topics: Sequencing
ariba
identification de résistance antibiotique par assemblage
Versions of package ariba
ReleaseVersionArchitectures
sid2.14.7+ds-2amd64,arm64,mips64el,ppc64el,riscv64
stretch2.6.1+ds-1amd64
bookworm2.14.6+ds-5amd64,arm64,mips64el,ppc64el
bullseye2.14.6+ds-1amd64,arm64,mips64el,ppc64el
buster2.13.3+ds-1amd64
stretch-backports2.13.3+ds-1~bpo9+1amd64
Popcon: 3 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

ARIBA est un outil identifiant les gènes de résistance antibiotique en lançant des assemblages locaux. L'entrée est un fichier FASTA de gènes de référence et de lectures de séquençages appairés. ARIBA rapporte les gènes de référence trouvés ainsi que des informations supplémentaires sur la qualité des assemblages et de toutes les variantes entre les lectures de séquençage et les gènes de référence.

Please cite: Martin Hunt, Alison E. Mather, Leonor Sanchez-Buso, Andrew J. Page, Julian Parkhill, Jacqueline A. Keane and Simon R. Harris: ARIBA: rapid antimicrobial resistance genotyping directly from sequencing reads. (PubMed,eprint) Microbial Genomics 3 (2017)
Registry entries: SciCrunch  Bioconda 
art-nextgen-simulation-tools
outils de simulation pour créer des lectures de séquençage synthétiques de nouvelle génération
Versions of package art-nextgen-simulation-tools
ReleaseVersionArchitectures
bookworm20160605+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye20160605+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid20160605+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie20160605+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch20160605+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster20160605+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ART est un ensemble d'outils de simulation pour créer des lectures de séquençage synthétiques de nouvelle génération. ART simule les lectures de séquençages en imitant le vrai processus de séquençage avec des modèles d'erreur empiriques ou des profils de qualité établis à partir de grandes données de séquençage recalibrées. ART peut également simuler les lectures grâce à un modèle d'erreur de lecture ou des profils de qualité fournis par l'utilisateur. ART prend en charge la simulation de lecture « single end », « paired-end » ou « mate-pair » des trois principales plateformes commerciales de séquençage de nouvelle génération : Solexa d'Illumina, 454 de Roche et SOLiD d'Applied Biosystems. Art peut servir à tester ou évaluer diverses méthodes ou outils pour l'analyse de données de séquençage de nouvelle génération, dont l'alignement de lectures, l'assemblage de novo et la découverte de variations SNP et de structures. ART a servi en tant qu'outil principal pour l'étude de simulation du projet « 1000 Genomes ». ART est implémenté en C++ avec des algorithmes optimisés et est très efficace dans la simulation de lecture. ART produit des lectures au format FASTQ et des alignements au format ALN. ART peut aussi créer des alignements au format d'alignement SAM ou au format UCSC BED. ART peut être utilisé conjointement avec des simulateurs de variantes de génome comme VarSim pour évaluer les outils ou méthodes d'appel de variante.

Please cite: Weichun Huang, Leping Li, Jason R. Myers and Gabor T. Marth: ART: a next-generation sequencing read simulator. (PubMed,eprint) Bioinformatics 28(4):593-594 (2012)
Registry entries: SciCrunch  Bioconda 
artemis
navigateur de génome et outil d'annotation
Versions of package artemis
ReleaseVersionArchitectures
stretch16.0.17+dfsg-1all
sid18.2.0+dfsg-3all
bookworm18.2.0+dfsg-3all
bullseye18.1.0+dfsg-3amd64
buster17.0.1+dfsg-2amd64
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Artemis est un navigateur de génome et un outil d'annotation qui permet de visualiser des caractéristiques de séquence, des données de nouvelle génération et les résultats d'analyses dans le contexte de la séquence, et la traduction six-frame de la séquence.

Ce paquet fournit le navigateur de génome Artemis, l'outil de comparaison Artemis (ACT) et les outils DNAplotter et BamView.

Please cite: Tim Carver, Simon R. Harris, Matthew Berriman, Julian Parkhill and Jacqueline A. McQuillan: Artemis: an integrated platform for visualization and analysis of high-throughput sequence-based experimental data. (PubMed,eprint) Bioinformatics 28(4):464-469 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
Screenshots of package artemis
artfastqgenerator
création de fichiers FASTQ artificiels dérivés d'un génome de référence
Versions of package artfastqgenerator
ReleaseVersionArchitectures
trixie0.0.20150519-5all
sid0.0.20150519-5all
stretch0.0.20150519-2all
buster0.0.20150519-3all
bullseye0.0.20150519-4all
bookworm0.0.20150519-4all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ArtificialFastqGenerator prend en entrée un génome de référence au format FASTA et renvoie des fichiers FASTQ artificiels au format Sanger. Il accepte les scores de qualité Phred de bases depuis des fichiers FASTQ existants et s'en sert pour simuler des erreurs de séquençage. Puisque les fichiers FASTQ artificiels sont dérivés du génome de référence, celui-ci fournit une référence pour appeler les variantes (« Single Nucleotide Polymorphisms » (SNP) et insertions et suppressions (indels)). Cela permet d'évaluer une infrastructure d'analyse de séquençage de nouvelle génération (NGS) qui aligne les lectures avec le génome de référence puis appelle les variantes.

Please cite: Matthew Frampton and Richard Houlston: Generation of Artificial FASTQ Files to Evaluate the Performance of Next-Generation Sequencing Pipelines. (PubMed,eprint) PLOSone 7(11):e49110 (2012)
assembly-stats
obtention des statistiques d'assemblage à partir de fichiers FASTA et FASTQ
Versions of package assembly-stats
ReleaseVersionArchitectures
bullseye1.0.1+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.1+ds-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.0.1+ds-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.1+ds-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet permet l'obtention de statistiques à partir d'une liste de fichiers.

La détection du format FASTA ou FASTQ de chaque fichier est automatique à partir du contenu des fichiers, ainsi les noms et les extensions des fichiers ne sont pas pertinents.

Le format de sortie par défaut est intelligible. Il est possible de changer le format de sortie et d'ignorer les séquences plus courtes qu'une longueur définie.

Registry entries: Bioconda 
assemblytics
détection et analyse de variantes structurelles à partir d’un assemblage de génome
Versions of package assemblytics
ReleaseVersionArchitectures
bookworm1.2.1+dfsg-1all
bullseye1.0+ds-2all
buster1.0+ds-1all
sid1.2.1+dfsg-2all
trixie1.2.1+dfsg-2all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Assemblytics incorpore une approche unique de filtrage d’ancre pour augmenter la robustesse d’éléments répétitifs et identifie six classes de variantes basées sur leurs signatures d’alignements distincts. Assemblytics peut être appliqué pour comparer des génomes aberrants, comme les cancers humains, à des références, ou pour identifier des différences entre des espèces proches.

Please cite: Maria Nattestad and Michael C. Schatz: Assemblytics: a web analytics tool for the detection of variants from an assembly. (PubMed) Bioinformatics 32(19):3021-3023 (2016)
atac
comparaison de génomes d'assemblage en assemblage
Versions of package atac
ReleaseVersionArchitectures
bullseye0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0~20150903+r2013-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0~20150903+r2013-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Atac calcule l'alignement par paires de grandes séquences d'ADN. Il trouve d'abord les k-mer uniques de chaque séquence, les enchaîne en des blocs plus grands puis remplit les espaces entre les blocs. Il a été écrit principalement pour transférer les annotations entre différents assemblages de génome humain.

La sortie est un ensemble de correspondances (« matches ») sans trou et un ensemble de « runs » avec des trous et formés à partir des correspondances. Chaque correspondance ou run associe une séquence avec l'autre séquence. L'association est unique dans le sens où il n'y a pas d'autre association (d'une certaine taille) pour chaque séquence. Ainsi, les longues répétitions et duplications sont absentes de la sortie : elles apparaissent en tant que régions non représentées.

Bien que la sortie soit toujours appairée, atac peut mettre les résultats intermédiaires en cache pour accélérer la comparaison de plusieurs séquences.

Ce paquet fait partie de la suite Kmer.

The package is enhanced by the following packages: kmer-examples
Please cite: B. Walenz and L. Florea: Sim4db and leaff: Utilities for fast batched spliced alignment and sequence indexing. (PubMed) Bioinformatics 27(13):1869-1870 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
ataqv
contrôle de qualité et visualisation pour ATAC-seq
Versions of package ataqv
ReleaseVersionArchitectures
bookworm1.3.0+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie1.3.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el
sid1.3.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye1.2.1+ds-1amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’une boîte à outils pour mesurer et comparer les résultats d’ATAC-seq, mise au point dans le Laboratoire Parker de l’université du Michigan. Elle a été conçue pour aider à comprendre comment leurs évaluations d’ATAC-seq ont fonctionné et pour faciliter le repérage des différences qui ont pu être causées par leur préparations de bibliothèque ou le séquençage.

Please cite: Peter Orchard, Yasuhiro Kyono, John Hensley, Jacob O. Kitzman and Stephen C.J. Parker: Quantification, Dynamic Visualization, and Validation of Bias in ATAC-Seq Data with ataqv. (eprint) Cell Systems 10(3):2405-4712 (2020)
atropos
Outil de taille de lecture NGS spécifique, sensible et rapide
Versions of package atropos
ReleaseVersionArchitectures
trixie1.1.32+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
sid1.1.32+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye1.1.29+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bookworm1.1.31+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Atropos est un outil pour la taille spécifique, sensible et rapide des lectures NGS. Il s'agit d'une reprise de la vénérable tailleuse à lecture Cutadapt, dont les principales améliorations sont :

  1. Prise en charge du multithreading, y compris un mode "écriture
parallèle" extrêmement rapide.
  2. Mise en œuvre d'un nouvel algorithme de taillage basé sur l'alignement
des inserts pour les lectures à deux extrémités, qui est nettement plus

sensible et spécifique que l'algorithme d'alignement basé sur l'adaptateur Cutadapt d'origine. Cet algorithme permet également de corriger les décalages entre les parties des lectures qui se chevauchent.

  3. Options pour la taille de types spécifiques de données (miRNA,
bisulfite-seq).
  4. Une nouvelle commande ('detect') qui détectera les séquences
d'adaptateurs et autres contaminants potentiels.
  5. Une nouvelle commande ('error') qui permet d'estimer le taux d'erreur
de séquençage, ce qui aide à sélectionner les valeurs appropriées des

paramètres d'adaptation et d'ajustement de la qualité.

  6. Une nouvelle commande ('qc') qui génère des statistiques de lecture
similaires à FastQC. La commande de taille peut également calculer les

statistiques de lecture avant et après la taille (en utilisant l'option'--stats').

  7. Amélioration des rapports de synthèse, y compris la prise en charge à
la sérialisation formats (JSON, YAML, pickle), la prise en charge des

modèles définis par l'utilisateur (via la dépendance optionnelle Jinja2), et intégration avec MultiQC.

  8. La possibilité de fusionner des lectures qui se chevauchent (c'est
expérimental et la fonctionnalité est limitée).
  9. La possibilité d'écrire le rapport de synthèse et les messages de log
dans des fichiers séparés.
 10. La possibilité de lire les fichiers SAM/BAM et de lire/écrire des
fichiers entrelacés FASTQ.
 11. Taillage direct des lectures depuis un accès SRA.
 12. Une barre de progression et d'autres améliorations mineures de
l'ergonomie.
Please cite: John P. Didion, Marcel Martin and Francis S. Collins: Atropos: specific, sensitive, and speedy trimming of sequencing reads. (PubMed,eprint) PeerJ 5:e3720 (2017)
Registry entries: Bio.tools  Bioconda 
augur
composants pipeline pour l'analyse de virus en temps réel
Versions of package augur
ReleaseVersionArchitectures
sid24.2.3-1all
buster-backports6.4.2-2~bpo10+1all
bullseye11.0.0-1all
bookworm20.0.0-1all
trixie24.2.2-1all
upstream24.3.0
Popcon: 3 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Le projet nextstrain est une tentative de faire des pipelines informatiques flexibles et des outils de visualisation pour suivre l'évolution en cours de pathogènes à mesure que les données de séquences surviennent. Le projet nextstrain dérive de nextflu qui était spécifique à l'évolution de la grippe.

nextrain est formé de trois composantes :

 – fauna : base de données et scripts d'E/S pour les séquences et
   les données sérologiques ;
 – augur : pipelines informatiques pour conduire des inférences
   à partir de données brutes ;
 – auspice : application web pour visualiser les inférences
   résultantes.
augustus
prédiction de gènes dans les génomes eucaryotes
Versions of package augustus
ReleaseVersionArchitectures
bullseye3.4.0+dfsg2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster3.3.2+dfsg-2amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
bookworm3.5.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch3.2.3+dfsg-1amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

AUGUSTUS est un logiciel de prédiction de gènes dans les séquences génomiques eucaryotes basé sur un modèle de Markov caché généralisé (HMM), un modèle probabiliste de séquence et sa structure de gène. Après l'apprentissage de structures de gènes à partir d'une annotation de référence, AUGUSTUS utilise le HMM pour reconnaître les gènes dans une nouvelle séquence et l'annote avec les régions des gènes identifiés. Des indices externes, par exemple depuis des séquences d'ARN, des EST ou des alignements de protéines, etc., peuvent être utilisés pour guider et améliorer le processus de découverte de gène. Le résultat est l'ensemble des structures de gènes les plus probables qui respectent toutes les contraintes utilisateurs, si de telles structures de gènes existent. AUGUSTUS comprend déjà des HMM préconstruits pour de nombreuses espèces, ainsi que des scripts d'entraînement de modèles personnalisés grâce à des génomes annotés.

Please cite: Stefanie König, Lars Romoth, Lizzy Gerischer and Mario Stanke: Simultaneous gene finding in multiple genomes. (PubMed,eprint) Bioinformatics 32(22):3388-3395 (2016)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Gene transcripts; Gene and protein families
autodock
Analyse de liaison de ligand à la structure d'une protéine
Versions of package autodock
ReleaseVersionArchitectures
buster4.2.6-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye4.2.6-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie4.2.6-2amd64,armel,armhf,i386
stretch4.2.6-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package autodock:
fieldbiology, biology:structural
interfacecommandline
roleprogram
scopeutility
useanalysing
works-with3dmodel
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Autodock est un des programmes principaux d'amarrage moléculaire (docking) de ligands de faible poids moléculaire à des récepteurs protéiques. Dans les versions précédentes le ligand était complètement flexible tandis que la protéine était rigide. La version 4 permet de considérer la protéine de manière partiellement flexible pour les chaînes latérales de résidus de surface sélectionnés en prenant en compte les rotamères.

Le programme AutoDock réalise l'amarrage moléculaire de ligands en utilisant des grilles pré-calculées qui décrivent la protéine cible en terme de préférence spatiale physico-chimique. AutoGrid pré-calcule ces grilles.

The package is enhanced by the following packages: autogrid
Screenshots of package autodock
autodock-vina
chargement de petites molécules jusqu'aux protéines
Versions of package autodock-vina
ReleaseVersionArchitectures
sid1.2.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.1.2-3amd64,armel,armhf,i386
stretch1.1.2-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.1.2-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.1.2-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 15 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

AutoDock Vina est un programme pour la découverte de médicaments, le chargement de molécules et l'affichage virtuel des bibliothèques de composés. Il offre des capacités multicœurs, de bonnes performances, une précision améliorée et est facile d'utilisation.

Le même institut développe également autodock, qui est très utilisé.

O. Trott, A. J. Olson, AutoDock Vina : improving the speed and accuracy of docking with a new scoring function, efficient optimization and multithreading, Journal of Computational Chemistry 31 (2010) 455-461

Please cite: Oleg Trott and Arthur J. Olson: AutoDock Vina: Improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. (eprint) Journal of Computational Chemistry 31(2):455-461 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
autogrid
Pré-calculer les liaisons de ligands à leur récepteur
Versions of package autogrid
ReleaseVersionArchitectures
trixie4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster4.2.6-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie4.2.6-2amd64,armel,armhf,i386
stretch4.2.6-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye4.2.6-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package autogrid:
fieldbiology, biology:structural
interfacecommandline
roleprogram
scopeutility
useanalysing
works-with3dmodel
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

AutoDockSuite permet l'analyse de l'amarrage de molécules de faible poids moléculaire à des récepteurs dont la structure tri-dimensionnelle est connue.

Le programme AutoGrid crée les grilles calculées en prévision de l'amarrage moléculaire de ligands à des grilles qui décrivent l'effet de l'environnement créé par la protéine sur des sondes moléculaires ponctuelles, chargées ou non, permettant de décrire les différents types d'interactions intermoléculaires ligand-protéine (charges positives, négatives, liaisons hydrogènes accepteur, liaisons hydrogènes donneur, hydrophobe, aliphatique, ...). L'effet de ces forces est ensuite analysé avec le programme AutoDock.

avogadro
système de modélisation et d'imagerie moléculaire
Versions of package avogadro
ReleaseVersionArchitectures
stretch1.2.0-1+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.2.0-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.93.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.97.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.99.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.99.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.0.3-10.1amd64,armel,armhf,i386
Debtags of package avogadro:
fieldchemistry
roleprogram
uitoolkitqt
useviewing
Popcon: 63 users (47 upd.)*
Versions and Archs
License: DFSG free
Git

Avogadro est un système de modélisation et d'imagerie moléculaire visant les molécules et les biomolécules. Il permet de visualiser des propriétés comme les orbites moléculaires ou les potentiels électrostatiques et dispose d'un constructeur de molécules intuitif.

Fonctions disponibles :

 — modeleur moléculaire avec optimisation géométrique basée sur les champs
   de force automatique ;
 — mécanique moléculaire incluant des recherches de contraintes et de
    conformation ;
 — visualisation des orbites moléculaires et d'isosurfaces générales ;
 — visualisation de vibrations et graphique du spectre de vibration ;
 — gestion des cellules cristallographiques ;
 — création d'entrée pour des paquets chimiques Gaussian, GAMESS and
    MOLPRO ;
 — architecture de greffon flexible et script Python.

Les formats de fichiers qu'Avogadro peut lire incluent PDB, XYZ, CML, CIF, Molden ainsi que les sorties Gaussian, GAMESS and MOLPRO.

Please cite: Marcus D Hanwell, Donald E Curtis, David C Lonie, Tim Vandermeersch, Eva Zurek and Geoffrey R Hutchison: Avogadro: An advanced semantic chemical editor, visualization, and analysis platform. (eprint) J. Cheminf. 4:17 (2012)
Registry entries: Bio.tools  SciCrunch 
axe-demultiplexer
démultiplexeur de lecture de séquence ADN basé sur les arbres préfixes
Versions of package axe-demultiplexer
ReleaseVersionArchitectures
sid0.3.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.3.2+dfsg1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.3.3+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.3.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.3.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.3.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Axe sélectionne très rapidement le code barre optimal présent dans la lecture d'une séquence, même en présence d'erreurs de séquençage. L'algorithme est capable de gérer les codes barres combinatoires, les codes barres de tailles différentes et plusieurs erreurs de correspondances par code barre.

Registry entries: SciCrunch 
baitfisher
paquet logiciel de conception de sondes d'enrichissement hybrides
Versions of package baitfisher
ReleaseVersionArchitectures
trixie1.2.7+git20211020.de26d5c+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.2.7+git20211020.de26d5c+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.2.7+git20180107.e92dbf2+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.2.7+git20190123.241d060+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.7+git20211020.de26d5c+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet BaitFisher est constitué de deux programmes : BaitFisher et BaitFilter.

BaitFisher a été conçu pour construire des BAIT (Bioinformatic Analysis of Inherited Templates) d'enrichissement hybrides à partir de plusieurs alignements de séquences (MSA) ou de fonctions annotées dans des MSA. L'objectif principal de BaitFisher est d'éviter la redondance dans la construction des BAIT en concevant moins de BAIT dans les régions conservées des MSA et en concevant plus de BAIT dans les régions variables. Cela utilise le fait que les BAIT d'enrichissement hybrides peuvent différer des régions cibles qu'elles devraient capturer dans la procédure d'enrichissement. En indiquant la distance autorisée entre les BAIT et les séquences dans les MSA, l'utilisateur peut contrôler cette distance et le degré de réduction dans le nombre de BAIT conçus. Veuillez consulter l'article sur BaitFisher pour plus de détails.

BaitFilter a été conçu (i) pour déterminer si des BAIT sont liés de façon non spécifique à un génome de référence, (ii) pour filtrer des BAIT qui n'ont qu'une correspondance de longueur partielle avec un génome de référence, (iii) pour déterminer la région de BAIT optimale dans un MSA et pour convertir les BAIT dans un format pouvant être envoyé à une société construisant des BAIT. La région de BAIT optimale peut être la région la plus conservée dans le MSA ou la région ayant le plus grand nombre de séquences sans trou ou nucléotides ambigus.

Please cite: Christoph Mayer, Manuela Sann, Alexander Donath, Martin Meixner, Lars Podsiadlowski, Ralph S. Peters, Malte Petersen, Karen Meusemann, Karsten Liere, Johann-Wolfgang Wägele, Bernhard Misof, Christoph Bleidorn, Michael Ohl and Oliver Niehuis: BaitFisher: A Software Package for Multispecies Target DNA Enrichment Probe Design. (PubMed,eprint) Mol. Biol. Evol. 33(7):1875-1886 (2016)
Registry entries: SciCrunch  Bioconda 
bali-phy
inférence bayésienne d’alignement et de phylogénie
Versions of package bali-phy
ReleaseVersionArchitectures
bullseye3.6.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.6.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm3.6.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
experimental4.0~beta2+dfsg-1amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
buster3.4+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.6.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

BAli-Phy évalue plusieurs alignements de séquence et d’arbres évolutionnaires à partir d’ADN non aligné, d’acide aminé ou de séquences de codons. BAli-Phy utilise MCMC pour évaluer les arbres évolutionnaires, la sélection positive et les longueurs de branches tout en moyennant d’autres alignements possibles. BAli-Phy peut afficher graphiquement l’ambiguïté d’alignement dans un graphe d’incertitude d’alignement (AU).

BAli-Phy peut également évaluer les phylogénies à partir d’un alignement fixé (comme MrBayes et BEAST) grâce à des modèles de substitution tels que GTR+gamma. BAli-Phy évalue automatiquement les taux relatifs de chaque gène.

Please cite: Benjamin D. Redelings and Marc A. Suchard: Joint Bayesian Estimation of Alignment and Phylogeny. (PubMed,eprint) Systematic Biology 54(3):401-418 (2005)
Registry entries: Bio.tools 
ballview
modélisation moléculaire (libre) et outil graphique moléculaire
Versions of package ballview
ReleaseVersionArchitectures
bullseye1.5.0+git20180813.37fc53c-6amd64,arm64,i386,mips64el,mipsel,ppc64el,s390x
jessie1.4.2+20140406-1amd64,armel,armhf,i386
bookworm1.5.0+git20180813.37fc53c-11amd64,arm64,i386,mips64el,mipsel,ppc64el,s390x
sid1.5.0+git20180813.37fc53c-11amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
stretch1.4.3~beta1-3amd64,arm64,armel,armhf,i386,mips,ppc64el,s390x
buster1.5.0+git20180813.37fc53c-3amd64,arm64,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream1.5.0+git20220524.d85d2dd
Debtags of package ballview:
interfacex11
roleprogram
uitoolkitqt
x11application
Popcon: 4 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

BALLView propose une visualisation rapide des structures moléculaires, des méthodes de mécanique moléculaire (minimisation, simulation dynamique moléculaire utilisant les champs de force « Assisted Model Building with Energy Refinement » et « Chemistry at HARvard Macromolecular Mechanics ») à l'aide de la technologie OpenGL, un calcul et une visualisation des propriétés électrostatiques (méthode « Finite Difference Poisson-Boltzmann ») et des fonctionnalités d'édition moléculaire.

BALLView peut être considéré comme une interface graphique utilisateur basée sur BALL (« Biochemical Algorithms Library »), en se concentrant sur les demandes les plus courantes de la chimie des protéines et des biophysiciens en particulier. Il est développé par les groupes de Hans-Peter Lenhof (Université de Saarland, Sarrebruck, Allemagne) et d'Oliver Kohlbacher (Université de Tübingen, Allemagne). BALL est un framework applicatif écrit en C++ qui a été spécifiquement conçu pour le développement rapide de logiciels pour la modélisation moléculaire et le calcul de la biologie moléculaire. Il propose de nombreuses structures de données ainsi que des cours de mécanique moléculaire, des méthodes avancées de résolution, la comparaison et l'analyse de structures de protéines, l'import/export de fichiers et la visualisation.

Please cite: Andreas Moll, Andreas Hildebrandt, Hans-Peter Lenhof and Oliver Kohlbacher: BALLView: a tool for research and education in molecular modeling. (PubMed,eprint) Bioinformatics 22(3):365-366 (2006)
Registry entries: SciCrunch 
Screenshots of package ballview
bamclipper
Remove gene-specific primer sequences from SAM/BAM alignments
Versions of package bamclipper
ReleaseVersionArchitectures
bookworm1.0.0-3all
trixie1.0.0-3all
sid1.0.0-3all
Popcon: 0 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Remove gene-specific primer sequences from SAM/BAM alignments of PCR amplicons by soft-clipping.

bamclipper.sh soft-clips gene-specific primers from BAM alignment file based on genomic coordinates of primer pairs in BEDPE format.

Please cite: Chun Hang Au, Dona N Ho, Ava Kwong, Tsun Leung Chan and Edmond S K Ma: BAMClipper: removing primers from alignments to minimize false-negative mutations in amplicon next-generation sequencing. (PubMed,eprint) Scientific Reports 7(1):1567 (2017)
Registry entries: Bioconda 
bamkit
tools for common BAM file manipulations
Versions of package bamkit
ReleaseVersionArchitectures
sid0.0.1+git20170413.ccd079d-3all
trixie0.0.1+git20170413.ccd079d-3all
bullseye0.0.1+git20170413.ccd079d-2all
bookworm0.0.1+git20170413.ccd079d-3all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides some Python3 tools for common BAM file manipulations.

bamtools
boîte à outils de manipulation de fichiers BAM (alignement de génomes)
Versions of package bamtools
ReleaseVersionArchitectures
jessie2.3.0+dfsg-2amd64,armel,armhf,i386
sid2.5.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.5.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.5.2+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.5.1+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.5.1+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch2.4.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 8 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

BamTools facilite l'analyse de recherche et la gestion de données grâce aux fichiers BAM. Il surmonte les énormes quantités de données produites par les technologies de séquençage actuelles qui sont généralement stockées dans des formats binaires compressés difficiles à gérer avec les analyseurs de textes couramment utilisés dans la recherche en bioinformatique.

BamTools fournit une API C++ pour la prise en charge des fichiers BAM ainsi qu'une boîte à outils en ligne de commande.

Il s'agit de la boîte à outils en ligne de commande bamtools.

Les commandes bamtools disponibles sont :

 − convert : conversion entre BAM et beaucoup d'autres formats ;
 − count : affichage du nombre d'alignements dans un ou plusieurs fichiers
   BAM ;
 − coverage :affichage des statistiques de couverture à partir d'un
   fichier d'entrée BAM ;
 − filter : filtrage des fichiers BAM selon des critères indiqués par
   l'utilisateur ;
 − header : affichage des informations d'en-tête BAM ;
 − index : création d'index pour un fichier BAM ;
 − merge : fusion de plusieurs fichiers BAM en un seul ;
 − random : sélection aléatoire d'alignements depuis des fichiers BAM
   existants à des fins de test ;
 − resolve : résolution de lectures de fins en paires (affichant le
   drapeau IsProperPair requis) ;
 − revert : suppression des marques dupliquées et restauration des
   qualités de base d'origine ;
 − sort : tri d'un fichier BAM en suivant certains critères ;
 − split : séparation d'un fichier BAM en fonction d'une propriété définie
   par l'utilisateur, créant un nouveau fichier BAM en sortie pour chaque
   valeur trouvée ;
 − stats : affichage de statistiques de base à partir d'un ou plusieurs
   fichiers BAM en entrée.
The package is enhanced by the following packages: multiqc
Please cite: Derek W. Barnett, Erik K. Garrison, Aaron R. Quinlan, Michael P. Stromberg and Gabor T. Marth: BamTools: a C++ API and toolkit for analyzing and managing BAM files. (PubMed,eprint) Bioinformatics 27(12):1691-2 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bandage
application de bio-informatique pour navigation simple dans les graphes d’assemblage De novo
Versions of package bandage
ReleaseVersionArchitectures
sid0.9.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.9.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster0.8.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.8.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.9.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Bandage est un programme graphique permettant aux utilisateurs d’interagir avec les graphes d’assemblage réalisés par les assembleurs de novo tels que Velvet, SPAdes, MEGAHIT et d’autres.

Les graphes d’assemblage de novo contiennent non seulement les contigs assemblés, mais aussi les connexions entre ceux-ci, qui n’étaient auparavant pas faciles d’accès. Bandage visualise les graphes d’assemblage, avec les connexions, grâce à des algorithmes d’agencement de graphes. Les nœuds du graphe dessiné, qui représentent les contigs, peuvent être étiquetés automatiquement avec leur identifiant, leur longueur ou leur profondeur. Les utilisateurs peuvent interagir avec le graphe en déplaçant, étiquetant ou colorant les nœuds. L’information de séquence peut aussi être directement extraite du visionneur de graphe. En représentant les connexions entre contigs, Bandage ouvre de nouvelles possibilités d’analyse et d’amélioration des assemblages de novo qui n’étaient pas possibles en observant les contigs seuls.

Le site web de Bandage propose davantage d’informations et de liens de téléchargement : rrwick.github.io/Bandage.

Ce paquet est utile dans le domaine de l’assemblage de génome.

The package is enhanced by the following packages: bandage-examples
Please cite: Ryan R. Wick, Mark B. Schultz, Justin Zobel and Kathryn E. Holt: Bandage: interactive visualisation of de novo genome assemblies. (PubMed,eprint) Bioinformatics 31(20):3350-3352 (2015)
Registry entries: Bio.tools  Bioconda 
barrnap
prédiction ribosomale rapide d'ARN
Versions of package barrnap
ReleaseVersionArchitectures
bookworm0.9+dfsg-3all
stretch0.7+dfsg-2all
trixie0.9+dfsg-4all
buster0.9+dfsg-1all
sid0.9+dfsg-4all
bullseye0.9+dfsg-2all
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Barrnap (« BAsic Rapid Ribosomal RNA Predictor ») prédit l'emplacement de gènes d'ARN ribosomal dans les génomes. Il gère les bactéries (5S,23S,16S), les archées (5S,5.8S,23S,16S), les mitochondries (12S,16S) et les eucariotes (5S,5.8S,28S,18S).

Barrnap prend des séquences d'ADN FASTA en entrée et écrit en GFF3 en sortie. Il utilise l'outil NHMMER fournit par HMMER 3.1 pour la recherche HMM de type ARN ou ADN. Le multithreading est pris en charge et il faut s'attendre à une accélération grossièrement linéaire avec le nombre de processeurs.

Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Functional, regulatory and non-coding RNA
bbmap
BBTools genomic aligner and other tools for short sequences
Versions of package bbmap
ReleaseVersionArchitectures
bookworm39.01+dfsg-2all
buster-backports38.63+dfsg-1~bpo10+1all
sid39.06+dfsg-1all
trixie39.06+dfsg-1all
bullseye38.90+dfsg-1all
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The BBTools are a collection of small programs to solve recurrent tasks for the creative handling of short biological RNA/DNA sequences. This suite may be best known for its mapper, which is also the name of the project on sourceforge, but several tools have been added over time. All tools are multi-threaded, implemented platform-independently in Java:

BBMap: Short read aligner for DNA and RNA-seq data. Capable of handling arbitrarily large genomes with millions of scaffolds. Handles Illumina, PacBio, 454, and other reads; very high sensitivity and tolerant of errors and numerous large indels.

BBNorm: Kmer-based error-correction and normalization tool.

Dedupe: Simplifies assemblies by removing duplicate or contained subsequences that share a target percent identity.

Reformat: Reformats reads between fasta/fastq/scarf/fasta+qual/sam, interleaved/paired, and ASCII-33/64, at over 500 MB/s.

BBDuk: Filters, trims, or masks reads with kmer matches to an artifact/contaminant file.

The package is enhanced by the following packages: multiqc
Please cite: Brian Bushnell, Jonathan Rood and Esther Singer: BBMerge – Accurate paired shotgun read merging via overlap. (PubMed,eprint) PLOS One (2017)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bcalm
de Bruijn compaction in low memory
Versions of package bcalm
ReleaseVersionArchitectures
sid2.2.3-5amd64,arm64,mips64el,ppc64el,riscv64
bullseye2.2.3-1amd64,arm64,i386,mips64el,ppc64el,s390x
trixie2.2.3-5amd64,arm64,mips64el,ppc64el
bookworm2.2.3-4amd64,arm64,mips64el,ppc64el
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

A bioinformatics tool for constructing the compacted de Bruijn graph from sequencing data.

This is the parallel version of the BCALM software using gatb-core library.

Please cite: Rayan Chikhi, Antoine Limasset and Paul Medvedev: Compacting de Bruijn graphs from sequencing data quickly and in low memory.. (eprint) Bioinformatics 32(12):208 (2016)
bcftools
appel de variantes génomiques et manipulation de fichiers VCF et BCF
Versions of package bcftools
ReleaseVersionArchitectures
stretch-backports1.8-1~bpo9+1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
stretch1.3.1-1amd64,arm64,armel,mips64el,mipsel,ppc64el
buster1.9-1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
bullseye1.11-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bookworm1.16-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie1.19-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
sid1.19-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
Popcon: 25 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

BCFtools est un ensemble d'outils qui manipulent des appels de variation dans le format « Variant Call Format » (VCF) et son équivalent binaire BCF. Toutes les commandes fonctionnent de façon transparente avec VCF et BCF, qu'ils soient compressés avec BGZF ou non.

The package is enhanced by the following packages: multiqc
Please cite: Petr Danecek and Shane A. McCarthy: BCFtools/csq: Haplotype-aware variant consequences. (2016)
Registry entries: Bio.tools  SciCrunch  Bioconda 
beads
détection par électrophorèse bidimensionnelle de tache d’images de gel
Versions of package beads
ReleaseVersionArchitectures
sid1.1.22-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.1.22-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.1.18+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.1.20-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.1.22-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Beads est un programme pour la détection de « tache » (spot) sur des images de gel en 2D. Il est basé sur l’analogie avec des gouttes flottant péniblement sur la surface d’une image de gel et l’analyse de leurs parcours (Langella & Zivy, 2008).

Please cite: Olivier Langella and Michel Zivy: A method based on bead flows for spot detection on 2-D gel images. (PubMed) Proteomics 8(23-24):4914-8 (2008)
beagle
appel de génotype, phasage de génotype et attribution de marqueurs non génotypés
Versions of package beagle
ReleaseVersionArchitectures
stretch4.1~160727-86a+dfsg-1all
trixie220722-1all
sid220722-1all
buster5.0-180928+dfsg-1+deb10u1all
bullseye5.1-200518+dfsg-1all
bookworm220722-1all
upstream240301
Popcon: 3 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Beagle réalise l'appel de génotype, le phasage de génotype, l'attribution de marqueurs non génotypés et la détection de segments identiques par descente. L'attribution génotypique fonctionne sur des haplotypes phasés grâce à un modèle de fréquence d'haplotype de Li et Stephens. Beagle implémente aussi l'algorithme IBD raffiné pour détecter les segments homozygotes par descente (HBD) et identiques par descente (IBD).

The package is enhanced by the following packages: beagle-doc
Please cite: Sharon R. Browning and Brian L. Browning: Rapid and Accurate Haplotype Phasing and Missing-Data Inference for Whole-Genome Association Studies By Use of Localized Haplotype Clustering. (eprint) The American Journal of Human Genetics 81(5):1084-1097 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
beast-mcmc
inférence phylogénétique bayésienne MCMC
Versions of package beast-mcmc
ReleaseVersionArchitectures
stretch1.8.4+dfsg.1-1all
buster1.10.4+dfsg-1all
trixie1.10.4+dfsg-5all
sid1.10.4+dfsg-5all
jessie1.8.0-1 (contrib)all
bookworm1.10.4+dfsg-5all
bullseye1.10.4+dfsg-2all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

BEAST est un programme multiplateforme pour l'analyse bayésienne MCMC de séquences moléculaires. Il est entièrement orienté vers les phylogénies à racine et mesurées dans le temps inférées avec des modèles d'horloge (« clock ») stricts ou relâchés. Il peut servir de méthode de reconstruction de phylogénies mais est également un environnement pour tester des hypothèses évolutionnaires sans poser de condition sur la topologie de l'arbre. BEAST utilise MCMC pour balancer la taille de l'arbre, afin que chaque arbre soit pondéré proportionnellement à sa probabilité postérieure. Une interface utilisateur simple à utilisée est incluse pour configurer les analyses standard, ainsi qu'une suite de programmes pour analyser les résultats.

The package is enhanced by the following packages: beast-mcmc-doc beast-mcmc-examples
Please cite: Alexei J Drummond and Andrew Rambaut: BEAST: Bayesian evolutionary analysis by sampling trees. (PubMed,eprint) BMC Evol Biol 8(7):214 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
beast2-mcmc
inférence phylogénétique bayésienne MCMC
Versions of package beast2-mcmc
ReleaseVersionArchitectures
bullseye2.6.3+dfsg-2all
stretch2.4.4+dfsg-1all
buster2.5.1+dfsg-2all
sid2.7.6+dfsg-1all
trixie2.7.6+dfsg-1all
bookworm2.7.3+dfsg-1all
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

BEAST est un programme multiplateforme pour l'analyse bayésienne MCMC de séquences moléculaires. Il est entièrement orienté vers les phylogénies à racine et mesurées dans le temps inférées avec des modèles d'horloge (« clock ») stricts ou relâchés. Il peut servir de méthode de reconstruction de phylogénies mais est également un environnement pour tester des hypothèses évolutionnaires sans poser de condition sur la topologie de l'arbre. BEAST utilise MCMC pour balancer la taille de l'arbre, afin que chaque arbre soit pondéré proportionnellement à sa probabilité postérieure. Une interface utilisateur simple à utilisée est incluse pour configurer les analyses standard, ainsi qu'une suite de programmes pour analyser les résultats.

Il ne s'agit pas d'une nouvelle version amont de beast-mcmc (version 1.x) mais plutôt d'une réécriture.

The package is enhanced by the following packages: beast2-mcmc-doc beast2-mcmc-examples
Please cite: Remco Bouckaert, Joseph Heled, Denise Kühnert, Tim Vaughan, Chieh-Hsi Wu, Dong Xie, Marc A. Suchard, Andrew Rambaut and Alexei J. Drummond: BEAST 2: A Software Platform for Bayesian Evolutionary Analysis. (PubMed,eprint) PLoS Comput Biol 10(4):e1003537 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bedops
opérations génomiques à haute performance
Versions of package bedops
ReleaseVersionArchitectures
stretch-backports2.4.35+dfsg-1~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.4.39+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.4.41+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.4.41+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.4.41+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.4.35+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

BEDOPS est une suite d'outils pour répondre aux questions couramment posées en études génomiques, surtout en lien avec les relations de chevauchement et de proximité entre des jeux de données. Elle vise à être évolutive et flexible pour faciliter l'analyse et la gestion efficace et précise de données génomiques de grande taille.

Please cite: Shane Neph, M. Scott Kuehn, Alex P. Reynolds, Eric Haugen, Robert E. Thurman, Audra K. Johnson, Eric Rynes, Matthew T. Maurano, Jeff Vierstra, Sean Thomas, Richard Sandstrom, Richard Humbert and John A. Stamatoyannopoulos: BEDOPS: high-performance genomic feature operations. (PubMed,eprint) 28(14):1919-1920 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bedtools
suite d'utilitaires pour la comparaison des caractéristiques de génomes
Versions of package bedtools
ReleaseVersionArchitectures
bullseye2.30.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.30.0+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.31.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.31.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie2.21.0-1amd64,armhf,i386
stretch2.26.0+dfsg-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
buster2.27.1+dfsg-4amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
Debtags of package bedtools:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, filtering
works-withbiological-sequence
Popcon: 46 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Les utilitaires BEDTools permettent de traiter les tâches génomiques ordinaires telles que trouver les chevauchements de caractéristiques et informatiser les données. Les utilitaires sont en grande partie basés sur quatre formats de fichier très utilisés : BED, GFF/GTF, VCF et SAM/BAM. En utilisant BEDTools, il est possible de développer des enchainements sophistiqués qui répondent à des questions de recherche en utilisant plusieurs outils séquentiellement.

L'outil groupBy est fourni par le paquet filo.

Please cite: Aaron R. Quinlan and Ira M. Hall: BEDTools: a flexible suite of utilities for comparing genomic features. (PubMed,eprint) Bioinformatics 26(6):841-842 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
belvu
visualisateur d’alignements de séquences multiples et outil phylogénétique
Versions of package belvu
ReleaseVersionArchitectures
buster4.44.1+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm4.44.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.44.1+dfsg-7.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye4.44.1+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Belvu est un est un visualisateur d’alignements de séquences multiples et un outil phylogénétique avec un grand ensemble de modes personnalisables de coloration de résidus.

 – vue d’alignements de séquences multiples ;
 – coloration des résidus selon la conservation, avec des seuils et
   couleurs personnalisables ;
 – coloration des résidus selon les types (personnalisables) ;
 – schémas de couleur importables ou exportables ;
 – récupération des inscriptions de Swissprot (ou PIR) par double clic ;
 – suivi aisé de la position dans l’alignement ;
 – suppression manuelle de lignes et colonnes ;
 – édition automatique de lignes et colonnes, basée sur des critères
   personnalisables :
    — suppression de toutes les colonnes avec trous,
    — suppression de tous les trous,
    — suppression de toutes les séquences redondantes,
    — suppression d’une colonne selon un pourcentage personnalisable
      de trous,
    — filtrage de séquences selon le pourcentage d’identités,
    — suppression de séquences selon un pourcentage personnalisable
      de trous,
    — suppression de séquences incomplètes (celles commençant ou finissant
      par des trous,
    — suppression de colonnes par conservation (avec des seuils hauts et
      bas personnalisables) ;
 – enregistrement des alignements aux formats Stockholm, Selex, MSF
   ou FASTA ;
 – matrices de distances entre séquences créées en utilisant différentes
   métriques de distance ;
 – matrices de distances importables ou exportables ;
 – construction d’arbres phylogénétiques basée sur différents algorithmes
   de reconstruction d’arbre basés sur la distance ;
 – enregistrement des arbres au format New Hampshire ;
 – reconstruction phylogénétique par technique « bootstrap ».
Please cite: Gemma Barson and Ed Griffiths: SeqTools: visual tools for manual analysis of sequence alignments. (PubMed,eprint) BMC Research Notes 9:39 (2016)
Registry entries: Bio.tools  SciCrunch 
berkeley-express
quantification de streaming pour le séquençage à taux élevé
Versions of package berkeley-express
ReleaseVersionArchitectures
bookworm1.5.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.5.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.5.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.5.2+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.5.1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.5.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

eXpress est un outil de streaming pour quantifier les abondances d'un ensemble de séquences cibles depuis des sous séquences échantillonnées. Des applications peuvent être la quantification de séquences d'ARN au niveau de la transcription, l'analyse d'expressions spécifiques à des allèles ou d'haplotypes, la quantification de lien de facteur de transcription dans le séquençage ChIP et l'analyse de données métagénomiques. Il est basé sur un algorithme EM en ligne dont les besoins en mémoire sont proportionnels à la taille totale des séquences cibles et les besoins en temps qui sont proportionnels au nombre de fragments échantillonnés. Ainsi, dans les applications comme le séquençage d'ARN, eXpress peut quantifier avec précision des échantillons bien plus grands que les autres outils actuellement disponibles, ce qui réduit grandement les besoins en infrastructure de calcul. eXpress peut être utilisé pour construire des infrastructures légères à haut débit de traitement de séquençage quand il est couplé à un aligneur de streaming comme Bowtie. En effet, la sortie peut être transférée directement dans eXpress, ce qui permet de ne pas avoir à stocker en mémoire ou sur le disque les alignements lus.

Une analyse des performances d'eXpress sur des données de séquençage d'ARN a montré que son efficacité ne se fait pas aux dépens de la précision. eXpress est plus précis que d'autres outils disponibles même avec des jeux de données de petite taille qui ne nécessitent pas une telle efficacité. De plus, comme le programme Cufflinks, eXpress peut servir à estimer les abondances de transcription de gènes multi-isoformes. eXpress est également capable de résoudre des cartographies multiples de lectures entre familles de gènes et ne nécessite pas de génome de référence, ce qui le rend utilisable avec des assembleurs de novo (depuis le début) comme Trinity, Oases ou Trans-ABySS. Le modèle sous-jacent est basé sur des modèles probabilistes décrits précédemment et développés pour le séquençage ARN, mais est également applicable dans d'autres situations où les séquences cibles sont échantillonnées. Il inclut des paramètres sur les distributions de longueurs de fragment, les erreurs de lecture et les erreurs systématiques de fragments spécifiques à la séquence.

eXpress peut servir à résoudre des cartographies ambigües dans d'autres applications basées sur le séquençage à haut débit. Les seules entrées nécessaires sont l'ensemble des séquences cibles et un ensemble de fragments de séquences multi-alignements avec elles. Bien que ces séquences cibles soient souvent des gènes isoformes, il n’est pas nécessaire qu'elles le soient. Les haplotypes peuvent être utilisés comme des références pour l'analyse d'expressions spécifiques aux allèles, liant des régions pour le séquençage ChIP, ou des génomes cibles dans les expériences métagénomiques. eXpress est utile pour toutes les analyses dans lesquelles se trouvent des lectures multi-map de séquences qui diffèrent en abondance.

Please cite: Adam Roberts and Lior Pachter: Streaming fragment assignment for real-time analysis of sequencing experiments. (PubMed) Nature Methods 10(1):71–73 (2013)
Registry entries: SciCrunch  Bioconda 
bifrost
parallel construction, indexing and querying of de Bruijn graphs
Versions of package bifrost
ReleaseVersionArchitectures
sid1.3.1-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.3.1-1amd64,arm64,mips64el,ppc64el,s390x
upstream1.3.5
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Bifrost is a command-line tool for sequencing that features a broad range of functions, such as indexing, editing, and querying the graph, and includes a graph coloring method that maps each k-mer of the graph to the genomes it occurs in.

  • Build, index, color and query the compacted de Bruijn graph
  • No need to build the uncompacted de Bruijn graph
  • Reads or assembled genomes as input
  • Output graph in GFA (can be visualized with Bandage), FASTA or binary
  • Graph cleaning: short tip clipping, etc.
  • Multi-threaded
  • No parameters to estimate with other tools
  • Exact or approximate k-mer search of queries
Please cite: Guillaume Holley and Páll Melsted: Bifrost – Highly parallel construction and indexing of colored and compacted de Bruijn graphs. (PubMed,eprint) bioRxiv 21(1):249 (2020)
Registry entries: Bio.tools  Bioconda 
bio-eagle
phasage d'haplotype au sein d'une cohorte génotypée ou grâce à un panel phasé de référence
Versions of package bio-eagle
ReleaseVersionArchitectures
bookworm2.4.1-3amd64,i386
trixie2.4.1-3amd64,i386
bullseye2.4.1-3amd64,i386
stretch2.3-3amd64,i386
sid2.4.1-3amd64,i386
buster2.4.1-1amd64
Popcon: 10 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Eagle estime la phase haplotype au sein d'une cohorte génotypée ou grâce à un panel phasé de référence. L'idée de base de l'algorithme Eagle1 est d'utiliser l'identité par descendance parmi les parents éloignés – qui est invasive pour de grandes tailles d'échantillons, mais rare parmi de faibles nombres d'échantillons – pour appeler rapidement une phase grâce à une approche de score rapide. Au contraire, l'algorithme Eagle2 analyse un modèle probabiliste complet similaire au modèle diploïde Li-Stephens utilisé par les méthodes antérieures basées sur des modèles de Markov cachés.

Note : l'exécutable a été renommé bio-eagle à cause d'un conflit de nommage. Plus d'informations sont disponibles dans /usr/share/doc/bio-eagle/README.Debian.

The package is enhanced by the following packages: bio-eagle-examples
Please cite: Po-Ru Loh, Pier Francesco Palamara and Alkes L Price: Fast and accurate long-range phasing in a UK Biobank cohort. Nature Genetics (2016)
bio-rainbow
partitionnement et assemblage de séquences courtes pour la bio-informatique
Versions of package bio-rainbow
ReleaseVersionArchitectures
buster2.0.4+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.0.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit un outil efficace de partitionnement et d'assemblage de séquences courtes (« short reads »), en particulier pour le séquençage RAD.

Rainbow est développé pour fournir une solution ultra rapide et efficace en utilisation de la mémoire pour regrouper et assembler les séquences courtes produites par le séquençage RAD. Tout d’abord, Rainbow regroupe les séquences en utilisant une méthode de graine espacée. Ensuite, Rainbow implémente une stratégie d’appel hétérozygote pour diviser les groupes potentiels en haplotypes de manière descendante. Le long d’un arbre guidé, il fusionne itérativement les feuilles sœurs de façon ascendante si elles sont suffisamment similaires. Ici, la similarité est définie en comparant les secondes séquences d’un segment RAD. Cette approche tente de détruire les hétérozygotes tout en discriminant les séquences répétitives. Enfin, Rainbow utilise un algorithme glouton pour assembler localement les séquences fusionnées en contigs. En se basant sur la simulation et de vraies données de séquençage RAD de guppy, il a été montré que Rainbow est plus efficace que les autres outils pour gérer les données de séquençage RAD.

Please cite: Zechen Chong, Jue Ruan and Chung-I. Wu: Rainbow: an integrated tool for efficient clustering and assembling RAD-seq reads.. (PubMed) Bioinformatics 28(21):2732-2737 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bio-tradis
analyse des sorties d'analyses TraDIS de séquences de génomes
Versions of package bio-tradis
ReleaseVersionArchitectures
sid1.4.5+dfsg2-2all
trixie1.4.5+dfsg2-2all
buster1.4.1+dfsg-1all
bookworm1.4.5+dfsg2-1all
bullseye1.4.5+dfsg2-1all
stretch-backports1.3.3+dfsg-3~bpo9+1all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Bio-Tradis fournit un ensemble d'outils pour analyser la sortie des analyses TraDIS.

La chaîne d'analyse Bio-Tradis est implémentée sous la forme d'une bibliothèque Perl extensible qui peut être utilisée telle quelle ou comme base de développement d'outils d'analyse plus évolués.

Note : il est nécessaire d’installer manuellement BioConductor Edger qui ne peut être distribué dans Debian dans une version récente car il utilise le code locfit qui n’est pas distribuable.

Please cite: Lars Barquist, Matthew Mayho, Carla Cummins, Amy K. Cain, Christine J. Boinett, Andrew J. Page, Gemma C. Langridge, Michael A. Quail, Jacqueline A. Keane and Julian Parkhill: The TraDIS toolkit: sequencing and analysis for dense transposon mutant libraries. (PubMed,eprint) Bioinformatics 32(7):1109-1111 (2016)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bio-vcf
domain specific language (DSL) for processing the VCF format
Versions of package bio-vcf
ReleaseVersionArchitectures
bookworm0.9.5-3all
bullseye0.9.5-2all
trixie0.9.5-3all
sid0.9.5-3all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Bio-vcf provides a domain specific language (DSL) for processing the VCF format. Record named fields can be queried with regular expressions, e.g.

 sample.dp>20 and rec.filter !~ /LowQD/ and rec.tumor.bcount[rec.alt]>4

Bio-vcf is a new generation VCF parser, filter and converter. Bio-vcf is not only very fast for genome-wide (WGS) data, it also comes with a really nice filtering, evaluation and rewrite language and it can output any type of textual data, including VCF header and contents in RDF and JSON.

bioawk
extension d’awk pour l’analyse de séquences biologiques
Versions of package bioawk
ReleaseVersionArchitectures
sid1.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 0 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Bioawk est une extension du awk de Brian Kernighan, ajoutant la prise en charge de plusieurs formats communs de données de biologie, incluant les formats facultativement compressés par gzip, BED, GFF, SAM, VCF, FASTA/Q et délimités par des tabulations avec des noms de colonne. Il ajoute des fonctions internes et une option en ligne de commande pour utiliser les tabulations comme délimiteurs d’entrée/sortie. Quand cette nouvelle fonctionnalité n’est pas utilisée, bioawk est prévu pour se comporter comme l’awk originel de Brian Wilson Kernighan.

Registry entries: Bioconda 
biobambam2
tools for early stage alignment file processing
Versions of package biobambam2
ReleaseVersionArchitectures
bullseye2.0.179+ds-1amd64,arm64,i386,ppc64el
trixie2.0.185+ds-1amd64,arm64,i386,ppc64el
sid2.0.185+ds-1amd64,arm64,i386,ppc64el,riscv64
bookworm2.0.185+ds-1amd64,arm64,i386,ppc64el
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

This package contains some tools for processing BAM files, including

  bamsormadup:  parallel sorting and duplicate marking
  bamcollate2:  reads BAM and writes BAM reordered such that alignment
                or collated by query name
  bammarkduplicates: reads BAM and writes BAM with duplicate alignments
                marked using the BAM flags field
  bammaskflags: reads BAM and writes BAM while masking (removing) bits
                from the flags column
  bamrecompress: reads BAM and writes BAM with a defined compression
                 setting. This tool is capable of multi-threading.
  bamsort:       reads BAM and writes BAM resorted by coordinates or
                 query name
  bamtofastq:    reads BAM and writes FastQ; output can be collated
                 or uncollated by query name
The package is enhanced by the following packages: multiqc
Please cite: German Tischler and Steven Leonard: biobambam: tools for read pair collation based algorithms on BAM files. (eprint) Source Code Biol Med. 9:13 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
biosyntax
coloration syntaxique pour la biologie computationnelle – métapaquet
Versions of package biosyntax
ReleaseVersionArchitectures
sid1.0.0b-6all
bookworm1.0.0b-4all
bullseye1.0.0b-2all
buster1.0.0b-1all
trixie1.0.0b-6all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet apporte la coloration syntaxique à la biologie computationnelle pour donner plus d’intuition aux utilisateurs sur leurs données. BioSyntax prend en charge les fichiers .sam, .flagstat, .vcf, .fasta, .fastq, .faidx , .clustal, .pdb, .gtf, .bed et d’autres.

Ce métapaquet dépend de tous les greffons bioSyntax.

Please cite: Artem Babaian, Anicet Ebou, Alyssa Fegen, Ho Yin Jeffrey Kam, German E Novakovsky, Jasper Wong, Dylan Aïssi and Li Yao: bioSyntax: syntax highlighting for computational biology. BMC Bioinformatics 19(303) (2018)
Registry entries: Bio.tools  SciCrunch 
bitseq
inférence bayésienne de transcripts à partir de données de séquençage
Versions of package bitseq
ReleaseVersionArchitectures
bookworm0.7.5+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.7.5+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster0.7.5+dfsg-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.7.5+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.7.5+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

BitSeq est une application pour inférer des niveaux d’expression de transcripts individuels depuis des données de séquençage (RNA-Seq) et pour estimer l’expression différentielle (DE) entre des « conditions ». Un avantage de cette approche est la capacité d’expliquer l’incertitude technique et la variance biologique pour éviter de faux appels DE. La contribution technique à l’incertitude vient depuis la profondeur de lecture finie et la correspondance potentiellement ambiguë de lectures depuis plusieurs transcripts.

Please cite: James Hensman, Panagiotis Papastamoulis, Peter Glaus, Antti Honkela and Magnus Rattray: Fast and accurate approximate inference of transcript expression from RNA-seq data. (PubMed,eprint) Bioinformatics 31(24):3881-9 (2015)
Registry entries: Bio.tools  SciCrunch 
blasr
correspondance de lectures de séquençage de molécules simples
Versions of package blasr
ReleaseVersionArchitectures
sid5.3.5+dfsg-6amd64,arm64,mips64el,ppc64el,riscv64
trixie5.3.5+dfsg-6amd64,arm64,mips64el,ppc64el
bookworm5.3.5+dfsg-6amd64,arm64,mips64el,ppc64el
bullseye5.3.3+dfsg-5amd64,arm64,mips64el,ppc64el
buster5.3.2+dfsg-1.1amd64,arm64,mips64el,ppc64el
stretch5.3+0-1amd64,arm64,mips64el,ppc64el
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

BLASR (« Basic local alignment with successive refinement ») est une méthode pour mettre en correspondance des lectures de séquençage de molécules simples avec un génome de référence. De telles lectures sont longues de plusieurs milliers de bases et les divergences entre elles et le génome sont dominées par les erreurs d'insertion et de suppression.

Registry entries: Bio.tools  SciCrunch  Bioconda 
blixem
navigateur interactif d’alignements de séquences
Versions of package blixem
ReleaseVersionArchitectures
buster4.44.1+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye4.44.1+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.44.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.44.1+dfsg-7.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Blixem est un navigateur interactif d’alignements de séquences qui ont été empilés dans un alignement multiple de type « maître-esclave » ; il ne s’agit pas d’un vrai alignement multiple mais d’un alignement « un vers beaucoup ».

  • section aperçu montrant les emplacements des gènes et des alignements autour de la fenêtre d’alignement ;
  • section détail montrant l’alignement de séquences de protéines ou de nucléotides dans la séquence d’ADN génomique ;
  • voir des alignements entre les deux brins de la séquence de référence ;
  • voir des séquences en mode nucléotide ou protéine ; en mode protéine, Blixem affiche la traduction en trois cadres de la séquence de référence ;
  • les résidus sont surlignés en différentes couleurs en fonction de s’il s’agit d’une correspondance parfaite, d’une substitution conservée ou d’une non-correspondance ;
  • les alignements avec trous sont pris en charge, les insertions ou suppressions étant surlignées dans la séquence correspondante ;
  • les correspondances peuvent être triées et filtrées ;
  • les polymorphismes de nucléotides simples (SNP) et autres variations peuvent être surlignés dans la séquence de référence ;
  • les queues Poly(A) peuvent être affichées et les signaux poly(A) peuvent être surlignés dans la séquence de référence.
Please cite: Gemma Barson and Ed Griffiths: SeqTools: visual tools for manual analysis of sequence alignments. (PubMed,eprint) BMC Research Notes 9:39 (2016)
Registry entries: Bio.tools  SciCrunch 
bolt-lmm
test efficace d’association de modèles mixtes bayésiens sur tout le génome de grandes cohortes
Versions of package bolt-lmm
ReleaseVersionArchitectures
buster2.3.2+dfsg-3amd64
trixie2.4.1+dfsg-2amd64,i386,ppc64el
sid2.4.1+dfsg-2amd64,i386,ppc64el
bookworm2.4.0+dfsg-1amd64,i386,ppc64el
bullseye2.3.4+dfsg-3amd64,i386,ppc64el
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet BOLT-LMM consiste actuellement en deux algorithmes principaux, l’algorithme BOLT-LMM pour le test d’association de modèles mixtes, et l’algorithme BOLT-REML pour l’analyse de variance de composants (par exemple, partitionnement d’héritabilité SNP et estimation de corrélations génétiques).

L’algorithme BOLT-LMM calcule des statistiques pour tester des associations entre des phénotypes et des génotypes en utilisant un modèle linéaire mixte. Par défaut, BOLT-LMM suppose une distribution bayésienne de probabilité antérieure (« prior ») de mélange de normales pour l’effet aléatoire attribué aux SNP autres que celui testé. Ce modèle généralise le modèle mixte infinitésimal standard utilisé par les méthodes d’association de modèles mixtes précédents, fournissant une plus grande puissance pour détecter des associations tout en contrôlant les faux positifs. De plus, BOLT-LMM applique les avancées algorithmiques pour calculer des statistiques d’association de modèle mixte bien plus rapidement que les méthodes basées sur la décomposition en éléments propres, à la fois en utilisant le modèle de mélange bayésien et quand l’association de modèle mixte, spécialisé vers standard, est utilisée.

L’algorithme BOLT-REML estime l’héritabilité expliquée par les SNP génotypés et les corrélations génétiques parmi plusieurs traits mesurés sur le même ensemble d’individus. BOLT-REML applique une analyse de variance de composants pour réaliser ces tâches et prend en charge à la fois la modélisation multicomposant pour partitionner l’héritabilité SNP et la modélisation multitrait pour estimer les corrélations. BOLT-REML applique un algorithme de Monte-Carlo qui est bien plus rapide que les méthodes basées sur la décomposition en éléments propres pour l’analyse de variance de composants pour de grandes tailles d’échantillons.

The package is enhanced by the following packages: bolt-lmm-example
Please cite: Po-Ru Loh, George Tucker, Brendan K Bulik-Sullivan, Bjarni J Vilhjálmsson, Hilary K Finucane, Rany M Salem, Daniel I Chasman, Paul M Ridker, Benjamin M Neale, Bonnie Berger, Nick Patterson and Alkes L Price: Efficient Bayesian mixed-model analysis increases association power in large cohorts. Nature Genetics (2015)
bowtie
aligneur ultra-rapide de lectures courtes avec une faible empreinte mémoire
Versions of package bowtie
ReleaseVersionArchitectures
bullseye1.3.0+dfsg1-1amd64,arm64,mips64el,ppc64el,s390x
trixie1.3.1-3amd64,arm64,mips64el,ppc64el,s390x
sid1.3.1-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster1.2.2+dfsg-4amd64,arm64,mips64el,ppc64el,s390x
jessie1.1.1-2amd64
stretch1.1.2-6amd64,arm64,mips64el,ppc64el,s390x
bookworm1.3.1-1amd64,arm64,mips64el,ppc64el,s390x
Debtags of package bowtie:
biologynuceleic-acids
fieldbiology:bioinformatics
interfacecommandline
roleprogram
sciencecalculation
scopeutility
useanalysing, comparing
works-withbiological-sequence
Popcon: 31 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet aborde le problème de l'interprétation des résultats des dernières technologies (2010) de séquençage de l'ADN. Celles-ci produiront des étirements assez courts et qui ne peuvent pas directement être interprétés. C'est le défi d'outils comme Bowtie de donner un emplacement chromosomique aux courts étirements de l'ADN séquencé à chaque exécution.

Bowtie aligne des (lectures de) séquences d'ADN du génome humain à un débit de 25 millions de lectures de paires de bases 35 par heure. Le paquet Bowtie indexe le génome humain avec un indice de Burrows-Wheeler pour garder une faible empreinte mémoire : typiquement environ 2,2 Go pour le génome humain (2,9 Go pour le séquençage à partir des deux extrémités).

The package is enhanced by the following packages: bowtie-examples multiqc
Please cite: Ben Langmead, Cole Trapnell, Mihai Pop and Steven L Salzberg: Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. (eprint) Genome Biology 10:R25 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
bowtie2
aligneur ultra-rapide de lectures courtes avec une faible empreinte mémoire
Versions of package bowtie2
ReleaseVersionArchitectures
bookworm2.5.0-3amd64,arm64,mips64el,ppc64el
sid2.5.2-1amd64,arm64,mips64el,ppc64el,riscv64
trixie2.5.2-1amd64,arm64,mips64el,ppc64el
jessie2.2.4-1amd64
buster2.3.4.3-1amd64
bullseye2.4.2-2amd64,arm64,mips64el,ppc64el
stretch2.3.0-2amd64
upstream2.5.3
Popcon: 31 users (7 upd.)*
Newer upstream!
License: DFSG free
Git

Ce paquet est un outil à faible empreinte mémoire et ultra-rapide pour l'alignement de lectures de séquençage à séquences longues de référence. Il est particulièrement performant pour l'alignement de lectures d'environ 50 symboles et jusqu'à des centaines ou des milliers de symboles, et particulièrement performant pour l'alignement de génomes relativement longs (par exemple, le génome de mammifères).

Bowtie 2 indexe le génome avec un FM-index pour garder une faible empreinte mémoire : pour le génome humain, son empreinte en mémoire vive est typiquement d'environ 3,2 Go. Bowtie 2 gère les modes d'alignement écarté, local, et par paire.

The package is enhanced by the following packages: bowtie2-examples multiqc
Please cite: Ben Langmead and Steven L Salzberg: Fast gapped-read alignment with Bowtie 2. (PubMed) Nature Methods 9:357–359 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
boxshade
Rendu élégant d'alignements multiples de séquences
Versions of package boxshade
ReleaseVersionArchitectures
jessie3.3.1-8amd64,armel,armhf,i386
bullseye3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3.3.1-12amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch3.3.1-10amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package boxshade:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usetypesetting
works-with-formathtml, plaintext, postscript, tex
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Boxshade est conçu pour l'impression de documents de qualité présentant des séquences d'ADN ou des alignements multiples de protéines. Ce n'est pas un programme de calcul d'alignements, il lui faut un fichier en entrée créé par un outil de calcul d'alignement ou édité à la main.

Boxshade lit les alignements de séquences depuis les fichiers générés par les logiciels PILEUP-PSF, CLUSTAL-ALN, MALIGNED et ESEE (dans la limite de 150 séquences contenant au maximum 10 000 éléments chacune). De nombreux jeux d'ombre peuvent être utilisés. La sortie est affichée à l'écran ou peut être envoyée dans un fichier dans les formats suivants : ANSI/VT100, PS/EPS, RTF, HPGL, ReGIS, LJ250-printer, ASCII, xFIG, PICT, HTML.

Registry entries: Bio.tools  SciCrunch 
bppphyview
afficheur phylogénétique pour Bio++
Versions of package bppphyview
ReleaseVersionArchitectures
stretch0.3.0-1.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.6.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.6.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.3.0-1amd64,armel,armhf,i386
sid0.6.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.6.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.6.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package bppphyview:
roleprogram
uitoolkitqt
Popcon: 0 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un éditeur pour classification phylogénétique utilisant Bio++ et Qt. Phyview permet de visualiser, éditer et produire des arbres phylogénétiques et les données afférentes.

bppsuite
suite de programmes Bio++
Versions of package bppsuite
ReleaseVersionArchitectures
buster2.4.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.4.1-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.4.1-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.2.0-0.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.4.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.4.1-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package bppsuite:
roleprogram
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

La suite de programmes Bio++ est un ensemble de programmes utilisant les bibliothèques Bio++ et dédiés à la phylogénétique et à l’évolution moléculaire. Tous les programmes sont indépendants mais peuvent être combinés pour réaliser des analyses complexes. Ces programmes utilisent les outils d’aide d’interface des bibliothèques et partagent donc la même syntaxe. Ils ont aussi plusieurs options communes, qui pourraient être partagées par des logiciels tiers.

Les programmes suivants sont inclus :

 – BppML pour une analyse de maximum de vraisemblance ;
 – BppSeqGen pour la simulation de séquences ;
 – BppAncestor pour la reconstruction d'états ancestraux ;
 – BppDist pour les méthodes de distance ;
 – BppPars pour l’analyse de parcimonie ;
 – BppSeqMan pour la conversion de fichiers et la manipulation de
   séquences ;
 – BppConsense pour construire des arbres de consensus et calculer des
   valeurs de démarrage (« bootstrap ») ;
 – BppReRoot pour le changement de racines d'arbre ;
 – BppTreeDraw pour le dessin d'arbres ;
 – BppAlnScore pour la comparaison d'alignements et le calcul de scores
   d'alignements ;
 – BppMixedLikelihood pour calculer les vraisemblances site par site des
   composants de modèles de mélange ;
 – BppPopGen pour les analyses génétiques de population.
The package is enhanced by the following packages: bppsuite-examples
brig
générateur d'images circulaires BLAST
Versions of package brig
ReleaseVersionArchitectures
stretch0.95+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.95+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.95+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.95+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.95+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.95+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

BRIG peut afficher des comparaisons circulaires entre un grand nombre de génomes avec un intérêt pour la gestion de données d'assemblage de génome.

 – les images montrent des similarités entre une séquence de référence
   centrale et d'autres séquences en cercles concentriques ;
 – BRIG réalise toutes les comparaisons BLAST et analyse les fichiers
   automatiquement à partir d'une interface simple ;
 – les frontières de contigs et la couverture de lecture peuvent être
   affichées pour les génomes brouillons ; des graphes et des annotations
   personnalisés peuvent être affichés ;
 – grâce à un ensemble de gènes définis en entrée par l'utilisateur, BRIG
   peut afficher la présence, l'absence ou la troncature de gènes ou une
   variation de séquence dans un ensemble de génomes complets, brouillons
   ou même sous forme de données de séquence brutes et non assemblées ;
 – BRIG peut également accepter les fichiers formatés par SAM de
   correspondance de lecture, ce qui permet à des régions génomiques
   présentes dans des données de séquence non assemblées provenant de
   plusieurs échantillons d'être comparées simultanément.
Please cite: Nabil-Fareed Alikhan, Nicola K Petty, Nouri L Ben Zakour and Scott A Beatson: BLAST Ring Image Generator (BRIG): simple prokaryote genome comparisons. (PubMed,eprint) BMC Genomics 12:402 (2011)
Registry entries: Bio.tools  SciCrunch 
btllib-tools
Bioinformatics Technology Lab common code library tools
Versions of package btllib-tools
ReleaseVersionArchitectures
trixie1.4.10+dfsg-1amd64,arm64,mips64el,ppc64el
bookworm1.4.10+dfsg-1amd64,arm64,mips64el,ppc64el
sid1.4.10+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64
upstream1.7.0
Popcon: 0 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Bioinformatics Technology Lab common code library in C++ with Python wrappers.

This package contains the tool indexlr.

Registry entries: Bioconda 
busco
benchmarking sets of universal single-copy orthologs
Versions of package busco
ReleaseVersionArchitectures
bullseye5.0.0-1all
bookworm5.4.4-1amd64,i386
sid5.5.0-2amd64,arm64,i386
Popcon: 8 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Assessing genome assembly and annotation completeness with Benchmarking Universal Single-Copy Orthologs (BUSCO).

  • Automated selection of lineages issued from https://www.orthodb.org/
  • Automated download of all necessary files and datasets to conduct a run
  • Use prodigal for non-eukaryotic genomes
The package is enhanced by the following packages: multiqc
Please cite: Mathieu Seppey, Mosè Manni and Evgeny M. Zdobnov: BUSCO: Assessing Genome Assembly and Annotation Completeness. (PubMed) Methods Mol Biol. 1962:227-245 (2019)
Registry entries: Bio.tools  Bioconda 
bustools
manipulation de fichiers BUS pour des ensembles de données de séquençage d’ADN de cellule unique
Versions of package bustools
ReleaseVersionArchitectures
trixie0.43.2+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
sid0.43.2+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm0.42.0+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
bullseye0.40.0-4amd64,arm64,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit le programme BUStools qui peut être utilisé pour corriger des erreurs de barcoding moléculaire, réduire les UMI, calculer le nombre de gènes ou des matrices de comptages de compatibilité de transcription.

Please cite: Páll Melsted, A. Sina Booeshaghi, Fan Gao, Eduardo Beltrame, Lambda Lu, Kristján Eldjárn Hjorleifsson, Jase Gehring and Lior Pachter: Modular and efficient pre-processing of single-cell RNA-seq.. BioRxiv :673285 (2019)
Registry entries: Bio.tools  Bioconda 
bwa
dispositif d'alignement Burrows-Wheeler
Versions of package bwa
ReleaseVersionArchitectures
stretch-backports0.7.17-1~bpo9+1amd64
buster0.7.17-3amd64
bullseye0.7.17-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.7.15-2+deb9u1amd64
jessie0.7.10-1amd64
bookworm0.7.17-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.7.17-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.7.17-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
experimental0.7.17-8~0expamd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package bwa:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
useanalysing, comparing
Popcon: 28 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

BWA est un paquet logiciel pour mettre en correspondance des séquences à faible divergence avec un grand génome de référence tel que le génome humain. Il est constitué de trois algorithmes : BWA-backtrack, BWA-SW et BWA-MEM. Le premier algorithme est conçu pour les lectures de séquences Illumina jusqu'à 100 paires de bases, alors que les deux autres sont conçus pour des lectures de séquences allant de 70 à 1 000 paires de bases. BWA-MEM et BWA-SW partagent des fonctionnalités communes telles que la prise en charge des lectures longues et des alignements de découpages (« split alignment »), mais BWA-MEM, plus récent, est généralement recommandé pour les requêtes de haute qualité, car il est plus rapide et plus précis. BWA-MEM a également de meilleures performances que BWA-backtrack pour les lectures Illumina de 70 à 100 paires de bases.

Please cite: Heng Li and Richard Durbin: Fast and accurate short read alignment with Burrows-Wheeler transform. (PubMed,eprint) Bioinformatics 25(14):1754-1760 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
canu
assembleur de séquences de molécules simples pour les génomes
Versions of package canu
ReleaseVersionArchitectures
sid2.2+dfsg-5amd64,arm64,mips64el,ppc64el,riscv64,s390x
stretch-backports1.7.1+dfsg-1~bpo9+1amd64
buster1.8+dfsg-2amd64
bookworm2.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Canu est un fork de Celera Assembler, conçu pour le séquençage fortement bruité de molécules simples (comme PacBio RS II ou Oxford Nanopore MinION).

Canu est un processus d'assemblage hiérarchique fonctionnant en quatre étapes :

 – détection des chevauchements dans les séquences très bruitées grâce à
   MHAP ;
 – génération du consensus de séquence corrigé ;
 – élagage des séquences corrigées ;
 – assemblage des séquences corrigées élaguées.
Please cite: Sergey Koren, Brian P. Walenz, Konstantin Berlin, Jason R. Miller and Adam M. Phillippy: Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation.. Genome Res. (2017)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
cassiopee
outil d'indexation et de recherche dans les séquences génomiques
Versions of package cassiopee
ReleaseVersionArchitectures
sid1.0.9-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0.9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.9-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.0.1+dfsg-3amd64,armel,armhf,i386
stretch1.0.5-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0.9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.9-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Cassiopee est une bibliothèque d'indexation et de recherche implémentée en C. Il s'agit d'une réécriture complète de la gemme ruby Cassiopee. Elle scanne une séquence génomique d'entrée (ADN, ARN, protéine) et recherche une sous-séquence avec une correspondance parfaite ou en permettant des substitutions (mesurées avec la distance de Hamming), des insertions ou des suppressions.

Ce paquet fournit les outils cassiopee et cassiopeeknife.

Registry entries: SciCrunch  Bioconda 
cat-bat
taxonomic classification of contigs and metagenome-assembled genomes (MAGs)
Versions of package cat-bat
ReleaseVersionArchitectures
trixie5.3-2amd64,arm64,ppc64el,s390x
sid5.3-2amd64,arm64,ppc64el,riscv64,s390x
bookworm5.2.3-2amd64,arm64,ppc64el,s390x
bullseye5.2.2-1amd64,arm64,ppc64el,s390x
upstream6.0.1
Popcon: 1 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

Contig Annotation Tool (CAT) and Bin Annotation Tool (BAT) are pipelines for the taxonomic classification of long DNA sequences and metagenome assembled genomes (MAGs/bins) of both known and (highly) unknown microorganisms, as generated by contemporary metagenomics studies. The core algorithm of both programs involves gene calling, mapping of predicted ORFs against the nr protein database, and voting-based classification of the entire contig / MAG based on classification of the individual ORFs. CAT and BAT can be run from intermediate steps if files are formatted appropriately.

Please cite: F. A. Bastiaan von Meijenfeldt, Ksenia Arkhipova, Diego D. Cambuy, Felipe H. Coutinho and Bas E. Dutilh: Robust taxonomic classification of uncharted microbial sequences and bins with CAT and BAT. (PubMed,eprint) Genome Biology 20(1):217 (2019)
Registry entries: Bioconda 
cct
comparaison visuelle de séquences bactériennes, de plasmides, de chloroplastes ou mitochondriales
Versions of package cct
ReleaseVersionArchitectures
bookworm1.0.3-1all
bullseye1.0.0-1all
sid1.0.3-1all
trixie1.0.3-1all
buster20170919+dfsg-1all
stretch-backports20170919+dfsg-1~bpo9+1all
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

L’outil de comparaison CGView (CCT) est un paquet pour comparer visuellement des séquences bactériennes, de plasmides, de chloroplastes ou mitochondriales intéressantes à des génomes existants ou des collections de séquences. Les comparaisons sont conduites avec BLAST, et leurs résultats sont présentés sous forme de cartes graphiques qui peuvent aussi montrer des caractéristiques de séquences, des noms de gènes ou de protéines, des affectations de catégories COG et des caractéristiques de compositions de séquences. CCT peut créer des cartes des plusieurs tailles, y compris en cartes de 400 mégapixels pour faire des posters. Les comparaisons peuvent être menées dans une espèce ou un genre (subdivision biologique) particuliers, ou tous les génomes disponibles peuvent être utilisés. Tout le processus de création de carte, du téléchargement de séquences au redessin de cartes zoomées, peut être accompli facilement grâce aux scripts inclus dans CCT. Les fonctions définies par l’utilisateur ou les résultats d’analyses peuvent être inclus dans les cartes, et les cartes peuvent être largement personnalisées. Pour simplifier la configuration du programme, une machine virtuelle CCT incluant toutes les dépendances préinstallées est disponible. Des tutoriels détaillés illustrant l’utilisation de CCT sont inclus avec la documentation de CCT.

Please cite: Jason R Grant, Adriano S Arantes and Paul Stothard: Comparing thousands of circular genomes using the CGView Comparison Tool. (PubMed,eprint) BMC Genomics 13:202 (2012)
cd-hit
suite de programmes conçus pour grouper rapidement des séquences
Versions of package cd-hit
ReleaseVersionArchitectures
stretch4.6.6-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie4.8.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid4.8.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie4.6.1-2012-08-27-2amd64,armel,armhf,i386
bullseye4.8.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster4.6.8-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm4.8.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 9 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

cd-hit contient un certain nombre de programmes conçus pour grouper rapidement des séquences. cd-hit groupe les protéines en grappes qui satisfont à un seuil de similitudes défini par l'utilisateur. cd-hit-est est similaire à cd-hit, mais conçu pour grouper des séquences (sans introns). cd-hit-est-2d est similaire à cd-hit-2d mais conçu pour comparer 2 ensembles de données de nucléotides. Un certain nombre d'autres programmes associés sont aussi dans ce paquet. De plus amples informations se trouvent dans le manuel utilisateur de cd-hit, qui se trouve dans ce paquet.

Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
cdbfasta
indexation avec Constant DataBase et outils de recherche pour les fichiers multi-FASTA
Versions of package cdbfasta
ReleaseVersionArchitectures
sid1.00+git20230710.da8f5ba+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.99-20100722-1amd64,armel,armhf,i386
stretch0.99-20100722-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.99-20100722-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.00+git20181005.014498c+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.00+git20230710.da8f5ba+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.00+git20181005.014498c+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

CDB (« Constant DataBase ») peut être utilisé pour la créer des indexes pour la recherche rapide de n'importe quelle séquence dans des fichiers au format multi-FASTA (concaténation de plusieurs fichiers au format FASTA) de taille importante. Il a la possibilité de compresser les enregistrements de données afin d'économiser de l'espace.

Registry entries: SciCrunch 
centrifuge
système rapide et économe en mémoire de classification de séquences ADN
Versions of package centrifuge
ReleaseVersionArchitectures
sid1.0.3-11armel,armhf,i386
buster1.0.3-2amd64
bullseye1.0.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm1.0.3-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el
trixie1.0.3-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el
sid1.0.3-12amd64,arm64,mips64el,ppc64el,riscv64
upstream1.0.4.1
Popcon: 2 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Centrifuge est un système très rapide et économe en mémoire de classification de séquences ADN d’échantillons microbiens, avec une meilleure sensibilité et une précision similaire que d’autres systèmes éminents. Le système utilise an nouveau schéma d’indexation basé sur la transformation de Burrows-Wheeler (BWT) et l’index de Ferragina-Manzini (FM), optimisés spécifiquement pour le problème de classification métagénomique. Centrifuge nécessite un index relativement petit (par exemple, 4,3 Go pour environ 4100 génomes de bactéries), mais propose une vitesse de classification très rapide lui permettant de procéder à une séquençage ADN classique en une heure. Ces avancées permettent une analyse rapide et précise de grands ensembles de données métagénomiques sur des ordinateurs de bureau conventionnels.

Please cite: Daehwan Kim, Li Song, Florian P. Breitwieser and Steven L. Salzberg: Centrifuge: rapid and sensitive classification of metagenomic sequences. (PubMed,eprint) Genome Research 26(12):1721-1729 (2016)
Registry entries: Bio.tools  Bioconda 
cgview
visionneuse de génome circulaire
Versions of package cgview
ReleaseVersionArchitectures
buster0.0.20100111-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.0.20100111-7all
sid0.0.20100111-7all
bullseye0.0.20100111-7all
trixie0.0.20100111-7all
stretch0.0.20100111-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

CGView est un paquet Java pour créer des cartes de haute qualité et zoomables de génomes circulaires. Son but principal est de servir de composant d'infrastructures d'annotation de séquences, comme un moyen de générer une sortie visuelle adaptée pour le web. Les informations de caractéristiques et les options de rendu sont fournies au programme grâce à un fichier XML, un fichier délimité par les tabulations ou un fichier ptt NCBI. CGView convertit l'entrée en une carte graphique (au format PNG, JPG ou SVG) complète avec des étiquettes, un titre, des légendes et des annotations. En plus de la carte complète par défaut, le programme peut créer une série de cartes hyperliées montrant des vues agrandies. Les cartes liées peuvent être explorées avec n'importe quel navigateur, ce qui permet une navigation rapide dans le génome et facilite le partage de données. Les étiquettes de caractéristiques dans les cartes peuvent être des liens vers des ressources externes, permettant aux cartes CGView d'être intégrées avec du contenu de site web ou des bases de données existants.

En plus de l'application CGView, une API est disponible pour créer des cartes depuis d'autres applications Java avec le paquet cgview.

CGView peut être utilisé pour :

 — la visualisation et la navigation de génome bactérien ; CGView peut
   être incorporé dans des infrastructures d'annotation de génome
   bactérien comme un moyen de créer du contenu web pour la visualisation
   de données et la navigation. Le contenu de la carte ne nécessite pas
   d'applet Java ou de greffon de navigateur particulier ;
 — la génération de poster de génome ; CGView peut créer des images de la
   taille d'un poster de génomes circulaires dans des formats d'images
   rasterisés ou au format SVG ;
 — la visualisation d'analyse de séquence ; CGView peut servir à afficher
   la sortie de programmes d'analyse de séquences dans un contexte
   circulaire.

Fonctions de CGView :

 — création d'images aux formats PNG, JPG ou SVG. Voir la galerie CGView ;
 — création de cartes statiques ou interactives. Les cartes interactives
   utilisent des images standard PNG et des cartes d'images HTML. La sortie
   SVG est incluse dans les cartes interactives (voir l'exemple) ;
 — l'entrée XML permet un contrôle complet sur l'apparence de la carte ;
 — des fichiers d'entrée délimités par des tabulations et des fichiers ptt
   NCBI peuvent servir d'alternative au format XML ;
 — l'API CGView peut servir à intégrer CGView dans des applications Java ;
 — l'applet CGView peut servir à intégrer des cartes zoomables dans les
   pages web (voir l'exemple) ;
 — le serveur CGView peut servir à créer des cartes en ligne.
Please cite: Paul Stothard and David S. Wishart: Circular genome visualization and exploration using CGView. (PubMed,eprint) Bioinformatics 21(4):537-539 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
changeo
boîte à outils d’affectation clonale de répertoire – Python 3
Versions of package changeo
ReleaseVersionArchitectures
bookworm1.3.0-1all
bullseye1.0.2-1all
sid1.3.0-1all
buster0.4.5-1all
Popcon: 3 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Change-O est un ensemble d’outils pour traiter la sortie d’outils d’alignement V(D)J, affecter des groupes clonaux à des séquences d’immunoglobuline (Ig) et reconstruire des séquences de lignées germinales.

D’importantes améliorations dans les technologies de séquençage à haut débit permettent maintenant de caractériser à grande échelle des répertoires Ig, définis comme l’ensemble de protéines réceptrices d’antigènes transmembranaires situées à la surface des cellules B et des cellules T. Change-O est une suite d’outils permettant de faciliter l’analyse avancée de séquences Ig et TCR suivant l’affectation de segments de lignées germinales. Change-O gère la sortie de IMGT/HighV-QUEST et d’IgBLAST et fournit une grande variété de méthodes de regroupement (clustering) pour affecter des groupes clonaux à des séquences Ig. Le tri d’enregistrements, le groupement et diverses opérations de manipulations de bases de données sont également inclus.

Ce paquet installe la bibliothèque pour Python 3.

Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Link to publication (PubMed,eprint) Bioinformatics 31(20):3356-3358 (2015)
Registry entries: Bioconda 
chimeraslayer
détecte les simili-chimères dans les ADN amplifiés via réaction en chaîne par polymérase
Versions of package chimeraslayer
ReleaseVersionArchitectures
jessie20101212+dfsg-1all
bullseye20101212+dfsg1-4all
sid20101212+dfsg1-5all
trixie20101212+dfsg1-5all
stretch20101212+dfsg1-1all
buster20101212+dfsg1-2all
bookworm20101212+dfsg1-5all
Debtags of package chimeraslayer:
biologyformat:aln, nuceleic-acids
fieldbiology, biology:molecular
roleprogram
scopeutility
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ChimeraSlayer est un utilitaire de détection de séquence chimérique, compatible avec des séquences d'une longueur pratiquement identique à celles de Sanger ainsi qu'avec des séquences 454-FLX plus courtes (environ 500bp).

ChimeraSlayer impose les séries d'étapes d'exploitation suivantes pour signaler des séquences rARN 16S chimériques :

 1. les terminaisons d'une séquence de requête sont recherchées parmi une
     base de données de référence incluse de séquences 16S sans chimère,
     pour identifier des parents potentiels d'une chimère ;
 2. les parents candidats d'une chimère sont sélectionnés selon ceux qui
     donnent le meilleur score d'alignement ramifié par rapport à la
     séquence de requête au format NAST ;
 3. l'alignement NAST de la séquence de requête est amélioré dans un
     réalignement, de profil NAST « vigilant aux chimères », sur les
     séquences parent de référence sélectionnées ;
 4. un environnement de travail de l'évolution est utilisé pour signaler
     des séquences de requête trouvées, afin de présenter une meilleure
     homologie de séquence avec une chimère formée in silico entre chacune
     des deux séquences parent de référence sélectionnées.

Pour lancer Chimera Slayer, vous avez besoin de séquences au format NAST générées par l'utilitaire de type nast.

ChimeraSlayer fait partie de la suite microbiomeutil.

The package is enhanced by the following packages: microbiomeutil-data
Please cite: Brian J. Haas, Dirk Gevers, Ashlee M. Earl, Mike Feldgarden, Doyle V. Ward, Georgia Giannoukos, Dawn Ciulla, Diana Tabbaa, Sarah K. Highlander, Erica Sodergren, Barbara Methé, Todd Z. DeSantis, The Human Microbiome Consortium, Joseph F. Petrosino, Rob Knight and Bruce W. Birren: Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. (PubMed,eprint) Genome Research 21(3):494-504 (2011)
Registry entries: SciCrunch 
chromhmm
découverte et caractérisation d’état de chromatine
Versions of package chromhmm
ReleaseVersionArchitectures
bullseye1.21+dfsg-1all
sid1.25+dfsg-1all
trixie1.25+dfsg-1all
bookworm1.24+dfsg-1all
buster1.18+dfsg-1all
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

ChromHMM est un logiciel pour apprendre et caractériser des états de chromatine. ChromHMM peut intégrer plusieurs jeux de données de chromatine tels que des données ChIP-seq de diverses modifications d’histones pour découvrir les motifs majeurs de réapparition combinatoire ou spatiale de marques. ChromHMM est basé sur un modèle de Markov caché (HMM) multivarié qui modélise explicitement la présence ou l’absence de chaque marque de chromatine. Le modèle qui en résulte peut ensuite servir à annoter systématiquement un génome dans un ou plusieurs types de cellules. En calculant automatiquement les enrichissements d’états pour des jeux de données fonctionnels et d’annotations de grande taille, ChromHMM facilite la caractérisation biologique de chaque état. ChromHMM produit également des fichiers avec des cartes sur tout le génome d’annotations d’état de chromatine qui peuvent être directement visualisés dans un navigateur de génome.

The package is enhanced by the following packages: chromhmm-example
Please cite: Jason Ernst and Manolis Kellis: ChromHMM: automating chromatin-state discovery and characterization. (eprint) Nature Methods 9(3):215-216 (2012)
Registry entries: Bio.tools  Bioconda 
chromimpute
attribution d’épigénome systématique à grande échelle
Versions of package chromimpute
ReleaseVersionArchitectures
bookworm1.0.3+dfsg-4all
bullseye1.0.3+dfsg-2all
sid1.0.3+dfsg-5all
trixie1.0.3+dfsg-5all
buster1.0.3+dfsg-1all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ChromImpute prend un compendium existant de données épigénomiques et s’en sert pour prédire des traces de signal pour des combinaisons de mark-sample non mappées expérimentalement ou pour créer une version potentiellement plus robuste de jeux de données ayant été mappés expérimentalement. ChromImpute base ses prédictions sur des fonctions de traces de signal d’autres marques ayant été mappées dans l’échantillon cible et la marque cible dans d’autres échantillons ayant ces fonctions combinées grâce à un ensemble d’arbres de régression.

Please cite: Jason Ernst and Manolis Kellis: Large-scale imputation of epigenomic datasets for systematic annotation of diverse human tissues. (eprint) Nature Biotechnology 33(4):364-376 (2015)
cif-tools
Suite of tools to manipulate, validate and query mmCIF files
Versions of package cif-tools
ReleaseVersionArchitectures
sid1.0.7-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.7-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.0.7-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.0.12
Popcon: 3 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

This package contains a suite of tools for the manipulation of mmCIF files.

The structure of macro molecules is nowadays recorded in mmCIF files. Until recently however the ancient PDB file format was used by many programs but that format has since long been deprecated.

This package provides two tools, pdb2cif and cif2pdb, that can convert files from one format into the other, provided that data fits of course.

Other tools are cif-validate, cif-grep, cif-diff, cif-merge and mmCQL. The latter can be used to manipulate an mmCIF file as if it were a SQL like database using SELECT, UPDATE, INSERT and DELETE commands.

This package depends on libcifpp.

circlator
circularisation d'assemblages de génomes
Versions of package circlator
ReleaseVersionArchitectures
stretch1.4.1-1all
bookworm1.5.6-7amd64
bullseye1.5.6-5amd64
buster1.5.5-3amd64
sid1.5.6-11all
Popcon: 4 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Circlator est un outil pour automatiser la circularisation d'assemblage pour les génomes de bactéries et de petits eucaryotes. Il produit des représentations linéaires précises de séquences circulaires.

Please cite: Martin Hunt, Nishadi De Silva, Thomas D. Otto, Julian Parkhill, Jacqueline A. Keane and Simon R. Harris: Circlator: automated circularization of genome assemblies using long sequencing reads. (PubMed) Genome Biology 29(16):294 (2015)
Registry entries: SciCrunch  Bioconda 
circos
outil de dessin pour visualiser des données
Versions of package circos
ReleaseVersionArchitectures
buster0.69.6+dfsg-2all
stretch0.69.4+dfsg-1all
bullseye0.69.9+dfsg-2all
bookworm0.69.9+dfsg-2all
trixie0.69.9+dfsg-2all
sid0.69.9+dfsg-2all
jessie0.66-1all
Debtags of package circos:
fieldbiology:bioinformatics
roleprogram
useviewing
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Circos affiche les données dans un graphe circulaire, de manière idéale pour étudier les relations entre objets ou positions et créer des graphiques hautement informatifs et de qualité publiable.

Ce paquet fournit le moteur de dessin de graphiques Circos qui se pilote à la ligne de commande (comme gnuplot) et est entièrement scriptable.

Please cite: Martin I Krzywinski, Jacqueline E Schein, Inanc Birol, Joseph Connors, Randy Gascoyne, Doug Horsman, Steven J Jones and Marco A Marra: Circos: An information aesthetic for comparative genomics. (PubMed,eprint) Genome Research 19(9):1639-45 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
clearcut
reconstruction d'arbre phylogénétique extrêmement efficace
Versions of package clearcut
ReleaseVersionArchitectures
buster1.0.9-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.0.9+git20211013.b799afe-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.0.9-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.9+git20211013.b799afe-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.9+git20211013.b799afe-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.0.9-1amd64,armel,armhf,i386
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Clearcut est l'implémentation de référence de l'algorithme RNJ (« Relaxed Neighbor Joining ») de J. Evans, L. Sheneman et J. Foster de l'initiative pour la bioinformatique et les études évolutionnaires (IBEST) à l'université de l'Idaho.

Please cite: Jason Evans, Luke Sheneman and James A. Foster: Relaxed Neighbor-Joining: A Fast Distance-Based Phylogenetic Tree Construction Method. (PubMed) J. Mol. Evol. 62(6):785-792 (2006)
Registry entries: SciCrunch  Bioconda 
clonalframe
inférence de microévolution bactérienne en utilisant des données de séquence multilocus
Versions of package clonalframe
ReleaseVersionArchitectures
jessie1.2-3amd64,armel,armhf,i386
sid1.2-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.2-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.2-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.2-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.2-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package clonalframe:
roleprogram
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ClonalFrame identifie les relations clonales entre les membres d'un échantillon et estime la position chromosomale des évènements de recombinaison homologue qui peuvent perturber l'héritage clonal.

ClonalFrame peut être appliqué à n'importe quelle séquence de données, d'un fragment d'ADN à des génomes entiers. Il est performant dans l'analyse de données MLST, où 7 fragments de gène ont été séquencés, et devient progressivement de plus en plus performant à mesure que les régions séquencées augmentent en longueur et nombre jusqu'au génome entier. Il nécessite cependant que les séquences soient alignées. Si les données génomiques ne sont pas alignées, il est recommandé d'utiliser Mauve qui produit un alignement de génomes bactériens entiers au format requis par ClonalFrame pour l'analyse.

Please cite: Xavier Didelot and Daniel Falush: Inference of Bacterial Microevolution Using Multilocus Sequence Data. (PubMed,eprint) Genetics Advance 175:1251-1266 (2006)
Registry entries: SciCrunch 
clonalframeml
inférence efficace de recombinaison de génomes de bactéries entières
Versions of package clonalframeml
ReleaseVersionArchitectures
trixie1.13-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.12-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.13-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.11-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.12-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ClonalFrameML est un paquet logiciel qui réalise une inférence efficace de recombinaison dans les génomes bactériens. ClonalFrameML a été créé par Xavier Didelot et Daniel Wilson. ClonalFrameML peut être appliqué à tout type de données de séquence alignée, mais est particulièrement prévu pour l’analyse de séquences de génomes entiers. Il est capable de comparer des centaines de génomes entiers en quelques heures sur un machine de bureau standard. ClonalFrameML produit trois sorties principales : une phylogénie avec des longueurs de branches corrigées pour tenir compte des recombinaisons, une estimation des paramètres clé du processus de recombinaison et une carte génomique d’où les recombinaisons se sont produites pour chaque branche de la phylogénie.

ClonalFrameML est une implémentation de vraisemblance maximale du logiciel bayésien ClonalFrame précédemment décrit par Didelot et Falush (2007). Le modèle de recombinaison servant de base à ClonalFrameML est exactement le même que pour ClonalFrame, mais cette nouvelle implémentation est beaucoup plus rapide, est capable de gérer des ensembles de données génomiques bien plus grands, et ne souffre pas de problèmes de convergence MCMC.

Please cite: Xavier Didelot and Daniel J. Wilson: ClonalFrameML: Efficient Inference of Recombination in Whole Bacterial Genomes. (PubMed,eprint) PLoS Comput Biology 11(2):e1004041 (2015)
Registry entries: Bioconda 
clonalorigin
inférence de recombinaison homologue dans les bactéries grâce à des séquences de génomes entiers
Versions of package clonalorigin
ReleaseVersionArchitectures
buster1.0-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Contrairement à nous, les bactéries peuvent se reproduire elles-mêmes. Elles ont néanmoins des mécanismes qui transfèrent l’ADN entre les organismes, un processus plus formellement appelé recombinaison. Les mécanismes dans lesquels la recombinaison a lieu ont été très étudiés en laboratoire mais il reste encore à comprendre comment, quand et où se produit la recombinaison dans les populations naturelles de bactéries et comment cela les aide à s’adapter à de nouveaux environnements. ClonalOrigin réalise une analyse comparée des séquences d’un échantillon de génomes bactériens afin de reconstruire les événements de recombinaison qui ont eu lieu chez leurs ancêtres.

Please cite: Xavier Didelot, Daniel Lawson, Aaron Darling and Daniel Falush: Inference of Homologous Recombination in Bacteria Using Whole-Genome Sequences. (PubMed,eprint) Genetics 186(4):1435-1449 (2010)
Registry entries: Bio.tools  SciCrunch 
clustalo
General-purpose multiple sequence alignment program for proteins
Versions of package clustalo
ReleaseVersionArchitectures
stretch1.2.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.2.4-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.2.1-1amd64,armel,armhf,i386
bookworm1.2.4-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.4-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.2.4-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2.4-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 21 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

Clustal Omega is a general-purpose multiple sequence alignment (MSA) program, primarily for amino-acid sequences. It produces high quality MSAs and is capable of handling data sets of hundreds of thousands of sequences in reasonable time, using multiple processors where available.

Please cite: Fabian Sievers, Andreas Wilm, David Dineen, Toby J Gibson, Kevin Karplus, Weizhong Li, Rodrigo Lopez, Hamish McWilliam, Michael Remmert, Johannes Söding, Julie D Thompson and Desmond G Higgins: Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. (PubMed,eprint) Molecular Systems Biology 7:539 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
clustalw
alignement de séquences de nucléotides ou de peptides
Versions of package clustalw
ReleaseVersionArchitectures
sid2.1+lgpl-7amd64,arm64,mips64el,ppc64el,riscv64,s390x
jessie2.1+lgpl-4amd64,armel,armhf,i386
stretch2.1+lgpl-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.1+lgpl-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.1+lgpl-7amd64,arm64,mips64el,ppc64el,s390x
bookworm2.1+lgpl-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.1+lgpl-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package clustalw:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 28 users (14 upd.)*
Versions and Archs
License: DFSG free
Git

Ce programme réalise l'alignement de séquences multiples de nucléotides ou d'acides aminés. Il identifie le format des séquences en entrée et détermine s'il s'agit d'acides nucléiques (ADN/ARN) ou d'acides aminés (peptides). Le format en sortie peut être choisi parmi divers formats pour les alignements multiples, comme Phylip ou FASTA. Clustal W est largement reconnu.

Les données en sortie de Clustal W peuvent être modifiées manuellement ou avec un éditeur d'alignement comme Seaview ou le logiciel compagnon Clustal X. Lorsqu'un modèle est construit à partir des alignements, il peut être utilisé pour améliorer les recherches dans les bases de données. Celles-ci peuvent être créées sous forme de modèles de Markov (HMM) avec le paquet HMMER.

The package is enhanced by the following packages: clustalw-mpi
Please cite: M. A. Larkin, G. Blackshields, N. P. Brown, R. Chenna, P. A. McGettigan, H. McWilliam, F. Valentin, I.M. Wallace, A. Wilm, R. Lopez, J. D. Thompson, T. J. Gibson and D. G. Higgins: Clustal W and Clustal X version 2.0. (PubMed,eprint) Bioinformatics 23(21):2947-2948 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
clustalx
alignement multiple de séquences d'acides nucléiques et de protéines - interface graphique
Versions of package clustalx
ReleaseVersionArchitectures
bookworm2.1+lgpl-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.1+lgpl-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.1+lgpl-3amd64,armel,armhf,i386
trixie2.1+lgpl-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster2.1+lgpl-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.1+lgpl-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.1+lgpl-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package clustalx:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacex11
roleprogram
scopeutility
uitoolkitmotif
useanalysing, comparing, viewing
works-with-formatplaintext
x11application
Popcon: 8 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet offre une interface graphique utilisateur pour le programme Clustal d'alignement de plusieurs séquences. Il fournit un environnement intégré pour effectuer plusieurs alignements par séquence et par profil pour analyser les résultats. L'alignement de séquences est affiché dans une fenêtre sur l'écran. Un système de coloration souple a été intégré pour mettre en évidence les caractéristiques conservées dans l'alignement. Pour les présentations professionnelles, il convient d'utiliser le paquet texshade (LaTeX) ou boxshade .

Les menus déroulants en haut de la fenêtre permettent de sélectionner toutes les options nécessaires pour les traditionnels alignements par séquences multiples et par profil. Vous pouvez couper-coller les séquences pour changer l'ordre de l'alignement ; vous pouvez sélectionner un sous-ensemble de séquences à aligner ; vous pouvez sélectionner une sous-plage de l'alignement à réaligner et réinsérer dans l'alignement original.

Une analyse de la qualité de l'alignement peut être réalisée et les segments à faible score ou les résidus exceptionnels peuvent être mis en évidence.

Please cite: M.A. Larkin, G. Blackshields, N.P. Brown, R. Chenna, P.A. McGettigan, H. McWilliam, F. Valentin, I.M. Wallace, A. Wilm, R. Lopez, J.D. Thompson, T.J. Gibson and D.G. Higgins: Clustal W and Clustal X version 2.0. (PubMed,eprint) Bioinformatics 23(21):2947-2948 (2007)
Registry entries: Bio.tools  SciCrunch 
Topics: Sequence analysis
cnvkit
Copy number variant detection from targeted DNA sequencing
Versions of package cnvkit
ReleaseVersionArchitectures
bookworm0.9.9-2amd64,arm64,ppc64el
bullseye0.9.8-1amd64,arm64,ppc64el
buster0.9.5-3amd64
experimental0.9.10-2~0expall
sid0.9.10-1amd64,arm64,ppc64el
Popcon: 6 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

A command-line toolkit and Python library for detecting copy number variants and alterations genome-wide from targeted DNA sequencing. It is designed for use with hybrid capture, including both whole-exome and custom target panels, and short-read sequencing platforms such as Illumina and Ion Torrent.

Please cite: Eric Talevich, A. Hunter Shain, Thomas Botton and Boris C. Bastian: CNVkit: Genome-Wide Copy Number Detection and Visualization from Targeted DNA Sequencing. (PubMed,eprint) PLOS 12(4):e1004873 (2016)
Registry entries: Bio.tools  Bioconda 
codonw
analyse de correspondance d'utilisation de codon
Versions of package codonw
ReleaseVersionArchitectures
bullseye1.4.4-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.4.4-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.4.4-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.4.4-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.4.4-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.4.4-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

CodonW est un paquet pour l'analyse d'utilisation de codons. Il a été conçu pour simplifier l'analyse multivariée (MVA) de l'utilisation de codons. La méthode MVA utilisée dans CodonW est l'analyse de correspondance (COA), la méthode la plus populaire pour l'analyse d'utilisation de codons. CodonW peut créer un COA pour l'utilisation do codons, l'utilisation de codons synonymes relatifs ou l'utilisation d'acides aminés. Des analyses supplémentaires d'utilisation de codons comprennent l'investigation de codons optimaux, les biais de codons et de dinucléotides ou la composition de bases. CodonW analyse les séquences encodées par les codes génétiques autres que le code universel.

Please cite: Paul M. Sharp, Elizabeth Bailes, Russell J. Grocock, John F. Peden and R. Elizabeth Sockett: Variation in the strength of selected codon usage bias among bacteria.. (PubMed,eprint) Nucleic Acids Research 33(4):1141-1153 (2005)
Registry entries: Bioconda 
Topics: Sequence composition, complexity and repeats
comet-ms
moteur de recherche de spectrométrie de masse en tandem (MS/MS)
Versions of package comet-ms
ReleaseVersionArchitectures
buster2018012-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2019015+cleaned1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2019015+cleaned1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2014022-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2019015+cleaned1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2019015+cleaned1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream2021010
Popcon: 0 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Comet est un moteur de recherche libre de base de données de séquences de spectrométrie de masse en tandem (MS/MS). Il identifie les peptides en recherchant dans les spectres MS/MS des séquences présentes dans les bases de données de séquences de protéines.

Ce paquet fournit un exécutable réalisant les recherches dans les bases de données MS/MS. Les formats de fichiers d'entrée pris en charge sont mzXML, mzML et ms2. Les formats de sortie pris en charge sont .out, SQT et pepXML.

Please cite: Jimmy K. Eng, Tahmina A. Jahan and Michael R. Hoopmann: Comet: an open source tandem mass spectrometry sequence database search tool. (PubMed) Proteomics 13(1) (2012)
concavity
prédicteur de sites de liaisons de ligands de la protéine à partir de la structure et de la conservation
Versions of package concavity
ReleaseVersionArchitectures
sid0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.1-2amd64,armel,armhf,i386
stretch0.1+dfsg.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.1+dfsg.1-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ConCavity prédit les sites de liaisons de ligands en combinant la conservation évolutive et la structure en 3D.

ConCavity prend en entrée une structure de protéine au format PDB (« Protein Data Bank ») et des fichiers facultatifs qui caractérisent la séquence de conservation évolutive des chaînes dans le fichier de structure.

Les fichiers de résultat suivants sont produits par défaut :

 −⋅les prédictions de liaisons de ligands résidus pour chaque chaîne
    (*.scores) ;
 −⋅les prédictions de liaisons de ligands résidus au format PDB (les scores
    des résidus sont placés dans le champ dépendant de la température,
    *_residue.pdb) ;
 −⋅les emplacements de prédictions de poche au format DX (*.dx) ;
 −⋅le script PyMOL pour visualiser les prédictions (*.pml).
The package is enhanced by the following packages: conservation-code
Please cite: John A. Capra, Roman A. Laskowski, Janet M. Thornton, Mona Singh and Thomas A. Funkhouser: Predicting Protein Ligand Binding Sites by Combining Evolutionary Sequence Conservation and 3D Structure. (PubMed) PLoS Computational Biology 5(12):e1000585 (2009)
Registry entries: SciCrunch 
conservation-code
outil de notation de la conservation des séquences de protéines
Versions of package conservation-code
ReleaseVersionArchitectures
stretch20110309.0-5all
jessie20110309.0-3all
bookworm20110309.0-8all
trixie20110309.0-8all
bullseye20110309.0-8all
buster20110309.0-7all
sid20110309.0-8all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit score_conservation(1), un outil pour noter la conservation des séquences de protéines.

Les méthodes de notation de conservation suivantes sont mises en œuvre :

  • somme de paires ;
  • somme pondérées de paires ;
  • entropie de Shannon ;
  • entropie de Shannon avec des groupements de propriété (Mirny et Shakhnovich 1995, Valdar et Thornton 2001) ;
  • entropie relative avec des groupements de propriété (Williamson 1995) ;
  • entropie de von Neumann (Caffrey et al 2004) ;
  • entropie relative (Samudrala et Wang 2006) ;
  • divergence de Jensen-Shannon (Capra et Singh 2007).

Une extension à base de fenêtres intégrant la conservation estimée de résidus séquentiellement adjacents dans le score pour chaque colonne est également fournie. Cette approche de fenêtres peut être appliquée à n'importe quelle méthode de notation de conservation.

Le programme accepte les alignements dans les formats CLUSTAL et FASTA.

La sortie spécifique d'une séquence peut être utilisée comme l'entrée de conservation pour ConCavity.

La conservation est hautement prédictive dans l'identification des sites catalytiques et des résidus proches des ligands liés.

Please cite: John A. Capra and Mona Singh: Predicting functionally important residues from sequence conservation. (PubMed) Bioinformatics 23(15):1875-82 (2007)
covtobed
conversion de « track » de couverture d’un fichier BAM dans un fichier BED
Versions of package covtobed
ReleaseVersionArchitectures
trixie1.3.5+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.2.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.3.5+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.3.5+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet lit un ou plusieurs fichiers d’alignements (triés selon le format BAM) et produit des fichiers au format BED avec la couverture. Il joint des bases consécutives avec la même couverture et il peut être utilisé pour imprimer un fichier BED avec les régions ayant un intervalle de couverture particulier.

Please cite: Giovanni Birolo and Andrea Telatin: covtobed: a simple and fast tool to extract coverage tracks from BAM files. Journal of Open Source Software 5(47):2119 (2020)
Registry entries: Bioconda 
crac
integrated RNA-Seq read analysis
Versions of package crac
ReleaseVersionArchitectures
bookworm2.5.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el
buster2.5.0+dfsg-3amd64,arm64,mips64el,ppc64el
sid2.5.2+dfsg-6amd64,arm64,mips64el,ppc64el,riscv64
sid2.5.2+dfsg-5armel,armhf,i386
trixie2.5.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el
stretch2.5.0+dfsg-1amd64
bullseye2.5.2+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

CRAC is a tool to analyze High Throughput Sequencing (HTS) data in comparison to a reference genome. It is intended for transcriptomic and genomic sequencing reads. More precisely, with transcriptomic reads as input, it predicts point mutations, indels, splice junction, and chimeric RNAs (ie, non colinear splice junctions). CRAC can also output positions and nature of sequence error that it detects in the reads. CRAC uses a genome index. This index must be computed before running the read analysis. For this sake, use the command "crac-index" on your genome files. You can then process the reads using the command crac. See the man page of CRAC (help file) by typing "man crac". CRAC requires large amount of main memory on your computer. For processing against the Human genome, say 50 million reads of 100 nucleotide each, CRAC requires about 40 gigabytes of main memory. Check whether the system of your computing server is equipped with sufficient amount of memory before launching an analysis.

Please cite: Eliseos J. Mucaki, Natasha G. Caminsky, Ami M. Perri, Ruipeng Lu, Alain Laederach, Matthew Halvorsen, Joan H. M. Knoll and Peter K. Rogan: A unified analytic framework for prioritization of non-coding variants of uncertain significance in heritable breast and ovarian cancer. (PubMed) BMS Medical Genomics 9:19 (2016)
Registry entries: Bio.tools  SciCrunch 
csb
Computational Structural Biology Toolbox (CSB)
Versions of package csb
ReleaseVersionArchitectures
bookworm1.2.5+dfsg-8all
sid1.2.5+dfsg-10all
buster1.2.5+dfsg-3all
bullseye1.2.5+dfsg-5all
trixie1.2.5+dfsg-10all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Computational Structural Biology Toolbox (CSB) is a Python class library for reading, storing and analyzing biomolecular structures in a variety of formats with rich support for statistical analyses.

CSB is designed for reusability and extensibility and comes with a clean, well-documented API following good object-oriented engineering practice.

This package contains some user executable tools.

Registry entries: SciCrunch  Bioconda 
ctffind
fast and accurate defocus estimation from electron micrographs
Versions of package ctffind
ReleaseVersionArchitectures
sid4.1.14-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.1.14-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

This is a widely-used program for the estimation of objective lens defocus parameters from transmission electron micrographs. Defocus parameters are estimated by fitting a model of the microscope's contrast transfer function (CTF) to an image's amplitude spectrum.

Please cite: Alexis Rohou and Nikolaus Grigorieff: CTFFIND4: Fast and accurate defocus estimation from electron micrographs. (PubMed) Journal of Structural Biology 192(2):216-221 (2015)
Registry entries: SciCrunch 
cutadapt
Clean biological sequences from high-throughput sequencing reads
Versions of package cutadapt
ReleaseVersionArchitectures
bullseye3.2-2all
sid4.7-2all
stretch1.12-2all
bookworm4.2-1all
trixie4.4-1all
sid4.4-1all
buster1.18-1all
Popcon: 16 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Cutadapt helps with biological sequence clean tasks by finding the adapter or primer sequences in an error-tolerant way. It can also modify and filter reads in various ways. Adapter sequences can contain IUPAC wildcard characters. Also, paired-end reads and even colorspace data is supported. If you want, you can also just demultiplex your input data, without removing adapter sequences at all.

This package contains the user interface.

The package is enhanced by the following packages: multiqc
Please cite: Marcel Martin: Cutadapt removes adapter sequences from high-throughput sequencing reads. (eprint) EMBnet.journal 17(1):10-12 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
cutesv
comprehensive discovery of structural variations of genomic sequences
Versions of package cutesv
ReleaseVersionArchitectures
bookworm2.0.2-1all
sid2.1.0-2all
Popcon: 1 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Long-read sequencing enables the comprehensive discovery of structural variations (SVs). However, it is still non-trivial to achieve high sensitivity and performance simultaneously due to the complex SV characteristics implied by noisy long reads.

cuteSV is a sensitive, fast and scalable long-read-based SV detection approach. cuteSV uses tailored methods to collect the signatures of various types of SVs and employs a clustering-and-refinement method to analyze the signatures to implement sensitive SV detection. Benchmarks on real Pacific Biosciences (PacBio) and Oxford Nanopore Technology (ONT) datasets demonstrate that cuteSV has better yields and scalability than state-of-the-art tools.

Please cite: Tao Jiang, Yongzhuang Liu, Yue Jiang, Junyi Li, Yan Gao, Zhe Cui, Yadong Liu, Bo Liu and Yadong Wang: Long-read-based human genomic structural variation detection with cuteSV. (PubMed,eprint) Genome Biology 21(1):189 (2020)
Registry entries: Bio.tools  Bioconda 
daligner
alignements locaux parmi des lectures longues de séquençages de nucléotide
Versions of package daligner
ReleaseVersionArchitectures
buster1.0+git20180524.fd21879-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0+git20240119.335105d-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0+git20240119.335105d-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.0+git20221215.bd26967-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0+git20200727.ed40ce5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0+20161119-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ces outils permettent de trouver tous les alignements locaux significatifs parmi des lectures encodées dans une base de données Dazzler. L’hypothèse est que les lectures sont originaires d’un séquenceur à lectures longues RS II de Pacific Biosciences. C'est-à-dire que les lectures sont longues et bruitées, jusqu’à 15 % en moyenne.

Please cite: Gene Myers: Efficient Local Alignment Discovery amongst Noisy Long Reads. 8701:52-67 (2014)
Registry entries: SciCrunch  Bioconda 
damapper
long read to reference genome mapping tool
Versions of package damapper
ReleaseVersionArchitectures
bookworm0.0+git20210330.ab45103-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.0+git20200322.b2c9d7f-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.0+git20210330.ab45103-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.0+git20210330.ab45103-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream0.0+git20240314.b025cf9
Popcon: 1 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Recognised as the Damapper Library, this is a long read to reference genome mapping command line tool.

For a given reference database 'X' and read block 'Y', damapper produces the single file 'Y.X.las'. Each output file is sorted in order of the A-reads, and if a match is a chain of local alignments, then the LA's in the chain occur in increasing order of A-coordinates.

HPC.damapper writes a UNIX shell script to the standard output that maps every read in blocks to of database to a reference sequence . If is missing then only the single block is mapped, and if is also missing then all blocks of the database are mapped.

This package contains the damapper and HPC.damapper binaries.

datamash
outil de statistiques pour interface en ligne de commande
Versions of package datamash
ReleaseVersionArchitectures
jessie1.0.6-2amd64,armel,armhf,i386
bullseye1.7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.8-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.8-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.7-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 57 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Datamash de GNU est un programme en ligne de commande réalisant des opérations de base numériques, textuelles et statistiques sur des fichiers de données textuelles. Il est conçu pour être portable et fiable, et pour aider les chercheurs à créer facilement des enchaînements d’analyse automatiques, sans écrire de code, ni même de courts scripts.

Registry entries: SciCrunch 
dawg
simulate the evolution of recombinant DNA sequences
Versions of package dawg
ReleaseVersionArchitectures
bullseye1.2-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.2-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.2-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.2-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

DNA Assembly with Gaps (Dawg) is an application designed to simulate the evolution of recombinant DNA sequences in continuous time based on the robust general time reversible model with gamma and invariant rate heterogeneity and a novel length-dependent model of gap formation. The application accepts phylogenies in Newick format and can return the sequence of any node, allowing for the exact evolutionary history to be recorded at the discretion of users. Dawg records the gap history of every lineage to produce the true alignment in the output. Many options are available to allow users to customize their simulations and results.

Please cite: Reed A. Cartwright: DNA assembly with gaps (Dawg): simulating sequence evolution. (PubMed,eprint) Bioinformatics 21(Suppl 3):iii31-iii38 (2005)
Registry entries: Bioconda 
dazzdb
manage nucleotide sequencing read data
Versions of package dazzdb
ReleaseVersionArchitectures
bullseye1.0+git20201103.8d98c37-1+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0+git20230919.414ad05-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.0+git20230919.414ad05-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.0+git20180908.0bd5e07-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.0+20161112-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0+git20221215.aad3a46-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.0+git20240115.be65e59
Popcon: 2 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

To facilitate the multiple phases of the dazzler assembler, all the read data is organized into what is effectively a database of the reads and their meta-information. The design goals for this data base are as follows:

  • The database stores the source Pacbio read information in such a way that it can re-create the original input data, thus permitting a user to remove the (effectively redundant) source files. This avoids duplicating the same data, once in the source file and once in the database.
  • The data base can be built up incrementally, that is new sequence data can be added to the data base over time.
  • The data base flexibly allows one to store any meta-data desired for reads. This is accomplished with the concept of tracks that implementors can add as they need them.
  • The data is held in a compressed form equivalent to the .dexta and .dexqv files of the data extraction module. Both the .fasta and .quiva information for each read is held in the data base and can be recreated from it. The .quiva information can be added separately and later on if desired.
  • To facilitate job parallel, cluster operation of the phases of the assembler, the database has a concept of a current partitioning in which all the reads that are over a given length and optionally unique to a well, are divided up into blocks containing roughly a given number of bases, except possibly the last block which may have a short count. Often programs can be run on blocks or pairs of blocks and each such job is reasonably well balanced as the blocks are all the same size. One must be careful about changing the partition during an assembly as doing so can void the structural validity of any interim block-based results.
Registry entries: Bioconda 
deblur
deconvolution for Illumina amplicon sequencing
Versions of package deblur
ReleaseVersionArchitectures
sid1.1.1-1all
Popcon: users ( upd.)*
Versions and Archs
License: DFSG free
Git

Deblur is a greedy deconvolution algorithm for amplicon sequencing based on Illumina Miseq/Hiseq error profiles. The authors recommend using Deblur via the QIIME2 plugin q2-deblur. Examples of its use can be found within the plugin itself. However, Deblur itself does not depend on QIIME2.

The input to Deblur workflow is a directory of FASTA or FASTQ files (1 per sample) or a single demultiplexed FASTA or FASTQ file. These files can be gzip'd. The output directory will contain three BIOM tables in which the observation IDs are the Deblurred sequences. The outputs are contingent on the reference databases used and a more focused discussion on them is in the subsequent README section titled "Positive and Negative Filtering." The output files are as follows:

  • reference-hit.biom : contains only Deblurred reads matching the positive filtering database. By default, a reference composed of 16S sequences is used, and this resulting table will contain only those reads which recruit at a coarse level to it will be retained. Reads are also filtered against the negative reference, which by default will remove any read which appears to be PhiX or adapter.

  • reference-hit.seqs.fa : a fasta file containing all the sequences in reference-hit.biom

  • reference-non-hit.biom : contains only Deblurred reads that did not align to the positive filtering database. Negative filtering is also appied to this table, so by default, PhiX and adapter are removed.

  • reference-non-hit.seqs.fa : a fasta file containing all the sequences in reference-non-hit.biom

  • all.biom : contains all Deblurred reads. This file represents the union of the "reference-hit.biom" and "reference-non-hit.biom" tables.

  • all.seqs.fa : a fasta file containing all the sequences in all.biom

Deblur uses two types of filtering on the sequences:

  • Negative mode - removes known artifact sequences (i.e. sequences aligning to PhiX or Adapter with >=95% identity and coverage).

  • Positive mode - keeps only sequences similar to a reference database (by default known 16S sequences). SortMeRNA is used, and any sequence with an e-value <= 10 is retained. Deblur also outputs a BIOM table without this positive filtering step (named all.biom).

The FASTA files for both of these filtering steps can be supplied via the --neg-ref-fp and --pos-ref-fp options. By default, the negative database is composed of PhiX and adapter sequence and the positive database of known 16S sequences.

Deblur uses negative mode filtering to remove known artifact (i.e. PhiX and Adapter sequences) prior to denoising. The output of Deblur contains three files: all.biom, which includes all sOTUs, reference-hit.biom, which contains the output of positive filtering of the sOTUs (default only sOTUs similar to 16S sequences), and reference-non-hit.biom, which contains only sOTUs failing the positive filtering (default only non-16S sOTUs).

deepnano
alternative basecaller for MinION reads of genomic sequences
Versions of package deepnano
ReleaseVersionArchitectures
bullseye0.0+git20170813.e8a621e-3.1amd64,arm64,armhf,i386,ppc64el,s390x
buster0.0+git20170813.e8a621e-3amd64,arm64,i386,ppc64el,s390x
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

DeepNano is alternative basecaller for Oxford Nanopore MinION reads based on deep recurrent neural networks.

Currently it works with SQK-MAP-006 and SQK-MAP-005 chemistry and as a postprocessor for Metrichor.

Please cite: Vladimír Boža, Broňa Brejová and Tomáš Vinař: DeepNano: Deep recurrent neural networks for base calling in MinION nanopore reads. PLOS one (2017)
Remark of Debian Med team: There is no intend to keep continue the existing packaging since

the program nanocall seems to serve the intended purpose better

delly
découverte de variantes structurelles par analyse des lectures
Versions of package delly
ReleaseVersionArchitectures
buster0.8.1-2amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.1.6-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.8-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.1.8-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.8.7-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.2.6
Popcon: 2 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Delly est une méthode de prédiction de variantes structurelles (SV) intégrée qui peut découvrir, génotyper et visualiser des délétions, des duplications en tandem, des inversions et des translocations à une résolution mononucléotidique dans des données de séquençage massivement parallèles à lecture courte et longue. Il utilise des extrémités appariées, des lectures fractionnées et une profondeur de lecture pour délimiter avec sensibilité et précision les réarrangements génomiques dans tout le génome.

Please cite: Tobias Rausch, Thomas Zichner, Andreas Schlattl, Adrian M. Stuetz, Vladimir Benes and Jan O. Korbel: DELLY: structural variant discovery by integrated paired-end and split-read analysis.. Bioinformatics 28:i333-i339 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
density-fitness
Calculates per-residue electron density scores
Versions of package density-fitness
ReleaseVersionArchitectures
bookworm1.0.8-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.8-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.0.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.8-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream1.0.11
Popcon: 0 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

The program density-fitness calculates electron density metrics, for main- (includes Cβ atom) and side-chain atoms of individual residues.

For this calculation, the program uses the structure model in either PDB or mmCIF format and the electron density from the 2mFo-DFc and mFo-DFc maps. If these maps are not readily available, the MTZ file and model can be used to calculate maps clipper. Density-fitness support both X-ray and electron diffraction data.

This program is essentially a reimplementation of edstats, a program available from the CCP4 suite. However, the output now contains only the RSR, SRSR and RSCC fields as in edstats with the addition of EDIAm and OPIA and no longer requires pre-calculated map coefficients.

Please cite: I. J. Tickle: Statistical quality indicators for electron-density maps. Acta Cryst. (D68):454-467 (2012)
dextractor
(d)extractor and compression command library
Versions of package dextractor
ReleaseVersionArchitectures
sid1.0-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Dextractor commands allow one to pull exactly and only the information needed for assembly and reconstruction from the source HDF5 files produced by the PacBio RS II sequencer, or from the source BAM files produced by the PacBio Sequel sequencer.

For each of the three extracted file types -- fasta, quiva, and arrow -- the library contains commands to compress the given file type, and to decompress it, which is a reversible process delivering the original uncompressed file. The compressed .fasta files, with the extension .dexta, consume 1/4 byte per base. The compressed .quiva files, with the extension .dexqv, consume 1.5 bytes per base on average, and the compressed .arrow files, with the extension .dexar, consume 1/4 byte per base

For more information, please view the available documentation at https://github.com/thegenemyers/DEXTRACTOR

Registry entries: Bioconda 
dialign
alignement de plusieurs séquences par segments
Versions of package dialign
ReleaseVersionArchitectures
bookworm2.2.1-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.2.1-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.2.1-10amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.2.1-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.2.1-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.2.1-7amd64,armel,armhf,i386
trixie2.2.1-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package dialign:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 22 users (28 upd.)*
Versions and Archs
License: DFSG free
Git

Dialign2 est un outil qui s'utilise en ligne de commande pour réaliser plusieurs alignements de séquences de protéines ou d'ADN. Il construit les alignements de paires sans écart de segments similaires des séquences. Il est à noter que Dialign n'emploie aucun type de pénalité de l'écart.

Please cite: Burkhard Morgenstern: DIALIGN 2: improvement of the segment-to-segment approach to multiple sequence alignment. (PubMed,eprint) Bioinformatics 15(3):211-218 (1999)
Registry entries: Bio.tools  SciCrunch  Bioconda 
dialign-tx
alignement séquentiel multiple basé sur les segments
Versions of package dialign-tx
ReleaseVersionArchitectures
buster1.0.2-12amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0.2-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.2-7amd64,armel,armhf,i386
sid1.0.2-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0.2-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.0.2-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.0.2-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package dialign-tx:
fieldbiology, biology:bioinformatics
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 18 users (17 upd.)*
Versions and Archs
License: DFSG free
Git

DIALIGN-TX est un outil en ligne de commandes pour réaliser un alignement multiple de séquences de protéines ou d'ADN. C'est une ré-implémentation complète de l'approche basée sur les segments incluant plusieurs nouvelles améliorations et heuristiques qui améliore significativement la qualité des alignements en sortie comparée à DIALIGN 2.2 et DIALIGN-T. Pour les alignements par paires, DIALIGN-TX utilise un algorithme de « fragment- chaining » qui favorise les chaînes d'alignements locaux de faible score plutôt que les fragments isolés de score élevé. Pour l'alignement multiple, DIALIGN-TX utilise une procédure gloutonne améliorée qui est moins sensible aux fausses similitudes locales des séquences.

The package is enhanced by the following packages: dialign-tx-data
Please cite: Amarendran R. Subramanian, Michael Kaufmann and Burkhard Morgenstern: DIALIGN-TX: greedy and progressive approaches for segment-based multiple sequence alignment. (PubMed) Algorithms for Molecular Biology 3(1):6 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
diamond-aligner
accelerated BLAST compatible local sequence aligner
Versions of package diamond-aligner
ReleaseVersionArchitectures
stretch-backports0.9.22+dfsg-2~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.0.7-1amd64,arm64,ppc64el,s390x
buster0.9.24+dfsg-1amd64
trixie2.1.9-1amd64,arm64,ppc64el,s390x
sid2.1.9-1amd64,arm64,ppc64el,riscv64,s390x
bookworm2.1.3-1amd64,arm64,ppc64el,s390x
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

DIAMOND is a sequence aligner for protein and translated DNA searches and functions as a drop-in replacement for the NCBI BLAST software tools. It is suitable for protein-protein search as well as DNA-protein search on short reads and longer sequences including contigs and assemblies, providing a speedup of BLAST ranging up to x20,000.

Please cite: Benjamin Buchfink, Chao Xie and Daniel H Huson: Fast and sensitive protein alignment using DIAMOND. (PubMed) Nature methods 12(1):59-60 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
discosnp
détection du polymorphisme d'un seul nucléotide pour des ensembles bruts de lectures
Versions of package discosnp
ReleaseVersionArchitectures
buster2.3.0-2amd64,arm64,i386,mips64el,ppc64el,s390x
bookworm2.6.2-2amd64,arm64,mips64el,ppc64el
trixie2.6.2-3amd64,arm64,mips64el,ppc64el
sid2.6.2-3amd64,arm64,mips64el,ppc64el,riscv64
bullseye4.4.4-1amd64,arm64,i386,mips64el,ppc64el,s390x
stretch1.2.6-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.2.5-1amd64,armel,armhf,i386
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Software discoSnp is designed for discovering Single Nucleotide Polymorphism (SNP) from raw set(s) of reads obtained with Next Generation Sequencers (NGS).

Note that number of input read sets is not constrained, it can be one, two, or more. Note also that no other data as reference genome or annotations are needed.

The software is composed by two modules. First module, kissnp2, detects SNPs from read sets. A second module, kissreads, enhance the kissnp2 results by computing per read set and for each found SNP:

 1) its mean read coverage
 2) the (phred) quality of reads generating the polymorphism.

This program is superseded by DiscoSnp++.

Registry entries: Bio.tools  SciCrunch  Bioconda 
disulfinder
prédiction de pont disulfure et de leur connectivité
Versions of package disulfinder
ReleaseVersionArchitectures
jessie1.2.11-4amd64,armel,armhf,i386
stretch1.2.11-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.2.11-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.2.11-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.11-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.2.11-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.2.11-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package disulfinder:
roleprogram
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Disulfinder sert à la prédiction de pont disulfure pour des cystéines et leur connectivité en partant d’une séquence seule. Les ponts disulfures jouent un rôle majeur dans la stabilisation des processus de repliement pour plusieurs protéines. La prédiction de ponts disulfures à partir d'une séquence seule est par conséquent utile pour l’étude des propriétés structurelles et fonctionnelles de protéines particulières. De plus, la connaissance de l’état de pont disulfure de cystéines peut aider le processus de détermination expérimentale de la structure et peut être utile pour d’autres travaux d’annotations génomiques.

Disulfinder prédit les modèles disulfures en deux étapes de calcul : (1) l’état de pont disulfure de chaque cystéine est prédit par une classification binaire BRNN-SVM. (2) Les cystéines connues pour participer à la formation de ponts sont associées par un réseau neuronal récursif (Recursive Neural Network) pour obtenir un modèle de connectivité.

Please cite: Alessio Ceroni, Andrea Passerini, Alessandro Vullo and Paolo Frasconi: DISULFIND: a disulfide bonding state and cysteine connectivity prediction server. (PubMed) Nucleic Acids Res 34(Web Server issue):W177-181 (2006)
Registry entries: Bio.tools  SciCrunch 
dnaclust
outil de regroupement de millions de séquences courtes d’ADN
Versions of package dnaclust
ReleaseVersionArchitectures
trixie3-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie3-2amd64,armel,armhf,i386
stretch3-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Dnaclust est un outil pour grouper un grand nombre de séquences courtes d’ADN. Les regroupements sont créés de telle façon que le « rayon » de chaque regroupement est inférieur au seuil précisé.

Les séquences entrées pour être regroupées doivent être au format Fasta. L’identifiant de chaque séquence est basé sur le premier mot de la séquence au format Fasta. Le premier mot est le préfixe de l’en-tête jusqu’à la première occurrence d’une espace dans l’en-tête.

Please cite: Mohammadreza Ghodsi, Bo Liu and Mihai Pop: DNACLUST: accurate and efficient clustering of phylogenetic marker genes. (PubMed,eprint) BMC Bioinformatics 12:271 (2011)
Registry entries: Bio.tools  SciCrunch 
dnarrange
Method to find rearrangements in long DNA reads relative to a genome seq
Versions of package dnarrange
ReleaseVersionArchitectures
sid1.5.3-1all
bookworm1.5.3-1all
trixie1.5.3-1all
upstream1.6.1
Popcon: 0 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

This package provides utilities to align the reads to the genome, find rearrangements and draw pictures of rearranged groups

dotter
comparaison détaillée de deux séquences génétiques
Versions of package dotter
ReleaseVersionArchitectures
bullseye4.44.1+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster4.44.1+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm4.44.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.44.1+dfsg-7.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Dotter est un programme graphique de matrices de points (dot-matrix) pour comparer en détail deux séquences.

 –⋅chaque résidu d'une séquence est comparé avec chaque résidu d'une
   autre, et une matrice de scores est calculée ;
 –⋅une séquence est positionnée sur l'axe des abscisses, l'autre sur
   l'axe des ordonnées ;
 –⋅le bruit est filtré pour que les alignements apparaissent comme des
   lignes diagonales ;
 –⋅les scores par paire sont indiqués sur une fenêtre glissante pour
   rendre leur matrice plus intelligible ;
 –⋅la matrice du score moyen constitue une représentation
   tridimensionnelle, avec les deux séquences dans deux dimensions
   et la hauteur des sommets dans la troisième. Ce paysage est
   projeté en deux dimensions en utilisant une image en échelle de
   gris où plus le gris d'un sommet est sombre, plus le score est
   élevé ;
 –⋅le contraste et les contours de l'image en échelle de gris
   peuvent être ajustés de manière interactive, sans qu'il soit
   nécessaire de recalculer la matrice du score ;
 –⋅un outil d'alignement est fourni pour observer l'alignement de la
   séquence représentée par l'image en échelle de gris ;
 –⋅les paires de score élevé connues peuvent être chargées à partir
   d'un fichier GFF et superposées sur le tracé ;
 –⋅des modèles de gènes peuvent être chargés à partir de GFF puis
   affichés sur l'axe pertinent ;
 –⋅comparaison d'une séquence avec elle-même pour chercher les
   répétitions internes ;
 –⋅recherche des chevauchements entre plusieurs séquences en faisant
   un graphique de ressemblance (dot-plot) de toutes les séquences sur
   elles-mêmes ;
 –⋅fonctionnement de Dotter en mode automatique (batch) pour créer
   en tâche de fond des graphiques de ressemblance grands et
   chronophages.
Please cite: Gemma Barson and Ed Griffiths: SeqTools: visual tools for manual analysis of sequence alignments. (PubMed,eprint) BMC Research Notes 9:39 (2016)
Registry entries: Bio.tools  SciCrunch 
drop-seq-tools
analyzing Drop-seq data
Versions of package drop-seq-tools
ReleaseVersionArchitectures
bullseye2.4.0+dfsg-6all
bookworm2.5.2+dfsg-1all
sid2.5.4+dfsg-1all
trixie2.5.4+dfsg-1all
upstream3.0.0
Popcon: 2 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

This software provide for core computational analysis of Drop-seq data, which shows you how to transform raw sequence data into an expression measurement for each gene in each individual cell.

Registry entries: Bioconda 
dssp
protein secondary structure assignment based on 3D structure
Versions of package dssp
ReleaseVersionArchitectures
sid4.2.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.2.1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.2.1-2amd64,armel,armhf,i386
bullseye4.0.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.2.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm4.2.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.0.0-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream4.4.6
Popcon: 5 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

DSSP is an application you use to assign the secondary structure of a protein based on its solved three dimensional (3D) structure.

This version (4.2) of DSSP is a rewrite that writes annotated mmCIF files by default but can still produce the older dssp format. New is also the support of PP helices.

Registry entries: Bio.tools  SciCrunch 
dwgsim
simulateur de lectures courtes de séquençage
Versions of package dwgsim
ReleaseVersionArchitectures
bookworm0.1.14-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.1.11-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.1.12-2amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.1.12-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.14-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.1.14-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

DWGSIM simule les lectures courtes de séquençage des plateformes de séquençage modernes. DWGSIM génère les taux d’erreurs de bases en utilisant un modèle paramétrique, permettant d’obtenir un profil d’erreurs plus réaliste. Il a été développé originellement pour une évaluation des alignements de lectures courtes.

Registry entries: SciCrunch  Bioconda 
e-mem
calcul efficace des MEM pour de très grands génomes
Versions of package e-mem
ReleaseVersionArchitectures
bookworm1.0.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.0.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.0.1-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

E-MEM permet le calcul efficace du nombre maximal de correspondances (MEM — Maximum Exact Matches) qui n’utilise pas des index pour tout le texte. L’algorithme utilise beaucoup moins d’espace et est hautement accommodant à la parallélisation. Il peut calculer tous les MEM de longueur minimale 100 entre le génome humain entier et celui de la souris sur une machine de 10 cœurs en 10 minutes et avec 2 GB de mémoire. La mémoire nécessaire peut être aussi basse que 600 MB. Il peut utiliser efficacement des génomes de toute taille. Des tests exhaustifs et des comparaisons avec les meilleurs algorithmes actuels sont fournis.

Mummer possède plusieurs scripts différents dont un est le programme clé du calcul de MEM. Dans tous les scripts, le programme de calcul de MEM peut être remplacé par e-mem aisément pour de meilleures performances.

Please cite: Nilesh Khiste and Lucian Ilie: E-MEM: efficient computation of maximal exact matches for very large genomes. (PubMed,eprint) Bioinformatics 31(4):509-514 (2015)
ea-utils
command-line tools for processing biological sequencing data
Versions of package ea-utils
ReleaseVersionArchitectures
sid1.1.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.1.2+dfsg-5amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.1.2+dfsg-6amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.1.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch1.1.2+dfsg-4amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 12 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ea-utils provides a set of command-line tools for processing biological sequencing data, barcode demultiplexing, adapter trimming, etc.

Primarily written to support an Illumina based pipeline - but should work with any FASTQs.

Main Tools are:

  • fastq-mcf Scans a sequence file for adapters, and, based on a log-scaled threshold, determines a set of clipping parameters and performs clipping. Also does skewing detection and quality filtering.

  • fastq-multx Demultiplexes a fastq. Capable of auto-determining barcode id's based on a master set fields. Keeps multiple reads in-sync during demultiplexing. Can verify that the reads are in-sync as well, and fail if they're not.

  • fastq-join Similar to audy's stitch program, but in C, more efficient and supports some automatic benchmarking and tuning. It uses the same "squared distance for anchored alignment" as other tools.

  • varcall Takes a pileup and calculates variants in a more easily parameterized manner than some other tools.

Please cite: Erik Aronesty: Comparison of Sequencing Utility Programs. (eprint) The Open Bioinformatics Journal 7:1-8 (2013)
Registry entries: Bio.tools  SciCrunch 
ecopcr
estimate PCR barcode primers quality
Versions of package ecopcr
ReleaseVersionArchitectures
bullseye1.0.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.0.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.5.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

DNA barcoding is a tool for characterizing the species origin using a short sequence from a standard position and agreed upon position in the genome. To be used as a DNA barcode, a genome locus should vary among individuals of the same species only to a minor degree and it should vary among species very quickly. From a practical point of view, a barcode locus should be flanked by two conserved regions to design PCR primers. Several manually discovered barcode loci like COI, rbcL, 18S, 16S and 23S rDNA, or trnH-ps are routinely used today, but no objective function has been described to measure their quality in terms of universality (barcode coverage, Bc ) or in terms of taxonomical discrimination capacity (barcode specificity, Bs ).

ecoPCR is an electronic PCR software developed by LECA and Helix-Project. It helps to estimate Barcode primers quality. In conjunction with OBITools you can postprocess ecoPCR output to compute barcode coverage and barcode specificity. New barcode primers can be developed using the ecoPrimers software

Registry entries: Bioconda 
edtsurf
surfaces de maillage triangulaire pour les structures de protéines
Versions of package edtsurf
ReleaseVersionArchitectures
bookworm0.2009-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.2009-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.2009-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.2009-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.2009-3amd64,armel,armhf,i386
trixie0.2009-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.2009-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

EDTSurf est un programme libre pour construire des surfaces triangulaires pour les macromolécules. Il génère 3 grandes surfaces macromoléculaires : la surface de Van der Waals, la surface accessible au solvant et la surface moléculaire (la surface non accessible au solvant). EDTsurf identifie aussi les cavités à l'intérieur des macromolécules.

Please cite: Dong Xu and Yang Zhang: Generating Triangulated Macromolecular Surfaces by Euclidean Distance Transform.. (PubMed,eprint) PLoS ONE 4(12):e8140 (2009)
eigensoft
reduction of population bias for genetic analyses
Versions of package eigensoft
ReleaseVersionArchitectures
bookworm8.0.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster7.2.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye7.2.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch6.1.4+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie8.0.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid8.0.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The EIGENSOFT package combines functionality from the group's population genetics methods (Patterson et al. 2006) and their EIGENSTRAT stratification method (Price et al. 2006). The EIGENSTRAT method uses principal components analysis to explicitly model ancestry differences between cases and controls along continuous axes of variation; the resulting correction is specific to a candidate marker's variation in frequency across ancestral populations, minimizing spurious associations while maximizing power to detect true associations. The EIGENSOFT package has a built-in plotting script and supports multiple file formats and quantitative phenotypes.

Please cite: Alkes L. Price, Nick J. Patterson, Robert M. Plenge, Michael E. Weinblatt, Nancy A. Shadick and David Reich: Principal components analysis corrects for stratification in genome-wide association studies. Nature Genetics 38:904 - 909 (2006)
Registry entries: Bio.tools  SciCrunch  Bioconda 
elph
DNA/protein sequence motif finder
Versions of package elph
ReleaseVersionArchitectures
bullseye1.0.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.1-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.0.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.0.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ELPH (Estimated Locations of Pattern Hits) is a general-purpose Gibbs sampler for finding motifs in a set of DNA or protein sequences. The program takes as input a set containing anywhere from a few dozen to thousands of sequences, and searches through them for the most common motif, assuming that each sequence contains one copy of the motif. ELPH was used to find patterns such as ribosome binding sites (RBSs) and exon splicing enhancers (ESEs).

embassy-domainatrix
commandes supplémentaires EMBOSS pour manipuler un fichier de classification de domaines
Versions of package embassy-domainatrix
ReleaseVersionArchitectures
stretch0.1.660-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.1.660-5amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.1.650-1amd64,armel,armhf,i386
bullseye0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.660-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package embassy-domainatrix:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, converting, editing, searching
works-with-formatplaintext
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Les logiciels DOMAINATRIX ont été développés par Jon Ison et ses collègues pour le projet HGMP (« Human Genome Mapping Project » − projet de cartographie du génome humain) au Medical Research Council (MRC) en Angleterre, pour leurs recherches dans le domaine de la protéine. Ils sont inclus dans un paquet embassy comme un travail en cours.

Les logiciels de la publication actuelle de domainatrix sont :

  • cathparse : crée un fichier DCF à partir de fichiers bruts CATH ;
  • domainnr : supprime les domaines redondants d'un fichier DCF ;
  • domainreso : supprime les domaines à faible résolution d'un fichier DCF ;
  • domainseqs : ajoute des enregistrements de séquences à un fichier DCF ;
  • domainsse : ajoute des enregistrements de structure secondaire à un fichier DCF ;
  • scopparse : crée un fichier DCF à partir de fichiers bruts SCOP ;
  • ssematch : parcourt un fichier DCF à la recherche de correspondances de la structure secondaire.
embassy-domalign
commandes EMBOSS additionnelles pour l'alignement dans le domaine des protéines
Versions of package embassy-domalign
ReleaseVersionArchitectures
jessie0.1.650-1amd64,armel,armhf,i386
stretch0.1.660-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.1.660-5amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.660-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package embassy-domalign:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, editing
works-with-formatplaintext
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Les programmes DOMALIGN ont été développés par Jon Ison et ses collègues de MRC HGMP dans le cadre de leurs travaux de recherche dans le domaine des protéines. Ils sont inclus comme un paquet EMBASSY en cours de développement.

Les applications de la version courante de DOMALIGN sont allversusall (comparaison de données de séquences similaires à partir de all-versus- all), domainalign (génère des alignements (fichier DAF) pour des nœuds d'un fichier DCF), domainrep (réordonne un fichier DCF afin d'identifier des structures représentatives) et seqalign (étend les alignements (fichier DAF) avec des séquences (fichier DHF)).

embassy-domsearch
commandes supplémentaires EMBOSS pour la recherche dans les domaines de la protéine
Versions of package embassy-domsearch
ReleaseVersionArchitectures
buster0.1.660-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.1.660-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.1.660-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.1.660-4amd64,arm64,mips64el,ppc64el,riscv64,s390x
jessie0.1.650-1amd64,armel,armhf,i386
bullseye0.1.660-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package embassy-domsearch:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Les logiciels domsearch ont été développés par Jon Ison et ses collègues pour le projet HGMP (« Human Genome Mapping Project » − projet de cartographie du génome humain) au Medical Research Council (MRC) en Angleterre, pour leurs recherches dans le domaine de la protéine. Ils sont inclus dans un paquet embassy comme un travail en cours.

Les logiciels de cette publication de domsearch sont :

  • seqfraggle : supprime des séquences de fragments des fichiers DHF ;
  • seqnr : supprime la redondance des fichiers DHF ;
  • seqsearch : crée des succès (« hits ») PSI-BLAST (de fichier DHF) à partir d'un fichier DAF ;
  • seqsort : supprime les séquences classifiées ambigues des fichiers DHF ;
  • seqwords : crée des fichiers DHF à partir de la recherche par mot-clé de la base de données UniProt.
emboss
ensemble de logiciels libres pour la biologie moléculaire européenne
Versions of package emboss
ReleaseVersionArchitectures
jessie6.6.0+dfsg-1amd64,armel,armhf,i386
sid6.6.0+dfsg-14amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid6.6.0+dfsg-12armel,armhf,i386
trixie6.6.0+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm6.6.0+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye6.6.0+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster6.6.0+dfsg-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch6.6.0+dfsg-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package emboss:
fieldbiology, biology:bioinformatics, biology:molecular
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, editing, organizing, searching, text-formatting, typesetting, viewing
works-withdb
works-with-formatplaintext
Popcon: 41 users (20 upd.)*
Versions and Archs
License: DFSG free
Git

EMBOSS (« European Molecular Biology Open Software Suite ») est un paquet de logiciels d'analyse libre et gratuit, spécialement développé pour les besoins de la communauté d'utilisateurs de la biologie moléculaire (par exemple EMBnet – « European Molecular Biology network »). Le logiciel prend automatiquement en charge les données dans divers formats et permet même une recherche transparente des données de séquences à partir du web. De plus, comme des bibliothèques importantes sont fournies avec le paquet, il s'agit d'une plate-forme permettant aux autres scientifiques de développer et publier des logiciels dans l'esprit du libre. EMBOSS intègre également un ensemble de paquets actuellement disponibles et des outils pour l'analyse de séquences dans un tout cohérent. EMBOSS casse la tendance historique vers des logiciels commerciaux.

The package is enhanced by the following packages: clustalw primer3
Please cite: Peter Rice, Ian Longden and Alan Bleasby: EMBOSS: The European Molecular Biology Open Software Suite. (PubMed) Trends in Genetics 16(6):276 - 277 (2000)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package emboss
emmax
cartographie génétique en fonction de la structure de la population
Versions of package emmax
ReleaseVersionArchitectures
bullseye0~beta.20100307-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0~beta.20100307-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0~beta.20100307-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0~beta.20100307-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

EMMAX est un test statistique pour la cartographie d’associations d’organismes humains ou modèles à grande échelle tenant compte de la structure de l’échantillon. En plus de l’efficacité de calcul obtenue par l’algorithme EMMA, EMMAX tire parti du fait que chaque loci n’explique qu’une petite fraction des traits complexes, ce qui nous permet d’éviter la procédure d’estimation répétitive des composantes de variance, ce qui entraîne une augmentation significative du temps de calcul du mappage d’association en utilisant un modèle mixte.

Please cite: Hyun Min Kang, Jae Hoon Sul, Susan K Service, Noah A Zaitlen, Sit-yee Kong, Nelson B Freimer, Chiara Sabatti and Eleazar Eskin: Variance component model to account for sample structure in genome-wide association studies. (PubMed) Nature Genetics 42(4):348-54 (2010)
Registry entries: Bio.tools 
estscan
détecteur indépendant du cadre de lecture ouvert pour les séquences codantes d’ADN
Versions of package estscan
ReleaseVersionArchitectures
bullseye3.0.3-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.0.3-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.0.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.0.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster3.0.3-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

vESTScan est un programme capable de détecter les régions codantes dans les séquences d’ADN, même si elles sont de piètre qualité. ESTScan détecte et corrige aussi les erreurs de séquençage conduisant à des décalages du cadre de lecture. ESTScan n’est pas un programme de prédiction de gènes, ni un détecteur de lecture de cadre ouvert. Sa force tient dans le fait qu’il ne nécessite pas de cadre de lecture ouvert pour détecter une région codante. Par conséquent, le programme peut rater quelques acides aminés avec comme extrémité N ou C-terminale, mais détectera des régions codantes avec une haute sélectivité et sensibilité.

ESTScan tire profit du biais de l’utilisation d’hexanucléotide trouvé dans des régions codantes par rapport aux régions non codantes. Ce biais est formalisé par un modèle de Markov caché (MMC) non homogène du cinquième ordre de période 3. De plus, le MMC d’ESTScan a été étendu pour permettre des insertions et des suppressions quand elles permettent une amélioration des statistiques de régions codantes.

Please cite: C. Lottaz, C. Iseli, CV. Jongeneel and Philipp Bucher: Modeling sequencing errors by combining Hidden Markov models Bioinformatics 19:103-112 (2003)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
examl
code Exascale Maximum Likelihood (ExaML) pour l’inférence phylogénétique
Versions of package examl
ReleaseVersionArchitectures
trixie3.0.22-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye3.0.22-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.0.22-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3.0.21-2amd64,i386
bookworm3.0.22-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Exascale Maximum Likelihood (ExaML) est un code pour les inférences phylogénétiques utilisant MPI. Ce code met en œuvre l’algorithme populaire de recherche RAxML pour l’inférence basée sur le maximum de vraisemblance dans les arbres phylogénétiques.

ExaML est une version légère réduite à l’essentiel de RAxML pour l’inférence phylogénétique d’ensembles de données énormes. Il ne peut exécuter que quelques fonctions basiques et est destiné aux utilisateurs avertis pouvant écrire de petits scripts Perl et ayant une expérience sur les scripts de mise en file d’attente pour des grappes. ExaML ne met en œuvre que les modèles CAT et GAMMA d’hétérogénéité de taux pour des données binaires d’ADN et protéines.

ExaML utilise une approche radicalement nouvelle de parallélisation MPI apportant une meilleure capacité parallèle, en particulier sur des ensembles de données partitionnés multi-gènes ou du génome entier. Il met en œuvre aussi un nouvel algorithme de répartition de charge qui apporte une meilleure capacité parallèle.

Il est quatre fois plus rapide que son prédécesseur RAxML-Light et s’étend à un plus grand nombre de processeurs.

Please cite: Alexey M. Kozlov, Andre J. Aberer and Alexandros Stamatakis: ExaML version 3: a tool for phylogenomic analyses on supercomputers. (PubMed,eprint) Bioinformatics 31(15):2577-2579 (2015)
exonerate
outil générique pour la comparaison de deux séquences
Versions of package exonerate
ReleaseVersionArchitectures
bookworm2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.2.0-6amd64,armel,armhf,i386
trixie2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster2.4.0-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.4.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package exonerate:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usesearching
works-with-formatplaintext
Popcon: 76 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet exonerate permet d'aligner des séquences en utilisant de nombreux modèles d'alignement, en utilisant soit de la programmation dynamique exhaustive, soit divers procédés heuristiques. La plupart des fonctionnalités de l'ensemble de la programmation dynamique ont été réécrites en C pour une meilleure efficacité. Le paquet exonerate est un composant intrinsèque de la construction des bases de données du projet Ensembl genome (par le centre de recherche European Bioinformatics Institute pour fournir des données à l'échelle du génome pour des espèces non-vertébrée), fournissant des notes de similitudes entre les séquences ARN et ADN et ainsi des variants d'épissage et les séquences de codage en général.

Un système In-silico PCR Experiment Simulation (voir la page du manuel d'ipcress) est fourni avec le paquet exonerate.

Ce paquet vient aussi avec une sélection d'utilitaires pour la réalisation rapide de manipulations simples avec des fichiers FASTA dépassant 2 Go.

Please cite: Guy C. Slater and Ewan Birney: Automated generation of heuristics for biological sequence comparison. (PubMed,eprint) BMC Bioinformatics 6(1):31 (2005)
Registry entries: Bio.tools  SciCrunch  Bioconda 
fasta3
tools for searching collections of biological sequences
Versions of package fasta3
ReleaseVersionArchitectures
buster36.3.8g-1 (non-free)amd64
bookworm36.3.8i.14-Nov-2020-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie36.3.8i.14-Nov-2020-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid36.3.8i.14-Nov-2020-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
experimental36.3.8i.14-Nov-2020-2~0exp0simdeamd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye36.3.8h.2020-02-11-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The FASTA programs find regions of local or global similarity between Protein or DNA sequences, either by searching Protein or DNA databases, or by identifying local duplications within a sequence. Other programs provide information on the statistical significance of an alignment. Like BLAST, FASTA can be used to infer functional and evolutionary relationships between sequences as well as help identify members of gene families.

  • Protein
  • Protein-protein FASTA
  • Protein-protein Smith-Waterman (ssearch)
  • Global Protein-protein (Needleman-Wunsch) (ggsearch)
  • Global/Local protein-protein (glsearch)
  • Protein-protein with unordered peptides (fasts)
  • Protein-protein with mixed peptide sequences (fastf)

  • Nucleotide

  • Nucleotide-Nucleotide (DNA/RNA fasta)
  • Ordered Nucleotides vs Nucleotide (fastm)
  • Un-ordered Nucleotides vs Nucleotide (fasts)

  • Translated

  • Translated DNA (with frameshifts, e.g. ESTs) vs Proteins (fastx/fasty)
  • Protein vs Translated DNA (with frameshifts) (tfastx/tfasty)
  • Peptides vs Translated DNA (tfasts)

  • Statistical Significance

  • Protein vs Protein shuffle (prss)
  • DNA vs DNA shuffle (prss)
  • Translated DNA vs Protein shuffle (prfx)

  • Local Duplications

  • Local Protein alignments (lalign)
  • Plot Protein alignment "dot-plot" (plalign)
  • Local DNA alignments (lalign)
  • Plot DNA alignment "dot-plot" (plalign)

This software is often used via a web service at the EBI with readily indexed reference databases at http://www.ebi.ac.uk/Tools/fasta/.

Please cite: William R. Pearson and D. J. Lipman: Improved tools for biological sequence comparison. (PubMed,eprint) Proc Natl Acad Sci U S A 85(8):2444-8 (1988)
Registry entries: Bioconda 
fastahack
utility for indexing and sequence extraction from FASTA files
Versions of package fastahack
ReleaseVersionArchitectures
stretch0.0+20160702-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el
sid1.0.0+dfsg-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.0+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.0+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.0+git20160702.bbc645f+dfsg-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.0.0+dfsg-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

fastahack is a small application for indexing and extracting sequences and subsequences from FASTA files. The included Fasta.cpp library provides a FASTA reader and indexer that can be embedded into applications which would benefit from directly reading subsequences from FASTA files. The library automatically handles index file generation and use.

Features:

  • FASTA index (.fai) generation for FASTA files
  • Sequence extraction
  • Subsequence extraction
  • Sequence statistics (currently only entropy is provided)

Sequence and subsequence extraction use fseek64 to provide fastest-possible extraction without RAM-intensive file loading operations. This makes fastahack a useful tool for bioinformaticists who need to quickly extract many subsequences from a reference FASTA sequence.

Registry entries: Bioconda 
fastani
Fast alignment-free computation of whole-genome Average Nucleotide Identity
Versions of package fastani
ReleaseVersionArchitectures
trixie1.33-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.33-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.33-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

ANI is defined as mean nucleotide identity of orthologous gene pairs shared between two microbial genomes. FastANI supports pairwise comparison of both complete and draft genome assemblies.

fastaq
outils de manipulation de fichiers FASTA ou FASTQ
Versions of package fastaq
ReleaseVersionArchitectures
bullseye3.17.0-3all
buster3.17.0-2all
jessie1.5.0-1all
sid3.17.0-6all
trixie3.17.0-6all
stretch3.14.0-1all
bookworm3.17.0-5all
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Fastaq est une collection variée de scripts qui réalisent des tâches utiles et courantes de manipulation pour FASTA et FASTQ, telles que le filtrage, la fusion, le fractionnement, le découpage, la recherche ou le remplacement, etc. Les fichiers d’entrée et de sortie peuvent être compressés (le format est automatiquement détecté) et les différentes commandes de Fastaq peuvent être redirigées (pipe).

Topics: Bioinformatics
fastdnaml
outil pour la construction d'arbres phylogénétiques de séquences d'ADN
Versions of package fastdnaml
ReleaseVersionArchitectures
bookworm1.2.2-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2.2-14amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.2.2-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.2-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.2.2-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.2.2-10amd64,armel,armhf,i386
trixie1.2.2-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package fastdnaml:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 7 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

fastDNAml est un logiciel dérivé de la version 3.3 du logiciel DNAML (« DNA Maximum Likelihood ») de Joseph Felsenstein faisant partie de son paquet PHYLIP (« PHYLogeny Inference Package »). Les utilisateurs devraient consulter la documentation de DNAML avant d'utiliser ce logiciel.

Le logiciel fastDNAml est une tentative de résoudre le même problème que DNAML, mais de le faire plus rapidement et en utilisant moins de mémoire. Ainsi, les grands arbres phylogénétiques qui reproduisent l'amorçage deviennent traitables. Une grande partie du logiciel fastDNAml est simplement un recodage de la version 3.3 du DNAML de PHYLIP du langage Pascal au C.

La page d'accueil de ce logiciel n'étant plus disponible, ce logiciel ne verra donc probablement pas d'autres mises à jour.

Please cite: Gary J. Olsen, Hideo Matsuda, Ray Hagstrom and Ross Overbeek: fastDNAml: a tool for construction of phylogenetic trees of DNA sequences using maximum likelihood. (PubMed,eprint) Comput Appl Biosci 10(1):41-48 (1994)
fastlink
version plus rapide des programmes de généalogie génétique Linkage
Versions of package fastlink
ReleaseVersionArchitectures
bullseye4.1P-fix100+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.1P-fix100+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.1P-fix100+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm4.1P-fix100+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie4.1P-fix95-3amd64,armel,armhf,i386
stretch4.1P-fix100+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.1P-fix100+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package fastlink:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

L'analyse de généalogie génétique est une technique statistique utilisée pour cartographier les gènes et trouver une approximation de l'emplacement de gènes malades. C'était un paquet logiciel standard pour la généalogie génétique appelée LINKAGE. FASTLINK est une version significativement modifiée et améliorée des programmes principaux de LINKAGE qui fonctionne plus rapidement de manière séquentielle, peut fonctionner en parallèle, permet à l'utilisateur une bonne récupération après un plantage de l'ordinateur et fournit une documentation nouvelle et abondante. FASTLINK a été utilisé dans plus de 1000 publications de généalogie génétique.

Ce paquet contient les programmes suivants :

 – ilink :    procédure d'optimisation GEMINI pour trouver une valeur
              optimale locale du vecteur thêta des fractions de
              recombinaison ;
 – linkmap :  calcul les scores de localisation d'un « locus » sur une
              carte déterminée d'autres « loci » ;
 – lodscore : comparaison des vraisemblances à un thêta optimum local ;
 – mlink :    calcul des « LOD score » et le risque avec deux « loci »
              et plus ;
 – unknown :  identification des génotypes possibles pour des inconnus.
Please cite: R. W. Cottingham Jr., R. M. Idury and A. A. Schaffer: Faster Sequential Genetic Linkage Computations. (PubMed,eprint) American Journal of Human Genetics 53(1):252-263 (1993)
Registry entries: SciCrunch 
fastml
reconstruction d’ancestrales séquences d’acide aminé par maximum de vraisemblance
Versions of package fastml
ReleaseVersionArchitectures
stretch3.1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.11-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.1-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm3.11-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.11-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid3.11-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

FastML is a bioinformatics tool for the reconstruction of ancestral sequences based on the phylogenetic relations between homologous sequences. FastML runs several algorithms that reconstruct the ancestral sequences with emphasis on an accurate reconstruction of both indels and characters. For character reconstruction the previously described FastML algorithms are used to efficiently infer the most likely ancestral sequences for each internal node of the tree. Both joint and the marginal reconstructions are provided. For indels reconstruction the sequences are first coded according to the indel events detected within the multiple sequence alignment (MSA) and then a state-of-the-art likelihood model is used to reconstruct ancestral indels states. The results are the most probable sequences, together with posterior probabilities for each character and indel at each sequence position for each internal node of the tree. FastML is generic and is applicable for any type of molecular sequences (nucleotide, protein, or codon sequences).

Please cite: Haim Ashkenazy, Osnat Penn, Adi Doron-Faigenboim, Ofir Cohen, Gina Cannarozzi, Oren Zomer and Tal Pupko: FastML: a web server for probabilistic reconstruction of ancestral sequences. (PubMed,eprint) Nucleic Acids Research 40(Web Server issue):W580-W584 (2012)
Registry entries: Bio.tools 
fastp
Ultra-fast all-in-one FASTQ preprocessor
Versions of package fastp
ReleaseVersionArchitectures
bookworm0.23.2+dfsg-2amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
sid0.23.4+dfsg-1amd64,arm64,armel,armhf,mips64el,ppc64el,riscv64,s390x
buster0.19.6+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.20.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.23.4+dfsg-1amd64,arm64,armel,armhf,mips64el,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

All-in-one FASTQ preprocessor, fastp provides functions including quality profiling, adapter trimming, read filtering and base correction. It supports both single-end and paired-end short read data and also provides basic support for long-read data.

The package is enhanced by the following packages: multiqc
Please cite: Shifu Chen, Yanqing Zhou, Yaru Chen and Jia Gu: fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics 34(17):i884-i890 (2018)
Registry entries: Bioconda 
fastq-pair
réécriture des appairages fastq pour que toutes les lectures aient une partenaire et éviter les singletons
Versions of package fastq-pair
ReleaseVersionArchitectures
sid1.0-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet réécrit les fichiers fastq avec les séquences ordonnées, avec un établissement de correspondances de fichiers pour deux fichiers fournis sur la ligne de commande, et alors toutes lectures uniques sans correspondance sont placées dans deux fichiers séparés, un pour chaque fichier originel.

Ce code est conçu pour être plus rapide, mieux utiliser la mémoire et fonctionner avec de gros fichiers fastq. Il ne stocke pas le fichier entier en mémoire, mais plutôt stocke les emplacements de chacun des index dans le premier fichier fourni en mémoire.

fastqc
contrôle qualité pour les données de séquences à haut débit
Versions of package fastqc
ReleaseVersionArchitectures
jessie0.11.2+dfsg-3all
sid0.12.1+dfsg-3all
bookworm0.11.9+dfsg-6all
trixie0.12.1+dfsg-3all
bullseye0.11.9+dfsg-4all
buster0.11.8+dfsg-2all
stretch0.11.5+dfsg-6all
Popcon: 33 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

FastQC a pour objectif de fournir un moyen simple de faire des contrôles de qualité sur des données de séquences brutes provenant de pipelines de séquençage à haut débit. Il propose un ensemble modulaire d'analyses pouvant être utilisées pour donner une impression rapide des problèmes dont l'utilisateur devrait être au courant avant de faire une analyse plus poussée.

Les principales fonctions de FastQC sont :

  • import des données des fichiers BAM (version binaire compressée de SAM), SAM (« Sequence Alignment/Map ») ou FastQ (n'importe quelle variante) ;
  • fournir un aperçu rapide pour indiquer les zones dans lesquelles il peut y avoir des problèmes ;
  • des graphes de résumé et des tables pour évaluer rapidement les données ;
  • export des résultats vers un rapport permanent en HTML ;
  • fonctionnement hors ligne afin de permettre la génération de rapports automatiques sans exécuter l'application interactive.
The package is enhanced by the following packages: multiqc
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing
fastqtl
mappage de LCQ (locus de caractères quantitatifs) dans cis pour les phénotypes moléculaires
Versions of package fastqtl
ReleaseVersionArchitectures
trixie2.184+v7+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.184+v7+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.184+dfsg-6amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.184+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.184+dfsg-5amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
bookworm2.184+v7+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le but de FastQTL est d’identifier les polymorphismes d'un seul nucléotide (SNP) qui sont associés de façon significative avec différents phénotypes moléculaires (c.-à-d. l’expression de gènes connus, les niveaux de méthylation de la cytosine, etc). Il réalise des analyses pour toutes les paires phénotype-variante dans cis (c.-à-d. les variantes à l’intérieur d’une fenêtre particulière autour d’un phénotype). FastQTL met en œuvre un nouveau schéma de permutation (approximation Bêta) pour précisément et rapidement corriger les génotypes et phénotypes pendant des tests multiples.

The package is enhanced by the following packages: fastqtl-doc
Please cite: Halit Ongen, Alfonso Buil, Andrew Anand Brown, Emmanouil T. Dermitzakis and and Olivier Delaneau: Fast and efficient QTL mapper for thousands of molecular phenotypes. (eprint) Bioinformatics (2015)
fasttree
arbres phylogénétiques à partir d'alignements de nucléotides ou des séquences de protéines
Versions of package fasttree
ReleaseVersionArchitectures
trixie2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.1.7-2amd64,armel,armhf,i386
stretch2.1.9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1.10-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 8 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet FastTree déduit les arbres phylogénétiques de probabilité approximativement maximale des alignements de nucléotides ou des séquences de protéines. Il manipule des alignements jusqu'à un million de séquences en une quantité de temps et de mémoire raisonnable. Pour de grands alignements, le paquet FastTree est 100 à 1000 fois plus rapide que la version 3.0 du paquet PhyML ou la version 7 du paquet RAxML.

Le paquet FastTree est plus précis que la version 3 du paquet PhyML avec des paramètres par défaut, et bien plus précis que les méthodes de matrices de distances qui sont traditionnellement utilisées pour de grands alignements. Le paquet FastTree utilise les modèles de Jukes-Cantor (1969) ou « Generalized Time Reversible » (GTR . Simon Tavaré , 1986) de l'évolution de nucléotides et le modèle de Jones, Taylor and Thornton (1992) de l'évolution des acides aminés. Pour tenir compte des taux variants de l'évolution à travers les sites, FastTree utilise un taux unique de chaque site (l'approximation CAT). Pour estimer rapidement la fiabilité de chaque scission dans l'arbre, le paquet FastTree calcule les valeurs d'appui avec le test de Shimodaira-Hasegawa (1999 ; Ces valeurs d'appui sont les mêmes que « les appuis locaux de type Shimodaira-Hasegawa » de la version 3 du paquet PhyML.)

Ce paquet contient une version à processus en série (fasttree) et une version à processus en parallèle qui utilise OpenMP (fasttreMP).

Please cite: Morgan N. Price, Paramvir S. Dehal and Adam P. Arkin: FastTree 2 -- Approximately Maximum-Likelihood Trees for Large Alignments.. (PubMed,eprint) PLoS ONE 5(3):e9490 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
ffindex
index/base de données simple pour d'énormes quantités de petits fichiers
Versions of package ffindex
ReleaseVersionArchitectures
stretch0.9.9.7-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.9.9.9-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.9.9.9-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.9.9.3-2amd64,armel,armhf,i386
bookworm0.9.9.9-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.9.9.9-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.9.9.9-6.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

FFindex est un index/base de données très simple pour d'énormes quantités de petits fichiers. Les fichiers sont stockés concaténés dans un grand fichier de données, séparés par '\0'. Un second fichier contient un index de texte brut, donnant le nom, le décalage et la longueur de petits fichiers. La recherche est actuellement réalisée avec une recherche binaire sur un tableau fabriqué sur un fichier d'index.

Ce paquet fournit les exécutables.

figtree
visionneuse d'arbres phylogénétiques sous forme graphique
Versions of package figtree
ReleaseVersionArchitectures
bookworm1.4.4-5all
bullseye1.4.4-5all
buster1.4.4-3all
stretch1.4.2+dfsg-2all
jessie1.4-2all
sid1.4.4-6all
trixie1.4.4-6all
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet figtree est conçu comme une visionneuse graphique d'arbres phylogénétiques et comme un programme pour produire des chiffres de publication prêts à l'emploi. En particulier, il est conçu pour afficher des arbres résumés et annotés produits par le logiciel BEAST (« Bayesian Evolutionary Analysis Sampling Trees »).

Registry entries: Bio.tools  SciCrunch  Bioconda 
filtlong
quality filtering tool for long reads of genome sequences
Versions of package filtlong
ReleaseVersionArchitectures
sid0.2.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.2.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.2.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.2.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Filtlong is a tool for filtering long reads by quality. It can take a set of long reads and produce a smaller, better subset. It uses both read length (longer is better) and read identity (higher is better) when choosing which reads pass the filter.

Registry entries: Bio.tools  Bioconda 
fitgcp
fitting genome coverage distributions with mixture models
Versions of package fitgcp
ReleaseVersionArchitectures
stretch0.0.20150429-1amd64,arm64,mips64el,ppc64el
bookworm0.0.20150429-5all
trixie0.0.20150429-5all
bullseye0.0.20150429-4all
buster0.0.20150429-2amd64,arm64,mips64el,ppc64el
sid0.0.20150429-5all
jessie0.0.20130418-2amd64,i386
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Genome coverage, the number of sequencing reads mapped to a position in a genome, is an insightful indicator of irregularities within sequencing experiments. While the average genome coverage is frequently used within algorithms in computational genomics, the complete information available in coverage profiles (i.e. histograms over all coverages) is currently not exploited to its full extent. Thus, biases such as fragmented or erroneous reference genomes often remain unaccounted for. Making this information accessible can improve the quality of sequencing experiments and quantitative analyses.

fitGCP is a framework for fitting mixtures of probability distributions to genome coverage profiles. Besides commonly used distributions, fitGCP uses distributions tailored to account for common artifacts. The mixture models are iteratively fitted based on the Expectation-Maximization algorithm.

Please cite: Martin S. Lindner, Maximilian Kollock, Franziska Zickmann and Bernhard Y. Renard: Analyzing genome coverage profiles with applications to quality control in metagenomics. (PubMed,eprint) Bioinformatics 29(10):1260-1267 (2013)
Registry entries: SciCrunch 
flash
Fast Length Adjustment of SHort reads
Versions of package flash
ReleaseVersionArchitectures
bullseye1.2.11-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.11-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.2.11-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.11-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

FLASH (Fast Length Adjustment of SHort reads) est un outil logiciel très rapide et précis pour fusionner des lectures de séquences appariées (paired-end reads) à partir de tests de séquençage à haut débit. FLASH est conçu pour fusionner des paires de lectures où les fragments de l’ADN originel sont deux fois plus petits que la longueur des lectures. Les lectures résultantes plus longues améliore l’assemblage du génome. Elles peuvent aussi améliorer significativement l’assemblage du transcriptome quand FLASH est utilisé pour fusionner les données de RNA- seq.

The package is enhanced by the following packages: multiqc
Please cite: Tanja Magoč and Steven L Salzberg: FLASH: Fast Length Adjustment of Short Reads to Improve Genome Assemblies. (PubMed,eprint) Bioinformatics 27(21):2957-2963 (2011)
Registry entries: Bio.tools  Bioconda 
flexbar
code-barres flexible et suppression de l'adaptation pour les plateformes de séquençage
Versions of package flexbar
ReleaseVersionArchitectures
bullseye3.5.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.50-1amd64,armhf,i386
buster3.4.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch2.50-2amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet Flexbar prétraite les données de séquençage efficacement et à haut débit. Il démultiplexe les lectures de code-barres et enlève les séquences d'adaptation. De plus, les fonctionnalités de découpage et de filtrage sont fournies. Le paquet Flexbar augmente les taux de correspondance et améliore les assemblages du génome et du transcriptome. Il gère les données de séquençage de dernière génération aux formats FASTA/Q et CSFASTA/Q des plateformes de l'entreprise Illumina, 454 de l'entreprise Roche et SOLiD de l'entreprise AppliedBIosystems.

Les noms de paramètres ont changé dans le paquet Flexbar. Veuillez donc vérifier vos scripts. Ces derniers mois, les paramètres par défaut ont été optimisés, plusieurs bogues ont été réparés, et diverses améliorations ont été effectuées, par exemple une interface en ligne de commande rénovée, de nouveaux modes de découpage ainsi que des exigences plus faibles en temps et en mémoire.

The package is enhanced by the following packages: multiqc
Please cite: Matthias Dodt, Johannes T. Roehr, Rina Ahmed and Christoph Dieterich: FLEXBAR — Flexible Barcode and Adapter Processing for Next-Generation Sequencing Platforms. (eprint) Biology 1(3):895-905 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
flye
assembleur de novo pour les lectures de séquençage de molécule unique utilisant un graphe de répétitions
Versions of package flye
ReleaseVersionArchitectures
sid2.9.3+dfsg2-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie2.9.3+dfsg2-1amd64,arm64,mips64el,ppc64el,s390x
bookworm2.9.1+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
Popcon: 0 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Flye est un assembleur de novo pour les lectures de séquençage de molécule unique, telles que celles produites par PacBio et « Oxford Nanopore Technologies ». Il est conçu pour une large diversité d’ensembles de données, du petit projet concernant des bactéries aux assemblages à l’échelle de mammifères. Ce paquet constitue une chaine complète : il prend en entrée des chaines brutes de PacBio ou ONT et produit des contigs propres. Flye possède aussi un mode spécial pour les assemblages de métagénome.

Please cite: Mikhail Kolmogorov, Jeffrey Yuan, Yu Lin and Pavel A. Pevzner: Assembly of long, error-prone reads using repeat graphs. (PubMed) Nature Biotechnology 37(5):540–546 (2019)
Registry entries: Bio.tools  Bioconda 
fml-asm
outil pour l’assemblage Illumina de lectures courtes pour de petites régions
Versions of package fml-asm
ReleaseVersionArchitectures
buster0.1-5amd64
experimental0.1+git20190320.b499514-2~0expamd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports0.1-4~bpo9+1amd64
stretch0.1-2amd64
upstream0.1+git20221215.85f159e
Popcon: 2 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Fml-asm est un outil en ligne de commande pour l’assemblage Illumina de lectures courtes pour des régions de taille 100 à 10 millions de paires de base, basé sur la bibliothèque fermi-lite. C’est une version en mémoire largement plus légère de fermikit sans génération de fichiers intermédiaires. Il hérite des performances, de l’empreinte mémoire relativement petite et des fonctions de fermikit. En particulier, fermi-lite est capable de conserver les évènements hétérozygotes et peut donc être utilisée pour assembler des régions diploïdes dans le but de détecter les variants.

Registry entries: Bio.tools  SciCrunch  Bioconda 
freebayes
détection bayésienne de polymorphismes basée sur les haplotypes et génotypage
Versions of package freebayes
ReleaseVersionArchitectures
bullseye1.3.5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports1.2.0-1~bpo9+1amd64
buster1.2.0-2amd64
sid1.3.7-1amd64,arm64,mips64el,ppc64el,riscv64
trixie1.3.7-1amd64,arm64,mips64el,ppc64el
experimental1.3.7-1~expamd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.3.6-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

FreeBayes est un détecteur de variant génétique bayésien conçu pour détecter des petits polymorphismes, plus spécialement les polymorphismes d'un seul nucléotide (SNP), les indels (insertions et suppressions), les polymorphismes de nucléotides multiples (MNP) et les évènements complexes (évènements d’insertion et de substitution composites), plus petits que la longueur d’un alignement de séquençage de lecture courte.

Please cite: Erik Garrison and Gabor Marth: Haplotype-based variant detection from short-read sequencing. (eprint) arXiv (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
freecontact
prédicteur rapide de contact de protéine
Versions of package freecontact
ReleaseVersionArchitectures
sid1.0.21-13.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0.21-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.21-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.0.21-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.0.21-3amd64,armel,armhf,i386
trixie1.0.21-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.0.21-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

FreeContact est un prédicteur de contact de résidu de protéine optimisé pour la vitesse. Son entrée est un alignement de séquences multiples. FreeContact peut servir comme un remplaçant accéléré des prédicteurs de contact existants EVfold-mfDCA de DS. Marks (2011) et PSICOV de D. Jones (2011).

FreeContact est accéléré par une combinaison de vecteurs, plusieurs fils d’exécution et une implémentation plus rapide des parties clés. Selon l’alignement, des accélérations de huit fois ou supérieures sont possibles.

Un alignement suffisamment grand est nécessaire pour des résultats significatifs. Comme minimum, un alignement avec un nombre de séquences effectif (après pondération) supérieur à la longueur de la séquence recherchée devrait être utilisé. Des alignements de dizaines de milliers de séquences (effectives) sont considérés comme une bonne entrée.

Par exemple, jackhmmer(1) du paquet hmmer ou hhblits(1) de hhsuite peuvent être utilisés pour générer les alignements.

Ce paquet fournit l’outil en ligne de commande freecontact(1).

Please cite: László Kaján, Thomas A. Hopf, Matúš Kalaš, Debora S. Marks and Burkhard Rost: FreeContact: fast and free software for protein contact prediction from residue co-evolution. BMC Bioinformatics (2014)
Topics: Structure prediction; Sequence analysis
fsa
Fast Statistical Alignment of protein, RNA or DNA sequences
Versions of package fsa
ReleaseVersionArchitectures
bullseye1.15.9+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.15.9+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.15.9+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.15.9+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.15.9+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.15.9+dfsg-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 66 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

FSA is a probabilistic multiple sequence alignment algorithm which uses a "distance-based" approach to aligning homologous protein, RNA or DNA sequences. Much as distance-based phylogenetic reconstruction methods like Neighbor-Joining build a phylogeny using only pairwise divergence estimates, FSA builds a multiple alignment using only pairwise estimations of homology. This is made possible by the sequence annealing technique for constructing a multiple alignment from pairwise comparisons, developed by Ariel Schwartz.

FSA brings the high accuracies previously available only for small-scale analyses of proteins or RNAs to large-scale problems such as aligning thousands of sequences or megabase-long sequences. FSA introduces several novel methods for constructing better alignments:

  • FSA uses machine-learning techniques to estimate gap and substitution parameters on the fly for each set of input sequences. This "query-specific learning" alignment method makes FSA very robust: it can produce superior alignments of sets of homologous sequences which are subject to very different evolutionary constraints.
  • FSA is capable of aligning hundreds or even thousands of sequences using a randomized inference algorithm to reduce the computational cost of multiple alignment. This randomized inference can be over ten times faster than a direct approach with little loss of accuracy.
  • FSA can quickly align very long sequences using the "anchor annealing" technique for resolving anchors and projecting them with transitive anchoring. It then stitches together the alignment between the anchors using the methods described above.
  • The included GUI, MAD (Multiple Alignment Display), can display the intermediate alignments produced by FSA, where each character is colored according to the probability that it is correctly aligned
Please cite: Robert K. Bradley, Adam Roberts, Michael Smoot, Sudeep Juvekar, Jaeyoung Do, Colin Dewey, Ian Holmes and Lior Pachter: Fast Statistical Alignment. (PubMed,eprint) PLoS Comput Biol. 5(5):e1000392 (2009)
Registry entries: Bioconda 
Remark of Debian Med team: Precondition for T-Coffee

see http://wiki.debian.org/DebianMed/TCoffee

Upstream address bounced when contacting about segfaults so it seems to be dead upstream and no good code quality.

fsm-lite
frequency-based string mining (lite)
Versions of package fsm-lite
ReleaseVersionArchitectures
bookworm1.0-8amd64,arm64,mips64el,ppc64el,s390x
stretch1.0-2amd64,arm64,mips64el,ppc64el,s390x
sid1.0-8amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye1.0-5amd64,arm64,mips64el,ppc64el,s390x
trixie1.0-8amd64,arm64,mips64el,ppc64el,s390x
buster1.0-3amd64,arm64,mips64el,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

A singe-core implementation of frequency-based substring mining used in bioinformatics to extract substrings that discriminate two (or more) datasets inside high-throughput sequencing data.

Registry entries: SciCrunch  Bioconda 
gamgi
interface graphique de modélisation atomique générale (GAMGI)
Versions of package gamgi
ReleaseVersionArchitectures
jessie0.17.1-1amd64,armel,armhf,i386
buster0.17.3-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.17.3-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.17.5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.17.5-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.17.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package gamgi:
roleprogram
uitoolkitgtk
Popcon: 10 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

GAMGI (« General Atomistic Modelling Graphic Interface ») propose une interface graphique pour construire, visualiser et analyser les structures des atomes. Le programme est destiné à la communauté scientifique et propose une interface graphique pour étudier les structures des atomes et préparer les images pour les présentations, et pour enseigner la structure de l'atome.

The package is enhanced by the following packages: gamgi-data gamgi-doc
Registry entries: SciCrunch 
Screenshots of package gamgi
garli
phylogenetic analysis of molecular sequence data using maximum-likelihood
Versions of package garli
ReleaseVersionArchitectures
trixie2.1-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.1-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

GARLI, Genetic Algorithm for Rapid Likelihood Inference is a program for inferring phylogenetic trees. Using an approach similar to a classical genetic algorithm, it rapidly searches the space of evolutionary trees and model parameters to find the solution maximizing the likelihood score. It implements nucleotide, amino acid and codon-based models of sequence evolution, and runs on all platforms. The latest version adds support for partitioned models and morphology-like datatypes.

garlic
logiciel de visualisation de biomolécules
Versions of package garlic
ReleaseVersionArchitectures
bookworm1.6-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.6-1.1amd64,armel,armhf,i386
buster1.6-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.6-1.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.6-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.6-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.6-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package garlic:
fieldbiology, chemistry
interfacex11
roleprogram
scopeutility
uitoolkitxlib
useviewing
x11application
Popcon: 17 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Garlic a été écrit pour l'analyse des protéines membranaires. Il permet aussi de visualiser les autres protéines, ainsi que d'autres objets géométriques. Cette version de Garlic reconnaît le format PDB version 2.1. Garlic peut aussi être utilisé pour analyser des séquences protéiques.

Il dépend uniquement des bibliothèque  X, aucune autre bibliothèque n'est nécessaire.

Parmi ses fonctions :

 – la position et l'épaisseur de la tranche sont visibles dans une petite
   fenêtre ;
 – les liaisons atomiques et les atomes sont traités comme des objets
   indépendants pour l'affichage ;
 – la couleur des atomes et des liaisons dépend de leur position. Cinq
   modes sont disponibles (comme pour la tranche) ;
 – il est capable de représenter des images stéréographiques ;
 – il est capable de représenter d'autres objets géométriques, comme une
   membrane ;
 – l'information sur un atome est disponible en déplaçant le pointeur de
   la souris au-dessus. Pas besoin de clic, il suffit de déplacer le
    pointeur au-dessus ;
 – il est capable de charger plus d'une structure ;
 – il est capable de représenter les diagrammes de Ramachandran, les roues
   hélicoïdales, les diagrammes de Venn, les profils d'hydrophobicité et
   les moments hydrophobes ;
 – l'invite de commande est disponible au bas de la fenêtre principale.
   Un message d'erreur et une ligne de commande peuvent être affichés.
Please cite: Damir Zucic and Davor Juretic: Precise Annotation of Transmembrane Segments with Garlic - a Free Molecular Visualization Program (eprint) Croatica Chemica Acta 77(1-2):397-401 (2004)
Registry entries: Bio.tools 
gasic
genome abundance similarity correction
Versions of package gasic
ReleaseVersionArchitectures
sid0.0.r19-8all
bullseye0.0.r19-7all
bookworm0.0.r19-8all
buster0.0.r19-4amd64
stretch0.0.r19-1amd64
jessie0.0.r18-2amd64
Popcon: 3 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

One goal of sequencing based metagenomic analysis is the quantitative taxonomic assessment of microbial community compositions. However, the majority of approaches either quantify at low resolution (e.g. at phylum level) or have severe problems discerning highly similar species. Yet, accurate quantification on species level is desirable in applications such as metagenomic diagnostics or community comparison. GASiC is a method to correct read alignment results for the ambiguities imposed by similarities of genomes. It has superior performance over existing methods.

The package is enhanced by the following packages: gasic-examples
Please cite: Martin S. Lindner and Bernhard Y. Renard: Metagenomic abundance estimation and diagnostic testing on species level. (PubMed,eprint) Nucleic Acids Research 41(1):e10 (2013)
Registry entries: SciCrunch 
gatb-core
Genome Analysis Toolbox with de-Bruijn graph
Versions of package gatb-core
ReleaseVersionArchitectures
bookworm1.4.2+dfsg-11amd64,arm64,mips64el,ppc64el
sid1.4.2+dfsg-13amd64,arm64,mips64el,ppc64el,riscv64
buster1.4.1+git20181225.44d5a44+dfsg-3amd64,arm64,i386,mips64el,ppc64el,s390x
trixie1.4.2+dfsg-13amd64,arm64,mips64el,ppc64el
bullseye1.4.2+dfsg-6amd64,arm64,i386,mips64el,ppc64el,s390x
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The GATB-CORE project provides a set of highly efficient algorithms to analyse NGS data sets. These methods enable the analysis of data sets of any size on multi-core desktop computers, including very huge amount of reads data coming from any kind of organisms such as bacteria, plants, animals and even complex samples (e.g. metagenomes). Read more about GATB at https://gatb.inria.fr/. By itself GATB-CORE is not an NGS data analysis tool. However, it can be used to create such tools. There already exist a set of ready-to-use tools relying on GATB-CORE library: see https://gatb.inria.fr/software/

Please cite: Erwan Drezen, Guillaume Rizk, Rayan Chikhi, Charles Deltel, Claire Lemaitre, Pierre Peterlongo and Dominique Lavenier: GATB: Genome Assembly & Analysis Tool Box. Bioinformatics 30(20):2959-2961 (2014)
Registry entries: Bioconda 
gbrowse
navigateur de génome générique GMOD
Versions of package gbrowse
ReleaseVersionArchitectures
sid2.56+dfsg-12all
jessie2.54+dfsg-3all
stretch2.56+dfsg-2all
buster2.56+dfsg-4all
bullseye2.56+dfsg-8all
bookworm2.56+dfsg-11all
trixie2.56+dfsg-12all
Debtags of package gbrowse:
fieldbiology, biology:bioinformatics
interfaceweb
roleprogram
useanalysing, viewing
webapplication, cgi
Popcon: 22 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit un navigateur web de génomes simple, mais hautement configurable. C'est un composant du projet « Generic Model Organism Database » (GMOD). Certaines de ses fonctionnalités sont :

  • vues simultanées en perspective et détaillées du génome ;
  • défilement, agrandissement, centrage ;
  • ajout d'URLs arbitraires à toute annotation ;
  • configuration de l'ordre et l'apparence de morceaux personnalisable par l'administrateur et l'utilisateur final ;
  • recherche par identifiant de l'annotation, le nom, ou le commentaire ;
  • gestion d'annotation d'une tierce personne en utilisant les formats GFF (« General Feature Format ») ;
  • conservation des paramètres entre les sessions ;
  • dépôts d'ADN et de GFF ;
  • connectivité vers des bases de données différentes, incluant BioSQL et Chado ;
  • gestion multilingue ;
  • chargement de fonctionnalités tierces ;
  • architecture en greffon personnalisable (par exemple, pour exécuter BLAST, exporter et importer dans de nombreux formats, trouver des oligonucléotides, concevoir des amorces, créer des cartes de restriction, modifier des caractéristiques).
The package is enhanced by the following packages: libbio-samtools-perl
Please cite: Maureen J. Donlin: Using the Generic Genome Browser (GBrowse). (eprint) Department of Biochemistry and Molecular Biology and Department of Molecular Microbiology and Immunology, Saint Louis University School of Medicine (2009)
Registry entries: Bio.tools  SciCrunch 
gdpc
Visualisateur de simulations de dynamique moléculaire
Versions of package gdpc
ReleaseVersionArchitectures
sid2.2.5-16amd64,arm64,mips64el,ppc64el,riscv64
jessie2.2.5-3amd64,armel,armhf,i386
stretch2.2.5-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.2.5-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.2.5-14amd64,arm64,mips64el,ppc64el
bookworm2.2.5-15amd64,arm64,mips64el,ppc64el
trixie2.2.5-16amd64,arm64,mips64el,ppc64el
Debtags of package gdpc:
fieldbiology, biology:structural, chemistry, physics
interfacex11
roleprogram
scopeapplication
uitoolkitgtk
useviewing
works-with3dmodel, image, video
works-with-formatjpg, png
x11application
Popcon: 14 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Le programme gpdc est un programme graphique de visualisation de données issues de simulations de dynamique moléculaire. Il gère en entrée le format standard xyz ainsi que d'autres formats et en sortie les formats de fichiers graphiques JPG et PNG.

gemma
Genome-wide Efficient Mixed Model Association
Versions of package gemma
ReleaseVersionArchitectures
buster0.98.1+dfsg-1amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
sid0.98.5+dfsg-2amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.98.5+dfsg-2amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
bookworm0.98.5+dfsg-2amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
bullseye0.98.4+dfsg-4amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

GEMMA is the software implementing the Genome-wide Efficient Mixed Model Association algorithm for a standard linear mixed model and some of its close relatives for genome-wide association studies (GWAS):

  • It fits a univariate linear mixed model (LMM) for marker association tests with a single phenotype to account for population stratification and sample structure, and for estimating the proportion of variance in phenotypes explained (PVE) by typed genotypes (i.e. "chip heritability").
  • It fits a multivariate linear mixed model (mvLMM) for testing marker associations with multiple phenotypes simultaneously while controlling for population stratification, and for estimating genetic correlations among complex phenotypes.
  • It fits a Bayesian sparse linear mixed model (BSLMM) using Markov chain Monte Carlo (MCMC) for estimating PVE by typed genotypes, predicting phenotypes, and identifying associated markers by jointly modeling all markers while controlling for population structure.
  • It estimates variance component/chip heritability, and partitions it by different SNP functional categories. In particular, it uses HE regression or REML AI algorithm to estimate variance components when individual-level data are available. It uses MQS to estimate variance components when only summary statisics are available.

GEMMA is computationally efficient for large scale GWAS and uses freely available open-source numerical libraries.

Please cite: Xiang Zhou and Matthew Stephens: Genome-wide efficient mixed-model analysis for association studies Nature Genetics 44:821-824 (2012)
Registry entries: Bioconda 
genometester
boîte à outils pour réaliser des opérations d’ensembles sur des listes de k-mères
Versions of package genometester
ReleaseVersionArchitectures
sid4.0+git20200511.91cecb5+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.0+git20200511.91cecb5+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster4.0+git20180508.a9c14a6+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye4.0+git20200511.91cecb5+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.0+git20200511.91cecb5+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream4.0+git20221122.71e6625
Popcon: 2 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Il s’agit d’une boîte à outils pour réaliser des opérations d’ensemble (union, intersection et complément) pour des listes de k-mères.

GenomeTester4 est une boîte à outils qui fournit un nouvel outil, GListCompare, pour réaliser des opérations d’ensembles (union, intersection et complément ou différence) sur des listes de k-mères. Elle contient des exemples montrant comment ces opérations générales peuvent être combinées pour résoudre des problèmes d’analyses biologiques diverses.

Please cite: Lauris Kaplinski, Maarja Lepamets and Maido Remm: GenomeTester4: a toolkit for performing basic set operations - union, intersection and complement on k-mer lists. (PubMed,eprint) GigaScience 4(1):58 (2015)
Registry entries: Bio.tools  Bioconda 
genomethreader
outil logiciel pour le calcul de prédictions de structure de gène
Versions of package genomethreader
ReleaseVersionArchitectures
bullseye1.7.3+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.7.3+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.7.3+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.7.3+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 1 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

GenomeThreader est un outil logiciel pour la prédiction de structures de gène. Cette prédiction est calculée en utilisant une approche basée sur la similitude où des séquences ADNc/EST et/ou des séquences protéiques sont utilisées pour prédire les structures de gène à l’aide d’alignements d’épissure. GenomeThreader a été motivé pour annuler les limitations de GeneSeqer, un programme populaire de prédiction de gène largement utilisé pour l’annotation de génomes végétaux.

Please cite: G. Gremme, V. Brendel, M.E. Sparks and S. Kurtz: Engineering a software tool for gene structure prediction in higher organisms. Information and Software Technology 47(15):965-978 (2005)
Registry entries: Bio.tools  Bioconda 
genometools
boîte à outils polyvalente d'analyse du génome
Versions of package genometools
ReleaseVersionArchitectures
bookworm-backports1.6.5+ds-2~bpo12+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.5.9+ds-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye-backports-sloppy1.6.5+ds-2~bpo11+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.6.1+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.6.2+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster-backports1.6.1+ds-3~bpo10+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.5.10+ds-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.6.5+ds-2.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.5.3-2amd64,armel,armhf,i386
trixie1.6.5+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package genometools:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
uitoolkitncurses
Popcon: 3 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet GenomeTools contient une collection d'outils utiles pour l'analyse de séquences biologiques et la présentation regroupés en un simple exécutable.

La boîte à outils contient les programmes exécutables pour les séquences et la manipulation des annotations, la compression de séquences, la génération de la structure de l'index et de l'accès, la visualisation de l'annotation, et bien plus.

Please cite: Gordon Gremme, Sascha Steinbiss and Stefan Kurtz: GenomeTools: a comprehensive software library for efficient processing of structured genome annotations.. (PubMed) IEEE/ACM Transactions on Computational Biology and Bioinformatics 10(3):645-656 (2013)
Registry entries: Bio.tools 
genomicsdb-tools
sparse array storage library for genomics (tools)
Versions of package genomicsdb-tools
ReleaseVersionArchitectures
bookworm1.4.4-3amd64,mips64el
sid1.5.0-2amd64,mips64el
upstream1.5.2
Popcon: 0 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

GenomicsDB is built on top of a htslib fork and an internal array storage system for importing, querying and transforming variant data. Variant data is sparse by nature (sparse relative to the whole genome) and using sparse array data stores is a perfect fit for storing such data.

The GenomicsDB stores variant data in a 2D array where:

  • Each column corresponds to a genomic position (chromosome + position);
  • Each row corresponds to a sample in a VCF (or CallSet in the GA4GH terminology);
  • Each cell contains data for a given sample/CallSet at a given position; data is stored in the form of cell attributes;
  • Cells are stored in column major order - this makes accessing cells with the same column index (i.e. data for a given genomic position over all samples) fast.
  • Variant interval/gVCF interval data is stored in a cell at the start of the interval. The END is stored as a cell attribute. For variant intervals (such as deletions and gVCF REF blocks), an additional cell is stored at the END value of the variant interval. When queried for a given genomic position, the query library performs an efficient sweep to determine all intervals that intersect with the queried position.

This package contains some tools to be run as executable files.

gentle
ensemble de logiciels pour planifier le clonage génétique
Versions of package gentle
ReleaseVersionArchitectures
bullseye1.9+cvs20100605+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.9.5~alpha1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.9.5~alpha1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.9+cvs20100605+dfsg1-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.9+cvs20100605+dfsg1-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.9+cvs20100605+dfsg1-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.9+cvs20100605+dfsg1-3amd64,armel,armhf,i386
Debtags of package gentle:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacex11
roleprogram
uitoolkitwxwidgets
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

GENtle est un logiciel pour la modification d'ADN et d'acide aminé, la gestion de la base de données, les représentations des plasmides, la restriction et la ligature, les alignements, l'import de données du séquenceur, les calculatrices, l'affichage de l'image du gel, réaction en chaîne par polymérase, et bien plus.

Please cite: Magnus Manske: GENtle, a free multi-purpose molecular biology tool. (eprint) (2006)
Registry entries: SciCrunch 
gff2aplot
tracés d'alignements par paires pour les séquences génomiques avec PostScript
Versions of package gff2aplot
ReleaseVersionArchitectures
buster2.0-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.0-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.0-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch2.0-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.0-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.0-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.0-7amd64,armel,armhf,i386
Debtags of package gff2aplot:
fieldbiology, biology:bioinformatics
interfacecommandline, shell
roleprogram
scopeutility
useconverting, viewing
works-withimage:vector
works-with-formatplaintext, postscript
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Gff2aplot est un logiciel pour visualiser ensemble l'alignement de deux séquences de génomes et leurs annotations. À partir de fichiers d'entrée au format GFF, il produit les images PostScript pour cet alignement. Le menu suivant liste les nombreuses fonctionnalités du logiciel gff2aplot⋅:

 -⋅des tracés d'alignements complets pour toute caractéristique du fichier
   GFF. Les attributs sont définis séparément, de sorte que vous pouvez
   les modifier uniquement quels que soient les attributs pour un fichier
   donné ou partager la même personnalisation à travers différents
   ensembles de données⋅;
 -⋅tous les paramètres sont définis par défaut à l'intérieur du logiciel,
   mais ils peuvent être aussi pleinement configurés par des fichiers de
   personnalisation flexibles de type gff2ps. Le logiciel peut manipuler
   plusieurs de ces fichiers, résumant tous les paramètres avant de
   produire la figure correspondante. De plus, tous les paramètres de
   personnalisation peuvent être définis par des interrupteurs en ligne
   de commande, qui permettent aux utilisateurs de jouer avec ces
   paramètres avant d'en ajouter à un fichier de personnalisation.
   L'ordre de la source est choisi à partir des fichiers d'entrée, si
   vous échangez l'ordre des fichiers, vous pouvez visualiser
   l'alignement et ses annotations avec la nouvelle disposition en
   entrée⋅;
 -⋅l'ordre des fichiers source est choisi à partir des fichiers d'entrée,
   si vous échangez l'ordre des fichiers, vous pouvez visualiser
   l'alignement et ses annotations avec la nouvelle disposition⋅;
 -⋅tous les scores des alignements peuvent être visualisés dans la boîte
   «⋅Picture in Picture⋅» en dessous la zone gff2aplot, utilisant des
   niveaux de gris en couleur, des niveaux de la couleur définie par
   l'utilisateur ou des gradients dépendants du score⋅;
 -⋅des polices vectorielles, qui peuvent être choisies parmi les polices de
   base par défaut avec PostScript. Les labels de caractéristiques et de
   groupes peuvent être pivotés pour améliorer la lisibilité dans les deux
   axes d'annotation⋅;
 -⋅le logiciel est toujours défini comme un filtre Unix, ainsi il peut
   manipuler des données des fichiers, redirections et pipes, l'écriture
   produite vers la sortie standard et avertissements vers la sortie
   d'erreur standard⋅;
 -⋅le logiciel gff2aplot est capable de gérer de nombreux formats de page
   réelle (de A0 à A10, et plus - voir les tailles de page disponibles
   dans son manuel), incluant celles définies par l'utilisateur. Cela
   permet, par exemple, la génération de cartes génomiques de la taille
   d'un poster ou l'utilisation d'un appareil de traçage gérant le papier
   continu, en portrait ou en paysage⋅;
 -⋅vous pouvez dessiner différents alignements sur le même tracé et les
   distinguer en utilisant différentes couleurs pour chaque alignement⋅;
 -⋅le dictionnaire de formes a été élargi, de sorte que d'autres
   caractéristiques de formes sont maintenant disponible (voir le
   manuel)⋅;
 -⋅les projections d'annotation à travers les tracés d'alignements
   (appelés rubans) émulent les transparences par des modèles de
   remplissage de couleurs complémentaires. Cette fonctionnalité permet
   de montrer la pseudo-fusion de couleur lorsque les rubans horizontaux
   et verticaux se chevauchent.
Please cite: J. F. Abril, R. Guigó and T. Wiehe: gff2aplot: Plotting sequence comparisons. (PubMed,eprint) Bioinformatics 19(18):2477-2479 (2003)
Registry entries: Bio.tools 
gff2ps
Produit des graphiques PostScript à partir de fichiers GFF
Versions of package gff2ps
ReleaseVersionArchitectures
stretch0.98d-5all
sid0.98l-6all
trixie0.98l-6all
bookworm0.98l-6all
bullseye0.98l-4all
buster0.98l-2all
jessie0.98d-4all
Debtags of package gff2ps:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useconverting, viewing
works-withimage:vector
works-with-formatpostscript
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

gff2ps est un script développé pour convertir des enregistrements au format GFF en dessins PostScript de haute qualité. De tels graphiques peuvent être utiles pour comparer des structures génomiques et visualiser les résultats des programmes d'annotation de génomes. Il peut être utilisé très facilement car il suppose que le fichier GFF contient assez d'informations de formatage mais il possède aussi un grand nombre d'options et un fichier de configuration pour une meilleure personnalisation.

Please cite: J. F. Abril and R. Guigó: gff2ps: visualizing genomic annotations.. (PubMed,eprint) Bioinformatics 16(8):743-744 (2000)
Registry entries: Bio.tools  SciCrunch 
gffread
GFF/GTF format conversions, region filtering, FASTA sequence extraction
Versions of package gffread
ReleaseVersionArchitectures
bullseye0.12.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.12.7-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.12.7-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.12.7-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Gffread is a GFF/GTF parsing utility providing format conversions, region filtering, FASTA sequence extraction and more.

Registry entries: Bio.tools  Bioconda 
ggd-utils
programs for use in ggd
Versions of package ggd-utils
ReleaseVersionArchitectures
sid1.0.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.0.7+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Takes a genome file and (currently) a .vcf.gz or a .bed.gz and checks that:

* a .tbi is present
* the VCF has ""##fileformat=VCF" as the first
line
* the VCF has a #CHROM header
* the chromosome are in the order specified by
the genome file (and present)
* the positions are sorted
* the positions are <= the chromosome lengths
defined in the genome file.

As a result, any new genome going into GGD will have a .genome file that will dictate the sort order and presence or absence of the 'chr' prefix for chromosomes

ghemical
environnement de modélisation moléculaire sous GNOME
Versions of package ghemical
ReleaseVersionArchitectures
stretch3.0.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm3.0.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.0.0-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.0.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.0.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package ghemical:
fieldchemistry
interface3d, x11
roleprogram
suitegnome
uitoolkitgtk
useediting, learning, viewing
works-with3dmodel
x11application
Popcon: 12 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Ghemical est un logiciel de modélisation de chimie écrit en C++. Il dispose d'une interface graphique utilisateur et prend en charge des modèles de mécanique quantique (semi-empirique) et des modèles de mécanique moléculaire. L'optimisation de la géométrie, la dynamique moléculaire et un grand ensemble d'outils de visualisation, réalisés à l'aide de la technologie OpenGL, sont actuellement disponibles.

Le logiciel Ghemical repose sur un code externe pour fournir les calculs de la mécanique quantique. Les méthodes semi-empiriques MNDO (« Modified Neglect of Diatomic Overlap »), MINDO/3 (« Modified Intermediate Neglect of Differential Overlap version 3 »), AM1 (« Austin Model 1 ») et PM3 (« Parameterized Model number 3 ») viennent du paquet MOPAC7 (« Molecular Orbital PACkage 7 ») dans le domaine public et sont inclus dans le paquet. Le paquet MPQC (« Massively Parallel Quantum Chemistry ») est utilisé pour proposer des méthodes ab initio (méthodes de chimie numérique basées sur la chimie quantique) : les méthodes basées sur la théorie Hartree-Fock sont actuellement prises en charge avec des ensembles de base allant de STO-3G à 6-31G**.

Registry entries: Bio.tools  SciCrunch 
Screenshots of package ghemical
ghmm
General Hidden-Markov-Model library - tools
Versions of package ghmm
ReleaseVersionArchitectures
bullseye0.9~rc3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.9~rc3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.9~rc3-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.9~rc3-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.9~rc3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The General Hidden Markov Model Library (GHMM) is a C library with additional Python3 bindings implementing a wide range of types of Hidden Markov Models and algorithms: discrete, continuous emissions, basic training, HMM clustering, HMM mixtures.

This package contains some tools using the library.

Registry entries: Bioconda 
glam2
motifs de protéines lacunaires de séquences non alignées
Versions of package glam2
ReleaseVersionArchitectures
buster1064-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1064-3amd64,armel,armhf,i386
stretch1064-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1064-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1064-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1064-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1064-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package glam2:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Glam2 est un paquet pour trouver des motifs dans les séquences, typiquement les séquences d'acides aminés ou de nucléotides. Un motif est un motif de séquence qui se reproduit : les exemples typiques sont la boîte TATA et le motif de prénylation CaaX. La principale innovation de glam2 est qu'il permet les insertions et les suppressions dans les motifs.

Ce paquet fournit des programmes pour découvrir les motifs partagés par un ensemble de séquences et trouver des correspondances à ces motifs dans une base de données de séquences, ainsi que des utilitaires pour convertir les motifs de glam2 en formats d’alignement standard, masquant les motifs de glam2 dans des séquences de façon que des motifs moindres puissent être trouvés et en retirant des portions hautement similaires d’un ensemble de séquences.

Le paquet inclut les logiciels suivants :

 — glam2 :découvrir les motifs partagés par un jeu de séquences ;
 — glam2scan : trouver des correspondances, dans une base de données de
    séquences, pour un motif découvert par glam2 ;
 — glam2format : conversion des motifs avec glam2 aux formats d'alignement
    standard ;
 — glam2mask : masquage des motifs de séquences avec glam2, de sorte que
    les motifs plus faibles peuvent être trouvés ;
 — glam2-purge : suppression de membres très similaires d'un ensemble de
    séquences.

Dans ce paquet, la transformée de Fourier rapide (FFT) a été activée pour glam2.

Please cite: Martin C. Frith, Neil F. W. Saunders, Bostjan Kobe and Timothy L. Bailey: Discovering Sequence Motifs with Arbitrary Insertions and Deletions. (PubMed) PLoS Computational Biology 4(5):e1000071 (2008)
Screenshots of package glam2
gmap
alignement d’épissage et tolérante sur les SNP pour les lectures courtes et mNRA
Versions of package gmap
ReleaseVersionArchitectures
stretch2017-01-14-1 (non-free)amd64
jessie2014-10-22-1 (non-free)amd64
trixie2024-02-22+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
buster2019-01-24-1 (non-free)amd64
bookworm2021-12-17+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid2024-02-22+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye2021-02-22+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
upstream2024-03-15
Debtags of package gmap:
fieldbiology, biology:bioinformatics, biology:structural
roleprogram
useanalysing
Popcon: 3 users (8 upd.)*
Newer upstream!
License: DFSG free
Git

Ce paquet fournit les programmes GMAP et GSNAP ainsi que des utilitaires pour gérer des bases de données concernant le génome au format GMAP/GSNAP. GMAP (Genomic Mapping and Alignment Program) est un outil pour aligner les séquences EST, mRNA et cDNA. GSNAP (Genomic Short-read Nucleotide Alignment Program) est un outil pour aligner les lectures de transcriptome à partir d’une ou de deux extrémités. Ces deux outils peuvent utiliser une base de données de :

 – sites d’épissage connus et des sites nouveaux identifiés d’épissage ;
 – polymorphismes de nucléotide simple connus (SNP).
GSNAP peut aligner de l’ADN traité avec du bisulfite.
Please cite: Thomas D. Wu and Serban Nacu: Fast and SNP-tolerant detection of complex variants and splicing in short reads. (PubMed,eprint) Bioinformatics 26(7):873-81 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
grabix
wee tool for random access into BGZF files
Versions of package grabix
ReleaseVersionArchitectures
bookworm0.1.7-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.1.7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie0.1.7-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.1.7-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.1.7-1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

In biomedical research it is increasing practice to study the genetic basis of disease. This now frequently comprises the sequencing of human sequences. The output of the machine however is redundant, and the real sequence is the best sequence to explain the redundancy. The exchange of data happens only with compressed files - to huge and redundant to perform otherwise. One should avoid uncompression whenever possible.

grabix leverages the fantastic BGZF library of the samtools package to provide random access into text files that have been compressed with bgzip. grabix creates it's own index (.gbi) of the bgzipped file. Once indexed, one can extract arbitrary lines from the file with the grab command. Or choose random lines with the, well, random command.

Registry entries: Bioconda 
graphlan
circular representations of taxonomic and phylogenetic trees
Versions of package graphlan
ReleaseVersionArchitectures
stretch1.1-2all
bullseye1.1.3-2all
buster1.1.3-1all
bookworm1.1.3-4all
sid1.1.3-4all
Popcon: 4 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

GraPhlAn is a software tool for producing high-quality circular representations of taxonomic and phylogenetic trees. It focuses on concise, integrative, informative, and publication-ready representations of phylogenetically- and taxonomically-driven investigation.

Registry entries: Bioconda 
grinder
simulateur polyvalent de lecture de séquençage global et d'amplicon omiques
Versions of package grinder
ReleaseVersionArchitectures
bullseye0.5.4-6all
sid0.5.4-6all
jessie0.5.3-3all
trixie0.5.4-6all
bookworm0.5.4-6all
stretch0.5.4-1all
buster0.5.4-5all
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Grinder est un programme polyvalent pour créer des bibliothèques de séquences aléatoires globales et d'amplicons basées sur des séquences de référence d'ADN, d'ARN ou de protéines fournies dans un fichier FASTA.

Grinder peut produire des ensembles de données globales et d'amplicons génomiques, méta-génomiques, transcriptomiques, méta-transcriptomiques, protéomiques, méta-protéomiques à partir de technologies de séquençage actuelles comme Sanger, 454, Illumina. Ces ensembles de données simulés peuvent être utilisés pour tester la précision d'outils bio-informatiques sous des hypothèses spécifiques, par exemple sans ou avec erreurs de séquençage, ou avec une grande ou faible diversité de communauté. Grinder peut aussi être utilisé pour aider à choisir entre des méthodes de séquençage alternatives pour un projet basé sur séquences, par exemple, si la banque doit être à extrémités appariées ou non, ou combien de lectures doivent être séquencées.

Please cite: Florent E. Angly, Dana Willner, Forest Rohwer, Philip Hugenholtz and Gene W. Tyson: Grinder: a versatile amplicon and shotgun sequence simulator. (PubMed,eprint) Nucleic Acids Research Epub ahead of print (2012)
Registry entries: SciCrunch 
gromacs
Simulateur de dynamique moléculaire avec outils d'analyse et de préparation
Versions of package gromacs
ReleaseVersionArchitectures
stretch2016.1-2amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2020.6-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2019.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2024.1-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
jessie5.0.2-1amd64,armel,armhf,i386
trixie2024.1-1amd64,arm64,mips64el,ppc64el,s390x
bookworm2022.5-2amd64,arm64,mips64el,ppc64el,s390x
Debtags of package gromacs:
fieldbiology, biology:structural, chemistry
interfacecommandline, x11
roleprogram
uitoolkitxlib
x11application
Popcon: 19 users (19 upd.)*
Versions and Archs
License: DFSG free
Git

GROMACS est un paquet polyvalent pour faire de la dynamique moléculaire, comme la simulation d'équations newtoniennes du mouvement de systèmes de millions de particules.

Il a été créé en premier lieu pour les molécules biochimiques comme les protéines et les lipides qui ont beaucoup d'interactions covalentes compliquées, mais comme GROMACS est extrêmement rapide pour calculer les interactions non covalentes (qui souvent dominent les simulations), beaucoup de groupes l'utilisent aussi pour la recherche sur des systèmes non biologiques, comme les polymères.

Ce paquet fournit des variantes pour l’exécution sur une seule machine et pour utiliser l’interface MPI sur plusieurs machines.

Please cite: Berk Hess, Carsten Kutzner, David van der Spoel and Erik Lindahl: GROMACS 4: Algorithms for Highly Efficient, Load-Balanced, and Scalable Molecular Simulation. (eprint) J. Chem. Theory Comput. 4(3):435-447 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
gsort
sort genomic data
Versions of package gsort
ReleaseVersionArchitectures
sid0.1.4-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.1.4-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.1.4-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.4-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

gsort is a tool to sort genomic files according to a genomefile. For example, to sort VCF to have order: X, Y, 2, 1, 3, ... and the header needs to be kept at the top.

As a more likely example, if a file nneds to be sorted to match GATK order (1 ... X, Y, MT) which is not possible with any other sorting tool. With gsort one can simply place MT as the last chrom in the ".genome" file.

It will also be useful for getting files ready for use in bedtools.

Registry entries: Bioconda 
gubbins
phylogenetic analysis of genome sequences
Versions of package gubbins
ReleaseVersionArchitectures
bookworm2.4.1-5amd64,i386
bullseye2.4.1-4amd64,i386
stretch2.2.0-1amd64,i386
sid3.3.3-1amd64,i386
buster2.3.4-1amd64,i386
upstream3.3.4
Popcon: 3 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Gubbins supports rapid phylogenetic analysis of large samples of recombinant bacterial whole genome sequences.

Gubbins (Genealogies Unbiased By recomBinations In Nucleotide Sequences) is an algorithm that iteratively identifies loci containing elevated densities of base substitutions while concurrently constructing a phylogeny based on the putative point mutations outside of these regions. Simulations demonstrate the algorithm generates highly accurate reconstructions under realistic models of short-term bacterial evolution, and can be run in only a few hours on alignments of hundreds of bacterial genome sequences.

Please cite: Nicholas J. Croucher, Andrew J. Page, Thomas R. Connor, Aidan J. Delaney, Jacqueline A. Keane, Stephen D. Bentley, Julian Parkhill and Simon R. Harris: Rapid phylogenetic analysis of large samples of recombinant bacterial whole genome sequences using Gubbins. (PubMed,eprint) Nucleic Acids Research 43(3):e15 (2014)
Registry entries: Bioconda 
gwama
Genome-Wide Association Meta Analysis
Versions of package gwama
ReleaseVersionArchitectures
buster2.2.2+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch2.2.2+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.2.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.2.2+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.2.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.2.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

GWAMA (Genome-Wide Association Meta Analysis) software performs meta-analysis of the results of GWA studies of binary or quantitative phenotypes. Fixed- and random-effect meta-analyses are performed for both directly genotyped and imputed SNPs using estimates of the allelic odds ratio and 95% confidence interval for binary traits, and estimates of the allelic effect size and standard error for quantitative phenotypes. GWAMA can be used for analysing the results of all different genetic models (multiplicative, additive, dominant, recessive). The software incorporates error trapping facilities to identify strand alignment errors and allele flipping, and performs tests of heterogeneity of effects between studies.

Please cite: Reedik Mägi and Andrew P. Morris: GWAMA: software for genome-wide association meta-analysis. (eprint) BMC Bioinformatics 11(May):288 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
harvest-tools
archivage et post-traitement d’alignements multiples génomiques « reference-compressed »
Versions of package harvest-tools
ReleaseVersionArchitectures
bookworm1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.3-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.3-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

HarvestTools est un outil pour créer et interfacer des fichiers Gingr, qui sont des archives performantes de la suite Harvest pour stocker des alignements multiples dans le mode « reference-compressed », des arbres phylogénétiques, des variantes filtrées et des annotations. Bien que conçu pour être utilisé avec Parsnp et Gingr, HarvestTools peut être aussi utilisé pour des conversions génériques entre les formats de fichiers bio-informatiques.

Please cite: Todd J. Treangen, Brian D. Ondov, Sergey Koren and Adam M. Phillippy: Rapid Core-Genome Alignment and Visualization for Thousands of Intraspecific Microbial Genomes. (PubMed,eprint) bioRxiv 15(11):524 (2014)
Registry entries: Bioconda 
hhsuite
recherche de séquence de protéines basée sur l’alignement HMM-HMM
Versions of package hhsuite
ReleaseVersionArchitectures
sid3.3.0+ds-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm3.3.0+ds-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie3.3.0+ds-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bullseye3.3.0+ds-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
stretch3.0~beta2+dfsg-3amd64
buster3.0~beta3+dfsg-3amd64
jessie2.0.16-5amd64
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

HH-suite est un logiciel au code source ouvert pour la recherche de séquences de protéines basé sur l’alignement par paire de modèles de Markov cachés (HMM).

Ce paquet fournit HHsearch et HHblits parmi d’autres programmes et utilitaires.

HHsearch prend en entrée un alignement de plusieurs séquences (MSA) ou de HMM de profil et recherche dans une base de données d’HMM (par exemple, PDB, Pfam ou InterPro) pour des protéines homologues. HHsearch est souvent utilisé pour la prédiction de structure de protéines pour détecter des modèles homologues et pour construire des alignements par paire précis de modèle de requête pour la modélisation d’homologie.

HHblits peut construire des MSA de haute qualité à partir d’une seule séquence ou de plusieurs. Il les transforme en HMM de requête et, en utilisant une stratégie de requêtes itératives, ajoute des séquences significativement semblables de la recherche précédente pour l’HMM de requête mis à jour pour la prochaine itération de recherche. Comparé à PSI-BLAST, HHblits est plus rapide, jusqu’à deux fois plus sensible et produit des alignements plus précis.

Please cite: Michael Remmert, Andreas Biegert, Andreas Hauser and Johannes Söding: HHblits: Lightning-fast iterative protein sequence searching by HMM-HMM alignment.. (PubMed) Nat. Methods 9(2):173-175 (2011)
Registry entries: SciCrunch  Bioconda 
hilive
alignement en temps réel des lectures Illumina
Versions of package hilive
ReleaseVersionArchitectures
bookworm2.0a-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1-2amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
stretch0.3-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
sid2.0a-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.0a-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

HiLive est un outil de mappage de lectures qui mappe les lectures d’HiSeq d’Illumina (ou comparables) à une référence de génome au moment où elles sont faites. Cela signifie que le mappage de lectures se termine aussitôt que le séquenceur a fini de générer des données.

Please cite: Martin S. Lindner, Benjamin Strauch, Jakob M. Schulze, Simon H. Tausch, Piotr W. Dabrowski, Andreas Nitsche and Bernhard Y. Renard: HiLive: real-time mapping of illumina reads while sequencing. (PubMed) Bioinformatics 33(6):917-919 (2017)
hisat2
graph-based alignment of short nucleotide reads to many genomes
Versions of package hisat2
ReleaseVersionArchitectures
sid2.2.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.2.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.0.5-1amd64
buster2.1.0-2amd64
bullseye2.2.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
experimental2.2.1-5~0expamd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.2.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 10 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

HISAT2 is a fast and sensitive alignment program for mapping next-generation sequencing reads (both DNA and RNA) to a population of human genomes (as well as against a single reference genome). Based on an extension of BWT for graphs a graph FM index (GFM) was designed and implementd. In addition to using one global GFM index that represents a population of human genomes, HISAT2 uses a large set of small GFM indexes that collectively cover the whole genome (each index representing a genomic region of 56 Kbp, with 55,000 indexes needed to cover the human population). These small indexes (called local indexes), combined with several alignment strategies, enable rapid and accurate alignment of sequencing reads. This new indexing scheme is called a Hierarchical Graph FM index (HGFM).

The package is enhanced by the following packages: multiqc
Please cite: Daehwan Kim, Joseph M. Paggi, Chanhee Park, Christopher Bennett and Steven L. Salzberg: Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology 37(8):907-915 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
hmmer
profilage de modèles de Markov cachés pour la recherche de séquences
Versions of package hmmer
ReleaseVersionArchitectures
bullseye3.3.2+dfsg-1amd64,i386
jessie3.1b1-3amd64,armel,armhf,i386
sid3.4+dfsg-2amd64,arm64,i386
trixie3.4+dfsg-2amd64,arm64,i386
buster3.2.1+dfsg-1amd64,i386
bookworm3.3.2+dfsg-1amd64,i386
stretch3.1b2+dfsg-5amd64,i386
Debtags of package hmmer:
biologyformat:aln, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usesearching
works-withdb
works-with-formatplaintext
Popcon: 35 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

HMMER est une implémentation des profils de modèles de Markov cachés pour rechercher des séquences biologiques dans des banques de données en les interrogeant avec des alignements multiples de séquences.

À partir d'un alignement multiple de séquences, HMMER construit un modèle statistique appelé « modèle de Markov caché », qui peut ensuite être utilisé pour interroger une banque de séquences afin de trouver plus d'homologues à la famille de séquences et, éventuellement, de les aligner.

Please cite: S. R. Eddy: Profile hidden Markov models. (PubMed,eprint) Bioinformatics 14(9):755-763 (1998)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package hmmer
hmmer2
profilage de modèles de Markov cachés pour la recherche de séquences
Versions of package hmmer2
ReleaseVersionArchitectures
buster2.3.2+dfsg-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.3.2+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.3.2+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.3.2+dfsg-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch-backports2.3.2+dfsg-6~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.3.2+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.3.2-13amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.3.2-8amd64,armel,armhf,i386
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

HMMER est une implémentation des profils de modèles de Markov cachés pour rechercher des séquences biologiques dans des banques de données en les interrogeant avec des alignements multiples de séquences.

À partir d'un alignement multiple de séquences, HMMER construit un modèle statistique appelé « modèle de Markov caché », qui peut ensuite être utilisé pour interroger une banque de séquences afin de trouver plus d'homologues à la famille de séquences et, éventuellement, de les aligner.

Please cite: Eddy, Sean R.: Profile hidden Markov models. (PubMed) Bioinformatics 14(9):755-763 (1998)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Remark of Debian Med team: This older version of HMMER is used in some applications

While Debian has HMMER 3 since some time there are users of HMMER 2 interested in having this old version available and thus the package is reintroduced.

hyphy-mpi
Hypothesis testing using Phylogenies (MPI version)
Versions of package hyphy-mpi
ReleaseVersionArchitectures
sid2.5.60+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.5.28+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.3.14+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.5.47+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.2.7+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.5.59+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

HyPhy is an open-source software package for the analysis of genetic sequences using techniques in phylogenetics, molecular evolution, and machine learning. It features a complete graphical user interface (GUI) and a rich scripting language for limitless customization of analyses. Additionally, HyPhy features support for parallel computing environments (via message passing interface) and it can be compiled as a shared library and called from other programming environments such as Python or R. Continued development of HyPhy is currently supported in part by an NIGMS R01 award 1R01GM093939.

This package provides an executable using MPI to do multiprocessing.

Please cite: Sergei L. Kosakovsky Pond, Simon D. W. Frost and Spencer V. Muse: HyPhy: hypothesis testing using phylogenies. (PubMed,eprint) Bioinformatics 21(5):676-679 (2005)
Registry entries: Bioconda 
hyphy-pt
Hypothesis testing using Phylogenies (pthreads version)
Versions of package hyphy-pt
ReleaseVersionArchitectures
bookworm2.5.47+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.2.7+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.5.28+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.5.60+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.5.59+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster2.3.14+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 14 users (15 upd.)*
Versions and Archs
License: DFSG free
Git

HyPhy is an open-source software package for the analysis of genetic sequences using techniques in phylogenetics, molecular evolution, and machine learning. It features a complete graphical user interface (GUI) and a rich scripting language for limitless customization of analyses. Additionally, HyPhy features support for parallel computing environments (via message passing interface) and it can be compiled as a shared library and called from other programming environments such as Python or R. Continued development of HyPhy is currently supported in part by an NIGMS R01 award 1R01GM093939.

This package provides an executable using pthreads to do multiprocessing.

Please cite: Sergei L. Kosakovsky Pond, Simon D. W. Frost and Spencer V. Muse: HyPhy: hypothesis testing using phylogenies. (PubMed,eprint) Bioinformatics 21(5):676-679 (2005)
Registry entries: Bioconda 
idba
iterative De Bruijn Graph short read assemblers
Versions of package idba
ReleaseVersionArchitectures
buster1.1.3-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.1.2-1amd64,armel,armhf,i386
trixie1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.1.3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

IDBA stands for iterative de Bruijn graph assembler. In computational sequence biology, an assembler solves the puzzle coming from large sequencing machines that feature many gigabytes of short reads from a large genome.

This package provides several flavours of the IDBA assembler, as they all share the same source tree but serve different purposes and evolved over time.

IDBA is the basic iterative de Bruijn graph assembler for second-generation sequencing reads. IDBA-UD, an extension of IDBA, is designed to utilize paired-end reads to assemble low-depth regions and use progressive depth on contigs to reduce errors in high-depth regions. It is a generic purpose assembler and especially good for single-cell and metagenomic sequencing data. IDBA-Hybrid is another update version of IDBA-UD, which can make use of a similar reference genome to improve assembly result. IDBA-Tran is an iterative de Bruijn graph assembler for RNA-Seq data.

Please cite: Yu Peng, Henry C. M. Leung, S. M. Yiu and Francis Y. L. Chin: IDBA-UD: a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth. (PubMed,eprint) Bioinformatics 28(11):1420-1428 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
igblast
Immunoglobulin and T cell receptor variable domain sequence analysis
Versions of package igblast
ReleaseVersionArchitectures
bookworm1.19.0-1amd64,arm64,mips64el,ppc64el,s390x
trixie1.19.0-1amd64,arm64,mips64el,ppc64el,s390x
sid1.19.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
upstream1.22.0
Popcon: 0 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

IgBLAST allows users to view the matches to the germline V, D, and J genes, details at rearrangement junctions, the delineation of IG V domain framework regions, and complementarity determining regions. IgBLAST has the capability to analyse nucleotide and protein sequences, and can process sequences in batches. Furthermore, IgBLAST allows searches against the germline gene databases and other sequence databases simultaneously to minimize the chance of missing possibly the best matching germline V gene.

Please cite: Jian Ye, Ning Ma, Thomas L Madden and James M Ostell: IgBLAST: an immunoglobulin variable domain sequence analysis tool. (PubMed,eprint) Nucleic Acids Res. 41:W34-W40 (2013)
Registry entries: Bio.tools  SciCrunch 
igdiscover
analyzes antibody repertoires to find new V genes
Versions of package igdiscover
ReleaseVersionArchitectures
bullseye0.11-3all
sid0.11-4all
upstream0.15.1
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

IgDiscover analyzes antibody repertoires and discovers new V genes from high-throughput sequencing reads. Heavy chains, kappa and lambda light chains are supported (to discover VH, VK and VL genes).

Please cite: Martin M. Corcoran, Ganesh E. Phad, Néstor Vázquez Bernat, Christiane Stahl-Hennig, Noriyuki Sumida, Mats A.A. Persson, Marcel Martin and Gunilla B. Karlsson Hedestam: Production of individualized V gene databases reveals high levels of immunoglobulin genetic diversity.. (eprint) Nature Communications 7:13642 (2016)
Registry entries: Bio.tools  Bioconda 
igor
infers V(D)J recombination processes from sequencing data
Versions of package igor
ReleaseVersionArchitectures
buster1.3.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.4.0+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.4.0+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.4.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.4.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

IGoR (Inference and Generation of Repertoires) is a versatile software to analyze and model immune receptors generation, selection, mutation and all other processes.

Please cite: Quentin Marcou, Thierry Mora and Aleksandra M. Walczak: High-throughput immune repertoire analysis with IGoR. (PubMed,eprint) Nature Communications 9(1):561 (2018)
Registry entries: Bioconda 
igv
visualiseur génomique intégratif
Versions of package igv
ReleaseVersionArchitectures
bullseye2.6.3+dfsg-3 (non-free)all
jessie2.3.38+dfsg-1 (non-free)all
stretch2.3.90+dfsg-1 (non-free)all
bookworm2.16.0+dfsg-1all
trixie2.17.3+dfsg-1all
sid2.17.3+dfsg-1all
Debtags of package igv:
fieldbiology
interfacex11
networkclient
roleprogram
scopeutility
useviewing
works-withbiological-sequence
Popcon: 16 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

IGV (Integrative Genomics Viewer) est un afficheur très performant qui gère de grands ensembles de données hétérogènes, tout en fournissant une utilisation intuitive et sans problèmes à tous les niveaux de la résolution de génomes. Une caractéristique clé est sa préoccupation de la nature intégrative des études génomiques avec une prise en charge des données de séquençage basées sur les tableaux et de nouvelle génération, et l’intégration de données cliniques et de phénotypes. Bien que IGV soit souvent utilisé pour visualiser des données génomiques issues de données publiques, sa première utilité est d’aider les chercheurs voulant visualiser et explorer leurs propres données et celle de leurs collègues. Dans ce but, IGV gère de manière flexible des jeux de données locaux ou distants et il est optimisé pour offrir une visualisation et une exploration de hautes performance sur les systèmes de bureau standard.

Please cite: James T Robinson, Helga Thorvaldsdóttir, Wendy Winckler, Mitchell Guttman, Eric S Lander, Gad Getz and Jill P Mesirov: Integrative genomics viewer. (PubMed,eprint) Nature Biotechnology 29(1):24–26 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
indelible
powerful and flexible simulator of biological evolution
Versions of package indelible
ReleaseVersionArchitectures
bullseye1.03-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.03-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch1.03-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.03-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.03-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.03-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

INDELible is a new, portable, and flexible application for biological sequence simulation that combines many features in the same place for the first time. Using a length-dependent model of indel formation it can simulate evolution of multi-partitioned nucleotide, amino-acid, or codon data sets through the processes of insertion, deletion, and substitution in continuous time.

Nucleotide simulations may use the general unrestricted model or the general time reversible model and its derivatives, and amino-acid simulations can be conducted using fifteen different empirical rate matrices. Substitution rate heterogeneity can be modeled via the continuous and discrete gamma distributions, with or without a proportion of invariant sites. INDELible can also simulate under non-homogeneous and non-stationary conditions where evolutionary models are permitted to change across a phylogeny.

Unique among indel simulation programs, INDELible offers the ability to simulate using codon models that exhibit nonsynonymous/synonymous rate ratio heterogeneity among sites and/or lineages.

Please cite: William Fletcher and Ziheng Yang: INDELible: A Flexible Simulator of Biological Sequence Evolution. (eprint) Molecular Biology and Evolution 26(8):1879-1888 (2009)
Topics: Sequencing
infernal
inférence d’alignements structurels secondaires d’ARN
Versions of package infernal
ReleaseVersionArchitectures
bullseye1.1.4-1amd64,i386
jessie1.1.1-2amd64,i386
stretch1.1.2-1amd64,i386
buster1.1.2-2amd64,i386
bookworm1.1.4-1amd64,i386
trixie1.1.5-2amd64,arm64,i386
sid1.1.5-2amd64,arm64,i386
Debtags of package infernal:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 17 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Infernal ("INFERence of RNA ALignment") recherche dans des bases de données de séquences d’ADN des similarités de structures ou séquences d’ARN. Il fournit une implémentation d’une variante spéciale de grammaires de profil stochastiques indépendantes du contexte appelées modèles de covariance. Un modèle est comme un profil de séquence, mais il marque une combinaison de séquence consensus et de structure consensus secondaire d’ARN, aussi dans bien des cas, il est plus capable d’identifier des homologues d’ARN qui conservent leur structure secondaire plus que leur séquence primaire.

Cet outil est un composant essentiel de la base de données Rfam.

Please cite: Eric P. Nawrocki, Diana L. Kolbe and Sean R. Eddy: Infernal 1.0: inference of RNA alignments. (PubMed,eprint) Bioinformatics 25(10):1335-1337 (2009)
Registry entries: SciCrunch  Bioconda 
insilicoseq
sequencing simulator producing realistic Illumina reads
Versions of package insilicoseq
ReleaseVersionArchitectures
sid2.0.0-1all
bullseye1.5.2-1all
bookworm1.5.4-6all
upstream2.0.1
Popcon: 2 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Primarily intended for simulating metagenomic samples, it can also be used to produce sequencing data from a single genome.

InSilicoSeq is written in Python, and use kernel density estimators to model the read quality of real sequencing data.

InSilicoSeq support substitution, insertion and deletion errors. If you don't have the use for insertion and deletion error a basic error model is provided.

Please cite: Hadrien Gourlé, Oskar Karlsson-Lindsjö, Juliette Hayer and Erik Bongcam-Rudloff: Simulating Illumina data with InSilicoSeq. Bioinformatics 35(3):521–522 (2019)
Registry entries: Bioconda 
ipig
intégration de PSM dans des visualisations de navigateur de génome
Versions of package ipig
ReleaseVersionArchitectures
sid0.0.r5-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.0.r5-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.0.r5-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.0.r5-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.0.r5-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.0.r5-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.0.r5-1amd64,armel,armhf,i386
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

iPiG targets the integration of peptide spectrum matches (PSMs) from mass spectrometry (MS) peptide identifications into genomic visualisations provided by genome browser such as the UCSC genome browser (http://genome.ucsc.edu/).

iPiG takes PSMs from the MS standard format mzIdentML (*.mzid) or in text format and provides results in genome track formats (BED and GFF3 files), which can be easily imported into genome browsers.

Please cite: Mathias Kuhring and Bernhard Y. Renard: iPiG: Integrating Peptide Spectrum Matches into Genome Browser Visualizations. (PubMed,eprint) PLoS ONE 7(12):e50246 (2012)
Registry entries: Bio.tools  SciCrunch 
iqtree
logiciel phylogénétique de maximum de vraisemblance
Versions of package iqtree
ReleaseVersionArchitectures
stretch1.5.3+dfsg-2amd64,i386
sid2.0.7+dfsg-1amd64,i386
trixie2.0.7+dfsg-1amd64,i386
bookworm2.0.7+dfsg-1amd64,i386
bullseye1.6.12+dfsg-1amd64,i386
buster1.6.9+dfsg-1amd64,i386
Popcon: 7 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

IQ-TREE est logiciel phylogénétique de maximum de vraisemblance très efficace avec, entre autres, les fonctions clés suivantes :

 .
  – un nouvel algorithme stochastique rapide et efficace pour estimer les
    arbres de maximum de vraisemblance. IQ-TREE surpasse RAxML et PhyML en
    termes de vraisemblance tout en requérant le même temps de calcul
    (consulter Nguyen et al., 2015) ;
  – une approximation par technique de bootstrap ultra-rapide pour estimer
    la prise en charge de branches (consulter Minh et al., 2013) ;
  – une grande diversité de modèles de substitution pour des alignements
    binaires, d’ADN, de protéines, de codons ou morphologiques ;
  – une sélection de modèle ultra-rapide pour tous les types de données,
    10 à 100 fois plus rapide que jModelTest et ProtTest ;
  – une découverte du meilleur schéma de partition comme PartitionFinder ;
  – des modèles de partition avec des types mélangés de données pour les
    alignements de phylogénomique (multi-gène), permettant des longueurs
    de branches distinctes, proportionnelles ou jointes entre les gènes ;
  – la prise en charge de la bibliothèque PLL (bibliothèque phylogénétique
    de vraisemblance) (consulter Flouri et al., 2014).
Please cite: Lam Tung Nguyen, Heiko A. Schmidt, Arndt von Haeseler and Bui Quang Minh: IQ-TREE: A fast and effective stochastic algorithm for estimating maximum likelihood phylogenies. (PubMed,eprint) Mol. Biol. Evol. 32(1):268-274 (2015)
Registry entries: Bio.tools  Bioconda 
iva
assemblage itératif de séquences virales
Versions of package iva
ReleaseVersionArchitectures
bookworm1.0.11+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie1.0.11+ds-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el
sid1.0.11+ds-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye1.0.9+ds-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster1.0.9+ds-6amd64,arm64,mips64el,ppc64el
stretch1.0.8+ds-1amd64,arm64,mips64el,ppc64el
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

IVA est un programme d’assemblage de novo conçu pour assembler des génomes de virus n’ayant pas de séquences répétées, utilisant des paires lues par Illumina séquencées à partir de populations mélangées à une profondeur extrêmement élevée.

L’algorithme principal d’IVA fonctionne en étendant de manière itérative des contigs utilisant des paires lues alignées. Son entrée peut être simplement des paires lues ou, en outre, un ensemble de contigs existants peut être fourni pour être étendu. Alternativement, il peut prendre des lectures avec une séquence de référence.

Please cite: M. Hunt, A. Gall, S. H. Ong, J. Brener, B. Ferns, P. Goulder, E. Nastouli, J. A. Keane, P. Kellam and T. D. Otto: IVA: accurate de novo assembly of RNA virus genomes. (PubMed) Bioinformatics 31(14):2374-2376 (2015)
Registry entries: Bio.tools  Bioconda 
jaligner
algorithme de Smith-Waterman avec l'amélioration de Gotoh
Versions of package jaligner
ReleaseVersionArchitectures
bullseye1.0+dfsg-7all
bookworm1.0+dfsg-10all
buster1.0+dfsg-6all
stretch1.0+dfsg-4all
trixie1.0+dfsg-11all
sid1.0+dfsg-11all
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

JAligner est une implémentation Java à source libre de l'algorithme de Smith-Waterman avec l'amélioration de Gotoh pour l'alignement local de séquences biologiques par paires avec le modèle à pénalité de gap affine.

jalview
multiple alignment editor
Versions of package jalview
ReleaseVersionArchitectures
bookworm2.11.2.5+dfsg-3all
sid2.11.3.1+dfsg-1all
trixie2.11.3.1+dfsg-1all
bullseye2.11.1.3+dfsg2-5all
jessie2.7.dfsg-4all
upstream2.11.3.2
Popcon: 3 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

JalView is a Java DNA, RNA and protein sequence alignment editor that can work with sequence alignments produced by programs implementing alignment algorithms such as clustalw, kalign and t-coffee.

It has lots of features, is actively developed, and will compare advantageously to BioEdit, while being free as in free speech!

Please cite: Andrew M. Waterhouse, James B. Procter, David M. A. Martin, Michèle Clamp and Geoffrey J. Barton: Jalview Version 2-a multiple sequence alignment editor and analysis workbench. (PubMed,eprint) Bioinformatics 25:1189-1191 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package jalview
jellyfish
count k-mers in DNA sequences
Versions of package jellyfish
ReleaseVersionArchitectures
sid2.3.1-3amd64,arm64,mips64el,ppc64el,riscv64
sid2.3.1-2.1i386
stretch2.2.6-1amd64
trixie2.3.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el
experimental2.3.1-2.1~exp1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
buster2.2.10-2amd64,arm64,mips64el,ppc64el
bookworm2.3.0-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el
jessie2.1.4-1amd64
bullseye2.3.0-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el
sid2.3.1-2armel,armhf
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

JELLYFISH is a tool for fast, memory-efficient counting of k-mers in DNA. A k-mer is a substring of length k, and counting the occurrences of all such substrings is a central step in many analyses of DNA sequence. JELLYFISH can count k-mers using an order of magnitude less memory and an order of magnitude faster than other k-mer counting packages by using an efficient encoding of a hash table and by exploiting the "compare-and-swap" CPU instruction to increase parallelism.

JELLYFISH is a command-line program that reads FASTA and multi-FASTA files containing DNA sequences. It outputs its k-mer counts in an binary format, which can be translated into a human-readable text format using the "jellyfish dump" command.

The package is enhanced by the following packages: multiqc
Please cite: Guillaume Marcais and Carl Kingsford: A fast, lock-free approach for efficient parallel counting of occurrences of k-mers. Bioinformatics 27(6):764-770 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
jellyfish1
count k-mers in DNA sequences
Versions of package jellyfish1
ReleaseVersionArchitectures
bullseye1.1.11-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.1.11-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.1.11-8amd64,arm64,mips64el,ppc64el
stretch-backports1.1.11-3~bpo9+1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
trixie1.1.11-9amd64,arm64,mips64el,ppc64el
sid1.1.11-9amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

JELLYFISH is a tool for fast, memory-efficient counting of k-mers in DNA. A k-mer is a substring of length k, and counting the occurrences of all such substrings is a central step in many analyses of DNA sequence. JELLYFISH can count k-mers using an order of magnitude less memory and an order of magnitude faster than other k-mer counting packages by using an efficient encoding of a hash table and by exploiting the "compare-and-swap" CPU instruction to increase parallelism.

JELLYFISH is a command-line program that reads FASTA and multi-FASTA files containing DNA sequences. It outputs its k-mer counts in an binary format, which can be translated into a human-readable text format using the "jellyfish dump" command.

This is the latest version of the 1.x series of jellyfish which is used by some other applications that are not compatible with version 2.x which is provided inside the jellyfish package.

Please cite: Guillaume Marcais and Carl Kingsford: A fast, lock-free approach for efficient parallel counting of occurrences of k-mers. Bioinformatics 27(6):764-770 (2011)
Registry entries: Bio.tools  SciCrunch 
jmodeltest
sélection par calculs intensifs de modèle de substitution de nucléotide
Versions of package jmodeltest
ReleaseVersionArchitectures
buster2.1.10+dfsg-7all
bullseye2.1.10+dfsg-10all
bookworm2.1.10+dfsg-12all
trixie2.1.10+dfsg-12all
sid2.1.10+dfsg-12all
stretch2.1.10+dfsg-5all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

jModelTest est un outil pour réaliser une sélection statistique des modèles les plus adaptés de substitution de nucléotide. Il met en œuvre cinq stratégies différentes de sélection de modèle : tests de ratio de vraisemblance dynamiques et hiérarchiques (dLRT et hLRT), le critère d’information d’Akaike et celui Bayesian (AIC et BIC) et une méthode de la théorie de décision (DT). Il fournit aussi une estimation de l’incertitude de la sélection de modèles, de l’importance des paramètres et paramètres de moyenne de modèle y compris pour les topologies d’arbres. jModelTest 2 intègre des possibilités de calcul intensifs (HPC – High Performance Computing) et des fonctions supplémentaires telles que des nouvelles stratégies pour l’optimisation d’arbre, des arbres phylogénétiques de moyennes de modèle (topologie et longueur d’arbre), un nouveau filtrage d’heuristique et une journalisation automatique de l’activité des utilisateurs.

Please cite: Diego Darriba, Guillermo L Taboada, Ramón Doallo and David Posada: jModelTest 2: more models, new heuristics and parallel computing. (PubMed) Nature Methods 9(8):772 (2012)
Registry entries: SciCrunch 
jmol
visualisateur moléculaire
Versions of package jmol
ReleaseVersionArchitectures
trixie14.32.83+dfsg-3all
jessie12.2.32+dfsg2-1all
stretch14.6.4+2016.11.05+dfsg1-3all
sid14.32.83+dfsg-3all
bullseye14.6.4+2016.11.05+dfsg1-4all
bookworm14.32.83+dfsg-2all
buster14.6.4+2016.11.05+dfsg1-4all
upstream16.2.1
Debtags of package jmol:
fieldchemistry
roleprogram
scopeutility
useviewing
Popcon: 53 users (41 upd.)*
Newer upstream!
License: DFSG free
Git

Jmol est un visualisateur Java moléculaire pour des structures chimiques en trois dimensions. Ses fonctions comprennent la lecture d’une variété de types de fichiers et de sorties de programmes de chimie quantique, l’animation de fichiers de multi-trames et les modes normaux calculés à partir de programmes quantiques. Il englobe des fonctions pour les produits chimiques, les cristaux, les matériaux et les biomolécules. Jmol peut être utile pour des étudiants, des enseignants ou des chercheurs en chimie et biochimie.

Les formats lus par Jmol comprennent PDB, XYZ, CIF, CML, MDL Molfile, Gaussian, GAMESS, MOPAC, ABINIT, ACES-II, Dalton et VASP.

Please cite: A. Herráez: Biomolecules in the computer: Jmol to the rescue. (PubMed,eprint) Biochem Mol Biol Educ. 34(4):255-261 (2006)
Registry entries: SciCrunch 
Screenshots of package jmol
kalign
Alignement séquentiel multiple global et progressif
Versions of package kalign
ReleaseVersionArchitectures
stretch2.03+20110620-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie3.3.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye3.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.03+20110620-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.3.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.03+20110620-2amd64,armel,armhf,i386
bookworm3.3.5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream3.4.0
Debtags of package kalign:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 18 users (9 upd.)*
Newer upstream!
License: DFSG free
Git

Kalign est un outil en ligne de commande pour l'alignement de séquences biologiques (ADN, ARN, proteïnes). Il utilise l'algorithme de concordance de chaînes Muth-Manber pour améliorer la précision et la vitesse de l'alignement. Il utilise une démarche d'alignement globale, progressive, enrichie par l'usage d'un algorithme de concordance de chaînes approché pour calculer les différences de séquence et par l'incorporation des correspondances locales dans tout autre alignement global.

Please cite: Lassmann, Timo.: Kalign 3: multiple sequence alignment of large datasets. (eprint) Bioinformatics 36(6):1928-1929 (2020)
Registry entries: Bio.tools  SciCrunch 
kallisto
quantification RNA-seq presque optimale
Versions of package kallisto
ReleaseVersionArchitectures
sid0.48.0+dfsg-4amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye0.46.2+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.48.0+dfsg-3amd64,arm64,mips64el,ppc64el,s390x
trixie0.48.0+dfsg-4amd64,arm64,mips64el,ppc64el,s390x
upstream0.50.1
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Kallisto est un programme pour quantifier l’abondance de transcriptions de données de RNA-Seq, ou, plus généralement, de séquences cibles en utilisant le séquençage de lectures à haut débit. Il est basé sur l’idée nouvelle de pseudoalignement pour déterminer la compatibilité de lectures avec des cibles sans avoir besoin de l’alignement. Sur des bancs d’essai avec des données de RNA-Seq standard, kallisto peut quantifier 30 millions de lectures d’humain en moins de 3 minutes sur un ordinateur de bureau Mac en utilisant les séquences de lectures et un index de transcriptome qui lui-même se construit en moins de 10 minutes. Le pseudoalignement de lectures préserve l’information clé nécessaire pour la quantification, et par conséquent kallisto n’est pas seulement rapide, mais également aussi précis que les outils de quantification existants. En fait, parce que la procédure de pseudoalignement est peu sensible aux erreurs dans les lectures, dans plusieurs bancs d’essai kallisto surpasse de manière significative les outils existants.

The package is enhanced by the following packages: multiqc
Please cite: Nicolas L Bray, Harold Pimentel, Páll Melsted and Lior Pachter: Near-optimal probabilistic RNA-seq quantification. (PubMed) Nature Biotechnology 34(5):525–527 (2016)
Registry entries: Bio.tools  Bioconda 
kaptive
obtain information about K and O types for Klebsiella genome assemblies
Versions of package kaptive
ReleaseVersionArchitectures
stretch-backports-sloppy0.7.0-2~bpo9+1all
buster-backports0.7.0-2~bpo10+1all
bookworm2.0.4-1all
bullseye0.7.3-3all
sid2.0.8-1all
upstream2.0.9
Popcon: 0 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Kaptive reports information about K and O types for Klebsiella genome assemblies.

Given a novel genome and a database of known loci (K or O), Kaptive will help a user to decide whether their sample has a known or novel locus. It carries out the following for each input assembly:

  • BLAST for all known locus nucleotide sequences (using blastn) to identify the best match ('best' defined as having the highest coverage).
  • Extract the region(s) of the assembly which correspond to the BLAST hits (i.e. the locus sequence in the assembly) and save it to a FASTA file.
  • BLAST for all known locus genes (using tblastn) to identify which expected genes (genes in the best matching locus) are present/missing and whether any unexpected genes (genes from other loci) are present.
  • Output a summary to a table file.

In cases where your input assembly closely matches a known locus, Kaptive should make that obvious. When your assembly has a novel type, that too should be clear. However, Kaptive cannot reliably extract or annotate locus sequences for totally novel types - if it indicates a novel locus is present then extracting and annotating the sequence is up to you! Very poor assemblies can confound the results, so be sure to closely examine any case where the locus sequence in your assembly is broken into multiple pieces.

The package is enhanced by the following packages: kaptive-data kaptive-example
Please cite: Kelly L. Wyres, Ryan R. Wick, Claire Gorrie, Adam Jenney, Rainer Follador, Nicholas R. Thomson and Kathryn E. Holt: Identification of Klebsiella capsule synthesis loci from whole genome data. (PubMed) Microbial Genomics 2(12):e000102 (2016)
Registry entries: Bioconda 
khmer
comptage k-mer, filtrage et parcours de graphe de séquences d’ADN en mémoire vive
Versions of package khmer
ReleaseVersionArchitectures
trixie3.0.0~a3+dfsg-8amd64
stretch2.0+dfsg-10amd64,arm64,mips64el,ppc64el
buster2.1.2+dfsg-6amd64,arm64
bullseye2.1.2+dfsg-8amd64,arm64
experimental3.0.0~a3+dfsg-9~0expamd64
sid3.0.0~a3+dfsg-8amd64
bookworm3.0.0~a3+dfsg-4amd64
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Khmer est une bibliothèque et un ensemble d’outils en ligne de commande pour travailler sur le séquençage d’ADN. Il vise en premier lieu les données de séquençage « short read » telles que produites par la plateforme Illumina. Khmer utilise une approche basée sur k-mer pour l’analyse de séquences, d’où son nom.

Please cite: Michael R. Crusoe, Hussien F. Alameldin, Sherine Awad, Elmar Bucher, Adam Caldwell, Reed Cartwright, Amanda Charbonneau, Bede Constantinides, Greg Edvenson, Scott Fay, Jacob Fenton, Thomas Fenzl, Jordan Fish, Leonor Garcia-Gutierrez, Phillip Garland, Jonathan Gluck, Iván González, Sarah Guermond, Jiarong Guo, Aditi Gupta, Joshua R. Herr, Adina Howe, Alex Hyer, Andreas Härpfer, Luiz Irber, Rhys Kidd, David Lin, Justin Lippi, Tamer Mansour, Pamela McA'Nulty, Eric McDonald, Jessica Mizzi, Kevin D. Murray, Joshua R. Nahum, Kaben Nanlohy, Alexander Johan Nederbragt, Humberto Ortiz-Zuazaga, Jeramia Ory, Jason Pell, Charles Pepe-Ranney, Zachary N Russ, Erich Schwarz, Camille Scott, Josiah Seaman, Scott Sievert, Jared Simpson, Connor T. Skennerton, James Spencer, Ramakrishnan Srinivasan, Daniel Standage, James A. Stapleton, Joe Stein, Susan R Steinman, Benjamin Taylor, Will Trimble, Heather L. Wiencko, Michael Wright, Brian Wyss, Qingpeng Zhang, en zyme and C. Titus Brown: The khmer software package: enabling efficient sequence analysis. (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
kineticstools
detection of DNA modifications
Versions of package kineticstools
ReleaseVersionArchitectures
bookworm0.6.1+git20220223.1326a4d+dfsg-2all
bullseye0.6.1+git20200729.e3723e0+dfsg-1all
buster0.6.1+git20180425.27a1878-2all
stretch0.6.1+20161222-1all
sid0.6.1+git20220223.1326a4d+dfsg-2all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Tools for detecting DNA modifications from single molecule, real-time (SMRT®) sequencing data. This tool implements the P_ModificationDetection module in SMRT® Portal, used by the RS_Modification_Detection and RS_Modifications_and_Motif_Detection protocol. Researchers interested in understanding or extending the modification detection algorithms can use these tools as a starting point.

This package is part of the SMRTAnalysis suite.

king-probe
évaluation et visualisation de compacité interatomique de protéines
Versions of package king-probe
ReleaseVersionArchitectures
trixie02.21-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster2.16.160404+git20180613.a09b012-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.16.160404+git20200121.9b198c1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm02.21-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid02.21-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.13.110909-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream02.26
Popcon: 9 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

king-probe est un programme permettant d’évaluer la compacité atomique, soit dans la molécule ou entre les molécules. Il génère des « points de contact » où les atomes sont en contact rapproché.

Le programme king-probe génère des « points de contact » à des points de la surface de van der Waals d’atomes qui sont dans une proximité étroite avec d’autres atomes. Il lit les coordonnées atomiques dans des fichiers au format PDB de la banque de données sur les protéines et écrit des listes de points codés en couleur (pic où les atomes sont en conflit) pour une inclusion dans une image cinétique (kinemage).

Please cite: J. Michael Word, Simon C. Lovell, Thomas H. LaBean, Hope C. Taylor, Michael E. Zalis, Brent K. Presley, Jane S. Richardson and David C. Richardson: Visualizing and Quantifying Molecular Goodness-of-Fit: Small-probe Contact Dots with Explicit Hydrogen Atoms. (PubMed,eprint) J. Mol. Biol. 285(4):1709-1731 (1999)
kissplice
détection de diverses sortes de polymorphismes dans les données du séquençage de l'ARN
Versions of package kissplice
ReleaseVersionArchitectures
sid2.6.2-3amd64,arm64,mips64el,ppc64el,riscv64
bullseye2.5.3-3amd64,arm64,mips64el,ppc64el
buster2.4.0-p1-4amd64,arm64,mips64el,ppc64el
jessie2.2.1-3amd64
stretch2.4.0-p1-1amd64,arm64,mips64el,ppc64el
bookworm2.6.2-2amd64,arm64,mips64el,ppc64el
trixie2.6.2-3amd64,arm64,mips64el,ppc64el
Debtags of package kissplice:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
works-withbiological-sequence
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

KisSplice est un logiciel qui permet l'analyse des données du séquençage de l'ARN avec ou sans génome de référence. C'est un assembleur de transcriptome local et exact, qui permet d'identifier les SNP (« Single-Nucleotide Polymorphism »), les insertions et les suppressions de bases azotées dans l'ADN d'un organisme et les événements d'épissage alternatif. Il peut traiter un nombre arbitraire de conditions biologiques, et quantifiera chaque type de données dans chaque condition biologique. Il a été testé sur des ensembles de données issus d'un système de séquençage de l'entreprise Illumina jusqu'à 1 milliards de lectures. Sa consommation en mémoire vive est d'environ 5 Go pour 100 millions de lectures.

Please cite: Gustavo AT Sacomoto, Janice Kielbassa, Rayan Chikhi, Raluca Uricaru, Pavlos Antoniou, Marie-France Sagot, Pierre Peterlongo and Vincent Lacroix: KISSPLICE: de-novo calling alternative splicing events from RNA-seq data. (PubMed,eprint) BMC Bioinformatics 13((Suppl 6)):S5 (2012)
Registry entries: SciCrunch  Bioconda 
Topics: RNA-seq; RNA splicing; Gene structure
kleborate
tool to screen Klebsiella genome assemblies
Versions of package kleborate
ReleaseVersionArchitectures
bullseye2.0.1-1amd64,arm64,mips64el,ppc64el,s390x
buster-backports1.0.0-3~bpo10+1amd64,arm64,mips64el,ppc64el,s390x
bookworm2.3.1-2amd64,arm64,mips64el,ppc64el,s390x
sid2.4.1-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
stretch-backports-sloppy1.0.0-3~bpo9+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Kleborate is a tool to screen Klebsiella genome assemblies for:

  • MLST sequence type
  • species (e.g. K. pneumoniae, K. quasipneumoniae, K. variicola, etc.)
  • ICEKp associated virulence loci: yersiniabactin (ybt), colibactin (clb)
  • virulence plasmid associated loci: salmochelin (iro), aerobactin (iuc), hypermucoidy (rmpA, rmpA2)
  • antimicrobial resistance genes, including quinolone resistance SNPs and colistin resistance truncations
  • K (capsule) and O antigen (LPS) serotype prediction, via wzi alleles and Kaptive
Please cite: Margaret M. C. Lam, Ryan R. Wick, Kelly L. Wyres, Claire L. Gorrie, Louise M. Judd, Adam W. J. Jenney, Sylvain Brisse and Kathryn E. Holt: Genetic diversity, mobilisation and spread of the yersiniabactin-encoding mobile element ICEKp in Klebsiella pneumoniae populations. (PubMed) Microbiology Society 4(9) (2018)
Registry entries: Bioconda 
kma
mapping genomic sequences to raw reads directly against redundant databases
Versions of package kma
ReleaseVersionArchitectures
trixie1.4.14-2amd64,arm64,mips64el,ppc64el,s390x
sid1.4.14-2amd64,arm64,mips64el,ppc64el,riscv64,s390x
stretch-backports-sloppy1.2.21-1~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.3.10-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.4.11-1amd64,arm64,mips64el,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

KMA is mapping a method designed to map raw reads directly against redundant databases, in an ultra-fast manner using seed and extend. KMA is particularly good at aligning high quality reads against highly redundant databases, where unique matches often does not exist. It works for long low quality reads as well, such as those from Nanopore. Non- unique matches are resolved using the "ConClave" sorting scheme, and a consensus sequence are outputtet in addition to other common attributes.

Please cite: Philip T. L. C. Clausen, Frank M. Aarestrup and Ole Lund: Rapid and precise alignment of raw reads against redundant databases with KMA. (PubMed,eprint) BMC Bioinformatics 19:307 (2018)
Registry entries: Bioconda 
kmc
décompte de k-mers dans des séquences de génome
Versions of package kmc
ReleaseVersionArchitectures
trixie3.2.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster2.3+dfsg-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch2.3+dfsg-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm3.2.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.1.1+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.2.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le logiciel kmc est conçu pour le décompte de k-mers (séquences de k symboles consécutifs) dans un ensemble de lectures. Le décompte de k-mers est important dans beaucoup d’applications de bio-informatique, par exemple, le développement d’assembleurs pour graphes de Bruijn.

La construction de graphes de Bruijn est une approche couramment utilisée pour l’assemblage de génome avec des données de séquençage de seconde génération. Malheureusement, les erreurs de séquençage (fréquentes en pratique) conduisent à des besoins de mémoire énormes pour les graphes de Bruijn, ainsi qu’un temps long de construction. Une des approches populaires pour gérer ce problème est de filtrer les lectures d’entrée de façon que les k-mers uniques (obtenus très certainement à la suite d’une erreur) soient rejetées.

Ainsi, KMC analyse les lectures brutes et produit une représentation compacte de toutes les lectures non uniques accompagnée du nombre de leurs occurrences. Les algorithmes mis en œuvre dans KMC utilisent essentiellement de l’espace disque plutôt que de la RAM, ce qui permet d’utiliser KMC même sur ordinateur personnel classique. Lorsqu’il est utilisé sur des serveurs haut de gamme (ce qui est nécessaire pour les concurrents de KMC), il les surpasse tant en besoins de mémoire qu’en vitesse de calcul. L’espace disque nécessaire pour les calculs est de l’ordre de la taille des données d’entrée (habituellement, c’est moins).

Please cite: S. Deorowicz, M. Kokot, Sz. Grabowski and A. Debudaj-Grabysz: KMC 2: Fast and resource-frugal k-mer counting. (PubMed) Bioinformatics 31(10):1569-1576 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence composition, complexity and repeats
kmer
suite of tools for DNA sequence analysis
Versions of package kmer
ReleaseVersionArchitectures
bullseye0~20150903+r2013-8all
buster0~20150903+r2013-6all
trixie0~20150903+r2013-8all
bookworm0~20150903+r2013-8all
stretch0~20150903+r2013-3all
sid0~20150903+r2013-8all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

The kmer package is a suite of tools for DNA sequence analysis. It provides tools for searching (ESTs, mRNAs, sequencing reads); aligning (ESTs, mRNAs, whole genomes); and a variety of analyses based on kmers.

This is a metapackage depending on the executable components of the kmer suite.

Please cite: B. Walenz and L. Florea: Sim4db and leaff: Utilities for fast batched spliced alignment and sequence indexing. (PubMed) Bioinformatics 27(13):1869-1870 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
kmerresistance
correlates mapped genes with the predicted species of WGS samples
Versions of package kmerresistance
ReleaseVersionArchitectures
bullseye2.2.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.2.0-4amd64,arm64,mips64el,ppc64el,s390x
sid2.2.0-4amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm2.2.0-4amd64,arm64,mips64el,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

KmerResistance correlates mapped genes with the predicted species of WGS samples, where this allows for identification of genes in samples which have been poorly sequenced or high accuracy predictions for samples with contamination. KmerResistance has one dependency, namely KMA to perform the mapping, which is also freely available.

Please cite: Philip T. L. C. Clausen, Ea Zankari, Frank M. Aarestrup and Ole Lund: Benchmarking of methods for identification of antimicrobial resistance genes in bacterial whole genome data. (PubMed,eprint) Journal of Antimicrobial Chemotherapy 71(9):2484-8 (2016)
kraken
assigning taxonomic labels to short DNA sequences
Versions of package kraken
ReleaseVersionArchitectures
trixie1.1.1-4amd64,arm64,mips64el,ppc64el
buster1.1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch-backports1.1-2~bpo9+1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch0.10.5~beta-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.1.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.1.1-4amd64,arm64,mips64el,ppc64el
sid1.1.1-4amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Kraken is a system for assigning taxonomic labels to short DNA sequences, usually obtained through metagenomic studies. Previous attempts by other bioinformatics software to accomplish this task have often used sequence alignment or machine learning techniques that were quite slow, leading to the development of less sensitive but much faster abundance estimation programs. Kraken aims to achieve high sensitivity and high speed by utilizing exact alignments of k-mers and a novel classification algorithm.

In its fastest mode of operation, for a simulated metagenome of 100 bp reads, Kraken processed over 4 million reads per minute on a single core, over 900 times faster than Megablast and over 11 times faster than the abundance estimation program MetaPhlAn. Kraken's accuracy is comparable with Megablast, with slightly lower sensitivity and very high precision.

The package is enhanced by the following packages: jellyfish1 multiqc
Please cite: Derrick E Wood and Steven L Salzberg: Kraken: ultrafast metagenomic sequence classification using exact alignments. (PubMed,eprint) Genome Biol. 15(3):R46 (2014)
Registry entries: Bio.tools  Bioconda 
kraken2
taxonomic classification system using exact k-mer matches
Versions of package kraken2
ReleaseVersionArchitectures
sid2.1.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.1.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye2.1.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.1.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 14 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Kraken 2 is the newest version of Kraken, a taxonomic classification system using exact k-mer matches to achieve high accuracy and fast classification speeds. This classifier matches each k-mer within a query sequence to the lowest common ancestor (LCA) of all genomes containing the given k-mer. The k-mer assignments inform the classification algorithm. [see: Kraken 1's Webpage for more details].

Kraken 2 provides significant improvements to Kraken 1, with faster database build times, smaller database sizes, and faster classification speeds. These improvements were achieved by the following updates to the Kraken classification program:

 1. Storage of Minimizers: Instead of storing/querying entire k-mers,
    Kraken 2 stores minimizers (l-mers) of each k-mer. The length of
    each l-mer must be ≤ the k-mer length. Each k-mer is treated by
    Kraken 2 as if its LCA is the same as its minimizer's LCA.
 2. Introduction of Spaced Seeds: Kraken 2 also uses spaced seeds to
    store and query minimizers to improve classification accuracy.
 3. Database Structure: While Kraken 1 saved an indexed and sorted list
    of k-mer/LCA pairs, Kraken 2 uses a compact hash table. This hash
    table is a probabilistic data structure that allows for faster
    queries and lower memory requirements. However, this data structure
    does have a <1% chance of returning the incorrect LCA or returning
    an LCA for a non-inserted minimizer. Users can compensate for this
    possibility by using Kraken's confidence scoring thresholds.
 4. Protein Databases: Kraken 2 allows for databases built from amino
    acid sequences. When queried, Kraken 2 performs a six-frame
    translated search of the query sequences against the database.
 5. 16S Databases: Kraken 2 also provides support for databases not
    based on NCBI's taxonomy. Currently, these include the 16S
    databases: Greengenes, SILVA, and RDP.
Please cite: Derrick E Wood and Steven L Salzberg: Kraken: ultrafast metagenomic sequence classification using exact alignments. (PubMed,eprint) Genome Biol. 15(3):R46 (2014)
Registry entries: Bio.tools  Bioconda 
lagan
highly parametrizable pairwise global genome sequence aligner
Versions of package lagan
ReleaseVersionArchitectures
trixie2.0-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster2.0-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.0-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.0-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports2.0-3~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 12 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Lagan takes local alignments generated by CHAOS as anchors, and limits the search area of the Needleman-Wunsch algorithm around these anchors.

Multi-LAGAN is a generalization of the pairwise algorithm to multiple sequence alignment. M-LAGAN performs progressive pairwise alignments, guided by a user-specified phylogenetic tree. Alignments are aligned to other alignments using the sum-of-pairs metric.

Please cite: Michael Brudno, Chuong Do, Gregory Cooper, Michael F. Kim, Eugene Davydov, Eric D. Green, Arend Sidow and Serafim Batzoglou: LAGAN and Multi-LAGAN: efficient tools for large-scale multiple alignment of genomic DNA. (PubMed,eprint) Genome Research 13(4):721-31 (2003)
Registry entries: Bio.tools  SciCrunch 
lamarc
analyse de vraisemblance avec l’algorythme de Metropolis en utilisant la théorie de la coalescence
Versions of package lamarc
ReleaseVersionArchitectures
bullseye2.1.10.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.1.10.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.1.10.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.1.10.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.1.10.1+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

LAMARC est un programme qui évalue les paramètres génétiques d’une population tels que sa taille, son taux d’accroissement, son taux de recombinaison et son taux de migration. Il évalue une agrégation de toutes les généalogies pouvant expliquer l’échantillon étudié, qui peut être composé de données de séquence, de microsatellite ou d’électrophorèse. LAMARC et son programme complémentaire Migrate sont les successeurs des anciens programmes Coalesce, Fluctuate et Recombine qui ne sont plus pris en charge. Ces programmes sont très gourmands de mémoire mais peuvent être exécutés sur des stations de travail.

Please cite: Mary K. Kuhner: Coalescent genealogy samplers: windows into population history. (PubMed) Trends in Ecology & Evolution 24(2):86-93 (2009)
Registry entries: SciCrunch 
lamassemble
fusion de lectures « longues » d’ADN chevauchantes en séquences consensus
Versions of package lamassemble
ReleaseVersionArchitectures
bookworm1.4.2-5all
trixie1.7.1-1all
sid1.7.1-1all
Popcon: 0 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

lamassemble fusionne des lectures « longues » d’ADN qui se chevauchent dans des séquences consensus (c’est-à-dire, les assemble). Il fonctionne bien quand le nombre de lectures est inférieur à approximativement un millier. L’assemblage n’est pas toujours précis. En particulier si les lectures proviennent d’énormes répétitions en tandem, de mauvaises parties des lectures pourraient être fusionnées.

lambda-align
Local Aligner for Massive Biological DatA
Versions of package lambda-align
ReleaseVersionArchitectures
bullseye1.0.3-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.1-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.3-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0.3-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.0.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Lambda is a local biosequence aligner optimized for many query sequences and searches in protein space. It is compatible to the de facto standard tool BLAST, but often outperforms the best currently available alternatives at reproducing BLAST’s results and is the fastest compared with the current state of the art at comparable levels of sensitivity.

Please cite: Hannes Hauswedell, Jochen Singer and Knut Reinert: Lambda: the local aligner for massive biological data. (PubMed,eprint) Bioinformatics 30(17):i349-i355 (2014)
Registry entries: Bioconda 
lambda-align2
Local Aligner for Massive Biological DatA - v2
Versions of package lambda-align2
ReleaseVersionArchitectures
bullseye2.0.0-9amd64
buster2.0.0-6amd64
sid2.0.1-1amd64
trixie2.0.1-1amd64
bookworm2.0.0-9amd64
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Lambda2 is a local biosequence aligner optimized for many query sequences and searches in protein space. It is compatible to the de facto standard tool BLAST, but often outperforms the best currently available alternatives at reproducing BLAST’s results and is the fastest compared with the current state of the art at comparable levels of sensitivity.

This package is for the Lambda (align) v2.x series which has an incompatible command line interface and on disk format from Lambda (align) v1.x.

Please cite: Hannes Hauswedell, Jochen Singer and Knut Reinert: Lambda: the local aligner for massive biological data. (PubMed,eprint) Bioinformatics 30(17):i349-i355 (2014)
Registry entries: Bioconda 
last-align
comparaison de séquences biologiques à l'échelle du génome
Versions of package last-align
ReleaseVersionArchitectures
stretch830-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1542-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1447-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie490-1amd64,armel,armhf,i386
sid1542-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1179-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster963-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package last-align:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
Popcon: 6 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

LAST est un logiciel permettant de comparer et aligner des séquences, typiquement des séquences d'ADN ou de protéines. LAST est similaire à BLAST, mais il s'en sort mieux avec les grandes quantités de données de séquences. Voici deux choses pour lesquelles LAST est bon :

  • la comparaison de grands génomes (ceux de mammifères par exemple) ;
  • la mise en correspondance de nombreuses étiquettes de séquences avec un génome.

La principale innovation technique vient du fait que LAST trouve les correspondances initiales en se basant sur leur multiplicité au lieu d'utiliser une taille fixe (par exemple, BLAST utilise des 10-mers). Cela permet de faire correspondre des étiquettes aux génomes sans masques répétitifs, sans être débordé par les correspondances répétitives. Pour trouver ces correspondances de tailles variables, il utilise un tableau de suffixes inspiré de Vmatch. Afin d'avoir une grande sensibilité, LAST utilise a tableau de suffixes non contigu, similaires aux seeds espacées.

Please cite: Martin C. Frith, Raymond Wan and Paul Horton: Incorporating sequence quality data into alignment improves DNA read mapping. (PubMed,eprint) Nucl. Acids Res. 38(7):e100 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
lastz
pairwise aligning DNA sequences
Versions of package lastz
ReleaseVersionArchitectures
sid1.04.22-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.04.03-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.04.22-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.04.22-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

LASTZ is a drop-in replacement for BLASTZ, and is backward compatible with BLASTZ’s command-line syntax. That is, it supports all of BLASTZ’s options but also has additional ones, and may produce slightly different alignment results.

Registry entries: Bioconda 
leaff
biological sequence library utilities and applications
Versions of package leaff
ReleaseVersionArchitectures
bookworm0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0~20150903+r2013-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0~20150903+r2013-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

LEAFF (Let's Extract Anything From Fasta) is a utility program for working with multi-fasta files. In addition to providing random access to the base level, it includes several analysis functions.

This package is part of the Kmer suite.

Please cite: B. Walenz and L. Florea: Sim4db and leaff: Utilities for fast batched spliced alignment and sequence indexing. (PubMed) Bioinformatics 27(13):1869-1870 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
lefse
determine features of organisms, clades, taxonomic units, genes
Versions of package lefse
ReleaseVersionArchitectures
trixie1.1.2-1all
bookworm1.1.2-1all
sid1.1.2-1all
stretch1.0+20160802-1all
buster1.0.8-2all
bullseye1.0.8-3all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

LEfSe (Linear discriminant analysis Effect Size) determines the features (organisms, clades, operational taxonomic units, genes, or functions) most likely to explain differences between classes by coupling standard tests for statistical significance with additional tests encoding biological consistency and effect relevance.

Registry entries: SciCrunch  Bioconda 
libpwiz-tools
ProteoWizard command line tools
Versions of package libpwiz-tools
ReleaseVersionArchitectures
stretch3.0.9393-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.0.18342-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.0.6585-2amd64,armel,armhf,i386
buster3.0.18342-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm3.0.18342-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.0.18342-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid3.0.18342-4.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The libpwiz library from the ProteoWizard project provides a modular and extensible set of open-source, cross-platform tools and libraries. The tools perform proteomics data analyses; the libraries enable rapid tool creation by providing a robust, pluggable development framework that simplifies and unifies data file access, and performs standard chemistry and LCMS dataset computations.

The primary goal of ProteoWizard is to eliminate the existing barriers to proteomic software development so that researchers can focus on the development of new analytic approaches, rather than having to dedicate significant resources to mundane (if important) tasks, like reading data files.

This package ships command line tools that include idconvert (conversion of MS identifications) and msconvert (conversion of MS raw data files from/to any supported format).

librg-utils-perl
analyseurs syntaxiques et les utilitaires de conversion de format, utilisés par profphd
Versions of package librg-utils-perl
ReleaseVersionArchitectures
trixie1.0.43-8all
bullseye1.0.43-7all
bookworm1.0.43-8all
buster1.0.43-6all
sid1.0.43-8all
jessie1.0.43-2all
stretch1.0.43-4all
Debtags of package librg-utils-perl:
devellang:perl, library
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet contribue au serveur PredictProtein pour l'annotation structurée automatisée de séquences de protéines. Il se caractérise par des séries d'outils de conversion telles que :

  • blast2saf.pl ;
  • blastpgp_to_saf.pl ;
  • conv_hssp2saf.pl ;
  • copf.pl ;
  • hssp_filter.pl ;
  • safFilterRed.pl.

qui sont pris en charge par les modules :

  • RG:Utils::Conv_hssp2saf ;
  • RG:Utils::Copf ;
  • RG:Utils::Hssp_filter ;
libvcflib-tools
C++ library for parsing and manipulating VCF files (tools)
Versions of package libvcflib-tools
ReleaseVersionArchitectures
trixie1.0.9+dfsg1-3amd64,arm64,mips64el,ppc64el
stretch1.0.0~rc1+dfsg1-3amd64
stretch-backports1.0.0~rc1+dfsg1-6~bpo9+1amd64
buster1.0.0~rc2+dfsg-2amd64
bookworm1.0.3+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.2+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.9+dfsg1-3amd64,arm64,mips64el,ppc64el,riscv64
buster-backports1.0.1+dfsg-3~bpo10+1amd64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The Variant Call Format (VCF) is a flat-file, tab-delimited textual format intended to concisely describe reference-indexed variations between individuals. VCF provides a common interchange format for the description of variation in individuals and populations of samples, and has become the defacto standard reporting format for a wide array of genomic variant detectors.

vcflib provides methods to manipulate and interpret sequence variation as it can be described by VCF. It is both:

  • an API for parsing and operating on records of genomic variation as it can be described by the VCF format,
  • and a collection of command-line utilities for executing complex manipulations on VCF files.

This package contains several tools using the library.

lighter
fast and memory-efficient sequencing error corrector
Versions of package lighter
ReleaseVersionArchitectures
bookworm1.1.2-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.2-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.2-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.1.2-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Lighter is a fast, memory-efficient tool for correcting sequencing errors. Lighter avoids counting k-mers. Instead, it uses a pair of Bloom filters, one holding a sample of the input k-mers and the other holding k-mers likely to be correct. As long as the sampling fraction is adjusted in inverse proportion to the depth of sequencing, Bloom filter size can be held constant while maintaining near-constant accuracy. Lighter is parallelized, uses no secondary storage, and is both faster and more memory-efficient than competing approaches while achieving comparable accuracy.

logol
??? missing short description for package logol :-(
Versions of package logol
ReleaseVersionArchitectures
bullseye1.7.9-3all
bookworm1.7.9+dfsg-6all
jessie1.7.0-2all
buster1.7.9-1all
stretch1.7.5-1all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git
loki
analyse de déséquilibre de liaison avec des chaînes de Markov
Versions of package loki
ReleaseVersionArchitectures
bookworm2.4.7.4-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4.7.4-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.4.7.4-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.4.7.4-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye2.4.7.4-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.4.7.4-5amd64,armel,armhf,i386
stretch2.4.7.4-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package loki:
fieldbiology
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 32 users (16 upd.)*
Versions and Archs
License: DFSG free
Git

Ce programme opère une analyse de liaison multipoint par une méthode utilisant des chaînes de Markov Monte Carlo (MCMC) sur des généalogies complexes et de grande taille. Pour le moment, le paquet ne propose que l'analyse de caractères quantitatifs, mais cette restriction sera levée dans une version future. L'estimation combinée du nombre de QTL (Quantitative Trait Loci), de leur position et de leurs effets est faite par un saut réversible MCMC (RJMCMC). Il est aussi possible de faire des analyses de type « affected only IBD (Identity By Descent) sharing ».

The package is enhanced by the following packages: loki-doc
ltrsift
post-traitement et classification de rétrotransposons LTR
Versions of package ltrsift
ReleaseVersionArchitectures
bullseye1.0.2-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.2-1amd64,armel,armhf,i386
stretch1.0.2-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.2-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0.2-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.2-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.0.2-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package ltrsift:
uitoolkitgtk
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

LTRsift est un outil graphique de bureau pour le post-traitement semi-automatique d’annotations de rétrotransposons, à séquence terminale longue répétée (LTR), de prédictions de novo, tels que ceux générés par LTRharvest et LTRdigest. Son interface conviviale affiche les candidats de rétrotransposon, leurs familles putatives et leurs structures internes de manière hiérarchique, permettant à l’utilisateur de « passer au crible » les résultats, parfois très importants, des logiciels de prédiction de novo. Il propose aussi des fonctions de filtrage et classification.

Screenshots of package ltrsift
lucy
DNA sequence quality and vector trimming tool
Versions of package lucy
ReleaseVersionArchitectures
bullseye1.20-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.20-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.20-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.20-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.20-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Lucy is a utility that prepares raw DNA sequence fragments for sequence assembly, possibly using the TIGR Assembler. The cleanup process includes quality assessment, confidence reassurance, vector trimming and vector removal. The primary advantage of Lucy over other similar utilities is that it is a fully integrated, stand alone program.

Lucy was designed and written at The Institute for Genomic Research (TIGR, now the J. Craig Venter Institute), and it has been used here for several years to clean sequence data from automated DNA sequencers prior to sequence assembly and other downstream uses. The quality trimming portion of lucy makes use of phred quality scores, such as those produced by many automated sequencers based on the Sanger sequencing method. As such, lucy’s quality trimming may not be appropriate for sequence data produced by some of the new “next-generation” sequencers.

lumpy-sv
general probabilistic framework for structural variant discovery
Versions of package lumpy-sv
ReleaseVersionArchitectures
sid0.3.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm0.3.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye0.3.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie0.3.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

LUMPY, a novel SV discovery framework that naturally integrates multiple SV signals jointly across multiple samples. LUMPY yields improved sensitivity, especially when SV signal is reduced owing to either low coverage data or low intra-sample variant allele frequency.

The package is enhanced by the following packages: lumpy-sv-examples
macs
analyse basée sur modèles de ChIP-Seq venant de séquenceurs de lectures courtes
Versions of package macs
ReleaseVersionArchitectures
trixie3.0.1-2amd64,arm64,armel,armhf,i386,ppc64el,s390x
stretch2.1.1.20160309-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1.2.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.2.7.1-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
bookworm2.2.7.1-6amd64,arm64,armel,armhf,i386,ppc64el,s390x
jessie2.0.9.1-1amd64,armel,armhf,i386
sid3.0.1-2amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
Popcon: 11 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

MACS modélise empiriquement la longueur des fragments ChIP séquencés, qui tend à être plus courte que les estimations de taille par sonication ou banque de construction, et l'utilise pour améliorer la résolution spatiale de sites de liaison prévisible. MACS utilise aussi une distribution de Poisson dynamique pour capturer efficacement des biais locaux dans la séquence du génome, permettant une prédiction plus sensible et robuste. MACS est tout à fait comparable aux algorithmes existants de recherche de pics dans les ChIP-Seq, est disponible publiquement en open source, et peut être utilisé pour des ChIP-Seq sans ou avec échantillons de contrôle.

Please cite: Yong Zhang, Tao Liu, Clifford A Meyer, Jérôme Eeckhoute, David S. Johnson, Bradley E. Bernstein, Chad Nussbaum, Richard M. Myers, Myles Brown, Wei Li and X Shirley Liu: Model-based Analysis of ChIP-Seq (MACS). (PubMed,eprint) Genome Biol. 9(9):R137 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
macsyfinder
detection of macromolecular systems in protein datasets
Versions of package macsyfinder
ReleaseVersionArchitectures
buster1.0.5-2all
bullseye2.0~rc1-3amd64,i386
bookworm2.0-2amd64,i386
trixie2.1.3-1amd64,arm64,i386
sid2.1.3-1amd64,arm64,i386
stretch1.0.2-3all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MacSyFinder is a program to model and detect macromolecular systems, genetic pathways... in protein datasets. In prokaryotes, these systems have often evolutionarily conserved properties: they are made of conserved components, and are encoded in compact loci (conserved genetic architecture). The user models these systems with MacSyFinder to reflect these conserved features, and to allow their efficient detection

This package presents the Open Source Java API to biological databases and a series of mostly sequence-based algorithms.

Please cite: Sophie S. Abby, Bertrand Néron, Hervé Ménager, Marie Touchon and Eduardo P. C. Rocha: MacSyFinder: A Program to Mine Genomes for Molecular Systems with an Application to CRISPR-Cas System. (PubMed,eprint) PLOS ONE 9(10):e110726 (2014)
Registry entries: Bio.tools 
maffilter
process genome alignment in the Multiple Alignment Format
Versions of package maffilter
ReleaseVersionArchitectures
buster1.3.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.1.0-1+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.3.1+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.3.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.3.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.3.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MafFilter applies a series of "filters" to a MAF file, in order to clean it, extract data and computer statistics while keeping track of the associated meta-data such as genome coordinates and quality scores.

  • It can process the alignment to remove low-quality / ambiguous / masked regions.
  • It can export data into a single or multiple alignment file in format such as Fasta or Clustal.
  • It can read annotation data in GFF or GTF format, and extract the corresponding alignment.
  • It can perform sliding windows calculations.
  • It can reconstruct phylogeny/genealogy along the genome alignment.
  • It can compute population genetics statistics, such as site frequency spectrum, number of fixed/polymorphic sites, etc.
The package is enhanced by the following packages: maffilter-examples
Please cite: Julien Y Dutheil, Sylvain Gaillard and Eva H Stukenbrock: MafFilter: a highly flexible and extensible multiple genome alignment files processor. (PubMed,eprint) BMC Genomics 15:53 (2014)
mafft
programme d'alignement multiple pour des séquences de nucléotides ou d'acides aminés
Versions of package mafft
ReleaseVersionArchitectures
jessie7.205-1amd64,armel,armhf,i386
sid7.505-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie7.505-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch7.307-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye7.475-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm7.505-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster7.407-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream7.525
Debtags of package mafft:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 28 users (10 upd.)*
Newer upstream!
License: DFSG free
Git

MAFFT est un programme d'alignement multiple de séquences qui offre trois méthodes orientées précision : - L-INS-i : probablement la plus précise ; recommandée pour moins de

   200 séquences ; méthode de raffinement itératif qui incorpore les
   informations d'alignement des paires locales ;
- G-INS-i : convient pour des séquences de longueurs similaires ;
   recommandée pour moins de 200 séquences ; méthode de raffinement
   itératif qui incorpore les informations d'alignement des paires
   globales ;
- E-INS-i : convient pour des séquences qui contiennent de grandes régions
   non-alignables ; recommandée pour moins de 200 séquences.
   MAFFT fournit également cinq méthodes orientées vitesse :
 - FFT-NS-i : méthode de raffinement itératif de deux cycles seulement ;
 - FFT-NS-i : méthode de raffinement itératif d'un maximum de 1 000
itérations ;

- FFT-NS-2 : rapide, méthode progressive ; - FFT-NS-1 : très rapide, recommandé pour plus de 2 000 séquences ; méthode progressive avec un arbre de recherche grossier ; - NW-NS-PartTree-1 : recommandé pour environ 50 000 séquences ; méthode progressive avec l'algorithme PartTree.

Please cite: Kazutaka Katoh and Hiroyuki Toh: Recent developments in the MAFFT multiple sequence alignment program. (PubMed) Brief Bioinform 9(4):286-298 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
malt
sequence alignment and analysis tool to process sequencing data
Versions of package malt
ReleaseVersionArchitectures
trixie0.5.2-3all
bookworm0.5.2-2all
sid0.5.2-3all
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MALT, an acronym for MEGAN alignment tool, is a sequence alignment and analysis tool designed for processing high-throughput sequencing data, especially in the context of metagenomics. It is an extension of MEGAN6, the MEGenome Analyzer and is designed to provide the input for MEGAN6, but can also be used independently of MEGAN6.

The core of the program is a sequence alignment engine that aligns DNA or protein sequences to a DNA or protein reference database in either BLASTN (DNA queries and DNA references), BLASTX (DNA queries and protein references) or BLASTP (protein queries and protein references) mode. The engine uses a banded-alignment algorithm with ane gap scores and BLOSUM substitution matrices (in the case of protein alignments). The program can compute both local alignments (Smith-Waterman) or semi-global alignments (in which reads are aligned end-to-end into reference sequences), the latter being more appropriate for aligning metagenomic reads to references.

The package is enhanced by the following packages: multiqc
Please cite: Alexander Herbig, Frank Maixner, Kirsten I. Bos, Albert Zink, Johannes Krause and Daniel H. Huson: MALT: Fast alignment and analysis of metagenomic DNA sequence data applied to the Tyrolean Iceman. (eprint) bioRxiv (2016)
mapdamage
tracking and quantifying damage patterns in ancient DNA sequences
Versions of package mapdamage
ReleaseVersionArchitectures
stretch2.0.6+dfsg-2all
buster2.0.9+dfsg-1all
sid2.2.1+dfsg-3all
bullseye2.2.1+dfsg-1all
bookworm2.2.1+dfsg-3all
trixie2.2.1+dfsg-3all
upstream2.2.2
Popcon: 8 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

MapDamage is a computational framework written in Python and R, which tracks and quantifies DNA damage patterns among ancient DNA sequencing reads generated by Next-Generation Sequencing platforms.

MapDamage is developed at the Centre for GeoGenetics by the Orlando Group.

Please cite: Hákon Jónsson, Aurélien Ginolhac, Mikkel Schubert and Philip Johnson and Ludovic Orlando: mapDamage2.0: fast approximate Bayesian estimates of ancient DNA damage parameters. (PubMed,eprint) Bioinformatics 29(13):1682-4 (2013)
Registry entries: SciCrunch  Bioconda 
mapsembler2
bioinformatics targeted assembly software
Versions of package mapsembler2
ReleaseVersionArchitectures
bullseye2.2.4+dfsg1-3amd64,arm64,ppc64el,s390x
sid2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
trixie2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
bookworm2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
buster2.2.4+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
stretch2.2.3+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
jessie2.1.6+dfsg-1amd64,armel,armhf,i386
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Mapsembler2 is a targeted assembly software. It takes as input a set of NGS raw reads (fasta or fastq, gzipped or not) and a set of input sequences (starters).

It first determines if each starter is read-coherent, e.g. whether reads confirm the presence of each starter in the original sequence. Then for each read-coherent starter, Mapsembler2 outputs its sequence neighborhood as a linear sequence or as a graph, depending on the user choice.

Mapsembler2 may be used for (not limited to):

  • Validate an assembled sequence (input as starter), e.g. from a de Bruijn graph assembly where read-coherence was not enforced.
  • Checks if a gene (input as starter) has an homolog in a set of reads
  • Checks if a known enzyme is present in a metagenomic NGS read set.
  • Enrich unmappable reads by extending them, possibly making them mappable
  • Checks what happens at the extremities of a contig
  • Remove contaminants or symbiont reads from a read set
Please cite: Pierre Peterlongo and Rayan Chikhi: Mapsembler, targeted and micro assembly of large NGS datasets on a desktop computer. (PubMed) BMC Bioinformatics 13:48 (2012)
Registry entries: Bio.tools  Bioconda 
maq
correspondance de lectures de séquences d'ADN polymorphique de longueur courte à des séquences de référence
Versions of package maq
ReleaseVersionArchitectures
stretch0.7.1-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.7.1-5amd64,armel,armhf,i386
bookworm0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster0.7.1-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package maq:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 16 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Maq (« Mapping and Assembly with Quality » − correspondance et assemblage de qualité) construit des associations de correspondance de lectures courtes générées par des machines de séquençage de nouvelles générations. Le logiciel a été particulièrement conçu pour l'analyseur de génome Solexa à 1 milliard de bases par exécution, par l'entreprise Illumina, et dispose d'une fonctionnalité préliminaire pour manipuler des données ABI SOLiD. Le logiciel Maq est déjà connu sous le nom de mapass2.

Le développement du logiciel Maq s'est arrêté en 2008. Ses successeurs sont BWA (« Burrows-Wheeler Aligner ») et SAMtools (« Sequence Alignment/Map tools »).

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.tools  SciCrunch 
maqview
graphical read alignment viewer for short gene sequences
Versions of package maqview
ReleaseVersionArchitectures
trixie0.2.5-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.2.5-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.2.5-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0.2.5-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.2.5-6amd64,armel,armhf,i386
sid0.2.5-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.2.5-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Maqview is graphical read alignment viewer. It is specifically designed for the Maq alignment file and allows you to see the mismatches, base qualities and mapping qualities. Maqview is nothing fancy as Consed or GAP, but just a simple viewer for you to see what happens in a particular region.

In comparison to tgap-maq, the text-based read alignment viewer written by James Bonfield, Maqview is faster and takes up much less memory and disk space in indexing. This is possibly because tgap aims to be a general-purpose viewer but Maqview fully makes use of the fact that a Maq alignment file has already been sorted. Maqview is also efficient in viewing and provides a command-line tool to quickly retrieve any region in an Maq alignment file.

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.tools  SciCrunch 
mash
estimation rapide de distance entre génomes et métagénomes utilisant MinHash
Versions of package mash
ReleaseVersionArchitectures
bookworm2.3+dfsg-3amd64,arm64,mips64el,ppc64el,s390x
buster2.1+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.1.1-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.3+dfsg-6amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie2.3+dfsg-6amd64,arm64,mips64el,ppc64el,s390x
bullseye2.2.2+dfsg-2amd64,arm64,mips64el,ppc64el,s390x
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Mash uses MinHash locality-sensitive hashing to reduce large biosequences to a representative sketch and rapidly estimate pairwise distances between genomes or metagenomes. Mash sketch databases effectively delineate known species boundaries, allow construction of approximate phylogenies, and can be searched in seconds using assembled genomes or raw sequencing runs from Illumina, Pacific Biosciences, and Oxford Nanopore. For metagenomics, Mash scales to thousands of samples and can replicate Human Microbiome Project and Global Ocean Survey results in a fraction of the time.

Please cite: Brian D. Ondovi, Todd J. Treangen, Páll Melsted, Adam B. Mallonee, Nicholas H. Bergman, Sergey Koren and Adam M. Phillippy: Mash: fast genome and metagenome distance estimation using MinHash. (PubMed,eprint) Genome Biology 17:132 (2016)
Registry entries: Bioconda 
massxpert
paquet de transition pour massxpert -> massxpert2
Versions of package massxpert
ReleaseVersionArchitectures
bullseye6.0.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.4.1-1amd64,armel,armhf,i386
stretch3.6.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm7.0.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid8.3.0-1all
trixie7.0.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package massxpert:
biologynuceleic-acids, peptidic
fieldbiology, chemistry
interfacex11
roleprogram
uitoolkitqt
useanalysing, simulating
works-withbiological-sequence
works-with-formatxml
x11application
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de transition pouvant être supprimé sans danger.

Registry entries: Bio.tools 
mauve-aligner
multiple genome alignment
Versions of package mauve-aligner
ReleaseVersionArchitectures
bookworm2.4.0+4736-6all
bullseye2.4.0+4736-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.4.0+4734-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.4.0+4736-6all
sid2.4.0+4736-6all
buster2.4.0+4736-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Mauve is a system for efficiently constructing multiple genome alignments in the presence of large-scale evolutionary events such as rearrangement and inversion. Multiple genome alignment provides a basis for research into comparative genomics and the study of evolutionary dynamics. Aligning whole genomes is a fundamentally different problem than aligning short sequences.

Mauve has been developed with the idea that a multiple genome aligner should require only modest computational resources. It employs algorithmic techniques that scale well in the amount of sequence being aligned. For example, a pair of Y. pestis genomes can be aligned in under a minute, while a group of 9 divergent Enterobacterial genomes can be aligned in a few hours.

Mauve computes and interactively visualizes genome sequence comparisons. Using FastA or GenBank sequence data, Mauve constructs multiple genome alignments that identify large-scale rearrangement, gene gain, gene loss, indels, and nucleotide substutition.

Mauve is developed at the University of Wisconsin.

The package is enhanced by the following packages: progressivemauve
Please cite: Aaron C. E. Darling, Bob Mau, Frederick R. Blattner and Nicole T. Perna: Mauve: multiple alignment of conserved genomic sequence with rearrangements. (PubMed,eprint) Genome research 14(7):1394-1403 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mcaller
recherche de méthylation dans les lectures de nanopore
Versions of package mcaller
ReleaseVersionArchitectures
sid1.0.3+git20210624.b415090-3all
bookworm1.0.3+git20210624.b415090-3all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git
   H
   |
 H-C-aller
   |
   H

Ce programme est conçu pour appeler m6A à partir de données de nanopores en utilisant les différences entre les courants attendus et ceux mesurés.

mecat2
ultra-fast and accurate de novo assembly tools for SMRT reads
Versions of package mecat2
ReleaseVersionArchitectures
sid0.0+git20200428.f54c542+ds-4amd64
bullseye0.0+git20200428.f54c542+ds-3amd64
bookworm0.0+git20200428.f54c542+ds-3amd64
trixie0.0+git20200428.f54c542+ds-4amd64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

An improved version of MECAT. It is an ultra-fast and accurate mapping and error correcting de novo assembly tools for single molecula sequencing (SMRT) reads. MECAT2 consists of the following three modules:

 1. mecat2map: a fast and accurate alignment tool for SMRT reads.
 2. mecat2cns: correct noisy reads based on their pairwise overlaps.
 3. fsa: a string graph based assembly tool.
Please cite: Chuan-Le Xiao, Ying Chen, Shang-Qian Xie, Kai-Ning Chen, Yan Wang, Yue Han, Feng Luo and Zhi Xie: MECAT: fast mapping, error correction, and de novo assembly for single-molecule sequencing reads. Nature Methods 14(11):1078 (2017)
megadepth
computes coverage from BigWig and BAM sequencing files
Versions of package megadepth
ReleaseVersionArchitectures
bookworm1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

A major concern for the interpretation of DNA and RNA (!) sequencing is the number of reads that cover a particular area. This package has interesting statistics for the distinction of coding and non-coding parts of the genome and knows how to interpret transcripts that span multiple exons.

This package is a successor of the program 'bamcount'.

Please cite: Christopher Wilks, Omar Ahmed, Daniel N Baker, David Zhang, Leonardo Collado-Torres and Ben Langmead: Megadepth: efficient coverage quantification for BigWigs and BAMs. (PubMed) Bioinformatics 37(18):3014–3016 (2021)
Registry entries: Bio.tools  Bioconda 
megahit
ultra-fast and memory-efficient meta-genome assembler
Versions of package megahit
ReleaseVersionArchitectures
bullseye1.2.9-2amd64
trixie1.2.9-5amd64
bookworm1.2.9-4amd64
sid1.2.9-5amd64
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Megahit is an ultra-fast and memory-efficient NGS assembler. It is optimized for metagenomes, but also works well on generic single genome assembly (small or mammalian size) and single-cell assembly.

The software was praised in a Briefings in Bioinformatics 5/2020 review (DOI: 10.1093/bib/bbaa085).

Please cite: Dinghua Li, Chi-Man Liu, Ruibang Luo, Kunihiko Sadakane and Tak-Wah Lam: MEGAHIT: an ultra-fast single-node solution for large and complex metagenomics assembly via succinct de Bruijn graph. (PubMed) 31:1674-1676 (2015)
Registry entries: Bio.tools  Bioconda 
megan-ce
interactive tool to explore and analyse microbiome sequencing data
Versions of package megan-ce
ReleaseVersionArchitectures
bookworm6.21.1+dfsg-2all
trixie6.21.1+dfsg-3all
sid6.21.1+dfsg-3all
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MEGAN Community Edition is a shotgun sequencer to analyze microbiome samples. It is a rewrite and extension of the widely-used microbiome analysis tool MEGAN so as to facilitate the interactive analysis of the taxonomic and functional content of very large microbiome datasets. Other new features include a functional classifier called InterPro2GO, gene-centric read assembly, principal coordinate analysis of taxonomy and function, and support for metadata. By integrating MEGAN CE with the high-throughput DNA-to-protein alignment tool DIAMOND a powerful and complete pipeline for the analysis of metagenome shotgun sequences can be provided.

Please cite: Daniel H. Huson, Sina Beier, Isabell Flade, Anna Górska, Mohamed El-Hadidi, Suparna Mitra, Hans-Joachim Ruscheweyh and Rewati Tappu: MEGAN Community Edition - Interactive Exploration and Analysis of Large-Scale Microbiome Sequencing Data. (PubMed,eprint) PLoS Comput Biol. 12(6):e1004957 (2016)
Registry entries: Bioconda 
melting
calcule la température de fusion de duplex d'acide nucléique
Versions of package melting
ReleaseVersionArchitectures
bookworm5.2.0-2all
jessie4.3.1+dfsg-1amd64,armel,armhf,i386
sid5.2.0-2all
bullseye5.2.0-2all
stretch4.3.1+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster5.2.0-1all
trixie5.2.0-2all
Debtags of package melting:
biologynuceleic-acids
fieldbiology, biology:molecular
interfacecommandline
roleprogram
scopeutility
suitegnu
useanalysing
works-with-formatplaintext
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Ce programme calcule, pour un duplex d'acide nucléique, l'enthalpie, l'entropie et la température de fusion des transitions de la spire hélicoïde. Trois types d'hybridation sont possibles : ADN/ADN, ADN/ARN, et ARN/ARN. Le programme calcule d'abord l'enthalpie et l'entropie d'hybridation à partir des paramètres élémentaires de chaque paire de Crick par la méthode de proximité. Ensuite, la température de fusion est calculée. L'ensemble des paramètres thermodynamiques peut être facilement modifié, par exemple pour suivre une avancée expérimentale.

Please cite: Le Novère, Nicolas: MELTING, computing the melting temperature of nucleic acid duplex. (PubMed,eprint) Bioinformatics 17(12):1226-1227 (2001)
Registry entries: Bio.tools 
Screenshots of package melting
meryl
in- and out-of-core kmer counting and utilities
Versions of package meryl
ReleaseVersionArchitectures
bullseye0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch0~20150903+r2013-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0~20150903+r2013-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

meryl computes the kmer content of genomic sequences. Kmer content is represented as a list of kmers and the number of times each occurs in the input sequences. The kmer can be restricted to only the forward kmer, only the reverse kmer, or the canonical kmer (lexicographically smaller of the forward and reverse kmer at each location). Meryl can report the histogram of counts, the list of kmers and their counts, or can perform mathematical and set operations on the processed data files.

This package is part of the Kmer suite.

Please cite: B. Walenz and L. Florea: Sim4db and leaff: Utilities for fast batched spliced alignment and sequence indexing. (PubMed) Bioinformatics 27(13):1869-1870 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
metabat
robust statistical framework for reconstructing genomes from metagenomic data
Versions of package metabat
ReleaseVersionArchitectures
bullseye2.15-3amd64,i386
bookworm2.15-4amd64,i386
sid2.15-4amd64,i386
trixie2.15-4amd64,i386
upstream2.17
Popcon: 2 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

MetaBAT integrates empirical probabilistic distances of genome abundance and tetranucleotide frequency for accurate metagenome binning. MetaBAT outperforms alternative methods in accuracy and computational efficiency on both synthetic and real metagenome datasets. It automatically forms hundreds of high quality genome bins on a very large assembly consisting millions of contigs in a matter of hours on a single node.

Please cite: Dongwan D. Kang, Jeff Froula, Rob Egan and Zhong Wang: MetaBAT, an efficient tool for accurately reconstructing single genomes from complex microbial communities. (PubMed) PeerJ 3:e1165 (2015)
Registry entries: Bioconda 
metaeuk
sensitive, high-throughput gene discovery and annotation for metagenomics
Versions of package metaeuk
ReleaseVersionArchitectures
sid6-a5d39d9+ds-5amd64,arm64,mips64el,ppc64el,riscv64
trixie6-a5d39d9+ds-5amd64,arm64,mips64el,ppc64el
Popcon: users ( upd.)*
Versions and Archs
License: DFSG free
Git

MetaEuk is a modular toolkit designed for large-scale gene discovery and annotation in eukaryotic metagenomic contigs. MetaEuk combines the fast and sensitive homology search capabilities of MMseqs2 with a dynamic programming procedure to recover optimal exons sets. It reduces redundancies in multiple discoveries of the same gene and resolves conflicting gene predictions on the same strand.

metaphlan
Metagenomic Phylogenetic Analysis
Versions of package metaphlan
ReleaseVersionArchitectures
sid4.0.4-1all
bookworm4.0.4-1all
upstream4.1.0
Popcon: 1 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

MetaPhlAn is a computational tool for profiling the composition of microbial communities (Bacteria, Archaea and Eukaryotes) from metagenomic shotgun sequencing data (i.e. not 16S) with species-level. With the newly added StrainPhlAn module, it is now possible to perform accurate strain-level microbial profiling.

MetaPhlAn relies on ~1.1M unique clade-specific marker genes (the latest marker information file mpa_v31_CHOCOPhlAn_201901_marker_info.txt.bz2 can be found here) identified from ~100,000 reference genomes (~99,500 bacterial and archaeal and ~500 eukaryotic), allowing:

  • unambiguous taxonomic assignments;
  • accurate estimation of organismal relative abundance;
  • species-level resolution for bacteria, archaea, eukaryotes and viruses;
  • strain identification and tracking
  • orders of magnitude speedups compared to existing methods.
  • metagenomic strain-level population genomics
Please cite: Duy Tin Truong, Eric A Franzosa, Timothy L Tickle, Matthias Scholz, George Weingart, Edoardo Pasolli, Adrian Tett, Curtis Huttenhower and Nicola Segata: MetaPhlAn2 for enhanced metagenomic taxonomic profiling. (PubMed) Nature Methods 12(10):902–903 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
metastudent
predictor of Gene Ontology terms from protein sequence
Versions of package metastudent
ReleaseVersionArchitectures
sid2.0.1-9all
jessie1.0.11-2all
trixie2.0.1-9all
bookworm2.0.1-9all
bullseye2.0.1-8all
buster2.0.1-6all
stretch2.0.1-4all
Popcon: 7 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Often, only the sequence of a protein is known, but not its functions. Metastudent will try to predict missing functional annotations through homology searches (BLAST).

All predicted functions correspond to Gene Ontology (GO) terms from the Molecular Function (MFO), the Biological Process (BPO) and the Cellular Component Ontology (CCO) and are associated with a reliability score.

Please cite: Tobias Hamp, Rebecca Kassner, Stefan Seemayer, Esmeralda Vicedo, Christian Schaefer, Dominik Achten, Florian Auer, Ariane Boehm, Tatjana Braun, Maximilian Hecht, Mark Heron, Peter Hönigschmid, Thomas A. Hopf, Stefanie Kaufmann, Michael Kiening, Denis Krompass, Cedric Landerer, Yannick Mahlich, Manfred Roos and Burkhard Rost: Homology-based inference sets the bar high for protein function prediction.. (PubMed) BMC Bioinformatics 14(Suppl 3):S7 (2013)
Registry entries: Bio.tools 
mhap
locality-sensitive hashing to detect long-read overlaps
Versions of package mhap
ReleaseVersionArchitectures
sid2.1.3+dfsg-3all
trixie2.1.3+dfsg-3all
bookworm2.1.3+dfsg-3all
buster2.1.3+dfsg-2all
stretch-backports2.1.3+dfsg-1~bpo9+1all
stretch2.1.1+dfsg-1all
bullseye2.1.3+dfsg-3all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The MinHash Alignment Process (MHAP--pronounced MAP) is a reference implementation of a probabilistic sequence overlapping algorithm. Designed to efficiently detect all overlaps between noisy long-read sequence data. It efficiently estimates Jaccard similarity by compressing sequences to their representative fingerprints composed on min-mers (minimum k-mer).

Please cite: Konstantin Berlin, Sergey Koren, Chen-Shan Chin, James P Drake, Jane M Landolin and Adam M Phillippy: Assembling large genomes with single-molecule sequencing and locality-sensitive hashing. (PubMed) Nature Biotechnology 33(6):623–630 (2015)
Registry entries: Bioconda 
microbegps
outil d’investigation pour le profilage taxonomique de données métagénomiques
Versions of package microbegps
ReleaseVersionArchitectures
bullseye1.0.0-5all
buster1.0.0-3all
sid1.0.0-6all
trixie1.0.0-6all
stretch1.0.0-2all
bookworm1.0.0-5all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

MicrobeGPS est un outil bioinformatique pour l’analyse de données de séquençages métagénomiques. Le but est de réaliser un profil de la composition de communautés métagénomiques aussi précisément que possible et de présenter les résultats d’une manière pratique. Un des buts principaux est la fiabilité : l’outil calcule des métriques de qualité pour les candidats estimés et permet d’identifier les faux candidats facilement.

Please cite: Martin S. Lindner and Bernhard Y. Renard: Metagenomic Profiling of Known and Unknown Microbes with MicrobeGPS. (PubMed,eprint) PLoS One 10(2):e0117711 (2015)
Registry entries: Bio.tools 
microbiomeutil
utilitaires d'analyse de microbiome
Versions of package microbiomeutil
ReleaseVersionArchitectures
bullseye20101212+dfsg1-4all
bookworm20101212+dfsg1-5all
buster20101212+dfsg1-2all
stretch20101212+dfsg1-1all
jessie20101212+dfsg-1all
sid20101212+dfsg1-5all
trixie20101212+dfsg1-5all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet microbiomeutil est fourni avec les utilitaires suivants :

  • ChimeraSlayer : détection de chimères ;
  • NAST-iEr : outil d'alignement basé sur l'algorithme NAST ;
  • WigeoN : nouvelle implémentation de l'utilitaire Pintail de détection d'anomalies 16S ;
  • RESOURCES : séquences 16S de référence et alignements basés sur NAST que les outils ci-dessus exploitent.
Please cite: Brian J. Haas, Dirk Gevers, Ashlee M. Earl, Mike Feldgarden, Doyle V. Ward, Georgia Giannoukos, Dawn Ciulla, Diana Tabbaa, Sarah K. Highlander, Erica Sodergren, Barbara Methé, Todd Z. DeSantis, The Human Microbiome Consortium, Joseph F. Petrosino, Rob Knight and Bruce W. Birren: Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. (PubMed,eprint) Genome Research 21(3):494-504 (2011)
Registry entries: SciCrunch 
mindthegap
détection et assemblage de variantes d’insertion d’ADN dans les ensembles de lectures NGS
Versions of package mindthegap
ReleaseVersionArchitectures
trixie2.3.0-3amd64,arm64,mips64el,ppc64el
sid2.3.0-3amd64,arm64,mips64el,ppc64el,riscv64
bullseye2.2.2-2amd64,arm64,i386,mips64el,ppc64el,s390x
bookworm2.3.0-2amd64,arm64,mips64el,ppc64el
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet est conçu pour appeler des assertions de n’importe quelle taille, qu'elles soient nouvelles ou dupliquées, homozygotes ou hétérozygotes dans le génome du donneur. Il prend en entrée un ensemble de lectures et un génome de référence. Il produit deux ensembles de séquences FASTA : l'un est un ensemble de points d’interruption (breakpoint) de sites d’insertion détectés, l’autre est un ensemble d’insertions assemblées pour chaque point d’interruption. MindTheGap peut être aussi utilisé comme un outil pour terminer l’assemblage de génome. Il peut remplir les trous dans un ensemble de contigs d’entrée sans aucun a priori de leur orientation et ordre relatifs. Les résultats sont produits dans un fichier gfa.

Registry entries: Bio.tools  Bioconda 
minexpert2
visualisation et fouille de données de spectrométrie de masse MS^n – exécutable
Versions of package minexpert2
ReleaseVersionArchitectures
sid9.3.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye7.4.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm8.6.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie9.3.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MineXpert2 permet de réaliser les tâches suivantes :

 – ouvrir les fichiers de données de spectrométrie de masse (mzML, mzXML,
   asc, xy…) ;
 – afficher dans une table l’ensemble complet de données pour un
   filtrage aisé ;
 – calculer et afficher le chromatogramme TIC ;
 – calculer et afficher le graphique coloré mz=f(rt) ;
 – pour les données de mobilité, calculer et afficher la carte de
   couleurs mz=f(dt) ;
 – intégrer les données de spectrométrie de masse de n’importe quelle
   représentation de données (spectre de masse ou « drift »,
   chromatogramme TIC ou XIC, carte de couleurs 2D) dans n’importe
   quelle sorte de représentation ;
 – pour n’importe quelle caractéristique de masse (pic de masse, pic TIC
   ou XIC, carte de couleurs), intégrer dans une seule valeur
   d’intensité XIC ;
 – calcul puissant de groupe isotopique à partir d’une formule chimique,
   avec facultativement des ratios d’abondance définis par l’utilisateur ;
 – ajustement gaussien sur n’importe quel groupe isotopique pour estimer
   la masse moyenne d’une installation donnée ;
 – déconvolution avec la souris de données m/z (charge basée sur
   l’enveloppe ou sur le groupe isotopique) ;
 – exportation des données dans des fichiers texte ;
 – exportation de la représentation graphique de données de spectrométrie
   de masse dans des fichiers graphiques (jpg, png, pdf).

Ce paquet fournit le programme mineXpert2.

Registry entries: Bio.tools 
minia
short-read biological sequence assembler
Versions of package minia
ReleaseVersionArchitectures
bookworm3.2.6-3amd64,arm64,mips64el,ppc64el
stretch1.6906-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie3.2.6-4amd64,arm64,mips64el,ppc64el
bullseye3.2.1+git20200522.4960a99-1amd64,arm64,i386,mips64el,ppc64el,s390x
buster1.6906-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.2.6-4amd64,arm64,mips64el,ppc64el,riscv64
jessie1.6088-1amd64,armel,armhf,i386
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

What was referred to as "next-generation" DNA sequencing up to the year 2020 delivered only "short" reads up to ~600 base pairs in length that would then have to be puzzled by random overlaps in their sequence towards a complete genome. This is the genome assembly. And there are many biological pitfalls on long stretches of low complexity regions and copy number variations and other sorts of redundancies that render this difficult.

This package provides a short-read DNA sequence assembler based on a de Bruijn graph, capable of assembling a human genome on a desktop computer in a day.

The output of Minia is a set of contigs, i.e. stretches of gap-free linear overlaps of short reads. In the best possible case this is a whole chromosome.

Minia produces results of similar contiguity and accuracy to other de Bruijn assemblers (e.g. Velvet).

Please cite: Rayan Chikhi and Guillaume Rizk: Space-Efficient and Exact de Bruijn Graph Representation Based on a Bloom Filter.. (PubMed,eprint) Algorithms for Molecular Biology 8(1):22 (2013)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence assembly
miniasm
assembleur de novo très rapide pour des lectures longues de séquences d’ADN bruitées
Versions of package miniasm
ReleaseVersionArchitectures
sid0.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster0.3+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.3+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.2+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Miniasm est un assembleur de novo très rapide basé sur OLC (Overlap-Layout- Consensus) pour des lectures longues bruitées. Il prend des auto-mappages de lectures « all-vs-all » (classiquement par mini-carte) comme entrée et produit des graphes d’assemblage au format GFA. Différent des assembleurs traditionnel, miniasm ne possède pas d’étape de consensus. Il concatène simplement des morceaux de séquences de lecture pour générer des séquences unitig. Par conséquent le taux d’erreur par base est similaire à celui des lectures brutes d’entrée.

Registry entries: Bioconda 
Topics: Sequence assembly
minimac4
Fast Imputation Based on State Space Reduction HMM
Versions of package minimac4
ReleaseVersionArchitectures
bookworm4.1.2-1amd64
sid4.1.6-1amd64
bullseye1.0.2-2amd64
buster1.0.0-2amd64
trixie4.1.6-1amd64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Minimac4 is a lower memory and more computationally efficient implementation of "minimac2/3". It is an algorithm for genotypic imputation that works on phased genotypes (say from MaCH).

Minimac4 is designed to handle very large reference panels in a more computationally efficient way with no loss of accuracy. This algorithm analyzes only the unique sets of haplotypes in small genomic segments, thereby saving on time-complexity, computational memory but no loss in degree of accuracy.

Please cite: Sayantan Das, Lukas Forer, Sebastian Schönherr, Carlo Sidore, Adam E Locke, Alan Kwong, Scott I Vrieze, Emily Y Chew, Shawn Levy, Matt McGue, David Schlessinger, Dwight Stambolian, Po-Ru Loh, William G Iacono, Anand Swaroop, Laura J Scott, Francesco Cucca, Florian Kronenberg, Michael Boehnke, Gonçalo R Abecasis and Christian Fuchsberger: Next-generation genotype imputation service and methods. Nature Genetics 48(10):1284-1287 (2016)
Registry entries: Bio.tools  SciCrunch 
minimap
correspondances approximatives de longues séquences biologiques telles que les lectures d’ADN
Versions of package minimap
ReleaseVersionArchitectures
bullseye0.2-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.2-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.2-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch0.2-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.2-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.2-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Minimap est un outil expérimental pour trouver efficacement des positions approximatives multiples correspondantes entre deux ensembles de longues séquences biologiques, tels qu’entre des lectures d’ADN et des génomes de référence ou entre des génomes et des lectures longues brouillées. Minimap ne crée pas d’alignements pour le moment et, à cause de cela, il est habituellement dix fois plus rapide que les principaux aligneurs. Il ne les remplace pas mais peut être utile pour identifier rapidement des correspondances approximatives longues, divergeant modérément, parmi une immense collection de séquences. Pour cette tâche, il est beaucoup plus rapide que la plupart des outils existants.

Please cite: Heng Li: Minimap and miniasm: fast mapping and de novo assembly for noisy long sequences. (eprint) Bioinformatics :2103-2110 (2016)
Registry entries: Bioconda 
Topics: Mapping
minimap2
versatile pairwise aligner for genomic and spliced nucleotide sequences
Versions of package minimap2
ReleaseVersionArchitectures
sid2.27+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.17+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.24+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports2.15+dfsg-1~bpo9+1amd64,i386
buster2.15+dfsg-1amd64,i386
trixie2.27+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 10 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Minimap2 is a versatile sequence alignment program that aligns DNA or mRNA sequences against a large reference database. Typical use cases include: (1) mapping PacBio or Oxford Nanopore genomic reads to the human genome; (2) finding overlaps between long reads with error rate up to ~15%; (3) splice-aware alignment of PacBio Iso-Seq or Nanopore cDNA or Direct RNA reads against a reference genome; (4) aligning Illumina single- or paired-end reads; (5) assembly-to-assembly alignment; (6) full- genome alignment between two closely related species with divergence below ~15%.

For ~10kb noisy reads sequences, minimap2 is tens of times faster than mainstream long-read mappers such as BLASR, BWA-MEM, NGMLR and GMAP. It is more accurate on simulated long reads and produces biologically meaningful alignment ready for downstream analyses. For >100bp Illumina short reads, minimap2 is three times as fast as BWA-MEM and Bowtie2, and as accurate on simulated data. Detailed evaluations are available from the minimap2 paper or the preprint.

Please cite: Heng Li: Minimap2: pairwise alignment for nucleotide sequences. (PubMed,eprint) Bioinformatics :2103-2110 (2018)
Registry entries: Bioconda 
mipe
Outil de sauvegarde de données dérivées de PCR
Versions of package mipe
ReleaseVersionArchitectures
bookworm1.1-9all
stretch1.1-5all
jessie1.1-4all
bullseye1.1-9all
buster1.1-7all
trixie1.1-9all
sid1.1-9all
Debtags of package mipe:
fieldbiology, biology:bioinformatics, biology:molecular
interfacecommandline
roledocumentation, program
scopeutility
useorganizing
works-with-formatxml
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MIPE fournit un format standard pour échanger et/ou enregistrer toutes les informations associées aux expérimentations PCR en utilisant un fichier texte simple. Cela permet :

  • d'échanger des données PCR entre chercheurs/laboratoires ;
  • de fournir une traçabilité des données ;
  • d'éviter des problèmes lors de la soumission de données à dbSTS ou dbSNP ;
  • d'écrire des scripts standards d'extraction de données (par exemple une liste de « PCR primers », positions SNP ou haplotypes pour différents animaux).

Bien que cet outil puisse être utilisé pour enregistrer des données, son but principal est l'échange de données. Pour de plus grands dépôts de données, des bases de données relationnelles sont plus appropriées pour leur enregistrement. Le format MIPE pourrait alors être utilisé pour importer et/ou exporter vers ces bases de données.

Please cite: Jan Aerts and T. Veenendaal: MIPE - a XML-format to facilitate the storage and exchange of PCR-related data. Online Journal of Bioinformatics 6(2):114-120 (2005)
Registry entries: SciCrunch 
mira-assembler
assembleur de séquences génomiques exprimées utilisant la méthode globale
Versions of package mira-assembler
ReleaseVersionArchitectures
trixie4.9.6-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch4.9.6-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster4.9.6-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye4.9.6-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie4.0.2-1amd64,armel,armhf,i386
sid4.9.6-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm4.9.6-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package mira-assembler:
roleprogram
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

L’assembleur de fragments de génome mira est un assembleur spécialisé pour les projets classés comme difficiles car concernant un nombre élevé de répétitions. Pour la transcription de marqueurs de séquence exprimée (EST), miraEST est spécialisé dans la reconstruction de transcriptions d’ARNm pures tout en détectant et classifiant les polymorphismes d'un seul nucléotide (SNP) se produisant dans celles-ci.

L’assembleur est systématiquement utilisé pour des tâches variées telles que la détection de mutation dans différents types de cellule, l’analyse de similarités de transcriptions de divers organismes, l’assemblage de séquences pures à partir de diverses sources pour la conception d’oligonucléotides dans les expérimentations cliniques de biopuces.

Ce paquet fournit les binaires (exécutables) suivants :

 — mira : assemblage de séquences génomiques ;
 — miramem : estimation de la mémoire nécessaire pour les projets
   d’assemblage ;
 – mirabait : outil de type « grep » pour choisir les lectures pour des
   k-mer jusqu’à 256 bases ;
 – miraconvert : outil pour convertir, extraire et parfois recalculer
   toutes sortes de données relatives aux fichiers d’assemblage de
   séquences.
Please cite: Bastien Chevreux, Thomas Pfisterer, Bernd Drescher, Albert J. Driesel, Werner E. G. Müller, Thomas Wetter and Sándor Suhai: Using the miraEST Assembler for Reliable and Automated mRNA Transcript Assembly and SNP Detection in Sequenced ESTs. (PubMed,eprint) Genome Research 14(6):1147-1159 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mirtop
annotate miRNAs with a standard mirna/isomir naming
Versions of package mirtop
ReleaseVersionArchitectures
sid0.4.25-5all
bookworm0.4.25-2all
bullseye0.4.23-2all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The main goal of this project is to create a reflection group on metazoan microRNAs (miRNAs), open to all interested researchers, to identify blockages and develop standards and guidelines to improve miRNA research, resources and communication. This can go through the use of standardized file formats, gene and variants nomenclature guidelines, and advancements in miRNA biology understanding. The group will eventually also aim at expanding its breadth to the development of novel tools, data resources, and best-practices guidelines to benefit the scientific community by providing high confidence validated research and analysis strategies, regardless the expertise in this field. This package provides the command line interface to mirtop.

The package is enhanced by the following packages: multiqc
Please cite: Thomas Desvignes, Karen Eilbeck, Ioannis S. Vlachos, Bastian Fromm, Yin Lu, Marc K. Halushka, Michael Hackenberg, Gianvito Urgese, Elisa Ficarra, Shruthi Bandyadka, Jason Sydes, Peter Batzel, John H. Postlethwait, Phillipe Loher, Eric Londin, Aristeidis G. Telonis, Isidore Rigoutsos and Lorena Pantano Rubino: miRTOP: An open source community project for the development of a unified format file for miRNA data [version 1; not peer reviewed]. (eprint) F1000Research 7(ISCB Comm. J.):953 (Slides) (2018)
Registry entries: Bio.tools  Bioconda 
mlv-smile
Find statistically significant patterns in sequences
Versions of package mlv-smile
ReleaseVersionArchitectures
bookworm1.47-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.47-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.47-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.47-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.47-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie1.47-3amd64,armel,armhf,i386
stretch1.47-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Smile determines sequence motifs on the basis of a set of DNA, RNA or protein sequences.

  • No hard limit on the number of combinations of motifs to describe subsets of sequences.
  • The sequence alphabet may be specified.
  • The use of wildcards is supported.
  • Better determination of significance of motifs by simulation.
  • Introduction of a set of sequences with negative controls that should not match automatically determined motifs.
mmb
model the structure and dynamics of macromolecules
Versions of package mmb
ReleaseVersionArchitectures
experimental4.0.0+dfsg-3.1~exp1amd64,arm64,armhf
bullseye3.2+dfsg-2+deb11u1amd64,arm64,ppc64el
bookworm4.0.0+dfsg-2amd64,arm64
sid4.0.0+dfsg-3armhf
sid4.0.0+dfsg-3.1amd64,arm64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MacroMoleculeBuilder, previously known as RNABuilder, can be used for morphing, homology modeling, folding (e.g. using base pairing contacts), redesigning complexes, fitting to low-resolution density maps, predicting local rearrangements upon mutation, and many other applications.

mmseqs2
recherche et partitionnement de protéines ultra rapide et sensible
Versions of package mmseqs2
ReleaseVersionArchitectures
trixie15-6f452+ds-2amd64,arm64,mips64el,ppc64el
bookworm14-7e284+ds-1amd64,arm64,mips64el,ppc64el
sid15-6f452+ds-2amd64,arm64,mips64el,ppc64el,riscv64
bullseye12-113e3+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

MMseqs2 (Many-against-Many sequence searching) est une suite logicielle pour rechercher et partitionner des grands ensembles de séquences de protéines ou de nucléotides. MMseqs2 est un logiciel au code source ouvert (licence GPL) implémenté en C++ pour Linux, macOS et (en version bêta à travers cygwin) Windows. Le logiciel est conçu pour fonctionner sur plusieurs cœurs et plusieurs serveurs et se révèle très extensible. MMseqs2 fonctionne 10 000 fois plus rapidement que BLAST. À 100 fois sa vitesse il atteint presque la même sensibilité. Il peut réaliser des recherches de profil avec la même sensibilité que PSI-BLAST à plus de 400 fois sa vitesse.

Please cite: Martin Steinegger and Johannes Söding: Clustering huge protein sequence sets in linear time. Nature Communications 9(1) (2018)
Registry entries: Bio.tools  Bioconda 
mosdepth
calcul de couverture BAM/CRAM de séquençage biologique
Versions of package mosdepth
ReleaseVersionArchitectures
trixie0.3.6+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
sid0.3.6+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye0.3.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bookworm0.3.3+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
upstream0.3.7
Popcon: 3 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

De nombreuses petites lectures sont produites par les technologies dites de « nouvelle génération » à haut débit. La séquence finale est déduite en fonction de la façon dont ces lectures se chevauchent pour créer une séquence consensus. Plus les lectures sont des parties de recouvrement/corroboration d’une séquence nucléotidique, plus grande est la confiance dans le résultat. Trop de lectures serait révélateur de, par exemple, des répétitions dans le génome.

mosdepth peut produire :

 – couverture par base 2 fois plus rapide que la couverture de samtools,
   autour de 25 minutes de temps CPU pour un génome 30X ;
 – moyenne de couvertures par fenêtre pour une taille de fenêtre donnée,
   comme pour un calcul de variabilité (CNV) ;
 – moyenne par région à partir d’un fichier BED de régions ;
 – distribution de proportions de bases couvertes à ou au-dessus d’un
   certain seuil pour chaque chromosome et pour tout le génome ;
 – sortie quantifiée fusionnant des bases adjacentes aussi longtemps
   qu’elles soient dans le même « bin », par exemple, (10-20) ;
 – sortie selon le seuil pour indiquer combien de bases dans chaque région
   sont couvertes pour un seuil donné.
Lorsque qu’approprié, les fichiers produits sont compressés et indexés

pour faciliter leur utilisation.

The package is enhanced by the following packages: multiqc
Please cite: Brent S Pedersen and Aaron R. Quinlan: Mosdepth: quick coverage calculation for genomes and exomes. (PubMed,eprint) Bioinformatics 34(5):867-868 (2018)
Registry entries: Bio.tools  Bioconda 
mothur
ensemble pour analyse de séquences pour la recherche sur le microbiome
Versions of package mothur
ReleaseVersionArchitectures
jessie1.33.3+dfsg-2amd64,armel,armhf,i386
trixie1.48.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.44.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.38.1.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.48.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.41.21-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.48.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package mothur:
roleprogram
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Mothur cherche à développer une application unique à source ouvert, extensible, remplissant tous les besoins les besoins de la bio-informatique pour la communauté de l’écologie microbienne. Sont intégrées, entre autres, les fonctions de DOTUR, SONS, TreeClimber, S-LibShuff et UniFrac. De plus pour améliorer la flexibilité de ces algorithmes, un certain nombre de fonctions ont été ajoutées telles que des outils de calcul ou d’affichage.

Please cite: Patrick D Schloss, Sarah L Westcott, Thomas Ryabin, Justine R Hall, Martin Hartmann, Emily B Hollister, Ryan A Lesniewski, Brian B Oakley, Donovan H Parks, Courtney J Robinson, Jason W Sahl, Blaz Stres, Gerhard G Thallinger, David J Van Horn and Carolyn F Weber: Introducing mothur: Open-source, platform-independent, community-supported software for describing and comparing microbial communities. (PubMed) Appl Environ Microbiol 75(23):7537-7541 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Microbial ecology
mptp
single-locus species delimitation
Versions of package mptp
ReleaseVersionArchitectures
buster0.2.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.2.4-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.2.4-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.2.4-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.2.4-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream0.2.5
Popcon: 2 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Implementation of a fast species delimitation method, based on PTP (Zhang et al. 2013) with a 64-bit multi-threaded design that handles very large datasets.

The tool mPTP can handle very large biodiversity datasets. It implements a fast method to compute the ML delimitation from an inferred phylogenetic tree of the samples. Using MCMC, it also computes the support values for each clade, which can be used to assess the confidence of the ML delimitation.

ML delimitation mPTP implements two flavours of the point-estimate solution. First, it implements the original method from (Zhang et al. 2013) where all within-species processes are modelled with a single exponential distribution. mPTP uses a dynamic programming implementation which estimates the ML delimitation faster and more accurately than the original PTP. The dynamic programming implementation has similar properties as (Gulek et al. 2010). See the wiki for more information. The second method assumes a distinct exponential distribution for the branching events of each of the delimited species allowing it to fit to a wider range of empirical datasets.

MCMC method mPTP generates support values for each clades. They represent the ratio of the number of samples for which a particular node was in the between-species process, to the total number of samples.

Please cite: Paschalia Kapli, Sarah Lutteropp, Jiajie Zhang, Kassian Kobert, Pavlos Pavlidis, Alexandros Stamatakis and Tomas Flouri: Multi-rate Poisson Tree Processes for single-locus species delimitation under Maximum Likelihood and Markov Chain Monte Carlo. (PubMed,eprint) bioRxiv (2016)
mrbayes
Bayesian Inference of Phylogeny
Versions of package mrbayes
ReleaseVersionArchitectures
jessie3.2.3+dfsg-1amd64,armel,armhf,i386
buster3.2.6+dfsg-2amd64,arm64,armhf,i386
stretch3.2.6+dfsg-1amd64,arm64,armhf,i386
bullseye3.2.7a-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.2.7a-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.2.7a-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid3.2.7a-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 7 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Bayesian inference of phylogeny is based upon a quantity called the posterior probability distribution of trees, which is the probability of a tree conditioned on the observations. The conditioning is accomplished using Bayes's theorem. The posterior probability distribution of trees is impossible to calculate analytically; instead, MrBayes uses a simulation technique called Markov chain Monte Carlo (or MCMC) to approximate the posterior probabilities of trees.

The package is enhanced by the following packages: mrbayes-doc
Please cite: Fredrik Ronquist, Maxim Teslenko, Paul van der Mark, Daniel L. Ayres, Aaron Darling, Sebastian Höhna, Bret Larget, Liang Liu, Marc A. Suchard and John P. Huelsenbeck: MrBayes 3.2: Efficient Bayesian Phylogenetic Inference and Model Choice across a Large Model Space. (PubMed,eprint) Systematic Biology (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package mrbayes
multiqc
output integration for RNA sequencing across tools and samples
Versions of package multiqc
ReleaseVersionArchitectures
sid1.18+dfsg-1all
bullseye1.9+dfsg-3all
bookworm1.14+dfsg-1all
trixie1.14+dfsg-1.1all
upstream1.21
Popcon: 109 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

The sequencing of DNA or RNA with current high-throughput technologies involves an array of tools and these are applied over a range of samples. It is easy to loose oversight. And gathering the data and forwarding them in a readable manner to the individuals who took the samples is a challenge for a tool in itself. Well. Here it is. MultiQC aggregates the output of multiple tools into a single report.

Reports are generated by scanning given directories for recognised log files. These are parsed and a single HTML report is generated summarising the statistics for all logs found. MultiQC reports can describe multiple analysis steps and large numbers of samples within a single plot, and multiple analysis tools making it ideal for routine fast quality control.

Please cite: Philip Ewels, Måns Magnusson, Sverker Lundin and Max Käller: MultiQC: summarize analysis results for multiple tools and samples in a single report. (PubMed,eprint) Bioinformatics 31(19):3047-8 (2016)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mummer
Alignement de séquence efficace de génomes complets
Versions of package mummer
ReleaseVersionArchitectures
buster3.23+dfsg-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.23+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.23+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm3.23+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.23+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch3.23+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.23~dfsg-2amd64,armel,armhf,i386
upstream4.0.0.~beta5
Debtags of package mummer:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 71 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

MUMmer a été conçu pour aligner rapidement des génomes entiers, bruts ou finis. Par exemple, MUMmer 3.0 peut trouver toutes les régions identiques sur plus de 20 paires de bases entre deux génomes de 5 mégabases en 13,7 secondes, sur un ordinateur tournant à 2.4 GHz en utilisant 78 Mo de mémoire. MUMmer peut aussi aligner des génomes incomplets ; il manipule les centaines ou les milliers de contigs d'un projet de séquençage « shotgun » avec aisance, et les alignera sur un autre génome ou une autre collection de contigs en utilisant le programme NUCmer, inclus dans le système. Si les génomes proviennent d'espèces trop différentes pour que des similarités soient détectées au niveau nucléotidique, le programme PROmer générera des alignements basés sur la traduction des six phases de lectures de chaque génome.

The package is enhanced by the following packages: e-mem
Please cite: Stefan Kurtz, Adam Phillippy, Arthur L. Delcher, Michael Smoot, Martin Shumway, Corina Antonescu and Steven L. Salzberg: Versatile and open software for comparing large genomes. (PubMed) Genome Biology 5(2):R12 (2004)
Registry entries: Bio.tools  Bioconda 
Topics: Sequence analysis
Screenshots of package mummer
murasaki
homology detection tool across multiple large genomes
Versions of package murasaki
ReleaseVersionArchitectures
bullseye1.68.6-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.68.6-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.68.6-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.68.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.68.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.68.6-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Murasaki is a scalable and fast, language theory-based homology detection tool across multiple large genomes. It enable whole-genome scale multiple genome global alignments. Supports unlimited length gapped-seed patterns and unique TF-IDF based filtering.

Murasaki is an anchor alignment software, which is

  • exteremely fast (17 CPU hours for whole Human x Mouse genome (with 40 nodes: 52 wall minutes))
  • scalable (Arbitrarily parallelizable across multiple nodes using MPI. Even a single node with 16GB of ram can handle over 1Gbp of sequence.)
  • unlimited pattern length
  • repeat tolerant
  • intelligent noise reduction
Please cite: Kris Popendorf, Hachiya Tsuyoshi, Yasunori Osana and Yasubumi Sakakibara: Murasaki: A Fast, Parallelizable Algorithm to Find Anchors from Multiple Genomes. (PubMed,eprint) PLOS one 5(9):e12651 (2010)
murasaki-mpi
homology detection tool across multiple large genomes (MPI-version)
Versions of package murasaki-mpi
ReleaseVersionArchitectures
sid1.68.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.68.6-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.68.6-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.68.6-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.68.6-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.68.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Murasaki is a scalable and fast, language theory-based homology detection tool across multiple large genomes. It enable whole-genome scale multiple genome global alignments. Supports unlimited length gapped-seed patterns and unique TF-IDF based filtering.

Murasaki is an anchor alignment software, which is

  • exteremely fast (17 CPU hours for whole Human x Mouse genome (with 40 nodes: 52 wall minutes))
  • scalable (Arbitrarily parallelizable across multiple nodes using MPI. Even a single node with 16GB of ram can handle over 1Gbp of sequence.)
  • unlimited pattern length
  • repeat tolerant
  • intelligent noise reduction

This package provides the MPI-enabled binary for murasaki. While this will speed up operation on multi-processor machines it will slow down on a single processor.

Please cite: Kris Popendorf, Hachiya Tsuyoshi, Yasunori Osana and Yasubumi Sakakibara: Murasaki: A Fast, Parallelizable Algorithm to Find Anchors from Multiple Genomes. (PubMed,eprint) PLOS one 5(9):e12651 (2010)
muscle
programme d'alignements multiples de séquences de protéine
Versions of package muscle
ReleaseVersionArchitectures
bookworm5.1.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid5.1.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie5.1.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie3.8.31-1amd64,armel,armhf,i386
stretch3.8.31+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster3.8.1551-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.8.1551-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package muscle:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 22 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

MUSCLE est un programme d'alignements multiples de séquences de protéine. L'acronyme MUSCLE signifie « MUltiple Sequence Comparison by Log-Expectation ». D'après les tests des auteurs, MUSCLE réalise les meilleurs résultats de tous les programmes testés sur plusieurs bancs de mesure concernant la précision d'alignement et est aussi un des plus rapides.

Muscle v5 est une réécriture majeure de MUSCLE basée sur de nouveaux algorithmes.

Les utilisateurs doivent faire attention à ce que les arguments de ligne de commande ne sont plus les mêmes que ceux des versions 3.x de MUSCLE.

Meilleure précision, extensible à des milliers de séquences

Comparé aux version précédentes, Muscle v5 est plus précis, souvent plus rapide et extensible à des ensembles de données plus grands. Au moment de son écriture (fin 2021), Muscle v5 réalise les meilleurs scores sur plusieurs bancs d’essai dont Balibase, Bralibase, Prefab et Balifam. Il peut aligner des milliers de séquences avec une grande précision sur un ordinateur de bas prix (par exemple, un CPU 8 cœurs d’Intel avec 32 Gb de RAM). Pour de grands ensembles de données, Muscle v5 est 20 à 30 % plus précis que MAFFT et Clustal-Omega.

Ensembles d’alignements

Muscle v5 peut générer des ensembles d’alignements alternatifs de haute précision. Toutes les réplications ont une précision moyenne égale lors de test sur banc d’essai, y compris les alignements multiples de séquences avec les paramètres par défaut. En comparant les résultats d’analyse en aval (arbres, prédiction de structure…) de différentes réplications, il est possible d’évaluer les effets des erreurs d’alignements lors d’études.

Please cite: Robert C. Edgar: MUSCLE: multiple sequence alignment with high accuracy and high throughput. (PubMed,eprint) Nucleic Acids Research 32(5):1792-1797 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
Screenshots of package muscle
muscle3
multiple alignment program of protein sequences
Versions of package muscle3
ReleaseVersionArchitectures
bookworm3.8.1551-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.8.1551-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid3.8.1551-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

MUSCLE is a multiple alignment program for protein sequences. MUSCLE stands for multiple sequence comparison by log-expectation. In the authors tests, MUSCLE achieved the highest scores of all tested programs on several alignment accuracy benchmarks, and is also one of the fastest programs out there.

This is version 3 of the muscle program. It is a different program than muscle version 5 which is packaged as muscle in Debian.

Please cite: Robert C. Edgar: MUSCLE: multiple sequence alignment with high accuracy and high throughput. (PubMed,eprint) Nucleic Acids Research 32(5):1792-1797 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
mustang
alignement structurel multiple de protéines
Versions of package mustang
ReleaseVersionArchitectures
stretch3.2.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm3.2.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.2.3-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.2.2-1amd64,armel,armhf,i386
bullseye3.2.3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.2.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.2.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package mustang:
biologypeptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing, comparing
works-with-formatplaintext
Popcon: 16 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Mustang est un algorithme pour aligner des structures multiples de protéines. Avec un ensemble donné de fichiers PDB, le programme utilise l'information spatiale dans les atomes Calpha de l'ensemble pour produire une séquence d'alignement. Basé sur un appairage heuristique progressif, l'algorithme traite ensuite un certain nombre de repasses d'affinage. Mustang rapporte les alignements de séquence multiples et la superposition de structures correspondantes.

The package is enhanced by the following packages: mustang-testdata
Please cite: Arun S. Konagurthu, James C. Whisstock, Peter J. Stuckey and Arthur M. Lesk: MUSTANG: A multiple structural alignment algorithm. (PubMed) Proteins: Structure, Function, and Bioinformatics 64(3):559-574 (2006)
Registry entries: Bio.tools 
Screenshots of package mustang
nanofilt
filtrage et ajustement de données de séquençage de longues lectures
Versions of package nanofilt
ReleaseVersionArchitectures
bullseye2.6.0-3all
sid2.8.0-1all
bookworm2.8.0-1all
Popcon: 3 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Filtrage et ajustement de données de séquençage de longues lectures. Filtrage selon la qualité ou la longueur de lecture et, facultativement, ajustage après application de filtres. Lectures à partir de stdin, écritures sur stdout. De manière facultative, lecture directement à partir d’un fichier non compressé indiqué sur la ligne de commande.

Conception destinée à une utilisation :

 1. Directement après une extraction fastq ;
 2. Avant un mappage ;
 3. Dans un flux entre extraction et mappage.
Please cite: Wouter De Coster, Svenn D'Hert, Darrin T. Schultz and Christine Van Broeckhoven: NanoPack: visualizing and processing long-read sequencing data. Bioinformatics 34 (2018)
Registry entries: Bioconda 
nanolyse
remove lambda phage reads from a fastq file
Versions of package nanolyse
ReleaseVersionArchitectures
bullseye1.2.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

NanoLyse is a tool for rapid removal of contaminant DNA, using the Minimap2 aligner through the mappy Python binding. A typical application would be the removal of the lambda phage control DNA fragment supplied by ONT, for which the reference sequence is included in the package. However, this approach may lead to unwanted loss of reads from regions highly homologous to the lambda phage genome.

Please cite: Wouter De Coster, Svenn D’Hert, Darrin T Schultz, Marc Cruts and Christine Van Broeckhoven: NanoPack: visualizing and processing long-read sequencing data. (PubMed,eprint) Bioinformatics 34(15):2666-2669 (2018)
Registry entries: Bioconda 
nanook
pre- and post-alignment analysis of nanopore sequencing data
Versions of package nanook
ReleaseVersionArchitectures
bookworm1.33+dfsg-5all
bullseye1.33+dfsg-2.1all
buster1.33+dfsg-1all
sid1.33+dfsg-5all
trixie1.33+dfsg-5all
stretch-backports1.33+dfsg-1~bpo9+1all
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

NanoOK is a flexible, multi-reference software for pre- and post- alignment analysis of nanopore sequencing data, quality and error profiles.

NanoOK (pronounced na-nook) is a tool for extraction, alignment and analysis of Nanopore reads. NanoOK will extract reads as FASTA or FASTQ files, align them (with a choice of alignment tools), then generate a comprehensive multi-page PDF report containing yield, accuracy and quality analysis. Along the way, it generates plain text files which can be used for further analysis, as well as graphs suitable for inclusion in presentations and papers.

The package is enhanced by the following packages: nanook-examples
Please cite: Richard M. Leggett, Darren Heavens, Mario Caccamo, Matthew D. Clark and Robert P. Davey: NanoOK: multi-reference alignment analysis of nanopore sequencing data, quality and error profiles. (PubMed,eprint) Bioinformatics 32(1):142-144 (2016)
Registry entries: Bio.tools 
nanopolish
identification de consensus pour les données de séquençage par nanopore
Versions of package nanopolish
ReleaseVersionArchitectures
bookworm0.14.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie0.14.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
buster0.11.0-2amd64
bullseye0.13.2-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports0.10.2-1~bpo9+1amd64
stretch0.5.0-1amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
sid0.14.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Nanopolish uses a signal-level hidden Markov model for consensus calling of nanopore genome sequencing data. It can perform signal-level analysis of Oxford Nanopore sequencing data. Nanopolish can calculate an improved consensus sequence for a draft genome assembly, detect base modifications, call SNPs and indels with respect to a reference genome and more.

Registry entries: Bio.tools  SciCrunch  Bioconda 
nanostat
statistics on long biological sequences
Versions of package nanostat
ReleaseVersionArchitectures
bookworm1.4.0-3all
bullseye1.4.0-3all
sid1.4.0-3all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

NanoStat calculates various statistics from a long read sequencing dataset in fastq, bam or albacore sequencing summary format. It is meant to augment pipelines for the interpretation of long DNA sequences as generated with the Nanopore.

This package provides the executable NanoStat.

nanosv
structural variant caller for nanopore data
Versions of package nanosv
ReleaseVersionArchitectures
bullseye1.2.4+git20190409.c1ae30c-3all
trixie1.2.4+git20190409.c1ae30c-6all
sid1.2.4+git20190409.c1ae30c-6all
bookworm1.2.4+git20190409.c1ae30c-6all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

NanoSV is a software package that can be used to identify structural genomic variations in long-read sequencing data, such as data produced by Oxford Nanopore Technologies’ MinION, GridION or PromethION instruments, or Pacific Biosciences RSII or Sequel sequencers. NanoSV has been extensively tested using Oxford Nanopore MinION sequencing data.

Please cite: Mircea Cretu Stancu, Markus J. van Roosmalen, Ivo Renkens, Marleen M. Nieboer, Sjors Middelkamp, Joep de Ligt, Giulia Pregno, Daniela Giachino, Giorgia Mandrile, Jose Espejo Valle-Inclan, Jerome Korzelius, Ewart de Bruijn, Edwin Cuppen, Michael E. Talkowski, Tobias Marschall, Jeroen de Ridder and Wigard P. Kloosterman: Mapping and phasing of structural variation in patient genomes using nanopore sequencing.. (eprint) Nature Communications 8:1326 (2017)
Registry entries: Bioconda 
nast-ier
NAST-based DNA alignment tool
Versions of package nast-ier
ReleaseVersionArchitectures
buster20101212+dfsg1-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye20101212+dfsg1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie20101212+dfsg-1amd64,armel,armhf,i386
bookworm20101212+dfsg1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch20101212+dfsg1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid20101212+dfsg1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie20101212+dfsg1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The NAST-iEr alignment utility aligns a single raw nucleotide sequence against one or more NAST formatted sequences.

The alignment algorithm involves global dynamic programming profile alignment to fixed (NAST-formatted) multiply aligned template sequences without any end-gap penalty.

NAST-iEr is part of the microbiomeutil suite.

The package is enhanced by the following packages: microbiomeutil-data
Please cite: Brian J. Haas, Dirk Gevers, Ashlee M. Earl, Mike Feldgarden, Doyle V. Ward, Georgia Giannoukos, Dawn Ciulla, Diana Tabbaa, Sarah K. Highlander, Erica Sodergren, Barbara Methé, Todd Z. DeSantis, The Human Microbiome Consortium, Joseph F. Petrosino, Rob Knight and Bruce W. Birren: Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. (PubMed,eprint) Genome Research 21(3):494-504 (2011)
Registry entries: SciCrunch 
ncbi-acc-download
download genome files from NCBI by accession
Versions of package ncbi-acc-download
ReleaseVersionArchitectures
bullseye0.2.7-1all
bookworm0.2.8-1all
trixie0.2.8-2all
sid0.2.8-2all
Popcon: 2 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides a script to download sequences from GenBank/RefSeq by accession through the NCBI ENTREZ API.

Registry entries: Bioconda 
ncbi-blast+
suite d'outils de recherche de séquences BLAST de dernière génération
Versions of package ncbi-blast+
ReleaseVersionArchitectures
buster-backports2.9.0-4~bpo10+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.11.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye-backports2.12.0+ds-3~bpo11+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.8.1-1+deb10u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch-backports-sloppy2.9.0-3~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.2.29-3amd64,armel,armhf,i386
sid2.12.0+ds-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.12.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.6.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.12.0+ds-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
upstream2.15.0
Debtags of package ncbi-blast+:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
works-withbiological-sequence
Popcon: 74 users (16 upd.)*
Newer upstream!
License: DFSG free
Git

BLAST (Basic Local Alignment Search Tool) est l'outil de similarité de séquences le plus répandu. Il existe des versions de BLAST qui comparent des séquences-test de protéine à des bases de données de protéines, des séquences-test de nucléotide à des bases de données de nucléotides, ainsi que des versions qui traduisent des séquences-test ou des bases de données de nucléotides dans tous les six cadres de lecture et les comparent à des bases de données de protéines ou à des séquences-test. PSI-BLAST produit une matrice de similarité d’alignement (PSSM — position-specific-scoring- matrix) à partir d’une séquence-test de protéine, puis utilise cette PSSM pour effectuer des recherches complémentaires. Il est aussi possible de comparer une séquence-test de protéine ou de nucléotide à une base de données de PSSM. NCBI gère une page web pour BLAST sur blast.ncbi.nlm.nih.gov ainsi qu'un service réseau.

Registry entries: Bio.tools  SciCrunch  Bioconda 
ncbi-blast+-legacy
script d’appel de legacy de BLAST du NCBI
Versions of package ncbi-blast+-legacy
ReleaseVersionArchitectures
bullseye-backports2.12.0+ds-3~bpo11+1all
stretch2.6.0-1all
bookworm2.12.0+ds-3all
stretch-backports-sloppy2.9.0-3~bpo9+1all
trixie2.12.0+ds-4all
bullseye2.11.0+ds-1all
buster-backports2.9.0-4~bpo10+1all
buster2.8.1-1+deb10u1all
jessie2.2.29-3all
sid2.12.0+ds-4all
upstream2.15.0
Debtags of package ncbi-blast+-legacy:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
Popcon: 20 users (10 upd.)*
Newer upstream!
License: DFSG free
Git

Ce paquet ajoute quelques scripts de bricolage pour appeler des programmes NCBI+ avec la ligne de commande de BLAST du NCBI. Il utilise le script legacy_blast du paquet ncbi-blast+.

Registry entries: Bio.tools  SciCrunch  Bioconda 
ncbi-entrez-direct
NCBI Entrez utilities on the command line
Versions of package ncbi-entrez-direct
ReleaseVersionArchitectures
bullseye14.6.20210224+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch6.10.20170123+ds-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm19.0.20230216+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie19.2.20230331+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster10.9.20190219+ds-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid19.2.20230331+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream21.7.20240322
Popcon: 5 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Entrez Direct (EDirect) is an advanced method for accessing NCBI's set of interconnected databases (publication, sequence, structure, gene, variation, expression, etc.) from a terminal window or script. Functions take search terms from command-line arguments. Individual operations are combined to build multi-step queries. Record retrieval and formatting normally complete the process.

EDirect also provides an argument-driven function that simplifies the extraction of data from document summaries or other results that are returned in structured XML format. This can eliminate the need for writing custom software to answer ad hoc questions. Queries can move seamlessly between EDirect commands and UNIX utilities or scripts to perform actions that cannot be accomplished entirely within Entrez.

ncbi-epcr
outil pour vérifier la présence d'un marqueur dans une séquence d'ADN
Versions of package ncbi-epcr
ReleaseVersionArchitectures
jessie2.3.12-1-2amd64,armel,armhf,i386
sid2.3.12-1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.3.12-1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.3.12-1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.3.12-1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.3.12-1-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch2.3.12-1-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package ncbi-epcr:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usechecking, searching
works-with-formatplaintext
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

« Electronic PCR » (« e-PCR ») est une procédure de calcul utilisée pour tester la présence de séquences uniques d'ADN (en anglais : STS, sequence tagged sites) dans une séquence génomique. e-PCR recherche de potentielles STS dans des séquences génomiques en recherchant des sous-séquences très similaires aux amorces de PCR (en anglais : Polymerase Chain Reaction) et correctement ordonnées, orientées et espacées qui puissent représenter les amorces PCR utilisées pour générer les STS connus.

La nouvelle version de E-PCR implémente une stratégie de reconnaissance floue. Pour réduire les chances qu'une vraie STS puisse être oubliée, des mots multiples et discontinus peuvent être utilisés au lieu d'un seul mot exact. Chacun de ces mots a des groupes de positions significatives séparés par des positions « joker » qui ne sont pas requises pour correspondre. De plus il est possible d'autoriser des trous dans les alignements de l'amorce.

La principale motivation pour implémenter une recherche inversée (« Reverse e-PCR ») était de rendre possible la recherche de séquence dans le génome humain et d'autres gros génomes. La nouvelle version de e-PCR fournit un mode de recherche utilisant une requête de séquence dans une base de données.

Ce programme est abandonné par l’amont et il est conseillé d’utiliser Primer-Blast (https://www.ncbi.nlm.nih.gov/tools/primer-blast/) à la place.

Please cite: Gregory D. Schuler: Sequence Mapping by Electronic PCR. (PubMed,eprint) Genome Research 7(5):541-550 (1997)
Registry entries: Bioconda 
ncbi-seg
tool to mask segments of low compositional complexity in amino acid sequences
Versions of package ncbi-seg
ReleaseVersionArchitectures
bookworm0.0.20000620-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.0.20000620-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.0.20000620-2amd64,armel,armhf,i386
stretch0.0.20000620-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.0.20000620-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.0.20000620-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.0.20000620-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ncbi-seg (a.k.a. SEG) is a program for identifying and masking segments of low compositional complexity in amino acid sequences.

ncbi-seg divides sequences into contrasting segments of low-complexity and high-complexity. Low-complexity segments defined by the algorithm represent "simple sequences" or "compositionally-biased regions".

This program is inappropriate for masking nucleotide sequences and, in fact, may strip some nucleotide ambiguity codes from nt. sequences as they are being read.

Please cite: John C. Wootton and Scott Federhen: Statistics of local complexity in amino acid sequences and sequence databases.. Computers & Chemistry 17:149-163 (1993)
ncbi-tools-bin
bibliothèques du NCBI pour applications de biologie –⋅utilitaires en mode texte
Versions of package ncbi-tools-bin
ReleaseVersionArchitectures
jessie6.1.20120620-8amd64,armel,armhf,i386
trixie6.1.20170106+dfsg1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm6.1.20170106+dfsg1-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye6.1.20170106+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster6.1.20170106+dfsg1-0+deb10u2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch6.1.20170106+dfsg1-0+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid6.1.20170106+dfsg2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package ncbi-tools-bin:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
networkclient
roleprogram
sciencecalculation
scopeutility
useanalysing, calculating, converting, searching
works-withbiological-sequence
works-with-formatplaintext, xml
Popcon: 7 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit certains utilitaires distribués avec le kit de développement en⋅C du NCBI dont les outils de développement asntool et errhdr (antérieurement dans le paquet libncbi6-dev). Aucun des programmes de ce paquet n'a besoin de⋅X⋅; les utilitaires basés sur⋅X se trouvent dans le paquet ncbi-tools-x11. BLAST et les outils qui lui sont liés sont issus maintenant d'une base de sources différentes, correspondant aux anciens paquets ncbi-blast+ et ncbi-blast+-legacy.

The package is enhanced by the following packages: mcl
Registry entries: Bio.tools  SciCrunch 
ncbi-tools-x11
bibliothèques du NCBI pour applications de biologie –⋅utilitaires⋅X
Versions of package ncbi-tools-x11
ReleaseVersionArchitectures
sid6.1.20170106+dfsg2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch6.1.20170106+dfsg1-0+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster6.1.20170106+dfsg1-0+deb10u2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye6.1.20170106+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm6.1.20170106+dfsg1-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie6.1.20170106+dfsg1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie6.1.20120620-8amd64,armel,armhf,i386
Debtags of package ncbi-tools-x11:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics, biology:structural
interface3d, x11
networkclient
roleprogram
sciencevisualisation
scopeutility
uitoolkitmotif
useanalysing, calculating, editing, searching, viewing
x11application
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit certains utilitaires⋅X distribués avec le kit de développement en⋅C du NCBI⋅: Network Entrez, Sequin, ddv et udv. Ces programmes ne font pas partie du paquet ncbi-tools-bin car ils dépendent de nombreuses bibliothèques supplémentaires.

Registry entries: Bio.tools  SciCrunch 
Screenshots of package ncbi-tools-x11
ncl-tools
outil pour traiter avec les fichiers NEXUS
Versions of package ncl-tools
ReleaseVersionArchitectures
stretch2.1.18+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1.21+git20180827.c71b264-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.1.21+git20190531.feceb81-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.1.21+git20210811.b1213a7-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.1.21+git20210811.b1213a7-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.1.21+git20210811.b1213a7-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream2.1.21+git20231019.f845ec2
Popcon: 3 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

La bibliothèque de classe NEXUS est une bibliothèque C++ pour analyser des fichiers NEXUS.

Le format de fichier NEXUS est largement utilisé en bioinformatique. Plusieurs programmes populaires de phylogénie tels que Paup, MrBayes, Mesquite et MacClade utilisent ce format.

Please cite: Paul O. Lewis: NCL: a C++ class library for interpreting data files in NEXUS format. (PubMed,eprint) Bioinformatics 19(17):2330-2331 (2003)
ncoils
prédiction de structure secondaire de superhélice
Versions of package ncoils
ReleaseVersionArchitectures
buster2002-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2002-4amd64,armel,armhf,i386
stretch2002-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2002-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2002-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2002-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2002-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 12 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Ce programme prévoit la structure secondaire des superhélices de séquences de protéine. L’algorithme a été publié dans Lupas, van Dyke & Stock, Predicting coiled coils from protein sequences Science, 252, 1162-1164, 1991.

Please cite: Andrei Lupas, Marc Van Dyke and Jeff Stock: Predicting coiled coils from protein sequences. (PubMed) Science 252:1162-1164 (1991)
Registry entries: Bio.tools  SciCrunch 
neobio
calcul d'alignements de séquences d'acides aminés et de nucléotides
Versions of package neobio
ReleaseVersionArchitectures
sid0.0.20030929-6all
bookworm0.0.20030929-6all
buster0.0.20030929-4all
stretch0.0.20030929-2all
jessie0.0.20030929-1.1all
trixie0.0.20030929-6all
bullseye0.0.20030929-6all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit une bibliothèque et et une interface graphique utilisateur pour les alignements de séquences par paires. Il s'agit dune mise en œuvre des méthodes de programmation dynamique de Needleman & Wunsch (alignement global) et de Smith & Waterman (alignement local).

Please cite: Maxime Crochemore, Gad M. Landau and Michal Ziv-Ukelson: A sub-quadratic sequence alignment algorithm for unrestricted cost matrices. :679-688 (2002)
Registry entries: Bio.tools 
Screenshots of package neobio
ngmlr
CoNvex Gap-cost alignMents for Long Reads
Versions of package ngmlr
ReleaseVersionArchitectures
experimental0.2.7+git20210816.a2a31fb+dfsg-4~0exp0simdeamd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.2.7+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.2.7+git20210816.a2a31fb+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.2.7+git20210816.a2a31fb+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.2.7+git20210816.a2a31fb+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ngmlr is a long-read mapper designed to sensitively align PacBilo or Oxford Nanopore to (large) reference genomes. It was designed to quickly and correctly align the reads, including those spanning (complex) structural variations. Ngmlr uses an SV aware k-mer search to find approximate mapping locations for a read and then a banded Smith- Waterman alignment algorithm to compute the final alignment. Ngmlr uses a convex gap cost model that penalizes gap extensions for longer gaps less than for shorter ones to compute precise alignments.

Please cite: Fritz J. Sedlazeck, Philipp Rescheneder, Moritz Smolka, Han Fang, Maria Nattestad, Arndt von Haeseler and Michael C. Schatz: Accurate detection of complex structural variations using single-molecule sequencing. Nature Methods 15:461–468 (2018)
Registry entries: Bio.tools  SciCrunch  Bioconda 
njplot
programme de dessin d’arbre phylogénétique
Versions of package njplot
ReleaseVersionArchitectures
buster2.4-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.4-2amd64,armel,armhf,i386
sid2.4-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.4-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.4-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.4-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.4-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package njplot:
fieldbiology, biology:bioinformatics
interfacex11
roleprogram
scopeutility
uitoolkitmotif
useanalysing, editing, organizing, printing, viewing
works-withbiological-sequence
works-with-formatplaintext
x11application
Popcon: 6 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

NJplot peut dessiner n’importe quel dendrogramme exprimé dans le format Newick standard d’arbre phylogénétique (par exemple, le format utilisé par le paquet PHYLIP). NJplot est particulièrement pratique pour enraciner les arbres non enracinés obtenus par des méthodes de parcimonie, de distance ou de maximum de vraisemblance pour la construction d’arbres.

Please cite: G. Perrière and M. Gouy: WWW-query: An on-line retrieval system for biological sequence banks. (PubMed) Biochimie 78(5):364–369 (1996)
Registry entries: Bio.tools 
Screenshots of package njplot
norsnet
tool to identify unstructured loops in proteins
Versions of package norsnet
ReleaseVersionArchitectures
trixie1.0.17-7all
sid1.0.17-7all
bookworm1.0.17-7all
bullseye1.0.17-6all
buster1.0.17-4all
stretch1.0.17-2all
jessie1.0.17-1all
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

NORSnet can distinguish between very long contiguous segments with non-regular secondary structure (NORS regions) and well-folded proteins.

NORSnet was trained on predicted information rather than on experimental data. This allows NORSnet to reach into regions in sequence space that are not covered by specialized disorder predictors. One disadvantage of this approach is that it is not optimal for the identification of the "average" disordered region.

NORSnet takes the following input, further described on norsnet(1):

  • a protein sequence in a FASTA file
  • secondary structure and solvent accessibility prediction by prof(1)
  • an HSSP file
  • flexible/rigid residues prediction by profbval(1)
Please cite: Avner Schlessinger, Jinfeng Liu and Burkhard Rost: Natively unstructured loops differ from other loops.. (PubMed,eprint) PLoS Comput Biol. 3:e140 (2007)
Registry entries: Bio.tools 
norsp
predictor of non-regular secondary structure
Versions of package norsp
ReleaseVersionArchitectures
bullseye1.0.6-6all
sid1.0.6-7all
jessie1.0.6-1all
bookworm1.0.6-7all
trixie1.0.6-7all
stretch1.0.6-2all
buster1.0.6-4all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

NORSp is a publicly available predictor for disordered regions in proteins. Specifically, it predicts long regions with no regular secondary structure. Upon submission of a protein sequence, NORSp analyses the protein about its secondary structure, the presence of transmembrane helices and coiled-coils. It then returns the presence and position of disordered regions.

NORSp can be useful for biologists in several ways. For example, crystallographers can check whether their proteins contain NORS regions and make the decision about whether to proceed with the experiments since NORS proteins may be difficult to crystallise, as demonstrated by the their low occurrence in PDB. Biologists interested in protein structure-function relationship may also find it interesting to verify whether the protein-protein interaction sites coincide with NORS regions.

Please cite: Jinfeng Liu and Burkhard Rost: NORSp: Predictions of long regions without regular secondary structure.. (PubMed,eprint) Nucleic Acids Res 31(13):3833-3835 (2003)
Registry entries: Bio.tools 
ntcard
Streaming algorithm to estimate cardinality in genomics datasets
Versions of package ntcard
ReleaseVersionArchitectures
sid1.2.2+dfsg-8amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.2.2+dfsg-8amd64,arm64,mips64el,ppc64el,s390x
bookworm1.2.2+dfsg-5amd64,arm64,mips64el,ppc64el
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

As input it takes file(s) in fasta, fastq, sam, or bam formats and computes the total number of distinct k-mers, F0, and also the k-mer coverage frequency histogram, fi, i>=1.

Please cite: Hamid Mohamadi, Hamza Khan and Inanc Birol: ntCard: a streaming algorithm for cardinality estimation in genomics data. (PubMed,eprint) Bioinformatics 33(9):1324-1330 (2017)
Registry entries: Bio.tools  Bioconda 
nxtrim
Optimized trimming of Illumina mate pair reads
Versions of package nxtrim
ReleaseVersionArchitectures
bookworm0.4.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.4.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.4.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

This package helps rmove Nextera Mate Pair junction adapters and categorise reads according to the orientation implied by the adapter location.

Registry entries: Bio.tools  Bioconda 
obitools
programmes d’analyse de données NGS dans un contexte de barcoding moléculaire
Versions of package obitools
ReleaseVersionArchitectures
buster1.2.12+dfsg-2amd64
bullseye1.2.13+dfsg-3amd64
bookworm1.2.13+dfsg-5amd64
trixie1.2.13+dfsg-7amd64
sid1.2.13+dfsg-7amd64
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Les programmes OBITools visent à aider à la manipulation de données diverses et de fichiers de séquence de manière pratique en utilisant une interface Unix en ligne de commande. Ils se conforment à l’interface Unix standard pour les programmes en ligne de commande, permettant ainsi d’enchainer un ensemble de commandes en utilisant le mécanisme « pipe ».

Please cite: Frédéric Boyer, Céline Mercier, Aurélie Bonin, Yvan Le Bras, Pierre Taberlet and Eric Coissac: obitools: a unix-inspired software package for DNA metabarcoding.. (PubMed,eprint) Mol. Ecol. Resour. 16(1):176-182 (2016)
Registry entries: Bio.tools  Bioconda 
openms
package for LC/MS data management and analysis
Versions of package openms
ReleaseVersionArchitectures
trixie2.6.0+cleaned1-4all
sid2.6.0+cleaned1-4all
jessie1.11.1-5all
buster2.4.0-real-1all
bullseye2.6.0+cleaned1-3all
bookworm2.6.0+cleaned1-3all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

OpenMS is a package for LC/MS data management and analysis. OpenMS offers an infrastructure for the development of mass spectrometry-related software and powerful 2D and 3D visualization solutions.

TOPP (the OpenMS proteomic pipeline) is a pipeline for the analysis of HPLC/MS data. It consists of a set of numerous small applications that can be chained together to create analysis pipelines tailored for a specific problem.

This package is a metapackage that depends on both the libopenms library package (libOpenMS and libOpenMS_GUI) and the OpenMS Proteomic Pipeline (topp) package.

Please cite: Marc Sturm, Andreas Bertsch, Clemens Gröpl, Andreas Hildebrandt, Rene Hussong, Eva Lange, Nico Pfeifer, Ole Schulz-Trieglaff, Alexandra Zerck, Knut Reinert and Oliver Kohlbacher: OpenMS – an Open-Source Software Framework for Mass Spectrometry. (PubMed,eprint) BMC Bioinformatics 9(163) (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package openms
optimir
Integrating genetic variations in miRNA alignment
Versions of package optimir
ReleaseVersionArchitectures
bookworm1.2-1all
sid1.2-1all
bullseye1.0-3all
Popcon: 2 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

OptimiR is a miRSeq data alignment workflow. It integrates genetic information to assess the impact of variants on miRNA expression.

OptimiR: A bioinformatics pipeline designed to detect and quantify miRNAs, isomiRs and polymiRs from miRSeq data, & study the impact of genetic variations on polymiRs' expression.

Please cite: Florian Thibord, Claire Perret, Maguelonne Roux, Pierre Suchon, Marine Germain, Jean-François Deleuze, Pierre-Emmanuel Morange and David-Alexandre Trégouët: OPTIMIR, a novel algorithm for integrating available genome-wide genotype data into miRNA sequence alignment analysis. RNA (2019)
Registry entries: Bio.tools  Bioconda 
pal2nal
converts proteins to genomic DNA alignment
Versions of package pal2nal
ReleaseVersionArchitectures
trixie14.1-3all
bullseye14.1-3all
buster14.1-2all
sid14.1-3all
bookworm14.1-3all
Popcon: 8 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

PAL2NAL is a program that converts a multiple sequence alignment of proteins and the corresponding DNA (or mRNA) sequences into a codon-based DNA alignment. The program automatically assigns the corresponding codon sequence even if the input DNA sequence has mismatches with the input protein sequence, or contains UTRs, polyA tails. It can also deal with frame shifts in the input alignment, which is suitable for the analysis of pseudogenes. The resulting codon-based DNA alignment can further be subjected to the calculation of synonymous (Ks) and non-synonymous (Ka) substitution rates.

Please cite: Mikita Suyama, David Torrents and Peer Bork: PAL2NAL: robust conversion of protein sequence alignment into the corresponding codon alignments. (PubMed,eprint) Nucleic Acids Research 34:W609-W612 (2006)
Registry entries: Bio.tools  Bioconda 
paleomix
pipelines and tools for the processing of ancient and modern HTS data
Versions of package paleomix
ReleaseVersionArchitectures
sid1.3.8-1amd64,arm64
buster1.2.13.3-1amd64
trixie1.3.8-1amd64,arm64
bookworm1.3.7-3amd64,arm64
bullseye1.3.2-1amd64,arm64,mips64el,ppc64el
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The PALEOMIX pipelines are a set of pipelines and tools designed to aid the rapid processing of High-Throughput Sequencing (HTS) data: The BAM pipeline processes de-multiplexed reads from one or more samples, through sequence processing and alignment, to generate BAM alignment files useful in downstream analyses; the Phylogenetic pipeline carries out genotyping and phylogenetic inference on BAM alignment files, either produced using the BAM pipeline or generated elsewhere; and the Zonkey pipeline carries out a suite of analyses on low coverage equine alignments, in order to detect the presence of F1-hybrids in archaeological assemblages. In addition, PALEOMIX aids in metagenomic analysis of the extracts.

The pipelines have been designed with ancient DNA (aDNA) in mind, and includes several features especially useful for the analyses of ancient samples, but can all be for the processing of modern samples, in order to ensure consistent data processing.

Please cite: Mikkel Schubert, Luca Ermini, Clio Der Sarkissian, Hákon Jónsson, Aurélien Ginolhac, Robert Schaefer, Michael D Martin, Ruth Fernández, Martin Kircher, Molly McCue, Eske Willerslev and Ludovic Orlando: Characterization of ancient and modern genomes by SNP detection and phylogenomic and metagenomic analysis using PALEOMIX. (PubMed) Nature Protocols 9(5):1056-82 (2014)
Registry entries: Bio.tools  SciCrunch 
paml
PAML – analyse de phylogenèse par maximum de vraisemblance
Versions of package paml
ReleaseVersionArchitectures
jessie4.8+dfsg-1 (non-free)amd64
stretch4.8+dfsg-1 (non-free)amd64
sid4.9j+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.9j+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm4.9j+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye4.9j+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster4.9h+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package paml:
roleprogram
Popcon: 13 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

PAML (Phylogenetic Analysis by Maximum Likelihood) est un paquet pour des analyses de phylogénèse d’ADN ou de séquences de protéine utilisant le maximum de vraisemblance. PAML n’est pas adapté à la construction d’arbres. Il peut être utilisé pour estimer des paramètres et étudier des processus évolutifs après la reconstruction d’arbres faite en utilisant d’autres programmes tels PAUP*, PHYLIP, MOLPHY, PhyML, RaxML, etc.

Please cite: Ziheng Yang: PAML 4: phylogenetic analysis by maximum likelihood. (PubMed,eprint) Molecular Biology and Evolution 24(8):1586-91 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
paraclu
Parametric clustering of genomic and transcriptomic features
Versions of package paraclu
ReleaseVersionArchitectures
trixie10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie9-1amd64,armel,armhf,i386
stretch9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster9-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm10-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Paraclu finds clusters in data attached to sequences. It was first applied to transcription start counts in genome sequences, but it could be applied to other things too.

Paraclu is intended to explore the data, imposing minimal prior assumptions, and letting the data speak for itself.

One consequence of this is that paraclu can find clusters within clusters. Real data sometimes exhibits clustering at multiple scales: there may be large, rarefied clusters; and within each large cluster there may be several small, dense clusters.

Please cite: Martin C. Frith, Eivind Valen, Anders Krogh, Yoshihide Hayashizaki, Piero Carninci and Albin Sandelin: A code for transcription initiation in mammalian genomes. (eprint) Genome Research 18(1):1-12 (2008)
parasail
Aligner based on libparasail
Versions of package parasail
ReleaseVersionArchitectures
bullseye2.4.3+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.6.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.6.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.6+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

This package contains a command-line aligner based on libparasail. Parasail is a SIMD C library containing implementations of the Smith-Waterman, Needleman-Wunsch, and various semi-global pairwise sequence alignment algorithm.

parsinsert
Parsimonious Insertion of unclassified sequences into phylogenetic trees
Versions of package parsinsert
ReleaseVersionArchitectures
trixie1.04-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.04-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.04-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.04-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.04-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.04-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.04-1amd64,armel,armhf,i386
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ParsInsert efficiently produces both a phylogenetic tree and taxonomic classification for sequences for microbial community sequence analysis. This is a C++ implementation of the Parsimonious Insertion algorithm.

The package is enhanced by the following packages: parsinsert-testdata
parsnp
rapid core genome multi-alignment
Versions of package parsnp
ReleaseVersionArchitectures
bullseye1.5.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2+dfsg-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.2+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.7.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.0.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Parsnp was designed to align the core genome of hundreds to thousands of bacterial genomes within a few minutes to few hours. Input can be both draft assemblies and finished genomes, and output includes variant (SNP) calls, core genome phylogeny and multi-alignments. Parsnp leverages contextual information provided by multi-alignments surrounding SNP sites for filtration/cleaning, in addition to existing tools for recombination detection/filtration and phylogenetic reconstruction.

Please cite: Todd J. Treangen, Brian D. Ondov, Sergey Koren and Adam M. Phillippy: The Harvest suite for rapid core-genome alignment and visualization of thousands of intraspecific microbial genomes. (PubMed,eprint) Genome Biology 15(11):524 (2014)
Registry entries: Bioconda 
patman
rapid alignment of short sequences to large databases
Versions of package patman
ReleaseVersionArchitectures
trixie1.2.2+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.2.2+dfsg-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.2.2+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.2+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.2.2+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Patman searches for short patterns in large DNA databases, allowing for approximate matches. It is optimized for searching for many small pattern at the same time, for example microarray probes.

Please cite: Kay Prüfer, Udo Stenzel, Michael Dannemann, Richard E Green, Michael Lachmann and Janet Kelso: PatMaN: rapid alignment of short sequences to large databases. (PubMed,eprint) Bioinformatics 24(13):1530-1 (2008)
Registry entries: Bio.tools  SciCrunch 
pbdagcon
sequence consensus using directed acyclic graphs
Versions of package pbdagcon
ReleaseVersionArchitectures
sid0.3+git20180411.c14c422+dfsg-8amd64,arm64,mips64el,ppc64el,riscv64
bookworm0.3+git20180411.c14c422+dfsg-8amd64,arm64,mips64el,ppc64el
bullseye0.3+git20180411.c14c422+dfsg-1amd64,arm64,mips64el,ppc64el
buster0.3+git20161121.0000000+ds-1.1amd64,arm64,mips64el,ppc64el
stretch0.3+20161121+ds-1amd64,arm64,mips64el,ppc64el
trixie0.3+git20180411.c14c422+dfsg-8amd64,arm64,mips64el,ppc64el
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

pbdagcon is a tool that implements DAGCon (Directed Acyclic Graph Consensus) which is a sequence consensus algorithm based on using directed acyclic graphs to encode multiple sequence alignment.

It uses the alignment information from blasr to align sequence reads to a "backbone" sequence. Based on the underlying alignment directed acyclic graph (DAG), it will be able to use the new information from the reads to find the discrepancies between the reads and the "backbone" sequences. A dynamic programming process is then applied to the DAG to find the optimum sequence of bases as the consensus. The new consensus can be used as a new backbone sequence to iteratively improve the consensus quality.

While the code is developed for processing PacBio(TM) raw sequence data, the algorithm can be used for general consensus purpose. Currently, it only takes FASTA input. For shorter read sequences, one might need to adjust the blasr alignment parameters to get the alignment string properly.

The code and the underlying graphical data structure have been used for some algorithm development prototyping including phasing reads and pre-assembly.

Registry entries: Bioconda 
pbhoney
genomic structural variation discovery
Versions of package pbhoney
ReleaseVersionArchitectures
stretch15.8.24+dfsg-2all
trixie15.8.24+dfsg-7all
sid15.8.24+dfsg-7all
bullseye15.8.24+dfsg-7all
buster15.8.24+dfsg-3all
bookworm15.8.24+dfsg-7all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PBHoney is an implementation of two variant-identification approaches designed to exploit the high mappability of long reads (i.e., greater than 10,000 bp). PBHoney considers both intra-read discordance and soft-clipped tails of long reads to identify structural variants.

PBHoney is part of the PBSuite.

pbjelly
genome assembly upgrading tool
Versions of package pbjelly
ReleaseVersionArchitectures
bookworm15.8.24+dfsg-7all
buster15.8.24+dfsg-3all
sid15.8.24+dfsg-7all
bullseye15.8.24+dfsg-7all
stretch15.8.24+dfsg-2all
trixie15.8.24+dfsg-7all
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PBJelly is a highly automated pipeline that aligns long sequencing reads (such as PacBio RS reads or long 454 reads in fasta format) to high-confidence draft assembles. PBJelly fills or reduces as many captured gaps as possible to produce upgraded draft genomes.

PBJelly is part of the PBSuite.

pbsim
simulateur pour les lectures de séquences de PacBio
Versions of package pbsim
ReleaseVersionArchitectures
bullseye1.0.3+git20180330.e014b1d+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.3-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.3+git20180330.e014b1d+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0.3+git20180330.e014b1d+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.3+git20180330.e014b1d+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.0.3+git20180330.e014b1d+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Les séquenceurs d’ADN PacBio produisent deux types de lectures caractéristiques : CSS (courtes et taux d’erreur bas) et CLR (longues et taux d’erreur haut), tous deux pouvant être utiles pour les assemblages de novo de génomes. PBSIM simule de telles lectures PacBio à partir d’une séquence de référence en utilisant soit une simulation basée sur un modèle ou basé un échantillonnage. Les lectures simulées sont utiles, par exemple, lors du développement ou l’évaluation d’assembleurs de séquences destinés aux données de PacBio.

Please cite: Yukiteru Ono, Kiyoshi Asai and Michiaki Hamada: PBSIM: PacBio reads simulator - toward accurate genome assembly. (PubMed,eprint) Bioinformatics 29(1):119-121 (2013)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
pbsuite
software for Pacific Biosciences sequencing data
Versions of package pbsuite
ReleaseVersionArchitectures
stretch15.8.24+dfsg-2all
trixie15.8.24+dfsg-7all
buster15.8.24+dfsg-3all
bullseye15.8.24+dfsg-7all
bookworm15.8.24+dfsg-7all
sid15.8.24+dfsg-7all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

The PBSuite contains two projects created for analysis of Pacific Biosciences long-read sequencing data.

  • PBJelly - genome upgrading tool
  • PBHoney - structural variation discovery
pdb2pqr
Preparation of protein structures for electrostatics calculations
Versions of package pdb2pqr
ReleaseVersionArchitectures
stretch2.1.1+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm3.5.2+dfsg-3all
trixie3.6.1+dfsg-1all
jessie1.9.0+dfsg-1amd64,armel,armhf,i386
buster2.1.1+dfsg-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.1.1+dfsg-7+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.6.1+dfsg-1all
upstream3.6.2
Popcon: 10 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

PDB2PQR is a Python software package that automates many of the common tasks of preparing structures for continuum electrostatics calculations. It thus provides a platform-independent utility for converting protein files in PDB format to PQR format. These tasks include:

  • Adding a limited number of missing heavy atoms to biomolecular structures
  • Determining side-chain pKas
  • Placing missing hydrogens
  • Optimizing the protein for favorable hydrogen bonding
  • Assigning charge and radius parameters from a variety of force fields
Please cite: Todd J Dolinsky, Paul Czodrowski, Hui Li, Jens E Nielsen, Jan H Jensen, Gerhard Klebe and Nathan A Baker: PDB2PQR: Expanding and upgrading automated preparation of biomolecular structures for molecular simulations. (PubMed,eprint) Nucleic Acids Research 35:W522-5 (2007)
perlprimer
Conception graphique d'amorce de PCR
Versions of package perlprimer
ReleaseVersionArchitectures
stretch1.2.3-1all
bullseye1.2.4-2all
buster1.2.4-1all
sid1.2.4-2all
trixie1.2.4-2all
bookworm1.2.4-2all
jessie1.1.21-2all
Debtags of package perlprimer:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:molecular
interfacex11
networkclient
roleprogram
scopeutility
uitoolkittk
useanalysing
works-with-formatplaintext
x11application
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PerlPrimer est un logiciel libre écrit en Perl. C'est une interface graphique qui permet la conception d'amorce (« primer ») de PCR (pour « Polymerase Chain Reaction »), de « bisulphite PCR », de PCR temps réel et de séquençage. Il vise à automatiser et simplifier le processus de conception des amorces.

S'il est utilisé en ligne, l'outil communique proprement avec le projet Ensembl pour un meilleur aperçu de la structure génétique, par exemple pour permettre de prendre l'emplacement des exons et introns en compte pour la conception des amorces. Les séquences peuvent, elles aussi, être sauvegardées.

Please cite: Owen J. Marshall: PerlPrimer: cross-platform, graphical primer design for standard, bisulphite and real-time PCR. (PubMed,eprint) Bioinformatics 20(15):2471-2472 (2004)
Registry entries: SciCrunch 
perm
efficient mapping of short reads with periodic spaced seeds
Versions of package perm
ReleaseVersionArchitectures
stretch0.4.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.4.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.4.0-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.4.0-1amd64,armel,armhf,i386
bookworm0.4.0-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.4.0-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.4.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PerM is a software package which was designed to perform highly efficient genome scale alignments for hundreds of millions of short reads produced by the ABI SOLiD and Illumina sequencing platforms. Today PerM is capable of providing full sensitivity for alignments within 4 mismatches for 50bp SOLID reads and 9 mismatches for 100bp Illumina reads.

Please cite: Yangho Chen, Tade Souaiaia and Ting Chen: PerM: efficient mapping of short sequencing reads with periodic full sensitive spaced seeds. (PubMed,eprint) Bioinformatics 25(19):2514-21 (2009)
Registry entries: Bio.tools  SciCrunch 
pftools
build and search protein and DNA generalized profiles
Versions of package pftools
ReleaseVersionArchitectures
trixie3.2.12-1amd64
bookworm3.2.12-1amd64
buster3+dfsg-3amd64
stretch-backports3+dfsg-3~bpo9+1amd64
sid3.2.12-1amd64
bullseye3.2.6-1amd64
Popcon: 12 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

The pftools package contains all the software necessary to build protein and DNA generalized profiles and use them to scan and align sequences, and search databases.

File formats used by the pftools

  • Generalized profiles format and syntax.
  • The multiple sequence alignment format (PSA).
  • The extended header multiple sequence alignment format (XPSA).

Programs to build generalized profiles

 pfmake
   Build a profile from a multiple sequence alignment.
 pfscale
   Fit parameters of an extreme-value distribution to a profile score list.
 pfw
   Weight sequences of a multiple sequence alignment to correct for
   sampling bias.

Programs to search with generalized profiles

 pfsearch / pfsearchV3
   Search a protein or DNA sequence library for sequence segments matching
   a profile (V3 is the new version of this tool).
 pfscan
   Scan a protein or DNA sequence with a profile library

Conversion programs

 psa2msa
   Reformat PSA file to Pearson/Fasta multiple sequence alignment file.
 ptof
   Convert a protein profile into a frame-search profile to search DNA
   sequences. To be used with 2ft.
 2ft
   Converts both strands of DNA into so-called interleaved
   frame-translated DNA sequences to search with protein profiles. To be
   used with ptof.
 6ft
   Translates all six reading frames of a double-stranded DNA sequence
   into individual protein sequences.
 pfgtop
   Convert a profile in GCG format into PROSITE format.
 pfhtop
   Convert a HMMER1 ASCII-formatted HMM into an equivalent PROSITE profile.
 ptoh
   Converts a generalized profile into an approximately equivalent HMM
   profile in HMMER1 format (can be read by the hmmconvert program from
   the HMMER2 package).
Please cite: Christian J. A. Sigrist, Lorenzo Cerutti, Nicolas Hulo, Alexandre Gattiker, Laurent Falquet, Marco Pagni, Amos Bairoch and Philipp Bucher: PROSITE: a documented database using patterns and profiles as motif descriptors. (PubMed,eprint) Briefings in Bioinformatics 3(3):265-74 (2002)
Registry entries: Bio.tools 
phast
phylogenetic analysis with space/time models
Versions of package phast
ReleaseVersionArchitectures
bullseye1.5+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.6+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.6+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.6+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.4+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PHAST is a software package for comparative and evolutionary genomics. It consists of about half a dozen major programs, plus more than a dozen utilities for manipulating sequence alignments, phylogenetic trees, and genomic annotations. For the most part, PHAST focuses on two kinds of applications: the identification of novel functional elements, including protein-coding exons and evolutionarily conserved sequences; and statistical phylogenetic modeling, including estimation of model parameters, detection of signatures of selection, and reconstruction of ancestral sequences.

PHAST does not support phylogeny reconstruction or sequence alignment, and it is designed for use with DNA sequences only (see Comparison).

Please cite: Melissa J. Hubisz, Katherine S. Pollard and Adam Siepel: PHAST and RPHAST: phylogenetic analysis with space/time models. (PubMed,eprint) Bioinformatics 12(1):41-51 (2011)
Registry entries: SciCrunch  Bioconda 
phipack
PHI test and other tests of recombination
Versions of package phipack
ReleaseVersionArchitectures
stretch0.0.20160614-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.0.20160614-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.0.20160614-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.0.20160614-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.0.20160614-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.0.20160614-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The PhiPack software package implements a few tests for recombination and can produce refined incompatibility matrices as well. Specifically, PHIPack implements the 'Pairwise Homoplasy Index', Maximum Chi2 and the 'Neighbour Similarity Score'. The program Phi can be run to produce a p-value of recombination within a data set and the program profile can be run to determine regions exhibiting strongest evidence mosaicism.

Please cite: Trevor C. Bruen, Hervé Philippe and David Bryant: A Simple and Robust Statistical Test for Detecting the Presence of Recombination. (PubMed,eprint) Genetics 172(4):2665-2681 (2006)
Registry entries: Bioconda 
phybin
binning/clustering newick trees by topology
Versions of package phybin
ReleaseVersionArchitectures
trixie0.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.3-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.3-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.3-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PhyBin is a simple command line tool that classifies a set of Newick tree files by their topology. The purpose of it is to take a large set of tree files and browse through the most common tree topologies.

It can do simple binning of identical trees or more complex clustering based on an all-to-all Robinson-Foulds distance matrix.

phybin produces output files that characterize the size and contents of each bin or cluster (including generating GraphViz-based visual representations of the tree topologies).

Please cite: Ryan R. Newton and Irene L.G. Newton: PhyBin: binning trees by topology. (PubMed,eprint) PeerJ 1:e187 (2013)
phylip
paquet de programmes pour déduire les phylogénies
Versions of package phylip
ReleaseVersionArchitectures
sid3.697+dfsg-3armel,armhf
sid3.697+dfsg-4amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
trixie3.697+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie3.696+dfsg-1amd64,armel,armhf,i386
stretch3.696+dfsg-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster3.697+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.697+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.697+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package phylip:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 36 users (16 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet PHYLogeny Inference est un paquet de programmes de déduction de phylogénies (arborescences évolutives) à partir de séquences. Les méthodes disponibles dans le paquet sont la parcimonie, la matrice de distance et les méthodes de probabilité dont le bootstrap et les arbres de consensus. Les types de données prises en charge sont notamment les séquences moléculaires, les fréquences de gène, les sites de restriction, les matrices de distance et les caractères discrets [0;1].

Registry entries: Bio.tools  SciCrunch  Bioconda 
phylonium
Fast and Accurate Estimation of Evolutionary Distances
Versions of package phylonium
ReleaseVersionArchitectures
bullseye1.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.6-1armel,armhf,i386
sid1.7-2amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm1.6-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

This is the phylonium program for estimating the evolutionary distances between closely related genomes. It is much faster than alignment based approaches for phylogeny reconstruction and usually more accurate than competing alignment-free methods.

Topics: Phylogenetics
phyml
estimation phylogénétique utilisant la probabilité maximale
Versions of package phyml
ReleaseVersionArchitectures
bookworm3.3.20220408-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.3.20220408-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid3.3.20220408-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie20120412-2amd64,armel,armhf,i386
stretch3.2.0+dfsg-7amd64,arm64,armhf,i386
buster3.3.20180621-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.3.20200621-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package phyml:
biologypeptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing, comparing
works-withbiological-sequence
Popcon: 20 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

PhyML est un logiciel qui estime la probabilité maximale de phylogénies à partir d'alignements de séquences de nucléotides ou d'acides aminés . Il fournit de nombreuses options qui ont été conçues pour faciliter les analyses phylogénétiques classiques. Les principales forces du logiciel PhyML reposent sur la grande quantité de modèles de substitution couplés avec de nombreuses options pour rechercher l'espace des topologies d'arbres phylogénétiques, allant de méthodes très rapides et efficaces à des approches moins rapides mais généralement plus précises. Il met également en œuvre deux méthodes pour évaluer les supports de branches dans une structure statistique fiable (le test du ratio de l'amorçage sans paramètre et de la probabilité approximative).

Le logiciel PhyML a été conçu pour traiter des ensembles de données modérés à volumineux. En théorie, les alignements jusqu'à 4 000 séquences de 2 000 000 symboles de longueur peuvent être analysés. Cependant, en pratique, la quantité de mémoire nécessaire pour traiter un ensemble de données est proportionnelle au produit du nombre de séquences par leur longueur. Par conséquent, un grand nombre de séquences peuvent seulement être traitées pour autant qu'elles soient courtes. Le logiciel PhyML peut aussi manipuler des séquences longues mais peu nombreuses. Avec les ordinateurs personnels les plus classiques, la « zone de confort » du logiciel PhyML se situe généralement entre 3 et 500 séquences de moins de 2 000 symboles de longueur.

Ce paquet fournit aussi PhyTime.

Please cite: Stéphane Guindon: Bayesian estimation of divergence times from large sequence alignments. (PubMed,eprint) Molecular Biology and Evolution 27(8):1768-81 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package phyml
physamp
sample sequence alignment corresponding to phylogeny
Versions of package physamp
ReleaseVersionArchitectures
bullseye1.1.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.1.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.1.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.2.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The PhySamp package currently contains two programs: bppphysamp, which samples sequences according to their similarity, and bppalnoptim, which samples a sequence alignment by removing sequences in order to maximize the number of sites suitable for a given analysis. The bppalnoptim program has three running modes:

  • Interactive: the user will be iteratively proposed a set of choices for sequence removal, with their corresponding site gains. The procedure stops when the user does not want to remove more sequences, and the resulting filtered alignment is written.
  • Automatic: the user enters an a priori criterion for stopping the filtering procedure (for instance a minimum number of sequences to keep).
  • Diagnostic: this mode allows one to plot the trade-off curve, by showing the site gain as a function of the number of removed sequences.
Please cite: Julien Y. Dutheil and Emeric Figuet: Optimization of sequence alignments according to the number of sequences vs. number of sites trade-off. (PubMed,eprint) BMC Bioinformatics 16:160 (2015)
phyutility
simple analyses or modifications on both phylogenetic trees and data matrices
Versions of package phyutility
ReleaseVersionArchitectures
sid2.7.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.7.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.7.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.7.3-1amd64,armel,armhf,i386
bookworm2.7.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.7.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster2.7.3+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Phyutility (fyoo-til-i-te) is a command line program that performs simple analyses or modifications on both trees and data matrices.

Currently it performs the following functions (to suggest another feature, submit an Issue and use the label Type-Enhancement) :

Trees

  • rerooting
  • pruning
  • type conversion
  • consensus
  • leaf stability
  • lineage movement
  • tree support

Data Matrices

  • concatenate alignments
  • genbank parsing
  • trimming alignments
  • search NCBI
  • fetch NCBI
Please cite: Stephen A. Smith and Casey W. Dunn: Phyutility: a phyloinformatics utility for trees, alignments, and molecular data. (PubMed,eprint) Bioinformatics 24(5):715-716 (2008)
phyx
UNIX-style phylogenetic analyses on trees and sequences
Versions of package phyx
ReleaseVersionArchitectures
buster0.999+ds-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.3.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.01+ds-2+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.3.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.3+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

phyx provides a convenient, lightweight and inclusive toolkit consisting of programs spanning the wide breadth of programs utilized by researchers performing phylogenomic analyses. Modeled after Unix/GNU/Linux command line tools, individual programs perform a single task and operate on standard I/O streams. A result of this stream-centric approach is that, for most programs, only a single sequence or tree is in memory at any moment. Thus, large datasets can be processed with minimal memory requirements. phyx’s ever-growing complement of programs consists of over 35 programs focused on exploring, manipulating, analyzing and simulating phylogenetic objects (alignments, trees and MCMC logs). As with standard Unix command line tools, these programs can be piped (together with non-phyx tools), allowing the easy construction of efficient analytical pipelines.

picard-tools
Command line tools to manipulate SAM and BAM files
Versions of package picard-tools
ReleaseVersionArchitectures
stretch2.8.1+dfsg-1all
bookworm2.27.5+dfsg-2all
sid3.1.1+dfsg-1all
trixie3.1.1+dfsg-1all
bullseye2.24.1+dfsg-1all
buster2.18.25+dfsg-2amd64
jessie1.113-1all
Popcon: 13 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

SAM (Sequence Alignment/Map) format is a generic format for storing large nucleotide sequence alignments. Picard Tools includes these utilities to manipulate SAM and BAM files:

 AddCommentsToBam                  FifoBuffer
 AddOrReplaceReadGroups            FilterSamReads
 BaitDesigner                      FilterVcf
 BamIndexStats                     FixMateInformation
                                   GatherBamFiles
 BedToIntervalList                 GatherVcfs
 BuildBamIndex                     GenotypeConcordance
 CalculateHsMetrics                IlluminaBasecallsToFastq
 CalculateReadGroupChecksum        IlluminaBasecallsToSam
 CheckIlluminaDirectory            LiftOverIntervalList
 CheckTerminatorBlock              LiftoverVcf
 CleanSam                          MakeSitesOnlyVcf
 CollectAlignmentSummaryMetrics    MarkDuplicates
 CollectBaseDistributionByCycle    MarkDuplicatesWithMateCigar
 CollectGcBiasMetrics              MarkIlluminaAdapters
 CollectHiSeqXPfFailMetrics        MeanQualityByCycle
 CollectIlluminaBasecallingMetrics MergeBamAlignment
 CollectIlluminaLaneMetrics        MergeSamFiles
 CollectInsertSizeMetrics          MergeVcfs
 CollectJumpingLibraryMetrics      NormalizeFasta
 CollectMultipleMetrics            PositionBasedDownsampleSam
 CollectOxoGMetrics                QualityScoreDistribution
 CollectQualityYieldMetrics        RenameSampleInVcf
 CollectRawWgsMetrics              ReorderSam
 CollectRnaSeqMetrics              ReplaceSamHeader
 CollectRrbsMetrics                RevertOriginalBaseQualitiesAndAddMateCigar
 CollectSequencingArtifactMetrics  RevertSam
 CollectTargetedPcrMetrics         SamFormatConverter
 CollectVariantCallingMetrics      SamToFastq
 CollectWgsMetrics                 ScatterIntervalsByNs
 CompareMetrics                    SortSam
 CompareSAMs                       SortVcf
 ConvertSequencingArtifactToOxoG   SplitSamByLibrary
 CreateSequenceDictionary          SplitVcfs
 DownsampleSam                     UpdateVcfSequenceDictionary
 EstimateLibraryComplexity         ValidateSamFile
 ExtractIlluminaBarcodes           VcfFormatConverter
 ExtractSequences                  VcfToIntervalList
 FastqToSam                        ViewSam
The package is enhanced by the following packages: multiqc
Please cite: Broad Institute: Picard toolkit. Broad Institute, GitHub repository (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing; Document, record and content management
picopore
lossless compression of Nanopore files
Versions of package picopore
ReleaseVersionArchitectures
trixie1.2.0-3all
sid1.2.0-3all
bullseye1.2.0-2all
bookworm1.2.0-2all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The Nanopore is a device to determine the sequences of single moleculres of DNA. No amplification. The output is gigantic and tools like this one help to reduce it.

Over time, other means have substitute the need for this one. Upstream has halted development. Some tutorials and pipelines of the Nanopore still refer to it, though.

Registry entries: Bio.tools  Bioconda 
pigx-rnaseq
pipeline for checkpointed and distributed RNA-seq analyses
Versions of package pigx-rnaseq
ReleaseVersionArchitectures
bullseye0.0.10+ds-2all
bookworm0.1.0-1.1all
sid0.1.0-1.1all
trixie0.1.0-1.1all
upstream0.1.1
Popcon: 2 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

This package provides a automated workflow for the automated analysis of RNA-seq experiments. A series of well-accecpted tools are connected in Python scripts and controlled via snakemake. This supports the parallel execution of these workflows and provides checkpointing, such that interrupted workflows can take up their work again.

Please cite: Ricardo Wurmus, Bora Uyar, Brendan Osberg, Vedran Franke, Alexander Gosdschan, Katarzyna Wreczycka, Jonathan Ronen and and Altuna Akalin: PiGx: Reproducible Genomics Analysis Pipelines with GNU Guix. (PubMed,eprint) GigaScience 7(12):giy123 (2018)
Registry entries: SciCrunch 
piler
genomic repeat analysis
Versions of package piler
ReleaseVersionArchitectures
buster0~20140707-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0~20140707-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0~20140707-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0~20140707-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0~20140707-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0~20140707-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PILER (Parsimonious Inference of a Library of Elementary Repeats) searches a genome sequence for repetitive elements. It implements search algorithms that identify characteristic patterns of local alignments induced by certain classes of repeats.

Please cite: Robert C. Edgar and Eugene W. Myers: PILER: identification and classification of genomic repeats. (PubMed,eprint) Bioinformatics 21(suppl 1):i152-i158 (2005)
Registry entries: Bioconda 
pilercr
software for finding CRISPR repeats
Versions of package pilercr
ReleaseVersionArchitectures
bookworm1.06+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.06+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.06+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.06+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

CRISPR elements are short, highly conserved repeats in prokaryotic genomes separated by unique sequences of similar length. PILERCR is designed for the identification and analysis of CRISPR repeats.

Please cite: R. C. Edgar: PILER-CR: fast and accurate identification of CRISPR repeats. (PubMed,eprint) BMC Bioinformatics 8:18 (2007)
pilon
automated genome assembly improvement and variant detection tool
Versions of package pilon
ReleaseVersionArchitectures
sid1.24-3all
bookworm1.24-2all
bullseye1.23+dfsg-2all
buster1.23+dfsg-1all
trixie1.24-3all
stretch-backports1.22+dfsg-2~bpo9+2all
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Pilon is a software tool which can be used to:

  • Automatically improve draft assemblies
  • Find variation among strains, including large event detection Pilon requires as input a FASTA file of the genome along with one or more BAM files of reads aligned to the input FASTA file. Pilon uses read alignment analysis to identify inconsistencies between the input genome and the evidence in the reads. It then attempts to make improvements to the input genome, including:

  • Single base differences

  • Small indels
  • Larger indel or block substitution events
  • Gap filling
  • Identification of local misassemblies, including optional opening of new gaps
Please cite: Bruce J. Walker, Thomas Abeel, Terrance Shea, Margaret Priest, Amr Abouelliel, Sharadha Sakthikumar, Christina A. Cuomo, Qiandong Zeng, Jennifer Wortman, Sarah K. Young and Ashlee M. Earl: Pilon: An Integrated Tool for Comprehensive Microbial Variant Detection and Genome Assembly Improvement". (PubMed,eprint) PLOSone 9(11):e11296 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
pinfish
outils pour l’annotation de génomes en utilisant des données transcriptomiques de lectures longues
Versions of package pinfish
ReleaseVersionArchitectures
bookworm0.1.0+ds-3amd64,arm64,mips64el,ppc64el,s390x
trixie0.1.0+ds-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.1.0+ds-2amd64,arm64,mips64el,ppc64el,s390x
sid0.1.0+ds-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The toolchain is composed of the following tools: 1. spliced_bam2gff – a tool for converting sorted BAM files containing spliced alignments into GFF2 format. Each read will be represented as a distinct transcript. This tool comes handy when visualizing spliced reads at particular loci and to provide input to the rest of the toolchain.

  1. cluster_gff – this tool takes a sorted GFF2 file as input and clusters together reads having similar exon/intron structure and creates a rough consensus of the clusters by taking the median of exon boundaries from all transcripts in the cluster.

  2. polish_clusters – this tool takes the cluster definitions generated by cluster_gff and for each cluster creates an error corrected read by mapping all reads on the read with the median length and polishing it using racon. The polished reads can be mapped to the genome using minimap2 or GMAP.

  3. collapse_partials – this tool takes GFFs generated by either cluster_gff or polish_clusters and filters out transcripts which are likely to be based on RNA degradation products from the 5' end. The tool clusters the input transcripts into "loci" by the 3' ends and discards transcripts which have a compatible transcripts in the loci with more exons.

pique
software pipeline for performing genome wide association studies
Versions of package pique
ReleaseVersionArchitectures
trixie1.0-7all
bullseye1.0-2all
sid1.0-7all
bookworm1.0-6all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PIQUE is a software pipeline for performing genome wide association studies (GWAS). The main function of PIQUE is to provide ‘convenience’ wrappers that allow users to perform GWAS using the popular program EMMAX (Kang et al., 2010) without the need to be familiar with all of the software tools used to generate the required EMMAX input files. PIQUE will also perform a number of quality control steps prior to running EMMAX, ensuring that the various input data files are in the correct format. PIQUE proceeds in two main stages although there are multiple entry and exit points from which the pipeline can be run. The first stage consists of running the “pique-input” program, which can read genotype and phenotype information in several different formats and generates all the necessary input files required to run EMMAX. The second step in the pipeline uses the “pique-run” program to actually run EMMAX using the files generated by “pique-input” (or pre-existing user-supplied input files) to perform the GWAS and output the analysis summary files.

The package is enhanced by the following packages: pique-doc
pirs
Profile based Illumina pair-end Reads Simulator
Versions of package pirs
ReleaseVersionArchitectures
stretch2.0.2+dfsg-5.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.0.2+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.0.2+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.0.2+dfsg-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.0.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.0.2+dfsg-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The program pIRS can be used for simulating Illumina PE reads, with a series of characters generated by Illumina sequencing platform, such as insert size distribution, sequencing error(substitution, insertion, deletion), quality score and GC content-coverage bias.

The insert size follows a normal distribution, so users should set the mean value and standard deviation. Usually the standard deviation is set as 1/20 of the mean value. The normal distribution by Box-Muller method is simulated.

The program simulates sequencing error, quality score and GC content- coverage bias according to the empirical distribution profile. Some default profiles counted from lots of real sequencing data are provided.

To simulate reads from diploid genome, users should simulate the diploid genome sequence firstly by setting the ratio of heterozygosis SNP, heterozygosis InDel and structure variation.

Please cite: Xuesong Hu, Jianying Yuan, Yujian Shi, Jianliang Lu, Binghang Liu, Zhenyu Li, Yanxiang Chen, Desheng Mu, Hao Zhang, Nan Li, Zhen Yue, Fan Bai, Heng Li and Wei Fan: pIRS: Profile-based Illumina pair-end reads simulator. (PubMed,eprint) Bioinformatics 28(11):1533-5 (2012)
Registry entries: Bioconda 
pizzly
identification de fusions de gènes dans des données de séquençage d’ARN
Versions of package pizzly
ReleaseVersionArchitectures
sid0.37.3+ds-9amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye0.37.3+ds-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.37.3+ds-9amd64,arm64,mips64el,ppc64el,s390x
trixie0.37.3+ds-9amd64,arm64,mips64el,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

For the interpretation of the transcriptome (the abundance and sequence of RNA) of tomour cells one is particularly interested in transcripts that cannot be mapped to single genes but that are seen to be fused as parts from two genes. Likely eplanations are chromosomal translocations.

Pizzly can identify novel such peculiarities, building on interpretations on variable splicing by the tool kallisto. Both tools are elements of the bcbio workflow.

Registry entries: Bioconda 
placnet
Plasmid Constellation Network project
Versions of package placnet
ReleaseVersionArchitectures
buster1.03-3all
sid1.04-1all
trixie1.04-1all
bookworm1.04-1all
bullseye1.03-3all
stretch1.03-2all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Placnet is a new tool for plasmid analysis in NGS projects. Placnet is optimized to work with Illumina sequences but it also works with 454, Iontorrent or any of the actual sequence technologies.

The input of placnet is a set of contigs and one or more SAM files with the mapping of the reads against the contigs. Placnet obtains a set of files, easily opened on Cytoscape software or other network tools.

Please cite: Val F. Lanza, María de Toro, M. Pilar Garcillán-Barcia, Azucena Mora, Jorge Blanco, Teresa M. Coque and Fernando de la Cruz: Plasmid Flux in Escherichia coli ST131 Sublineages, Analyzed by Plasmid Constellation Network (PLACNET), a New Method for Plasmid Reconstruction from Whole Genome Sequences. (PubMed,eprint) PLOS 10(12):e1004766 (2014)
plasmidid
mapping-based, assembly-assisted plasmid identification tool
Versions of package plasmidid
ReleaseVersionArchitectures
sid1.6.5+dfsg-2amd64,arm64
bookworm1.6.5+dfsg-2amd64
bullseye1.6.3+dfsg-3amd64
trixie1.6.5+dfsg-2amd64,arm64
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PlasmidID is a mapping-based, assembly-assisted plasmid identification tool that analyzes and gives graphic solution for plasmid identification.

PlasmidID is a computational pipeline that maps Illumina reads over plasmid database sequences. The k-mer filtered, most covered sequences are clustered by identity to avoid redundancy and the longest are used as scaffold for plasmid reconstruction. Reads are assembled and annotated by automatic and specific annotation. All information generated from mapping, assembly, annotation and local alignment analyses is gathered and accurately represented in a circular image which allow user to determine plasmidic composition in any bacterial sample.

Registry entries: Bioconda 
plasmidomics
dessin de plasmides et de vecteurs avec export de graphiques en PostScript
Versions of package plasmidomics
ReleaseVersionArchitectures
bookworm0.2.0-10all
jessie0.2.0-3all
trixie0.2.0-10all
sid0.2.0-10all
bullseye0.2.0-9all
buster0.2.0-7all
stretch0.2.0-5all
Debtags of package plasmidomics:
fieldbiology, biology:molecular
interfacex11
roleprogram
scopeutility
uitoolkittk
works-withimage:vector
works-with-formatpostscript
x11application
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Plasmidomics a été conçu pour faciliter le dessin de plasmides et de vecteurs dans le but de les utiliser dans des thèses, des présentations ou toute autre forme de publication. Il permet d'exporter les graphiques au format PostScript.

Screenshots of package plasmidomics
plasmidseeker
identification of known plasmids from whole-genome sequencing reads
Versions of package plasmidseeker
ReleaseVersionArchitectures
trixie1.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PlasmidSeeker is a k-mer based program for the identification of known plasmids from bacterial whole genome sequencing reads.

PlasmidSeeker that enables the detection of plasmids from bacterial WGS data without read assembly. The PlasmidSeeker algorithm is based on k-mers and uses k-mer abundance to distinguish between plasmid and bacterial sequences. The performance of PlasmidSeeker was tested on a set of simulated and real bacterial WGS samples, resulting in 100% sensitivity and 99.98% specificity.

Please cite: Märt Roosaare, Mikk Puustusmaa, Märt Möls, Mihkel Vaher and Maido Remm: PlasmidSeeker: identification of known plasmids from bacterial whole genome sequencing reads. (PubMed,eprint) PeerJ - Life & Environment 6:e4588 (2018)
plast
Parallel Local Sequence Alignment Search Tool
Versions of package plast
ReleaseVersionArchitectures
sid2.3.2+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.3.2+dfsg-1amd64
stretch2.3.1+dfsg-4amd64
bullseye2.3.2+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.3.2+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.3.2+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PLAST is a fast, accurate and NGS scalable bank-to-bank sequence similarity search tool providing significant accelerations of seeds- based heuristic comparison methods, such as the Blast suite of algorithms.

Relying on unique software architecture, PLAST takes full advantage of recent multi-core personal computers without requiring any additional hardware devices.

Please cite: Van Hoa Nguyen and Dominique Lavenier: PLAST: parallel local alignment search tool for database comparison. (PubMed,eprint) BMC Bioinformatics 10:329 (2009)
Registry entries: Bio.tools 
plink
outils d'analyse d'associations sur le génome entier
Versions of package plink
ReleaseVersionArchitectures
stretch1.07-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.07-3amd64,armel,armhf,i386
sid1.07+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.07+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.07+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.07+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.07+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package plink:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
Popcon: 21 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Plink traite les données provenant de fragments SNP (single nucleotide polymorphism) de nombreux individus et leur description d'un phénotype pathologique. Il trouve les associations entre un phénotype et les variations d'ADN simple ou double brin et il peut récupérer les annotations SNP depuis une ressource en ligne.

Les SNP peuvent être analysés individuellement ou en tant que paires pour leur association avec les phénotypes pathologiques. L'étude conjointe des variations du nombre de copies est prise en charge. Divers tests statistiques ont été implémentés.

Remarque : l'exécutable a été renommé plink1 du fait d'un conflit de noms. Pour en savoir plus, lire /usr/share/doc/plink/README.Debian.

Please cite: Shaun Purcell, Benjamin Neale, Kathe Todd-Brown, Lori Thomas, Manuel A. R. Ferreira, David Bender, Julian Maller, Pamela Sklar, Paul I. W. de Bakker, Mark J. Daly and Pak C. Sham: PLINK: a toolset for whole-genome association and population-based linkage analysis. (PubMed) American Journal of Human Genetics 81(3):559-75 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
plink1.9
outils d'analyse d'associations sur le génome entier
Versions of package plink1.9
ReleaseVersionArchitectures
sid1.90~b7.2-231211-1amd64,armel,armhf,i386
trixie1.90~b7.2-231211-1amd64,armel,armhf,i386
stretch1.90~b3.45-170113-1amd64,armel,armhf,i386,mipsel
buster1.90~b6.6-181012-1amd64,armel,armhf,i386,mipsel
bullseye1.90~b6.21-201019-1amd64,armel,armhf,i386,mipsel
bookworm1.90~b6.26-220402-1amd64,armel,armhf,i386,mipsel
Popcon: 93 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Plink traite les données provenant de fragments SNP (single nucleotide polymorphism — polymorphisme d'un seul nucléotide) de nombreux individus et leur description d'un phénotype pathologique. Il trouve les associations entre un phénotype et les variations d'ADN simple ou double brin et il peut récupérer les annotations SNP depuis une ressource en ligne.

Les SNP peuvent être analysés individuellement ou en tant que paires pour leur association avec les phénotypes pathologiques. L'étude conjointe des variations du nombre de copies est prise en charge. Divers tests statistiques ont été implémentés.

Plink1.9 est une mise à jour complète de plink avec de nouveaux algorithmes et de nouvelles méthodes et une utilisation de la mémoire plus faible et rapide que le premier plink.

Il est à noter que l'exécutable a été renommé en plink1.9 en raison d'un conflit de noms. Consulter /usr/share/doc/plink1.9/README.Debian pour plus d'informations.

Please cite: Christopher C. Chang, Carson C. Chow, Laurent C.A.M. Tellier, Shashaank Vattikuti, Shaun M. Purcell and James J. Lee: Second-generation PLINK: rising to the challenge of larger and richer datasets. (eprint) GigaScience 4(1):7 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
plink2
whole-genome association analysis toolset
Versions of package plink2
ReleaseVersionArchitectures
sid2.00~a5.8-231123+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.00~a3-210203+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.00~a3.5-220809+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.00~a5.8-231123+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

plink expects as input the data from SNP (single nucleotide polymorphism) chips of many individuals and their phenotypical description of a disease. It finds associations of single or pairs of DNA variations with a phenotype and can retrieve SNP annotation from an online source.

SNPs can evaluated individually or as pairs for their association with the disease phenotypes. The joint investigation of copy number variations is supported. A variety of statistical tests have been implemented.

plink2 is a comprehensive update of plink and plink1.9 with new algorithms and new methods, faster and less memory consumer than the first plink.

Please cite: Christopher C. Chang, Carson C. Chow, Laurent C.A.M. Tellier, Shashaank Vattikuti, Shaun M. Purcell and James J. Lee: Second-generation PLINK: rising to the challenge of larger and richer datasets. (eprint) GigaScience 4(1):7 (2015)
Registry entries: SciCrunch 
plip
fully automated protein-ligand interaction profiler
Versions of package plip
ReleaseVersionArchitectures
buster1.4.3~b+dfsg-2all
sid2.3.0+dfsg-2all
bullseye2.1.7+dfsg-1all
bookworm2.2.2+dfsg-1all
trixie2.3.0+dfsg-2all
stretch1.3.3+dfsg-1all
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The Protein-Ligand Interaction Profiler (PLIP) is a tool to analyze and visualize protein-ligand interactions in PDB files.

Features include:

  • Detection of eight different types of noncovalent interactions
  • Automatic detection of relevant ligands in a PDB file
  • Direct download of PDB structures from wwPDB server if valid PDB ID is given
  • Processing of custom PDB files containing protein-ligand complexes (e.g. from docking)
  • No need for special preparation of a PDB file, works out of the box
  • Atom-level interaction reports in rST and XML formats for easy parsing
  • Generation of PyMOL session files (.pse) for each pairing, enabling easy preparation of images for publications and talks
  • Rendering of preview image for each ligand and its interactions with the protein
Please cite: Sebastian Salentin, Sven Schreiber, V. Joachim Haupt, Melissa F. Adasme and Michael Schroeder: PLIP: fully automated protein–ligand interaction profiler. (eprint) Nucleic Acids Research (W1) (2015)
Registry entries: Bio.tools 
poa
alignement d'ordre partiel pour les alignements multiples de séquences
Versions of package poa
ReleaseVersionArchitectures
buster2.0+20060928-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.0+20060928-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.0+20060928-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.0+20060928-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.0+20060928-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie2.0+20060928-3amd64,armel,armhf,i386
bookworm2.0+20060928-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package poa:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
works-with-formatplaintext
Popcon: 18 users (17 upd.)*
Versions and Archs
License: DFSG free
Git

POA signifie Alignement d'Ordre Partiel (Partial Order Aligment en anglais). C'est un programme rapide de MSA (alignement multiple de séquences) en bio-informatique. Ses points forts sont la vitesse, la déployabilité, la sensibilité et son aptitude supérieure à gérer les branchements et les indels dans l'alignement. L'alignement d'ordre partiel est une approche pour MSA qui peut être combinée avec d'autres méthodes comme l'alignement progressif. POA aligne de manière optimale une paire de MSA et peut donc être utilisé directement avec des méthodes progressives comme CLUSTAL. Pour les alignements de grande taille, POA est de dix à trente fois plus rapide que CLUSTALW.

Registry entries: Bioconda 
Screenshots of package poa
populations
logiciel de génétique de populations
Versions of package populations
ReleaseVersionArchitectures
buster1.2.33+svn0120106+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.2.33+svn0120106+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.33+svn0120106+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.2.33+svn0120106+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.2.33+svn0120106+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.2.33+svn0120106-2.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.2.33+svn0120106-2.1amd64,armel,armhf,i386
Debtags of package populations:
roleprogram
uitoolkitqt
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Populations est un logiciel de génétique de populations. Il permet de calculer la distance génétique entre des populations ou des individus. Il permet aussi de créer des arbres phylogénétiques (NJ ou UPGMA) avec des valeurs de démarrage.

Screenshots of package populations
porechop
adapter trimmer for Oxford Nanopore reads
Versions of package porechop
ReleaseVersionArchitectures
sid0.2.4+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.2.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.2.4+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.2.4+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.2.4+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Porechop is a tool for finding and removing adapters from Oxford Nanopore reads. Adapters on the ends of reads are trimmed off, and when a read has an adapter in its middle, it is treated as chimeric and chopped into separate reads. Porechop performs thorough alignments to effectively find adapters, even at low sequence identity. Porechop also supports demultiplexing of Nanopore reads that were barcoded with the Native Barcoding Kit, PCR Barcoding Kit or Rapid Barcoding Kit.

Registry entries: Bioconda 
poretools
toolkit for nanopore nucleotide sequencing data
Versions of package poretools
ReleaseVersionArchitectures
stretch0.6.0+dfsg-2all
sid0.6.0+dfsg-6all
trixie0.6.0+dfsg-6all
bookworm0.6.0+dfsg-6all
bullseye0.6.0+dfsg-5all
buster0.6.0+dfsg-3all
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

poretools is a flexible toolkit for exploring datasets generated by nanopore sequencing devices from MinION for the purposes of quality control and downstream analysis. Poretools operates directly on the native FAST5 (a variant of the HDF5 standard) file format produced by ONT and provides a wealth of format conversion utilities and data exploration and visualization tools.

Please cite: Nicholas Loman and Aaron Quinlan: Poretools: a toolkit for analyzing nanopore sequence data. (PubMed,eprint) Bioinformatics 30(23):3399-3401 (2014)
Registry entries: Bio.tools  Bioconda 
pplacer
phylogenetic placement and downstream analysis
Versions of package pplacer
ReleaseVersionArchitectures
sid1.1~alpha19-6amd64,arm64,ppc64el,s390x
bullseye1.1~alpha19-4amd64,arm64,ppc64el,s390x
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Pplacer places reads on a phylogenetic tree. guppy (Grand Unified Phylogenetic Placement Yanalyzer) yanalyzes them. rppr is a helpful tool for working with reference packages.

Pplacer places query sequences on a fixed reference phylogenetic tree to maximize phylogenetic likelihood or posterior probability according to a reference alignment. Pplacer is designed to be fast, to give useful information about uncertainty, and to offer advanced visualization and downstream analysis.

Please cite: Frederick A Matsen, Robin B Kodner and E Virginia Armbrust: pplacer: linear time maximum-likelihood and Bayesian phylogenetic placement of sequences onto a fixed reference tree. (PubMed,eprint) BMC Bioinformatics 11:538 (2010)
Registry entries: Bioconda 
prank
Probabilistic Alignment Kit for DNA, codon and amino-acid sequences
Versions of package prank
ReleaseVersionArchitectures
jessie0.0.140110-1amd64,armel,armhf,i386
bookworm0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster0.0.170427+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0.0.150803-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 18 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

PRANK is a probabilistic multiple alignment program for DNA, codon and amino-acid sequences. It's based on a novel algorithm that treats insertions correctly and avoids over-estimation of the number of deletion events. In addition, PRANK borrows ideas from maximum likelihood methods used in phylogenetics and correctly takes into account the evolutionary distances between sequences. Lastly, PRANK allows for defining a potential structure for sequences to be aligned and then, simultaneously with the alignment, predicts the locations of structural units in the sequences.

PRANK is a command-line program for UNIX-style environments but the same sequence alignment engine is implemented in the graphical program PRANKSTER. In addition to providing a user-friendly interface to those not familiar with Unix systems, PRANKSTER is an alignment browser for alignments saved in the HSAML format. The novel format allows for storing all the information generated by the aligner and the alignment browser is a convenient way to analyse and manipulate the data.

PRANK aims at an evolutionarily correct sequence alignment and often the result looks different from ones generated with other alignment methods. There are, however, cases where the different look is caused by violations of the method's assumptions. To understand why things may go wrong and how to avoid that, read this explanation of differences between PRANK and traditional progressive alignment methods.

Please cite: Ari Löztznoja: Phylogeny-aware alignment with PRANK. (PubMed) Methods Mol. Biol. 1079:155-170 (2014)
Registry entries: Bio.tools  Bioconda 
Screenshots of package prank
predictnls
prédiction et analyse de signaux de localisation nucléaire de protéines
Versions of package predictnls
ReleaseVersionArchitectures
buster1.0.20-5all
bullseye1.0.20-6all
jessie1.0.20-1all
stretch1.0.20-3all
sid1.0.20-8all
trixie1.0.20-8all
bookworm1.0.20-8all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

predictnls est une méthode de prédiction et d'analyse de signaux de localisation nucléaire de protéines (NLS). En plus de rapporter les positions des signaux de localisation nucléaire trouvés, le paquet predictnls donne aussi des statistiques concises.

Please cite: Murat Cokol, Rajesh Nair and Burkhard Rost: Finding nuclear localization signals.. (PubMed,eprint) EMBO reports 1(5):411-415 (2000)
Registry entries: Bio.tools  SciCrunch 
Screenshots of package predictnls
presto
toolkit for processing B and T cell sequences
Versions of package presto
ReleaseVersionArchitectures
sid0.7.2-1all
bullseye0.6.2-1all
bookworm0.7.1-1all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

pRESTO is a toolkit for processing raw reads from high-throughput sequencing of B cell and T cell repertoires.

Dramatic improvements in high-throughput sequencing technologies now enable large-scale characterization of lymphocyte repertoires, defined as the collection of trans-membrane antigen-receptor proteins located on the surface of B cells and T cells. The REpertoire Sequencing TOolkit (pRESTO) is composed of a suite of utilities to handle all stages of sequence processing prior to germline segment assignment. pRESTO is designed to handle either single reads or paired-end reads. It includes features for quality control, primer masking, annotation of reads with sequence embedded barcodes, generation of unique molecular identifier (UMI) consensus sequences, assembly of paired-end reads and identification of duplicate sequences. Numerous options for sequence sorting, sampling and conversion operations are also included.

Please cite: Jason A. Vander Heiden, Gur Yaari, Mohamed Uduman, Joel N.H. Stern, Kevin C. O’Connor, David A. Hafler, Francois Vigneault and Steven H. Kleinstein: pRESTO: a toolkit for processing high-throughput sequencing raw reads of lymphocyte receptor repertoires. (PubMed,eprint) Bioinformatics 30(13):1930-1932 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
prime-phylo
bayesian estimation of gene trees taking the species tree into account
Versions of package prime-phylo
ReleaseVersionArchitectures
stretch1.0.11-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.11-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.0.11-2amd64,armel,armhf,i386
sid1.0.11-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.11-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.0.11-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.11-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PrIME (Probabilistic Integrated Models of Evolution) is a package supporting inference of evolutionary parameters in a Bayesian framework using Markov chain Monte Carlo simulation. A distinguishing feature of PrIME is that the species tree is taken into account when analyzing gene trees.

The input data to PrIME is a multiple sequence alignment in FASTA format and the output data contains trees in Newick format.

Please cite: Ö. Åkerborg, B. Sennblad, L. Arvestad and J. Lagergren: Simultaneous Bayesian gene tree reconstruction and reconciliation analysis. (PubMed,eprint) Proceedings of the National Academy of Sciences 106(14):5714-5719 (2009)
Registry entries: Bio.tools 
primer3
outil de choix d'amorces l'amplification d'ADN
Versions of package primer3
ReleaseVersionArchitectures
trixie2.6.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye2.4.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch2.3.7-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.3.6-1amd64,armel,armhf,i386
sid2.6.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.6.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package primer3:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
works-with-formatplaintext
Popcon: 24 users (17 upd.)*
Versions and Archs
License: DFSG free
Git

Primer3 choisit des amorces pour des réactions de polymérisation en chaîne, avec les critères suivants : la température de fusion des oligonucléotides, leur taille, leur contenu en GC et la possibilité de former des dimères ; la taille du produit de PCR ; les contraintes positionnelles dans la séquence source ; diverses autres contraintes. Tous ces critères peuvent êtres spécifiés comme des contraintes par l'utilisateur et certains sont spécifiables comme les termes d'une fonction objective qui caractérise une paire idéale d'amorces.

Please cite: Steve Rozen and Helen J. Skaletsky: Primer3 on the WWW for general users and for biologist programmers. (PubMed,eprint) Methods Mol Biol. 132(3):365-86 (2000)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package primer3
prinseq-lite
PReprocessing and INformation of SEQuence data (lite version)
Versions of package prinseq-lite
ReleaseVersionArchitectures
sid0.20.4-6all
bookworm0.20.4-6all
trixie0.20.4-6all
bullseye0.20.4-6all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PRINSEQ will help you to preprocess your genomic or metagenomic sequence data in FASTA or FASTQ format. It is a tool that generates summary statistics of sequence and quality data and that is used to filter, reformat and trim next-generation sequence data. It is particular designed for 454/Roche data, but can also be used for other types of sequence data. The standalone version is primarily designed for data preprocessing and does not generate summary statistics in graphical form.

Please cite: Schmieder R and Edwards R: Quality control and preprocessing of metagenomic datasets. (PubMed,eprint) Bioinformatics 27(6):863-864 (2011)
proalign
logiciel d'alignements de multiples séquences probabilistes
Versions of package proalign
ReleaseVersionArchitectures
bookworm0.603-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.603-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.603-1amd64,armel,armhf,i386
trixie0.603-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster0.603-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.603-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.603-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le logiciel ProAlign réalise des alignements de séquences probabilistes en utilisant le modèle de Markov caché. Il inclut une interface graphique utilisateur permettant de: (i) réaliser des alignements de nucléotides ou d'acides aminés (ii) visionner la qualité des solutions (iii) filtrer les régions considérées non fiables de l'alignement (iv) exporter les alignements vers d'autres logiciels

Le logiciel ProAlign une méthode progressive, telle que l'alignement de multiples séquences est créé par étapes en réalisant des alignements par paires dans les noeuds d'un arbre de guidage . Les séquences sont décrites avec des vecteurs de probabilité de symboles, et chaque alignement par paires, reconstruit la séquence ancestrale (parente) en calculant les probabilités de différents symboles selon un modèle évolutif.

Please cite: Ari Löytynoja and Michel C Milinkovitch: A hidden Markov model for progressive multiple alignment. (PubMed,eprint) Bioinformatics 19(12):1505-13 (2003)
probabel
Toolset for Genome-Wide Association Analysis
Versions of package probabel
ReleaseVersionArchitectures
bullseye0.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.4.3-2amd64,armel,armhf,i386
stretch0.4.5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster0.5.0+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.5.0+dfsg-6amd64,i386
trixie0.5.0+dfsg-6amd64,i386
sid0.5.0+dfsg-6amd64,i386
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The ProbABEL package is part of the GenABEL project for analysis of genome-wide data. ProbABEL is used to run GWAS. Using files in filevector/DatABEL format even allows for running GWAS on computers with only a few GB of RAM.

The package is enhanced by the following packages: probabel-examples
Please cite: Yurii S Aulchenko, Maksim V Struchalin and Cornelia M van Duijn: ProbABEL package for genome-wide association analysis of imputed data.. (PubMed,eprint) BMC Bioinformatics 11:134 (2010)
Registry entries: Bio.tools  SciCrunch 
probalign
alignement de séquences multiples en utilisant les probabilités à postériori de la fonction de partition
Versions of package probalign
ReleaseVersionArchitectures
sid1.4-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.4-3amd64,armel,armhf,i386
stretch1.4-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.4-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.4-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.4-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.4-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 13 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Probalign utilise l’estimation de probabilités à postériori de la fonction de partition pour calculer les alignements de séquence multiple avec la précision maximale attendue. Il obtient des résultats statistiquement significativement meilleurs que les programmes d´alignement leaders Probcons v1.1, MAFFT v5.851 et MUSCLE v3.6 avec les tests de performance BAliBASE 3.0, HOMSTRAD et OXBENCH. Les améliorations de Probalign sont plus importantes sur les ensembles de données contenant des extrémités N/C-terminales et sur les ensembles de données avec des séquences de longueurs hétérogènes. Sur les ensembles de données de longueurs hétérogènes contenant des répétitions, la précision d’alignement de Probalign est 10 % et 15 % meilleure que les trois autres méthodes quand l´écart-type de longueur est au moins 300 et 400.

Please cite: Usman Roshan and Dennis R. Livesay: Probalign: multiple sequence alignment using partition function posterior probabilities. (PubMed,eprint) Bioinformatics 22(22):2715-21 (2006)
Registry entries: SciCrunch 
probcons
alignement de séquences multiples basé sur la cohérence probabiliste
Versions of package probcons
ReleaseVersionArchitectures
trixie1.12-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.12-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.12-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.12-12amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.12-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.12-9amd64,armel,armhf,i386
bookworm1.12-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package probcons:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 20 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Ceci est un outil pour la génération d'alignements de séquences multiples de protéines. En utilisant une combinaison de techniques d'alignements basées sur la modélisation probabiliste et la cohérence, le logiciel PROBCONS a atteint les meilleures précisions des méthodes d'alignement à ce jour. Sur la base de données d'alignements de test de performance BAliBASE (« Benchmark ALIgnment dataBASE »), les alignements produits par le logiciel PROBCONS montrent une amélioration statistiquement significative sur les logiciels actuels, contenant une moyenne de plus de 7 % de colonnes alignées correctement que celles du logiciel T-Coffee, plus de 11 % de colonnes alignées correctement que celles du logiciel ClustalW, et plus de 11 % de colonnes alignées que celles du logiciel Dialign.

Please cite: Chuong B. Do, Mahathi S.P. Mahabhashyam, Michael Brudno and Serafim Batzoglou: ProbCons: Probabilistic consistency-based multiple sequence alignment. (PubMed,eprint) Genome Research 15(2):330-340 (2005)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package probcons
proda
Alignement multiple de séquences protéiques
Versions of package proda
ReleaseVersionArchitectures
bullseye1.0-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.0-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.0-12amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.0-10amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.0-8amd64,armel,armhf,i386
Debtags of package proda:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 17 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

ProDA est un programme pour détecter et aligner les régions homologues dans des collections de protéines comportant divers arrangements de domaines. À partir d'un ensemble de séquences non alignées, ProDA identifiera toutes les régions homologues apparaissant dans une ou plusieurs séquences et renverra une collection d'alignements multiples locaux pour chacune d'entre elles.

Please cite: Tu Minh Phuong, Chuong B. Do, Robert C. Edgar and Serafim Batzoglou: Multiple alignment of protein sequences with repeats and rearrangements. (PubMed,eprint) Nucl. Acids Res. 34(20):5932-5942 (2006)
Registry entries: Bio.tools  Bioconda 
Screenshots of package proda
prodigal
Microbial (bacterial and archaeal) gene finding program
Versions of package prodigal
ReleaseVersionArchitectures
stretch2.6.3-1amd64,arm64,armel,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.6.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster2.6.3-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.6.3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.6.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.6.3-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.6.1-1amd64,armel,i386
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Prodigal (Prokaryotic Dynamic Programming Genefinding Algorithm) is a microbial (bacterial and archaeal) gene finding program developed at Oak Ridge National Laboratory and the University of Tennessee. Key features of Prodigal include:

Speed: Prodigal is an extremely fast gene recognition tool (written in very vanilla C). It can analyze an entire microbial genome in 30 seconds or less.

Accuracy: Prodigal is a highly accurate gene finder. It correctly locates the 3' end of every gene in the experimentally verified Ecogene data set (except those containing introns). It possesses a very sophisticated ribosomal binding site scoring system that enables it to locate the translation initiation site with great accuracy (96% of the 5' ends in the Ecogene data set are located correctly).

Specificity: Prodigal's false positive rate compares favorably with other gene identification programs, and usually falls under 5%.

GC-Content Indifferent: Prodigal performs well even in high GC genomes, with over a 90% perfect match (5'+3') to the Pseudomonas aeruginosa curated annotations.

Metagenomic Version: Prodigal can run in metagenomic mode and analyze sequences even when the organism is unknown.

Ease of Use: Prodigal can be run in one step on a single genomic sequence or on a draft genome containing many sequences. It does not need to be supplied with any knowledge of the organism, as it learns all the properties it needs to on its own.

Please cite: Doug Hyatt, Gwo-Liang Chen, Philip F. Locascio, Miriam L. Land, Frank W. Larimer and Loren J. Hauser: Prodigal: prokaryotic gene recognition and translation initiation site identification. (PubMed,eprint) BMC Bioinformatics 11:119 (2010)
Registry entries: SciCrunch  Bioconda 
profbval
prédicteur des résidus de protéine flexibles/rigides à partir d'une séquence
Versions of package profbval
ReleaseVersionArchitectures
trixie1.0.22-8all
bullseye1.0.22-7all
jessie1.0.22-1all
buster1.0.22-6all
stretch1.0.22-4all
bookworm1.0.22-8all
sid1.0.22-8all
Popcon: 0 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

PROFbval peut servir à la prédiction de la structure et de la fonction d'une protéine. Par exemple, un biologiste peut localiser des déterminants potentiellement antigéniques en identifiant les résidus les plus flexibles à la surface d'une protéine. En outre, un cristallographe peut localiser des résidus ayant potentiellement des B-valeurs élevées expérimentales.

PROFbval accepte les entrées suivantes, décrites davantage dans profbval(1) :

 –⋅une séquence de protéine dans un fichier FASTA ;
 –⋅une structure secondaire et la prédiction de l'accessibilité
   d'un solvant par prof(1) ;
 –⋅un fichier HSSP.

Contexte : la mobilité d'un résidu donné à la surface d'une protéine est liée à son rôle fonctionnel. Donc, l'identification de résidus extrêmement rigides ou flexibles à la surface d'une protéine permet d'identifier les résidus fonctionnellement importants des protéines. La mesure classique de la mobilité des atomes dans les protéines constitue des données B-valeur à partir de structures de cristallographie aux rayon⋅X. PROFbval est le premier outil pour prédire des B-valeurs normalisées d'un squelette à partir d'une séquence d'acides aminés.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: PROFbval: predict flexible and rigid residues in proteins.. (PubMed) Bioinformatics 22(7):891-3 (2006)
profisis
prédiction des sites d'interaction protéine-protéine à partir d'une séquence
Versions of package profisis
ReleaseVersionArchitectures
bookworm1.0.11-7all
stretch1.0.11-3all
buster1.0.11-5all
bullseye1.0.11-6all
sid1.0.11-7all
jessie1.0.11-1all
trixie1.0.11-7all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le logiciel PROFisis (ISIS) identifie l'interaction des résidus de protéines dans les surfaces protéine-protéine à partir d'une séquence seule.

Les prédictions les plus fortes de la méthode ont atteint plus 90 % de précision lors d'une expérience de validation croisée.

Please cite: Yanay Ofran and Burkhard Rost: ISIS: interaction sites identified from sequence. (PubMed,eprint) Bioinformatics 23(2):e13-e16 (2007)
Registry entries: Bio.tools 
profnet-bval
neural network architecture for profbval
Versions of package profnet-bval
ReleaseVersionArchitectures
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie1.0.22-2amd64,armel,armhf,i386
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.22-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet is a component of the prediction methods that make up the Predict Protein service by the lab of Burkhard Rost. It provides the neural network component to a variety of predictors that perform protein feature prediction directly from sequence. This neural network implementation has to be compiled for every different network architecture.

This package contains the neural network architecture for profbval.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profnet-chop
neural network architecture for profchop
Versions of package profnet-chop
ReleaseVersionArchitectures
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.22-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.22-2amd64,armel,armhf,i386
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet is a component of the prediction methods that make up the Predict Protein service by the lab of Burkhard Rost. It provides the neural network component to a variety of predictors that perform protein feature prediction directly from sequence. This neural network implementation has to be compiled for every different network architecture.

This package contains the neural network architecture for profchop.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profnet-con
neural network architecture for profcon
Versions of package profnet-con
ReleaseVersionArchitectures
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.22-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.22-2amd64,armel,armhf,i386
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet is a component of the prediction methods that make up the Predict Protein service by the lab of Burkhard Rost. It provides the neural network component to a variety of predictors that perform protein feature prediction directly from sequence. This neural network implementation has to be compiled for every different network architecture.

This package contains the neural network architecture for profcon.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profnet-isis
neural network architecture for profisis
Versions of package profnet-isis
ReleaseVersionArchitectures
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.22-2amd64,armel,armhf,i386
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.22-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet is a component of the prediction methods that make up the Predict Protein service by the lab of Burkhard Rost. It provides the neural network component to a variety of predictors that perform protein feature prediction directly from sequence. This neural network implementation has to be compiled for every different network architecture.

This package contains the neural network architecture for profisis.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profnet-md
neural network architecture for metadisorder
Versions of package profnet-md
ReleaseVersionArchitectures
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.0.22-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.22-2amd64,armel,armhf,i386
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet is a component of the prediction methods that make up the Predict Protein service by the lab of Burkhard Rost. It provides the neural network component to a variety of predictors that perform protein feature prediction directly from sequence. This neural network implementation has to be compiled for every different network architecture.

This package contains the neural network architecture for metadisorder.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profnet-norsnet
neural network architecture for norsnet
Versions of package profnet-norsnet
ReleaseVersionArchitectures
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.22-2amd64,armel,armhf,i386
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.22-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet is a component of the prediction methods that make up the Predict Protein service by the lab of Burkhard Rost. It provides the neural network component to a variety of predictors that perform protein feature prediction directly from sequence. This neural network implementation has to be compiled for every different network architecture.

This package contains the neural network architecture for norsnet.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profnet-prof
neural network architecture for profacc
Versions of package profnet-prof
ReleaseVersionArchitectures
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie1.0.22-2amd64,armel,armhf,i386
buster1.0.22-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet is a component of the prediction methods that make up the Predict Protein service by the lab of Burkhard Rost. It provides the neural network component to a variety of predictors that perform protein feature prediction directly from sequence. This neural network implementation has to be compiled for every different network architecture.

This package contains the neural network architecture for profsec and profacc.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profnet-snapfun
neural network architecture for snapfun
Versions of package profnet-snapfun
ReleaseVersionArchitectures
jessie1.0.22-2amd64,armel,armhf,i386
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.0.22-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet is a component of the prediction methods that make up the Predict Protein service by the lab of Burkhard Rost. It provides the neural network component to a variety of predictors that perform protein feature prediction directly from sequence. This neural network implementation has to be compiled for every different network architecture.

This package contains the neural network architecture for snapfun.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profphd
secondary structure and solvent accessibility predictor
Versions of package profphd
ReleaseVersionArchitectures
buster1.0.42-3all
jessie1.0.40-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides prof(1), the protein secondary structure, accessibility and transmembrane helix predictor from Burkhard Rost. Prediction is either done from protein sequence alone or from an alignment - the latter should be used for optimal performance.

How well does prof(1) perform?

  • Secondary structure is predicted at an expected average accuracy > 72% for the three states helix, strand and loop.

  • Solvent accessibility is predicted at a correlation coefficient (correlation between experimentally observed and predicted relative solvent accessibility) of 0.54

  • Transmembrane helix prediction has an expected per-residue accuracy of about 95%. The number of false positives, i.e., transmembrane helices predicted in globular proteins, is about 2%.

Please cite: Burkhard Rost and Chris Sander: Combining evolutionary information and neural networks to predict protein secondary structure. (PubMed) Proteins 19(1):55-72 (1994)
profphd-net
architecture de réseaux de neurones pour le paquet profphd
Versions of package profphd-net
ReleaseVersionArchitectures
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.22-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.22-2amd64,armel,armhf,i386
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le logiciel Profnet est un composant des méthodes de prédiction qui composent le service de prédiction de protéines par le laboratoire de Burkhard Rost. Il fournit le composant d'un réseau de neurones à divers prédicteurs qui réalisent la prédiction de caractéristiques de protéines directement à partir d'une séquence. Cette implémentation de réseau de neurones doit être compilée pour chaque architecture différente de réseaux de neurones.

Ce paquet fournit l'architecture de réseaux de neurones pour le paquet profphd.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profphd-utils
profphd helper utilities convert_seq and filter_hssp
Versions of package profphd-utils
ReleaseVersionArchitectures
sid1.0.10-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0.10-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.0.10-1amd64,armel,armhf,i386
bullseye1.0.10-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.10-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.10-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.0.10-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The package provides the following binary utilities: convert_seq, filter_hssp. These are used by prof from the profphd package: a secondary structure, accessibility and transmembrane helix predictor from Burkhard Rost.

proftmb
per-residue prediction of bacterial transmembrane beta barrels
Versions of package proftmb
ReleaseVersionArchitectures
stretch1.1.12-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.1.12-2amd64,armel,armhf,i386
buster1.1.12-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.1.12-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.1.12-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.12-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.1.12-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

proftmb predicts transmembrane beta-barrel (TMB) proteins in Gram-negative bacteria.

For each query protein, proftmb provides both a Z-value indicating that the protein actually contains a membrane barrel, and a four-state per-residue labeling of upward- and downward-facing strands, periplasmic hairpins and extracellular loops.

The package is enhanced by the following packages: proftmb-dbg
Please cite: H. Bigelow and B. Rost: PROFtmb: a web server for predicting bacterial transmembrane beta barrel proteins.. (PubMed) Nucleic Acids Res 34(Web Server issue):W186-8 (2006)
Registry entries: Bio.tools 
progressivemauve
multiple genome alignment algorithms
Versions of package progressivemauve
ReleaseVersionArchitectures
trixie1.2.0+4713+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.2.0+4713+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.0+4713+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.2.0+4713+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2.0+4713+dfsg-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.2.0+4713-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The mauveAligner and progressiveMauve alignment algorithms have been implemented as command-line programs included with the downloadable Mauve software. When run from the command-line, these programs provide options not yet available in the graphical interface.

Mauve is a system for efficiently constructing multiple genome alignments in the presence of large-scale evolutionary events such as rearrangement and inversion. Multiple genome alignment provides a basis for research into comparative genomics and the study of evolutionary dynamics. Aligning whole genomes is a fundamentally different problem than aligning short sequences.

Mauve has been developed with the idea that a multiple genome aligner should require only modest computational resources. It employs algorithmic techniques that scale well in the amount of sequence being aligned. For example, a pair of Y. pestis genomes can be aligned in under a minute, while a group of 9 divergent Enterobacterial genomes can be aligned in a few hours.

Mauve computes and interactively visualizes genome sequence comparisons. Using FastA or GenBank sequence data, Mauve constructs multiple genome alignments that identify large-scale rearrangement, gene gain, gene loss, indels, and nucleotide substutition.

Mauve is developed at the University of Wisconsin.

Please cite: Aaron E. Darling, Bob Mau and Nicole T. Perna: progressiveMauve: multiple genome alignment with gene gain, loss and rearrangement. (PubMed,eprint) PloS one 5(6):e11147 (2010)
Registry entries: Bio.tools  SciCrunch 
prokka
rapid annotation of prokaryotic genomes
Versions of package prokka
ReleaseVersionArchitectures
sid1.14.6+dfsg-6all
trixie1.14.6+dfsg-6all
bookworm1.14.6+dfsg-4amd64
bullseye1.14.6+dfsg-3amd64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

A typical 4 Mbp genome can be fully annotated in less than 10 minutes on a quad-core computer, and scales well to 32 core SMP systems. It produces GFF3, GBK and SQN files that are ready for editing in Sequin and ultimately submitted to Genbank/DDJB/ENA.

The package is enhanced by the following packages: multiqc
Please cite: Torsten Seemann: Prokka: rapid prokaryotic genome annotation. (PubMed,eprint) Bioinformatics 30(14):2068-2069 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
proteinortho
Detection of (Co-)orthologs in large-scale protein analysis
Versions of package proteinortho
ReleaseVersionArchitectures
bullseye6.0.28+dfsg-1amd64,arm64,ppc64el,s390x
stretch5.15+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid6.3.1+dfsg-1amd64,arm64,ppc64el,riscv64,s390x
buster5.16.b+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm6.1.7+dfsg-1amd64,arm64,ppc64el,s390x
trixie6.3.1+dfsg-1amd64,arm64,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Proteinortho is a stand-alone tool that is geared towards large datasets and makes use of distributed computing techniques when run on multi-core hardware. It implements an extended version of the reciprocal best alignment heuristic. Proteinortho was applied to compute orthologous proteins in the complete set of all 717 eubacterial genomes available at NCBI at the beginning of 2009. Authors succeeded identifying thirty proteins present in 99% of all bacterial proteomes.

Please cite: Marcus Lechner, Sven Findeiß, Lydia Steiner, Manja Marz, Peter F Stadler and Sonja J Prohaska: Proteinortho: Detection of (Co-)orthologs in large-scale analysis. (PubMed,eprint) BMC Bioinformatics 12:124 (2011)
prottest
selection of best-fit models of protein evolution
Versions of package prottest
ReleaseVersionArchitectures
trixie3.4.2+dfsg-8all
sid3.4.2+dfsg-8all
bullseye3.4.2+dfsg-5all
bookworm3.4.2+dfsg-8all
stretch3.4.2+dfsg-2all
buster3.4.2+dfsg-3all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PROTTEST (ModelTest's relative) is a program for selecting the model of protein evolution that best fits a given set of sequences (alignment). This java program is based on the Phyml program (for maximum likelihood calculations and optimization of parameters) and uses the PAL library as well. Models included are empirical substitution matrices (such as WAG, LG, mtREV, Dayhoff, DCMut, JTT, VT, Blosum62, CpREV, RtREV, MtMam, MtArt, HIVb, and HIVw) that indicate relative rates of amino acid replacement, and specific improvements (+I:invariable sites, +G: rate heterogeneity among sites, +F: observed amino acid frequencies) to account for the evolutionary constraints impossed by conservation of protein structure and function. ProtTest uses the Akaike Information Criterion (AIC) and other statistics (AICc and BIC) to find which of the candidate models best fits the data at hand.

Please cite: Diego Darriba, Guillermo L. Taboada, Ramón Doallo and David Posada: ProtTest 3: fast selection of best-fit models of protein evolution. (PubMed,eprint) Bioinformatics 27(8):1164-5 (2011)
Registry entries: Bio.tools  SciCrunch 
provean
Protein Variation Effect Analyzer
Versions of package provean
ReleaseVersionArchitectures
sid1.1.5+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.1.5+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PROVEAN (Protein Variation Effect Analyzer) is a software tool which predicts whether an amino acid substitution or indel has an impact on the biological function of a protein.

PROVEAN is useful for filtering sequence variants to identify nonsynonymous or indel variants that are predicted to be functionally important.

The performance of PROVEAN is comparable to popular tools such as SIFT or PolyPhen-2.

A fast computation approach to obtain pairwise sequence alignment scores enabled the generation of precomputed PROVEAN predictions for 20 single AA substitutions and a single AA deletion at every amino acid position of all protein sequences in human and mouse.

pscan-chip
ChIP-based identifcation of TF binding sites
Versions of package pscan-chip
ReleaseVersionArchitectures
buster1.1-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Regulation of transcription is one of the main check points of gene expression regulation and plays a key role in fundamental processes like cellular differentiation and dynamic molecular responses to stimuli The transcriptional activity of genes is finely regulated by the interaction of sequence elements on the DNA (transcription factor binding sites or TFBSs) and particular proteins called Transcription Factors (TFs). , TFBSs are usually clustered in specific regulatory genomic regions called promoters and enhancers. TFs usually recognize TFBSs in a loose sequence specific fashion but there is no computational way to determine if any given sequence motif on the DNA is actually bound in-vivo by a TF, even when the motif is an istance of the sequences typically bound by the TF itself.

Tools like Pscan and PscanChIP analyse a set of regulatory sequences to detect motif enrichment. The rationale is that if a given TFBS is present in a "surpisingly high" number of istances then there is a good chance that the TF that recognize that motif is a common regulator of the input sequences, thus they use redundancy as an information source.

While Pscan (of the pscan-tfbs package) is tailored to work on promoters, that is the regulatory regions upstream of transcription start sites, PscanChIP is suited to work on more general regulatory genomic regions like the ones identified through ChIP-Seq experiments.

Registry entries: Bio.tools  SciCrunch 
pscan-tfbs
search for transcription factor binding sites
Versions of package pscan-tfbs
ReleaseVersionArchitectures
bookworm1.2.2-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.2-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.2.2-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.2-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.2.2-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 8 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Pscan finds Over-represented Transcription Factor Binding Site Motifs in Sequences from Co-Regulated or Co-Expressed Genes.

Pscan is a software tool that scans a set of sequences (e.g. promoters) from co-regulated or co-expressed genes with motifs describing the binding specificity of known transcription factors and assesses which motifs are significantly over- or under-represented, providing thus hints on which transcription factors could be common regulators of the genes studied, together with the location of their candidate binding sites in the sequences. Pscan does not resort to comparisons with orthologous sequences and experimental results show that it compares favorably to other tools for the same task in terms of false positive predictions and computation time. The website is free and open to all users and there is no login requirement.

Please cite: Federico Zambelli, Graziano Pesole and Giulio Pavesi: Pscan: Finding Over-represented Transcription Factor Binding Site Motifs in Sequences from Co-Regulated or Co-Expressed Genes. (PubMed,eprint) Nucleic Acids Research 37(Web Server Issue):W247-W252 (2009)
Registry entries: Bio.tools 
psortb
outil de prédiction de localisation bactérienne
Versions of package psortb
ReleaseVersionArchitectures
bookworm3.0.6+dfsg-3amd64
bullseye3.0.6+dfsg-2amd64
stretch-backports3.0.6+dfsg-1~bpo9+1amd64
sid3.0.6+dfsg-3amd64
buster3.0.6+dfsg-1amd64
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PSORTb permet la prédiction de localisation sub-cellulaire (SCL) de protéines de bactérie et fournit des moyens rapides et peu couteux pour obtenir une vue dans la fonction de protéine, la vérification de résultats expérimentaux, l’annotation de génomes de bactérie nouvellement séquencés, la détection de cibles de médicament potentielles de sécrétion ou de membrane plasmique, ainsi que l’identification de biomarqueurs pour des microbes.

Please cite: Nancy Y. Yu, James R. Wagner, Matthew R. Laird, Gabor Melli, Sébastien Rey, Raymond Lo, Phuong Dao, S. Cenk Sahinalp, Martin Ester, Leonard J. Foster and F. S. Brinkman: PSORTb 3.0: improved protein subcellular localization prediction with refined localization subcategories and predictive capabilities for all prokaryotes. (PubMed,eprint) Bioinformatics 26(13):1608-1615 (2010)
pullseq
Extract sequence from a fasta or fastq
Versions of package pullseq
ReleaseVersionArchitectures
trixie1.0.2-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.0.2-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.2-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

This is a utility to extract sequence from a fasta or fastq. Also helps filter sequences by a minimum length or maximum length. Fast, written in C, using kseq.h library.

pycoqc
computes metrics and generates Interactive QC plots
Versions of package pycoqc
ReleaseVersionArchitectures
sid2.5.2+dfsg-3all
bullseye2.5.2+dfsg-1all
bookworm2.5.2+dfsg-3all
trixie2.5.2+dfsg-3all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PycoQC computes metrics and generates interactive QC plots for Oxford Nanopore technologies sequencing data

PycoQC relies on the sequencing_summary.txt file generated by Albacore and Guppy, but if needed it can also generates a summary file from basecalled fast5 files. The package supports 1D and 1D2 runs generated with Minion, Gridion and Promethion devices and basecalled with Albacore 1.2.1+ or Guppy 2.1.3+

The package is enhanced by the following packages: multiqc
Registry entries: Bioconda 
pycorrfit
outil pour l’ajustement de courbes de corrélation sur un tracé logarithmique
Versions of package pycorrfit
ReleaseVersionArchitectures
bullseye1.1.7+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.9.9+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.8.3-2all
sid1.1.7+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.1.7+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.1.7+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1.5+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package pycorrfit:
fieldbiology, mathematics, physics
interfacex11
roleprogram
sciencemodelling, plotting, visualisation
scopeapplication
uitoolkitwxwidgets
useanalysing, learning, organizing, viewing
x11application
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PyCorrFit est un logiciel généraliste d’évaluation de SCF (Spectroscopie de corrélation de fluorescence, FCS — Fluorescence correlation spectroscopy) qui, entre autres formats, prend en charge le format bien établi de fichier ~.fcs de ConfoCor3 de Zeiss. PyCorrFit est fourni avec plusieurs fonctions internes de modèle, couvrant une large diversité d’applications dans la microscopie confocale standard. De plus, il contient des équations gérant différentes géométries d’excitation telles que TIR (total internal reflection — réflexion totale).

Please cite: Paul Müller, Petra Schwille and Thomas Weidemann: PyCorrFit—generic data evaluation for fluorescence correlation spectroscopy. (PubMed) Bioinformatics 30(17):2532–2533 (2014)
pyensembl
installs data from the Ensembl genome database
Versions of package pyensembl
ReleaseVersionArchitectures
bookworm2.2.4+ds-1all
trixie2.3.9-2all
sid2.3.11-1all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The Ensembl genome database is an established reference for genomic sequences and their automated annotation. To have this data local has advantages for bulk analyses, e.g. for the mapping of reads from RNA-seq against the latest golden path - or a previous one to compare analyses.

This package provides a reproducible way to insatll this data and thus simplify the automation of respective workflows.

Registry entries: Bio.tools  Bioconda 
pyfastx
fast random access to sequences from FASTA/Q file - command
Versions of package pyfastx
ReleaseVersionArchitectures
sid2.1.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.0.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.8.4-2amd64,arm64,i386,mips64el,ppc64el,s390x
Popcon: 0 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The pyfastx is a lightweight Python C extension that enables users to randomly access to sequences from plain and gzipped FASTA/Q files. This module aims to provide simple APIs for users to extract sequence from FASTA and reads from FASTQ by identifier and index number. The pyfastx will build indexes stored in a sqlite3 database file for random access to avoid consuming excessive amount of memory. In addition, the pyfastx can parse standard (sequence is spread into multiple lines with same length) and nonstandard (sequence is spread into one or more lines with different length) FASTA format.

It features:

  • a single file for the Python extension;
  • lightweight, memory efficient FASTA/Q file parsing;
  • fast random access to sequences from gzipped FASTA/Q file;
  • sequences reading from FASTA file line by line;
  • N50 and L50 calculation of sequences in FASTA file;
  • GC content and nucleotides composition calculation;
  • reverse, complement and antisense sequences extraction;
  • excellent compatibility: support for parsing nonstandard FASTA file;
  • support for FASTQ quality score conversion;
  • a command line interface for splitting FASTA/Q file.

This package provides the command line interface.

Please cite: Lianming Du, Qin Liu, Zhenxin Fan, Jie Tang, Xiuyue Zhang, Megan Price, Bisong Yue and Kelei Zhao: Pyfastx: a robust Python package for fast random access to sequences from plain and gzipped FASTA/Q files. (PubMed) Briefings in Bioinformatics 22(4) (2021)
Registry entries: Bioconda 
pymol
système de graphismes moléculaires
Versions of package pymol
ReleaseVersionArchitectures
jessie1.7.2.1-1amd64,armel,armhf,i386
buster2.2.0+dfsg-4all
stretch1.8.4.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.4.0+dfsg-2all
bookworm2.5.0+dfsg-1all
trixie2.5.0+dfsg-1all
sid2.5.0+dfsg-1all
Debtags of package pymol:
fieldbiology:structural, chemistry
interface3d, x11
roleprogram
scopeutility
uitoolkittk
uselearning, viewing
works-withimage
x11application
Popcon: 81 users (25 upd.)*
Versions and Archs
License: DFSG free
Git

PyMOL est un programme de visualisation de molécules ciblant la biologie structurale pour des biomolécules moyennes ou grosses telles que les protéines. Il peut produire des graphismes et des animations de molécules de qualité professionnelle.

Les fonctions incluent :

 – la visualisation de molécules, de trajectoires moléculaires et de
   structures de données cristallographiques ou d’orbitales ;
 – un « constructeur » et « sculpteur » de molécules ;
 – un lanceur de rayons et un générateur de film internes ;
 – la possibilité de toutes extensions et scripts à l’aide d’une interface
   en Python.

Les formats de fichier que PyMOL peut lire incluent PDB, XYZ, CIF, MDL Molfile, ChemDraw, les « cartes » CCP4, XPLOR et Gaussian cube.

Registry entries: Bio.tools  SciCrunch 
pyscanfcs
scientific tool for perpendicular line scanning FCS
Versions of package pyscanfcs
ReleaseVersionArchitectures
bookworm0.3.6+ds-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.2.3-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.3.6+ds-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.2.2-2amd64,armel,armhf,i386
buster0.3.2+ds-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.3.6+ds-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.3.6+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

When a membrane is scanned perpendicularly to its surface, the fluorescence signal originating from the membrane itself must be separated from the signal of the surrounding medium for an FCS analysis. PyScanFCS interactively extracts the fluctuating fluorescence signal from such measurements and applies a multiple-tau algorithm. The obtained correlation curves can be evaluated using PyCorrFit.

Package provides the Python module pyscanfcs and its graphical user interface. The graphical user interface is written in wxPython.

python3-biomaj3-daemon
BioMAJ daemon library
Versions of package python3-biomaj3-daemon
ReleaseVersionArchitectures
sid3.0.24-2all
trixie3.0.24-2all
bookworm3.0.24-2all
bullseye3.0.22-2all
buster3.0.17-1all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

BioMAJ downloads remote data banks, checks their status and applies transformation workflows, with consistent state, to provide ready-to-use data for biologists and bioinformaticians. For example, it can transform original FASTA files into BLAST indexes. It is very flexible and its post-processing facilities can be extended very easily.

BioMAJ3 is a rewrite of BioMAJ v1.x, see online documentation for migration.

This package contains the library and microservice to manage daemon and CLI in BioMAJ3

Registry entries: Bio.tools 
python3-bioxtasraw
traitement de données biologiques de diffusion des rayons X aux petits angles
Versions of package python3-bioxtasraw
ReleaseVersionArchitectures
sid2.2.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm2.1.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
upstream2.2.2
Popcon: 0 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

BioXTAS RAW un programme graphique en Python pour la réduction et l’analyse de diffusion des rayons X aux petits angles (SAXS – Small Angle X-rays Scattering). Ce paquet est conçu pour des données biologiques SAXS.

BioXTAS RAW fournit un remplacement aux programmes source proches comme Primus et Scatter pour l’analyse basique de données. Parce qu’il calibre, masque et intègre des images, il fournit aussi une alternative aux pipelines de faisceau de synchrotron que les scientifiques installent sur leur propre ordinateur et utilisent à la maison et sur la ligne de faisceau.

python3-cogent3
framework pour la biologie du génome
Versions of package python3-cogent3
ReleaseVersionArchitectures
bullseye2020.12.21a+dfsg-4+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2023.12.15a1+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
bookworm2023.2.12a1+dfsg-2+deb12u1amd64,arm64,mips64el,ppc64el,s390x
upstream2024.2.5a1
Popcon: 2 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

PyCogent est une bibliothèque pour la biologie du génome. C'est un framework complètement intégré et testé en profondeur pour :

  • le pilotage d'applications tierces ;
  • la conception de workflows ; l'interrogation des bases de données ;
  • la conduite de nouvelles analyses probabilistes de l'évolution de séquences biologiques ;
  • la génération de publications avec des graphismes de qualité. Il se distingue par de nombreuses fonctionnalités uniques intégrées (telles que l'alignement de codons véritables) et l'ajout fréquent de méthodes complètement nouvelles pour l'analyse de données de génomes.
Please cite: Rob Knight, Peter Maxwell, Amanda Birmingham, Jason Carnes, J Gregory Caporaso, Brett C Easton, Michael Eaton, Micah Hamady, Helen Lindsay, Zongzhi Liu, Catherine Lozupone, Daniel McDonald, Michael Robeson, Raymond Sammut, Sandra Smit, Matthew J Wakefield, Jeremy Widmann, Shandy Wikman, Stephanie Wilson, Hua Ying and Gavin A Huttley: PyCogent: a toolkit for making sense from sequence. (PubMed,eprint) Genome Biology 8(8):R171 (2007)
Registry entries: Bio.tools  Bioconda 
python3-emperor
visualizing high-throughput microbial community data
Versions of package python3-emperor
ReleaseVersionArchitectures
sid1.0.3+ds-9all
trixie1.0.3+ds-9all
bookworm1.0.3+ds-7all
upstream1.0.4
Popcon: 46 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Emperor is an interactive next generation tool for the analysis, visualization and understanding of high throughput microbial ecology datasets.

Due to its tailor-made graphical user interface, delving into a new dataset to elucidate the patterns hidden in the data, has never been easier. Emperor brings a rich set of customizations and modifications that can be integrated into any QIIME or scikit-bio compliant dataset; with lightweight data files and hardware accelerated graphics, constitutes itself as the state of the art for analyzing N-dimensional data using principal coordinates analysis.

Please cite: Yoshiki Vázquez-Baeza, Meg Pirrung, Antonio Gonzalez and Rob Knight: EMPeror: a tool for visualizing high-throughput microbial community data. (PubMed) Gigascience 2(1):16 (2013)
Registry entries: Bioconda 
python3-geneimpacts
wraps command line tools to assess variants in gene sequences
Versions of package python3-geneimpacts
ReleaseVersionArchitectures
trixie0.3.7-4all
sid0.3.7-4all
bullseye0.3.7-3all
bookworm0.3.7-4all
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Interpersonal differences in DNA is responsible for variations in response to external stimuli, the efficiency of metabolism or may even cause what is referenced as a genetic disorder.

A range of tools have been created to predict the importance of differences (polymorphisms) in genetic sequences at single nucleotides, SNPs. This Python class wraps and represents findings provided by any of the tools snpEff, VEP and BCFT.

Registry entries: Bioconda 
python3-gffutils
Work with GFF and GTF files in a flexible database framework
Versions of package python3-gffutils
ReleaseVersionArchitectures
bullseye0.10.1-2all
bookworm0.11.1-3all
buster0.9-1all
sid0.12-3all
Popcon: 2 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

A Python package for working with and manipulating the GFF and GTF format files typically used for genomic annotations. Files are loaded into a sqlite3 database, allowing much more complex manipulation of hierarchical features (e.g., genes, transcripts, and exons) than is possible with plain-text methods alone.

Registry entries: Bio.tools  Bioconda 
python3-pairtools
Framework to process sequencing data from a Hi-C experiment
Versions of package python3-pairtools
ReleaseVersionArchitectures
trixie1.0.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm1.0.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye0.3.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Simple and fast command-line framework to process sequencing data from a Hi-C experiment.

Process pair-end sequence alignments and perform the following operations:

  • Detect ligation junctions (a.k.a. Hi-C pairs) in aligned paired-end sequences of Hi-C DNA molecules
  • Sort .pairs files for downstream analyses
  • Detect, tag and remove PCR/optical duplicates
  • Generate extensive statistics of Hi-C datasets
  • Select Hi-C pairs given flexibly defined criteria
  • Restore .sam alignments from Hi-C pairs
The package is enhanced by the following packages: python3-pairtools-examples
Registry entries: Bioconda 
python3-pybedtools
enveloppe de Python 3 pour BEDTools pour des tâches de bio-informatique
Versions of package python3-pybedtools
ReleaseVersionArchitectures
sid0.9.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie0.9.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm0.9.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye0.8.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster0.8.0-1amd64,arm64,mips64el,ppc64el
Popcon: 1 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

La suite BEDTools de programmes est largement utilisée pour la manipulation d’intervalle génomique ou « l’algèbre génomique ». pybedtools enveloppe et étend BEDTools et propose des manipulations au niveau fonction à partir de Python.

Il s'agit de la version en Python⋅3.

Please cite: R. K. Dale, B. S. Pedersen and A. R. Quinlan: Pybedtools: a flexible Python library for manipulating genomic datasets and annotations". Bioinformatics 27(24):3423-3424 (2011)
Registry entries: Bio.tools  Bioconda 
python3-sqt
SeQuencing Tools for biological DNA/RNA high-throughput data
Versions of package python3-sqt
ReleaseVersionArchitectures
bullseye0.8.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster0.8.0-3amd64,arm64,mips64el,ppc64el
bookworm0.8.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie0.8.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el
sid0.8.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

sqt is a collection of command-line tools for working with high-throughput sequencing data. Conceptionally not fixed to use any particular language, many sqt subcommands are currently implemented in Python. For them, a Python package is available with functions for reading and writing FASTA/FASTQ files, computing alignments, quality trimming, etc.

The following tools are offered:

  • sqt-coverage -- Compute per-reference statistics such as coverage and GC content
  • sqt-fastqmod -- FASTQ modifications: shorten, subset, reverse complement, quality trimming.
  • sqt-fastastats -- Compute N50, min/max length, GC content etc. of a FASTA file
  • sqt-qualityguess -- Guess quality encoding of one or more FASTA files.
  • sqt-globalalign -- Compute a global or semiglobal alignment of two strings.
  • sqt-chars -- Count length of the first word given on the command line.
  • sqt-sam-cscq -- Add the CS and CQ tags to a SAM file with colorspace reads.
  • sqt-fastamutate -- Add substitutions and indels to sequences in a FASTA file.
  • sqt-fastaextract -- Efficiently extract one or more regions from an indexed FASTA file.
  • sqt-translate -- Replace characters in FASTA files (like the 'tr' command).
  • sqt-sam-fixn -- Replace all non-ACGT characters within reads in a SAM file.
  • sqt-sam-insertsize -- Mean and standard deviation of paired-end insert sizes.
  • sqt-sam-set-op -- Set operations (union, intersection, ...) on SAM/BAM files.
  • sqt-bam-eof -- Check for the End-Of-File marker in compressed BAM files.
  • sqt-checkfastqpe -- Check whether two FASTQ files contain correctly paired paired-end data.
Registry entries: Bioconda 
python3-treetime
inférence de phylogénies marquées temporellement et reconstruction ancestrale – Python 3
Versions of package python3-treetime
ReleaseVersionArchitectures
trixie0.11.1-1all
bullseye0.8.1-1all
buster0.5.3-1all
bookworm0.9.4-1all
sid0.11.1-1all
upstream0.11.3
Popcon: 3 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

TreeTime fournit des routines pour la reconstruction de séquences ancestrales (ASR) et l’inférence du maximum de vraisemblance de phylogénies selon l’horloge moléculaire, c’est-à-dire un arbre où toutes les branches sont échelonnées de façon que leurs emplacements de nœuds terminaux correspondent à leurs temps d’échantillonnage et les nœuds internes sont placés selon le moment de divergence le plus probable.

TreeTime essaie de trouver un compromis entre les modèles probabilistes sophistiqués de l’évolution et les heuristiques rapides. IL met en œuvre les modèles GTR (Generalised time reversible) d’inférence ancestrale et d’optimisation de longueur de branche, mais prend la topologie de l’arbre telle que donnée. Pour optimiser la vraisemblance de phylogénies échelonnées selon le temps, treetime utilise une approche itérative qui d’abord infère les séquences ancestrales selon la longueur de branche de l’arbre, puis optimise la position des nœuds non contraints sur l’axe de temps, et puis répète ce cycle. La seule optimisation de topologie est la résolution (facultative) des polytomies de façon que cela soit le plus (approximativement) cohérent avec les contraintes d’échantillonnage de temps de l’arbre. Ce paquet est conçu pour être utilisé comme un outil autonome ou comme une bibliothèque utilisée dans une suite d’analyse plus large de phylogénie.

Caractéristiques :

 – reconstruction de séquences ancestrale (maximum de vraisemblance marginale et jointe) ;
 – inférence d’arbre selon l’horloge moléculaire (maximum de vraisemblance marginale et jointe) ;
 – inférence de modèles GTR ;
 – changement de racine pour obtenir la meilleure régression racine-extrémité ;
 – horloge moléculaire auto-corrélée souple.

Ce paquet fournit le module avec Python 3.

Registry entries: Bioconda 
pyvcf
helper scripts for Variant Call Format (VCF) parser
Versions of package pyvcf
ReleaseVersionArchitectures
sid0.6.8+git20170215.476169c-10all
bookworm0.6.8+git20170215.476169c-9all
bullseye0.6.8+git20170215.476169c-7all
buster0.6.8+git20170215.476169c-1all
stretch0.6.8-1all
trixie0.6.8+git20170215.476169c-10all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The Variant Call Format (VCF) specifies the format of a text file used in bioinformatics for storing gene sequence variations. The format has been developed with the advent of large-scale genotyping and DNA sequencing projects, such as the 1000 Genomes Project.

The intent of this module is to mimic the csv module in the Python stdlib, as opposed to more flexible serialization formats like JSON or YAML. vcf will attempt to parse the content of each record based on the data types specified in the meta-information lines -- specifically the ##INFO and ##FORMAT lines. If these lines are missing or incomplete, it will check against the reserved types mentioned in the spec. Failing that, it will just return strings.

This package provides helper scripts using python3-pyvcf.

Registry entries: Bioconda 
qcat
demultiplexing Oxford Nanopore reads from FASTQ files
Versions of package qcat
ReleaseVersionArchitectures
sid1.1.0-6all
bullseye1.1.0-2all
bookworm1.1.0-6all
Popcon: 3 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Qcat is a command-line tool for demultiplexing Oxford Nanopore reads from FASTQ files. It accepts basecalled FASTQ files and splits the reads into separate FASTQ files based on their barcode. Qcat makes the demultiplexing algorithms used in albacore/guppy and EPI2ME available to be used locally with FASTQ files. Currently qcat implements the EPI2ME algorithm.

The package is enhanced by the following packages: qcat-examples
Registry entries: Bioconda 
qcumber
quality control of genomic sequences
Versions of package qcumber
ReleaseVersionArchitectures
bullseye2.3.0-2all
buster1.0.14+dfsg-1all
sid2.3.0-2all
bookworm2.3.0-2all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

QCPipeline is a tool for quality control. The workflow is as follows:

 1. Quality control with FastQC
 2. Trim Reads with Trimmomatic
 3. Quality control of trimmed reads with FastQC
 4. Map reads against reference using bowtie2
 5. Classify reads with Kraken
Registry entries: Bioconda 
qiime
QIIME, Quantitative Insights Into Microbial Ecology
Versions of package qiime
ReleaseVersionArchitectures
jessie1.8.0+dfsg-4amd64,armel,armhf,i386
bookworm2022.11.1-2all
sid2024.2.0-1all
trixie2024.2.0-1all
bullseye2020.11.1-1all
Debtags of package qiime:
roleprogram
Popcon: 35 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Les microbes sont omniprésents autour des humains, des animaux, des plantes et de tous leurs parasites, avec un forte interaction sur eux et sur leur environnement. La qualité du sol vient à l’esprit, mais aussi l’effet qu’ont les bactéries sur tous. Les humains influent sur leur abondance relative et absolue par des antibiotiques, des aliments, des engrais ou tout ce qui vient à l’esprit, et ces changements affectent tout le monde.

QIIME 2 est un paquet pour l’analyse de microbiome, extensible et décentralisée avec une attention particulière sur la transparence des données et analyses. QIIME 2 permet aux chercheurs de commencer une analyse avec des données de séquences d’ADN et de terminer avec des figures et des résultats statistiques de qualité professionnelle. Principales caractéristiques :

 — suivi intégré et automatique de la provenance des données ;
 — système de type sémantique ;
 — système de greffons pour étendre les fonctionnalités d’analyse de
   microbiome ;
 — prise en charge de plusieurs types d’interface (par exemple, API,
   ligne de commande, graphique) ;

QIIME 2 est une nouvelle conception et une réécriture de la tuyauterie d’analyse de microbiome, QIIME 1. QIIME 2 corrigera la plupart des limitations de QIIME 1, tout en conservant les fonctions qui font de QIIME 1 une tuyauterie d’analyse puissante et largement utilisée.

QIIME 2 actuellement prend en charge une première tuyauterie d’analyse de microbiome de bout en bout. De nouvelles fonctionnalités seront régulièrement disponibles à travers des greffons de QIIME 2. Une liste de greffons peut être consultée sur la page de disponibilité de greffons de QIIME 2. La page des futurs greffons liste les greffons en cours de développement.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (PubMed,eprint) Nature Biotechnology 37:852 - 857 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Microbial ecology
qtltools
Tool set for molecular QTL discovery and analysis
Versions of package qtltools
ReleaseVersionArchitectures
bullseye1.3.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.3.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.1+dfsg-3amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
stretch1.1+dfsg-1amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
bookworm1.3.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.3.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

QTLtools is a tool set for molecular Quantitative Trait Loci (QTL) discovery and analysis. It allows user to go from the raw sequence data to collection of molecular QTL in few easy-to-perform steps. QTLtools contains multiple methods to prepare the data, to discover proximal and distal molecular QTL and to finally integrate them with GWAS variants and functional annotations of the genome.

The package is enhanced by the following packages: qtltools-example
Please cite: Olivier Delaneau, Halit Ongen, Andrew A. Brown, Alexandre Fort, Nikolaos I. Panousis and Emmanouil T. Dermitzakis: A complete tool set for molecular QTL discovery and analysis. (eprint) Nature Communications (2017)
Registry entries: Bio.tools 
quicktree
Neighbor-Joining algorithm for phylogenies
Versions of package quicktree
ReleaseVersionArchitectures
trixie2.5-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye2.5-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.5-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.5-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

QuickTree is an efficient implementation of the Neighbor-Joining algorithm (PMID: 3447015), capable of reconstructing phylogenies from huge alignments in time less than the age of the universe.

QuickTree accepts both distance matrix and multiple-sequence-aligment inputs. The former should be in PHYLIP format. The latter should be in Stockholm format, which is the native alignment format for the Pfam database. Alignments in various formats can be converted to Stockholm format with the sreformat program, which is part of the HMMer package (hmmer.org).

The tress are written to stdout, in the Newick/New-Hampshire format use by PHYLIP and many other programs

quorum
QUality Optimized Reads of genomic sequences
Versions of package quorum
ReleaseVersionArchitectures
trixie1.1.2-2amd64,arm64,mips64el,ppc64el
bullseye1.1.1-4amd64,arm64,mips64el,ppc64el
buster1.1.1-2amd64,arm64,mips64el,ppc64el
bookworm1.1.1-7amd64,arm64,mips64el,ppc64el
sid1.1.2-2amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

QuorUM enables to obtain trimmed and error-corrected reads that result in assemblies with longer contigs and fewer errors. QuorUM provides best performance compared to other published error correctors in several metrics. QuorUM is efficiently implemented making use of current multi- core computing architectures and it is suitable for large data sets (1 billion bases checked and corrected per day per core). The third-party assembler (SOAPdenovo) benefits significantly from using QuorUM error- corrected reads. QuorUM error corrected reads result in a factor of 1.1 to 4 improvement in N50 contig size compared to using the original reads with SOAPdenovo for the data sets investigated.

Please cite: Guillaume Marçais, James A. Yorke and Aleksey Zimin: QuorUM: An Error Corrector for Illumina Reads. (PubMed,eprint) PLoS One 10(6):e0130821 (2015)
Registry entries: SciCrunch 
qutemol
visualisation interactive de macromolécules
Versions of package qutemol
ReleaseVersionArchitectures
stretch0.4.1~cvs20081111-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.4.1~cvs20081111-3.2amd64,armel,armhf,i386
buster0.4.1~cvs20081111-12amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.4.1~cvs20081111-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.4.1~cvs20081111-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.4.1~cvs20081111-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.4.1~cvs20081111-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package qutemol:
interfacex11
roleprogram
uitoolkitglut, wxwidgets
x11application
Popcon: 10 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

QuteMol est un système de visualisation moléculaire interactif et de haute qualité. Il exploite les capacités des GPU actuels grâce aux shaders OpenGL pour proposer un ensemble d'effets visuels innovants. Les techniques de visualisation de QuteMole sont destinées à améliorer la clarté et la compréhension de la forme en 3D et de la structure de grandes molécules ou de protéines complexes.

QuteMol utilise des techniques évoluées d'OpenGL et pourrait ne pas fonctionner correctement avec toutes les cartes graphiques et tous les pilotes.

Les fonctionnalités proposées par QuteMol incluent :

 − occlusion ambiante en temps réel ;
 − amélioration de la silhouette prenant en compte la profondeur ;
 − modes de visualisation en boule et bâton, remplissage de l'espace et
    « liquorice » ;
 − création automatique de gifs animés de molécules en rotation pour les
    animations de pages web ;
 − rendu interactif de macromolécules (plus de 100 atomes).

QuteMol lit les fichiers PDB en entrée.

Please cite: Marco Tarini, Paolo Cignoni and Claudio Montani: Ambient Occlusion and Edge Cueing for Enhancing Real Time Molecular Visualization. (eprint) IEEE Transactions on Visualization and Computer Graphics 12(5):1237-1244 (2006)
Registry entries: SciCrunch 
Screenshots of package qutemol
r-bioc-annotate
annotations de BioConductor pour les puces à ADN
Versions of package r-bioc-annotate
ReleaseVersionArchitectures
sid1.80.0+dfsg-1all
bookworm1.76.0+dfsg-1all
buster1.60.0+dfsg-1all
trixie1.80.0+dfsg-1all
bullseye1.68.0+dfsg-1all
stretch1.52.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 23 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Ce module de BioConductor fournit des méthodes pour l'annotation de puces à ADN.

Dans son état présent, l'objectif de base d'annotate est de fournir des routines d'interface qui prennent en charge les actions de l'utilisateur qui reposent sur les différents paquets de métadonnées fournis à travers le projet BioConductor.

Registry entries: Bioconda 
r-bioc-biostrings
GNU R string objects representing biological sequences
Versions of package r-bioc-biostrings
ReleaseVersionArchitectures
bookworm2.66.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.32.1-1amd64,armel,armhf,i386
stretch2.42.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.50.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.58.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.70.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.70.2+dfsg-1armel,armhf
sid2.70.3+dfsg-1amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 49 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Memory efficient string containers, string matching algorithms, and other utilities, for fast manipulation of large biological sequences or set of sequences.

Registry entries: Bio.tools  Bioconda 
r-bioc-bitseq
inférence de transcription d’expression et analyse pour des données de RNA-seq
Versions of package r-bioc-bitseq
ReleaseVersionArchitectures
buster1.26.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.34.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet BitSeq est destiné à l’analyse d’expression de transcription et l’analyse d’expression différentielle de données de RNA-seq data dans un processus en deux étapes. Dans la première, il utilise la méthode d’inférence bayésienne pour inférer l’expression de transcriptions individuelles d’expériences de RNA-seq particulières. La seconde étape de BitSeq englobe l’analyse d’expression différentielle d’expression de transcription. Fournissant une expression estimée à partir de réplications dans plusieurs conditions, le modèle Log-Normal des estimations est utilisé pour déduire l’expression de transcription d’espérance conditionnelle et classer les transcriptions en se basant sur la probabilité de l’expression différentielle.

Please cite: Peter Glaus, Antti Honkela and Magnus Rattray: Identifying differentially expressed transcripts from RNA-seq data with biological variation. (PubMed,eprint) Bioinformatics 28(13):1721–1728 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-cner
CNE Detection and Visualization
Versions of package r-bioc-cner
ReleaseVersionArchitectures
buster1.18.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.34.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.38.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.26.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Large-scale identification and advanced visualization of sets of conserved noncoding elements.

Registry entries: Bio.tools  Bioconda 
r-bioc-cummerbund
tool for analysis of Cufflinks RNA-Seq output
Versions of package r-bioc-cummerbund
ReleaseVersionArchitectures
bookworm2.40.0-1all
jessie2.6.1-1all
buster2.24.0-2all
sid2.44.0-1all
stretch2.16.0-2all
bullseye2.32.0-1all
Popcon: 6 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Allows for persistent storage, access, exploration, and manipulation of Cufflinks high-throughput sequencing data. In addition, provides numerous plotting functions for commonly used visualizations.

Please cite: L. Goff and C. Trapnell: cummeRbund: Analysis, exploration, manipulation, and visualization of Cufflinks high-throughput sequencing data (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-deseq2
R package for RNA-Seq Differential Expression Analysis
Versions of package r-bioc-deseq2
ReleaseVersionArchitectures
bullseye1.30.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.38.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.42.0+dfsg-1armel,armhf
buster1.22.2+dfsg-1amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.42.1+dfsg-1amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
trixie1.42.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch1.14.1-1amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 18 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Differential gene expression analysis based on the negative binomial distribution. Estimate variance-mean dependence in count data from high-throughput sequencing assays and test for differential expression based on a model using the negative binomial distribution.

Please cite: Michael I Love, Wolfgang Huber and Simon Anders: Moderated estimation of fold change and dispersion for {RNA}-seq data with {DESeq}2. (eprint) Genome Biol 15(12) (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-ebseq
R package for RNA-Seq Differential Expression Analysis
Versions of package r-bioc-ebseq
ReleaseVersionArchitectures
buster1.22.1-2all
trixie2.0.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.38.0-1all
bullseye1.30.0-1all
stretch1.14.0-1all
sid2.0.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

r-bioc-ebseq is an R package for identifying genes and isoforms differentially expressed (DE) across two or more biological conditions in an RNA-seq experiment.

Please cite: Ning Leng, John A. Dawson, James A. Thomson, Victor Ruotti, Anna I. Rissman, Bart M. G. Smits, Jill D. Haag, Michael N. Gould, Ron M. Stewart and Christina Kendziorski: EBSeq: an empirical Bayes hierarchical model for inference in RNA-seq experiments. (eprint) Bioinformatics 29(8):1035-1043 (2013)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-edger
analyse empirique de données numériques d’expressions de gène avec R
Versions of package r-bioc-edger
ReleaseVersionArchitectures
jessie3.8.2+dfsg-1amd64,armel,armhf,i386
bookworm3.40.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.32.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.0.15+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid4.0.15+dfsg-1armel,armhf
stretch3.14.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid4.0.16+dfsg-1amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 18 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un paquet de Bioconductor pour l’analyse différentielle des expressions de tout le séquençage du transcriptome (RNA-seq) et des profils numériques d’expressions de gène avec réplication biologique. Il utilise l’estimation empirique de Bayes et des tests exacts basés sur la loi binomiale négative. Il est aussi utile pour l’analyse différentielle de signaux avec d’autres types de données de dénombrement à l’échelle du génome.

Please cite: Mark D. Robinson, Davis J. McCarthy and Gordon K. Smyth: edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. (PubMed,eprint) Bioinformatics 26,:139-140 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-genefilter
methods for filtering genes from microarray experiments
Versions of package r-bioc-genefilter
ReleaseVersionArchitectures
bullseye1.72.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.64.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.56.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.80.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.84.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.84.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 18 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

This BioConductor module provides methods for filtering genes from microarray experiments. It contains some basic functions for filtering genes.

Registry entries: Bio.tools  Bioconda 
r-bioc-geoquery
Get data from NCBI Gene Expression Omnibus (GEO)
Versions of package r-bioc-geoquery
ReleaseVersionArchitectures
bullseye2.58.0+dfsg-2all
trixie2.70.0+dfsg-1all
sid2.70.0+dfsg-1all
bookworm2.66.0+dfsg-1all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The NCBI Gene Expression Omnibus (GEO) is a public repository of microarray data. Given the rich and varied nature of this resource, it is only natural to want to apply BioConductor tools to these data. GEOquery is the bridge between GEO and BioConductor.

Please cite: Sean Davis and Paul Meltzer: GEOquery: a bridge between the Gene Expression Omnibus (GEO) and BioConductor Bioinformatics 14,:1846-1847, (2007,)
Registry entries: Bio.tools  Bioconda 
r-bioc-hilbertvis
paquet de GNU R pour visualiser de grands vecteurs de données
Versions of package r-bioc-hilbertvis
ReleaseVersionArchitectures
bullseye1.48.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.40.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.56.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.24.0-1amd64,armel,armhf,i386
trixie1.60.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.60.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.32.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package r-bioc-hilbertvis:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
useanalysing
Popcon: 7 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Cet outil permet d’afficher de très grands vecteurs de données d’une manière efficace du point de vue espace, en les organisant le long d’une courbe de Hilbert en 2D. L’utilisateur peut visuellement évaluer la structure de grande échelle et la distribution des caractéristiques simultanément avec la forme et l’intensité grossières des caractéristiques individuelles.

En bio-informatique, un cas typique d’utilisation est ChIP-Chip et ChIP- Seq, ou, fondamentalement, toutes les sortes de donnée génomique affichées conventionnellement sous forme de traces quantitatives (« données wiggle ») dans les navigateurs de génomes tels que ceux fournis par Ensembl ou UCSC.

Please cite: Simon Anders: Visualization of genomic data with the Hilbert curve. (PubMed,eprint) Bioinformatics 25(10):1231-1235 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Remark of Debian Med team: It would be interesting to package HilbertVisGUI as well.
r-bioc-htsfilter
GNU R filter replicated high-throughput transcriptome sequencing data
Versions of package r-bioc-htsfilter
ReleaseVersionArchitectures
bookworm1.38.0+dfsg-2all
bullseye1.30.1+dfsg-1all
trixie1.42.0+dfsg-1all
sid1.42.0+dfsg-1all
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

This package implements a filtering procedure for replicated transcriptome sequencing data based on a global Jaccard similarity index in order to identify genes with low, constant levels of expression across one or more experimental conditions.

r-bioc-impute
Imputation for microarray data
Versions of package r-bioc-impute
ReleaseVersionArchitectures
trixie1.76.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.56.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.64.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.72.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.76.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 8 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

R package which provide a function to perform imputation for microarray data (currently KNN only).

Registry entries: Bio.tools  Bioconda 
r-bioc-limma
modèles linéaires pour des données de biopuce (microarray)
Versions of package r-bioc-limma
ReleaseVersionArchitectures
bullseye3.46.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.38.3+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.58.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.54.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.58.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie3.22.1+dfsg-1amd64,armel,armhf,i386
stretch3.30.8+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 19 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

Les biopuces (puces à gènes) sont des plaques microscopiques de brins de courtes séquences d’ADN soigneusement arrangées ou des surfaces préparées chimiquement auxquelles d’autres ADN se lient de préférence. Le montant des liaisons d’ADN dans des emplacements différents de ces puces, déterminé classiquement par un colorant fluorescent, est à déterminer. La technologie est utilisée habituellement avec de l’ADN dérivant d’ARN, c'est-à-dire pour déterminer l’activité d’un gène ou des variantes d’épissage. Mais la technologie est aussi utilisée pour déterminer les variations de séquence dans l’ADN génomique.

Le paquet Bioconductor prend en charge l’analyse de données d’expression de biopuces (microarray), particulièrement l’utilisation de modèles linéaires pour l’analyse d’expériences imaginées et l’évaluation d’expression différentielle. Le paquet fournit des possibilités de pré- traitement pour les puces décolorées en deux couleurs. Les méthodes d’expression différentielle s’appliquent à toutes les plateformes de puce et traitent les expérimentations simple canal et double canaux d’Affymetrix, de manière unifiée.

Please cite: Gordon K. Smyth: Limma: linear models for microarray data. (eprint) :397-420 (2005)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-megadepth
BioCOnductor BigWig and BAM related utilities
Versions of package r-bioc-megadepth
ReleaseVersionArchitectures
sid1.12.0+ds-2all
trixie1.12.0+ds-2all
bookworm1.8.0+ds-1all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides an R interface to Megadepth by Christopher Wilks available at https://github.com/ChristopherWilks/megadepth. It is particularly useful for computing the coverage of a set of genomic regions across bigWig or BAM files. With this package, you can build base-pair coverage matrices for regions or annotations of your choice from BigWig files. Megadepth was used to create the raw files provided by https://bioconductor.org/packages/recount3.

Registry entries: Bio.tools  Bioconda 
r-bioc-mergeomics
Integrative network analysis of omics data
Versions of package r-bioc-mergeomics
ReleaseVersionArchitectures
buster1.10.0-1all
sid1.30.0-1all
trixie1.30.0-1all
bookworm1.26.0-1all
bullseye1.18.0-1all
stretch1.2.0-1all
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The Mergeomics pipeline serves as a flexible framework for integrating multidimensional omics-disease associations, functional genomics, canonical pathways and gene-gene interaction networks to generate mechanistic hypotheses. It includes two main parts: 1) Marker set enrichment analysis (MSEA); 2) Weighted Key Driver Analysis (wKDA).

Please cite: Le Shu, Yuqi Zhao, Zeyneb Kurt, Sean Geoffrey Byars, Taru Tukiainen, Johannes Kettunen, Luz D. Orozco, Matteo Pellegrini, Aldons J. Lusis, Samuli Ripatti, Bin Zhang, Michael Inouye, Ville-Petteri Mäkinen and Xia Yang: Mergeomics: multidimensional data integration to identify pathogenic perturbations to biological systems. (eprint) BMC Genomics (2016)
Registry entries: Bio.tools 
r-bioc-metagenomeseq
GNU R statistical analysis for sparse high-throughput sequencing
Versions of package r-bioc-metagenomeseq
ReleaseVersionArchitectures
trixie1.43.0-2all
buster1.24.1-1all
bookworm1.40.0-1all
bullseye1.32.0-1all
stretch1.16.0-2all
sid1.43.0-2all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MetagenomeSeq is designed to determine features (be it Operational Taxanomic Unit (OTU), species, etc.) that are differentially abundant between two or more groups of multiple samples. metagenomeSeq is designed to address the effects of both normalization and under-sampling of microbial communities on disease association detection and the testing of feature correlations.

Registry entries: Bio.tools  Bioconda 
r-bioc-mofa
Multi-Omics Factor Analysis (MOFA)
Versions of package r-bioc-mofa
ReleaseVersionArchitectures
sid1.6.1+dfsg-12all
bullseye1.6.1+dfsg-1all
bookworm1.6.1+dfsg-10all
trixie1.6.1+dfsg-12all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Multi-Omics Factor Analysis: an unsupervised framework for the integration of multi-omics data sets.

Upstream no longer supports this package. This package only still ships to help with rerunning/comparing/transitioning existing projects. For new projects please upgrade to MOFA2 (MOFA+). Actually, also when adding new data to old projects, MOFA2 has further improved the handling of multiple factors, and to compensate for a batch effect that is likely introduced with additional data, may be an immediate use case for that new version.

Please cite: Ricard Argelaguet, Britta Velten, Damien Arnol, Sascha Dietrich, Thorsten Zenz, John C Marioni, Florian Buettner, Wolfgang Huber and Oliver Stegle: Link to publication Mol Syst Biol 14:e8124 (2018)
Registry entries: Bioconda 
r-bioc-multiassayexperiment
Software for integrating multi-omics experiments in BioConductor
Versions of package r-bioc-multiassayexperiment
ReleaseVersionArchitectures
sid1.28.0+dfsg-1all
bullseye1.16.0+dfsg-1all
trixie1.28.0+dfsg-1all
bookworm1.24.0+dfsg-2all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

MultiAssayExperiment harmonizes data management of multiple assays performed on an overlapping set of specimens. It provides a familiar Bioconductor user experience by extending concepts from SummarizedExperiment, supporting an open-ended mix of standard data classes for individual assays, and allowing subsetting by genomic ranges or rownames.

Registry entries: Bio.tools  Bioconda 
r-bioc-mutationalpatterns
GNU R comprehensive genome-wide analysis of mutational processes
Versions of package r-bioc-mutationalpatterns
ReleaseVersionArchitectures
bullseye3.0.1+dfsg-2all
sid3.12.0+dfsg-1all
bookworm3.8.1+dfsg-1all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

This BioConductor package provides an extensive toolset for the characterization and visualization of a wide range of mutational patterns in base substitution catalogs.

r-bioc-phyloseq
GNU R handling and analysis of high-throughput microbiome census data
Versions of package r-bioc-phyloseq
ReleaseVersionArchitectures
sid1.46.0+dfsg-1all
buster1.26.1+dfsg-1all
trixie1.46.0+dfsg-1all
stretch1.19.1-2all
bookworm1.42.0+dfsg-1all
bullseye1.34.0+dfsg-1all
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The Bioconductor module phyloseq provides a set of classes and tools to facilitate the import, storage, analysis, and graphical display of microbiome census data.

Please cite: Paul J. McMurdie and Susan Holmes: phyloseq: An R package for reproducible interactive analysis and graphics of microbiome census data. PLoS ONE 8(4):e61217 (2013)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-rtracklayer
GNU R interface to genome browsers and their annotation tracks
Versions of package r-bioc-rtracklayer
ReleaseVersionArchitectures
bullseye1.50.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.34.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.62.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.62.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.58.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.42.1-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.24.2-1amd64,armel,armhf,i386
Popcon: 15 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Extensible framework for interacting with multiple genome browsers (currently UCSC built-in) and manipulating annotation tracks in various formats (currently GFF, BED, bedGraph, BED15, WIG, BigWig and 2bit built-in). The user may export/import tracks to/from the supported browsers, as well as query and modify the browser state, such as the current viewport.

Please cite: Michael Lawrence, Robert Gentleman and "Vincent Carey: rtracklayer: an R package for interfacing with genome browsers. (PubMed,eprint) Bioinformatics 25(14):1841-1842 (2009)
Registry entries: Bio.tools  Bioconda 
r-bioc-scater
Single-Cell Analysis Toolkit for Gene Expression Data in R
Versions of package r-bioc-scater
ReleaseVersionArchitectures
trixie1.30.1+ds-2all
bullseye1.18.3+ds-4all
sid1.30.1+ds-2all
bookworm1.26.1+ds-1all
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

A collection of tools for doing various analyses of single-cell RNA-seq gene expression data, with a focus on quality control and visualization.

Please cite: McCarthy DJ, Campbell KR, Lun ATL and Willis QF: Scater: pre-processing, quality control, normalisation and visualisation of single-cell RNA-seq data in R. Bioinformatics 33:1179-1186 (2017)
Registry entries: Bio.tools  Bioconda 
r-bioc-tfbstools
GNU R Transcription Factor Binding Site (TFBS) Analysis
Versions of package r-bioc-tfbstools
ReleaseVersionArchitectures
bookworm1.36.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.20.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.28.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.40.0+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

TFBSTools is a package for the analysis and manipulation of transcription factor binding sites. It includes matrices conversion between Position Frequency Matirx (PFM), Position Weight Matirx (PWM) and Information Content Matrix (ICM). It can also scan putative TFBS from sequence/alignment, query JASPAR database and provides a wrapper of de novo motif discovery software.

Please cite: Ge Tan and Boris Lenhard: TFBSTools: an R/bioconductor package for transcription factor binding site analysis. (PubMed,eprint) Bioinformatics 32(10):1555–1556 (2016)
Registry entries: Bio.tools  Bioconda 
r-cran-adegenet
GNU R exploratory analysis of genetic and genomic data
Versions of package r-cran-adegenet
ReleaseVersionArchitectures
trixie2.1.10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster2.1.1-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.1.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.1.10-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.0.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.1.10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 11 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Toolset for the exploration of genetic and genomic data. Adegenet provides formal (S4) classes for storing and handling various genetic data, including genetic markers with varying ploidy and hierarchical population structure ('genind' class), alleles counts by populations ('genpop'), and genome-wide SNP data ('genlight'). It also implements original multivariate methods (DAPC, sPCA), graphics, statistical tests, simulation tools, distance and similarity measures, and several spatial methods. A range of both empirical and simulated datasets is also provided to illustrate various methods.

Please cite: Thibaut Jombart: adegenet: a R package for the multivariate analysis of genetic markers. (PubMed,eprint) Bioinformatics 24(11):1403-5 (2008)
Registry entries: SciCrunch 
r-cran-adephylo
GNU R exploratory analyses for the phylogenetic comparative method
Versions of package r-cran-adephylo
ReleaseVersionArchitectures
trixie1.1-16-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.1-13-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1-11-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1-11-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.1-16-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.1-10-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 8 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

This GNU R package provides multivariate tools to analyze comparative data, i.e. a phylogeny and some traits measured for each taxa.

Please cite: Thibaut Jombart, François Balloux and Stéphane Dray: adephylo: new tools for investigating the phylogenetic signal in biological traits. (PubMed,eprint) Bioinformatics 26(15):1907-1909 (2010)
Registry entries: Bioconda 
r-cran-alakazam
lignage clonal d’immunoglobuline et analyse de diversité
Versions of package r-cran-alakazam
ReleaseVersionArchitectures
sid1.3.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster0.2.11-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.2.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Alakazam is part of the Immcantation analysis framework for Adaptive Immune Receptor Repertoire sequencing (AIRR-seq) and provides a set of tools to investigate lymphocyte receptor clonal lineages, diversity, gene usage, and other repertoire level properties, with a focus on high-throughput immunoglobulin (Ig) sequencing.

Alakazam serves five main purposes:

  • Providing core functionality for other R packages in the Immcantation framework. This includes common tasks such as file I/O, basic DNA sequence manipulation, and interacting with V(D)J segment and gene annotations.
  • Providing an R interface for interacting with the output of the pRESTO and Change-O tool suites.
  • Performing lineage reconstruction on clonal populations of Ig sequences and analyzing the topology of the resultant lineage trees.
  • Performing clonal abundance and diversity analysis on lymphocyte repertoires.
  • Performing physicochemical property analyses of lymphocyte receptor sequences.
Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data. (eprint) 31(20):3356–3358 (2017)
r-cran-ape
paquet de GNU R pour l’analyse de phylogénie et d’évolution
Versions of package r-cran-ape
ReleaseVersionArchitectures
buster5.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch4.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.1-4-1amd64,armel,armhf,i386
bookworm5.7-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie5.7-1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye5.4-1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid5.7-1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 71 users (20 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit des fonctions pour lire, écrire, tracer et manipuler des arbres phylogénétiques, des analyses de données comparatives dans un environnement phylogénétique, des analyses de caractères ancestraux, des analyses de diversification et macroévolution, pour calculer des distances de séquences d’ARN, pour lire et écrire des séquences de nucléotides, ainsi que l’importation à partir de BioConductor et plusieurs outils tels que le test de Mantel, les tracés de profils d’horizon généralisés (generalized skyline plots), l’exploration graphique de données phylogénétiques (alex, trex, kronoviz), l’estimation de taux évolutionnaires absolus et des arbres similaires à des horloges utilisant les longueurs de chemin moyennes, la vraisemblance pénalisée, des arbres de datation avec des séquences contemporaines, la traduction de séquences d’ADN en séquences AA et l’évaluation d’alignements de séquences. L’estimation phylogénétique peut être faite avec les méthodes NJ, BIONJ, ME, MVR, SDM et de « triangle » ainsi que plusieurs méthodes gérant les matrices incomplètes de distance (NJ, BIONJ, MVR* et la « méthode du triangle » correspondante. Quelques fonctions appellent des applications externes (PhyML, Clustal, T-Coffee, Muscle) dent les résultats sont renvoyés dans R.

Please cite: Emmanuel Paradis and Klaus Schliep: ape 5.0: an environment for modern phylogenetics and evolutionary analyses in R. Bioinformatics (2018)
r-cran-bio3d
paquet GNU R pour l'analyse de structures biologiques
Versions of package r-cran-bio3d
ReleaseVersionArchitectures
trixie2.4-4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch2.3-1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.3-4-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.4-4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.4-4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.4-1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 6 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet bio3d contient des outils pour traiter, organiser et explorer les données de structure, de séquence et de dynamique des protéines. Ils peuvent lire et écrire ces données, effectuer des sélections d'atomes, des ré-orientations, des superpositions, de l'identification de régions rigides (« rigid core identification »), de l'agglomération (« clustering »), de l'analyse de torsion, de l'analyse matricielle de distances, de l'analyse de structure et de conservation de séquence et l'analyse du composant principal (PCA : principal component analysis). En plus de cela, des fonctions utilitaires sont fournies pour permettre à la puissance graphique de l'environnement R de travailler avec des données de séquencement et de structuration biologiques.

Please cite: Barry J. Grant, Ana P. C. Rodrigues, Karim M. ElSawy, J. Andrew McCammon and Leo S. D. Caves: Bio3d: an R package for the comparative analysis of protein structures. (PubMed,eprint) Bioinformatics 22(21):2695-2696 (2006)
r-cran-distory
GNU R distance between phylogenetic histories
Versions of package r-cran-distory
ReleaseVersionArchitectures
sid1.4.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.4.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.4.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.4.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.4.3-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.4.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 7 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

This GNU R package enables calculation of geodesic distance between phylogenetic trees and associated functions.

r-cran-genabel
GNU R package for genome-wide SNP association analysis
Versions of package r-cran-genabel
ReleaseVersionArchitectures
trixie1.8-0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie1.8-0-1amd64,armel,armhf,i386
sid1.8-0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.8-0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.8-0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.8-0-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.8-0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 6 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

The package offers the R library GenABEL for the hunt of genetic contributions to a disease (or any other pheonypical trait) by so called genome-wide association analysis. Additional input commonly comes from DNA mircoarray experiments, performed on every individual, that determine differences (polymorphisms) in the population. GenABEL finds associations between quantitative or binary traits and single-nucleiotide polymorphisms (SNPs).

Package 'GenABEL’ was removed from the CRAN repository. The code was obtained from the archive.

Please cite: Yurii S. Aulchenko, Stephan Ripke, Aaron Isaacs and Cornelia M. van Duijn: GenABEL: an R library for genome-wide association analysis. (PubMed,eprint) Bioinformatics 23(10):1294-1296 (2007)
Registry entries: Bio.tools  SciCrunch 
r-cran-kaos
Encoding of Sequences Based on Frequency Matrix Chaos
Versions of package r-cran-kaos
ReleaseVersionArchitectures
trixie0.1.2-2all
bookworm0.1.2-2all
sid0.1.2-2all
bullseye0.1.2-2all
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Sequences encoding by using the chaos game representation. Löchel et al. (2019) .

Please cite: Hannah F. Löchel, Dominic Eger, Theodor Sperlea and Dominik Heider: Deep learning on chaos game representation for proteins. Bioinformatics (2019)
Registry entries: Bioconda 
r-cran-metamix
GNU R bayesian mixture analysis for metagenomic community profiling
Versions of package r-cran-metamix
ReleaseVersionArchitectures
bullseye0.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.3-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.3-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Resolves complex metagenomic mixtures by analysing deep sequencing data, using a mixture model based approach. The use of parallel Monte Carlo Markov chains for the exploration of the species space enables the identification of the set of species more likely to contribute to the mixture.

Please cite: Sofia Morfopoulou and Vincent Plagnol: Bayesian mixture analysis for metagenomic community profiling. (eprint) Bioinformatics 31(18):2930-2938 (2015)
Registry entries: Bio.tools 
r-cran-phangorn
GNU R package for phylogenetic analysis
Versions of package r-cran-phangorn
ReleaseVersionArchitectures
trixie2.11.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch2.1.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.11.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.4.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.11.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.5.5-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 67 users (16 upd.)*
Versions and Archs
License: DFSG free
Git

phangorn is a tool for reconstructing phylogenies, using distance-based methods, maximum parsimony or maximum likelihood, and performing Hadamard conjugation. It also offers functions for comparing trees, phylogenetic models or splits, simulating character data and performing congruence analysis.

Please cite: K.P. Schliep: phangorn: phylogenetic analysis in R. (PubMed) Bioinformatics 27(4):592-593 (2011)
r-cran-phytools
GNU R phylogenetic tools for comparative biology
Versions of package r-cran-phytools
ReleaseVersionArchitectures
trixie2.1-1-1all
bookworm1.5-1-1all
sid2.1-1-1all
bullseye0.7-70-1all
buster0.6-60-1all
Popcon: 7 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

A wide range of functions for phylogenetic analysis. Functionality is concentrated in phylogenetic comparative biology, but also includes a diverse array of methods for visualizing, manipulating, reading or writing, and even inferring phylogenetic trees and data. Included among the functions in phylogenetic comparative biology are various for ancestral state reconstruction, model-fitting, simulation of phylogenies and data, and multivariate analysis. There are a broad range of plotting methods for phylogenies and comparative data which include, but are not restricted to, methods for mapping trait evolution on trees, for projecting trees into phenotypic space or a geographic map, and for visualizing correlated speciation between trees. Finally, there are a number of functions for reading, writing, analyzing, inferring, simulating, and manipulating phylogenetic trees and comparative data not covered by other packages. For instance, there are functions for randomly or non-randomly attaching species or clades to a phylogeny, for estimating supertrees or consensus phylogenies from a set, for simulating trees and phylogenetic data under a range of models, and for a wide variety of other manipulations and analyses that phylogenetic biologists might find useful in their research.

Please cite: Liam J. Revell: phytools: an R package for phylogenetic comparative biology (and other things). (eprint) Methods in Ecology and Evolution 3(2):217-223 (2012)
Registry entries: SciCrunch 
r-cran-pscbs
R package: Analysis of Parent-Specific DNA Copy Numbers
Versions of package r-cran-pscbs
ReleaseVersionArchitectures
sid0.67.0-1all
trixie0.67.0-1all
buster0.64.0-1all
bullseye0.65.0-3all
bookworm0.66.0-2all
stretch0.62.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Segmentation of allele-specific DNA copy number data and detection of regions with abnormal copy number within each parental chromosome. Both tumor-normal paired and tumoronly analyses are supported.

Please cite: Adam B. Olshen, Henrik Bengtsson, Pierre Neuvial, Paul T. Spellman, Richard A. Olshen and Venkatraman E. Seshan: Parent-specific copy number in paired tumor-normal studies using circular binary segmentation. (PubMed,eprint) Bioinformatics 27(15):2038-2046 (2011)
Registry entries: SciCrunch  Bioconda 
r-cran-qtl
paquet de GNU R d’analyse de liaisons de marqueurs génétiques
Versions of package r-cran-qtl
ReleaseVersionArchitectures
bookworm1.58-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.66-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.47-9-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.40-8-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.66-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.33-7-1amd64,armel,armhf,i386
buster1.44-9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package r-cran-qtl:
devellang:r, library
fieldbiology, statistics
roleapp-data
suitegnu
Popcon: 17 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

R/qtl est un environnement interactif et extensible pour cartographier les QTL (locus de caractères quantitatifs) dans des croisements expérimentaux. Il est implanté comme un module complémentaire pour le langage/logiciel de statistiques libre et largement utilisé « R » (voir http://www.r- project.org).

Le développement de ce logiciel comme extension de R permet de profiter des fonctions mathématiques et statistiques basiques ainsi que des capacités graphiques puissantes fournies avec R. De plus, l’utilisateur bénéficie de l’intégration transparente du logiciel de cartographie QTL dans le programme d’analyse statistique générale. Le but est rendre les méthodes complexes de mappage de QTL très accessibles et de permettre aux utilisateurs de se concentrer plutôt sur la modélisation que sur le calcul.

Un composant clef des méthodes de calcul pour le mappage QTL est la technologie du modèle de Markov caché (MMC/HMM) pour composer avec les données de génotype manquantes. Les algorithmes MMC principaux, avec compensation de la présence d’erreurs de génotypage, pour rétrocroisement, intercroisement, croisement « four-way » à phases connues ont été implémentés.

La version actuelle de R/qtl inclut des structures pour estimer les cartes génétiques, identifier les erreurs du génotype, lancer des recherches de QTL simple et QTL double, des recherches bi-dimensionnelles, par correspondance d’intervalle (avec l’algorithme EM), la régression de Haley-Knott, et l’imputation multiple. Tout cela peut être réalisé en la présence de covariantes (comme le sexe, l’âge ou le traitement). Il est aussi possible de faire correspondre des modèles de QTL d’ordre plus élevé par imputation multiple.

Please cite: Karl W. Broman, Hao Wu, Saunak Sen and Gary A. Churchill: R/qtl: QTL mapping in experimental crosses. (PubMed,eprint) Bioinformatics 19:889-890 (2003)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-cran-rotl
GNU R interface to the 'Open Tree of Life' API
Versions of package r-cran-rotl
ReleaseVersionArchitectures
buster3.0.6-1all
bookworm3.0.14-1all
stretch3.0.1-1all
bullseye3.0.11-1all
trixie3.1.0-1all
sid3.1.0-1all
Popcon: 9 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

An interface to the 'Open Tree of Life' API to retrieve phylogenetic trees, information about studies used to assemble the synthetic tree, and utilities to match taxonomic names to 'Open Tree identifiers'. The 'Open Tree of Life' aims at assembling a comprehensive phylogenetic tree for all named species.

r-cran-samr
GNU R significance analysis of microarrays
Versions of package r-cran-samr
ReleaseVersionArchitectures
bookworm3.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye3.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

This GNU R package provides significance analysis of microarrays. A microarray is a multiplex lab-on-a-chip. It is a 2D array on a solid substrate (usually a glass slide or silicon thin-film cell) that assays large amounts of biological material using high-throughput screening miniaturized, multiplexed and parallel processing and detection methods.

This package helps analysing this kind of microarrays.

Registry entries: Bio.tools  SciCrunch  Bioconda 
r-cran-sdmtools
Species Distribution Modelling Tools
Versions of package r-cran-sdmtools
ReleaseVersionArchitectures
bullseye1.1-221.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.1-221.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1-221-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.1-221.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.1-221.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides a set of tools for post processing the outcomes of species distribution modeling exercises. It includes novel methods for comparing models and tracking changes in distributions through time. It further includes methods for visualizing outcomes, selecting thresholds, calculating measures of accuracy and landscape fragmentation statistics, etc.

This package was made possible in part by financial support from the Australian Research Council & ARC Research Network for Earth System Science.

r-cran-seqinr
GNU R biological sequences retrieval and analysis
Versions of package r-cran-seqinr
ReleaseVersionArchitectures
stretch3.3-3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid4.2-36-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.2-36-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster3.4-5-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye4.2-5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.2-23-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 14 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Exploratory data analysis and data visualization for biological sequence (DNA and protein) data. Includes also utilities for sequence data management under the ACNUC system.

r-cran-seurat
Tools for Single Cell Genomics
Versions of package r-cran-seurat
ReleaseVersionArchitectures
sid5.0.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye4.0.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.3.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream5.0.3
Popcon: 6 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

A toolkit for quality control, analysis, and exploration of single cell RNA sequencing data. 'Seurat' aims to enable users to identify and interpret sources of heterogeneity from single cell transcriptomic measurements, and to integrate diverse types of single cell data. See Satija R, Farrell J, Gennert D, et al (2015) , Macosko E, Basu A, Satija R, et al (2015) , and Butler A and Satija R (2017) for more details.

Please cite: Rahul Satija, Jeffrey A. Farrell, David Gennert, Alexander F. Schier and Aviv Regev: Spatial reconstruction of single-cell gene expression data. (PubMed) Nature Biotechnology 33:495–502 (2015)
Registry entries: Bioconda 
r-cran-shazam
Immunoglobulin Somatic Hypermutation Analysis
Versions of package r-cran-shazam
ReleaseVersionArchitectures
bullseye1.0.2-1all
bookworm1.1.2-1all
buster0.1.11-1all
sid1.2.0-1all
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Provides a computational framework for Bayesian estimation of antigen-driven selection in immunoglobulin (Ig) sequences, providing an intuitive means of analyzing selection by quantifying the degree of selective pressure. Also provides tools to profile mutations in Ig sequences, build models of somatic hypermutation (SHM) in Ig sequences, and make model-dependent distance comparisons of Ig repertoires.

SHazaM is part of the Immcantation analysis framework for Adaptive Immune Receptor Repertoire sequencing (AIRR-seq) and provides tools for advanced analysis of somatic hypermutation (SHM) in immunoglobulin (Ig) sequences. Shazam focuses on the following analysis topics:

  • Quantification of mutational load SHazaM includes methods for determine the rate of observed and expected mutations under various criteria. Mutational profiling criteria include rates under SHM targeting models, mutations specific to CDR and FWR regions, and physicochemical property dependent substitution rates.
  • Statistical models of SHM targeting patterns Models of SHM may be divided into two independent components: 1) a mutability model that defines where mutations occur and 2) a nucleotide substitution model that defines the resulting mutation. Collectively these two components define an SHM targeting model. SHazaM provides empirically derived SHM 5-mer context mutation models for both humans and mice, as well tools to build SHM targeting models from data.
  • Analysis of selection pressure using BASELINe The Bayesian Estimation of Antigen-driven Selection in Ig Sequences (BASELINe) method is a novel method for quantifying antigen-driven selection in high-throughput Ig sequence data. BASELINe uses SHM targeting models can be used to estimate the null distribution of expected mutation frequencies, and provide measures of selection pressure informed by known AID targeting biases.
  • Model-dependent distance calculations SHazaM provides methods to compute evolutionary distances between sequences or set of sequences based on SHM targeting models. This information is particularly useful in understanding and defining clonal relationships.
Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data.. (PubMed,eprint) Bioinformatics 31(20):3356-3358 (2015)
Registry entries: Bioconda 
r-cran-spp
GNU R ChIP-seq processing pipeline
Versions of package r-cran-spp
ReleaseVersionArchitectures
bookworm1.16.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.16.0-2amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye1.16.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.15.5-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

R package for anlaysis of ChIP-seq and other functional sequencing data

  • Assess overall DNA-binding signals in the data and select appropriate quality of tag alignment.
  • Discard or restrict positions with abnormally high number of tags.
  • Calculate genome-wide profiles of smoothed tag density and save them in WIG files for viewing in other browsers.
  • Calculate genome-wide profiles providing conservative statistical estimates of fold enrichment ratios along the genome. These can be exported for browser viewing, or thresholded to determine regions of significant enrichment/depletion.
  • Determine statistically significant point binding positions
  • Assess whether the set of point binding positions detected at a current sequencing depth meets saturation criteria, and if does not, estimate what sequencing depth would be required to do so.
Please cite: Peter V Kharchenko, Michael Y Tolstorukov and Peter J Park: Design and analysis of ChIP-seq experiments for DNA-binding proteins. (PubMed) Nature biotechnology 26(12):1351–1359 (2008)
r-cran-tcr
Advanced Data Analysis of Immune Receptor Repertoires
Versions of package r-cran-tcr
ReleaseVersionArchitectures
bookworm2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.2.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Cells of the immune system are the grand exception to the rule that all cells of an individuum have (mostly exact) copies of the same DNA. B cells (which produce antibodies) and T cells (which communicate with cells) however have a section of their DNA with genes of the groups V, D and J that are reorganised within the genomic DNA to provide the flexibility to deal with yet unknown pathogens.

This package provides a platform for the advanced analysis of T cell receptor repertoire data and its visualisations.

Caveat: This package is soon to be replaced by http://github.com/immunomind/immunarch which is not yet available as a Debian package.

Please cite: Vadim I. Nazarov, Mikhail V. Pogorelyy, Ekaterina A. Komech, Ivan V. Zvyagin, Dmitry A. Bolotin, Mikhail Shugay, Dmitry M. Chudakov, Yury B. Lebedev and Ilgar Z. Mamedov: tcR: an R package for T cell receptor repertoire advanced data analysis. (eprint) BMC Bioinformatics 16:175 (2015)
Registry entries: Bio.tools  Bioconda 
r-cran-tigger
Infers new Immunoglobulin alleles from Rep-Seq Data
Versions of package r-cran-tigger
ReleaseVersionArchitectures
bookworm1.0.1-1all
buster0.3.1-1all
sid1.1.0-1all
bullseye1.0.0-1all
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Summary: Infers the V genotype of an individual from immunoglobulin (Ig) repertoire-sequencing (Rep-Seq) data, including detection of any novel alleles. This information is then used to correct existing V allele calls from among the sample sequences.

High-throughput sequencing of B cell immunoglobulin receptors is providing unprecedented insight into adaptive immunity. A key step in analyzing these data involves assignment of the germline V, D and J gene segment alleles that comprise each immunoglobulin sequence by matching them against a database of known V(D)J alleles. However, this process will fail for sequences that utilize previously undetected alleles, whose frequency in the population is unclear.

TIgGER is a computational method that significantly improves V(D)J allele assignments by first determining the complete set of gene segments carried by an individual (including novel alleles) from V(D)J-rearrange sequences. TIgGER can then infer a subject’s genotype from these sequences, and use this genotype to correct the initial V(D)J allele assignments.

The application of TIgGER continues to identify a surprisingly high frequency of novel alleles in humans, highlighting the critical need for this approach. TIgGER, however, can and has been used with data from other species.

Core Abilities:

  • Detecting novel alleles
  • Inferring a subject’s genotype
  • Correcting preliminary allele calls

Required Input

  • A table of sequences from a single individual, with columns containing the following:
  • V(D)J-rearranged nucleotide sequence (in IMGT-gapped format)
  • Preliminary V allele calls
  • Preliminary J allele calls
  • Length of the junction region
  • Germline Ig sequences in IMGT-gapped fasta format (e.g., as those downloaded from IMGT/GENE-DB)

The former can be created through the use of IMGT/HighV-QUEST and Change-O.

Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data. (eprint) 31(20):3356–3358 (2017)
Registry entries: Bioconda 
r-cran-treespace
Statistical Exploration of Landscapes of Phylogenetic Trees
Versions of package r-cran-treespace
ReleaseVersionArchitectures
bullseye1.1.4.0+dfsg-1amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.1.4.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.1.3+dfsg-1amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.1.4.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.4.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 3 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Tools for the exploration of distributions of phylogenetic trees. This package includes a shiny interface which can be started from R using 'treespaceServer()'.

r-cran-tsne
t-distributed stochastic neighbor embedding for R (t-SNE)
Versions of package r-cran-tsne
ReleaseVersionArchitectures
bookworm0.1-3.1-1all
trixie0.1-3.1-1all
sid0.1-3.1-1all
bullseye0.1-3-3all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

A "pure R" implementation of the t-SNE algorithm.

r-cran-vegan
Community Ecology Package for R
Versions of package r-cran-vegan
ReleaseVersionArchitectures
trixie2.6-4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster2.5-4+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.5-7+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.0-10-1amd64,armel,armhf,i386
sid2.6-4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.6-4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.4-2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 138 users (56 upd.)*
Versions and Archs
License: DFSG free
Git

R package for community ecologists. It contains most multivariate analysis needed in analysing ecological communities, and tools for diversity analysis. Most diversity methods assume that data are counts of individuals.

These tools are sometimes used outside the field of ecology, for instance to study populations of white blood cells or RNA molecules.

Registry entries: SciCrunch 
r-cran-webgestaltr
find over-represented properties in gene lists
Versions of package r-cran-webgestaltr
ReleaseVersionArchitectures
trixie0.4.6-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.4.5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.4.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.4.6-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The web version WebGestalt http://www.webgestalt.org supports 12 organisms, 354 gene identifiers and 321,251 function categories. Users can upload the data and functional categories with their own gene identifiers. In addition to the Over-Representation Analysis, WebGestalt also supports Gene Set Enrichment Analysis and Network Topology Analysis. The user-friendly output report allows interactive and efficient exploration of enrichment results. The WebGestaltR package not only supports all above functions but also can be integrated into other pipeline or simultaneously analyze multiple gene lists.

r-cran-wgcna
Weighted Correlation Network Analysis
Versions of package r-cran-wgcna
ReleaseVersionArchitectures
bookworm1.72-1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.72-5-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.72-5-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.69-1amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 6 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Functions necessary to perform Weighted Correlation Network Analysis on high-dimensional data as originally described in Horvath and Zhang (2005) and Langfelder and Horvath (2008) . Includes functions for rudimentary data cleaning, construction of correlation networks, module identification, summarization, and relating of variables and modules to sample traits. Also includes a number of utility functions for data manipulation and visualization.

Please cite: Peter Langfelder and Steve Horvath: WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics 9:559 (2012)
Registry entries: Bio.tools  Bioconda 
r-other-ascat
Allele-Specific Copy Number Analysis of Tumours
Versions of package r-other-ascat
ReleaseVersionArchitectures
bookworm3.1.1-1all
bullseye2.5.2-3all
sid3.1.2-1all
trixie3.1.2-1all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ASCAT (allele-specific copy number analysis of tumors) is a allele- specific copy number analysis of the in vivo breast cancer genome. It can be used to accurately dissect the allele-specific copy number of solid tumors, simultaneously estimating and adjusting for both tumor ploidy and nonaberrant cell admixture.

Please cite: Peter Van Loo, Silje H Nordgard, Ole Christian Lingjærde, Hege G Russnes, Inga H Rye, Wei Sun, Victor J Weigman, Peter Marynen, Anders Zetterberg, Bjørn Naume, Charles M Perou, Anne-Lise Børresen-Dale and Vessela N Kristensen: Allele-specific Copy Number Analysis of Tumors. (PubMed) PNAS 107(39):16910-5 (2010)
Registry entries: Bio.tools  Bioconda 
r-other-mott-happy.hbrem
GNU R package for fine-mapping complex diseases
Versions of package r-other-mott-happy.hbrem
ReleaseVersionArchitectures
sid2.4-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.4-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.4-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster2.4-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.4-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.4-1amd64,armel,armhf,i386
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Happy is an R interface into the HAPPY C package for fine-mapping Quantitative Trait Loci (QTL) in Heterogenous Stocks (HS). An HS is an advanced intercross between (usually eight) founder inbred strains of mice. HS are suitable for fine-mapping QTL. It uses a multipoint analysis which offers significant improvements in statistical power to detect QTLs over that achieved by single-marker association.

The happy package is an extension of the original C program happy; it uses the C code to compute the probability of descent from each of the founders, at each locus position, but the happy packager allows a much richer range of models to be fit to the data.

Read /usr/share/doc/r-other-mott-happy/README.Debian for a more detailed explanation.

Please cite: Richard Mott, Christopher J. Talbot, Maria G. Turri, Allan C. Collins and Jonathan Flint: A method for fine mapping quantitative trait loci in outbred animal stocks. (PubMed,eprint) Proc. Natl. Acad. Sci. USA 97(23):12649-12654 (2000)
Registry entries: SciCrunch 
r-other-rajewsky-dropbead
Basic Exploration and Analysis of Drop-seq Data
Versions of package r-other-rajewsky-dropbead
ReleaseVersionArchitectures
trixie0.3.1+git20180221.d746c6f+ds-3all
bullseye0.3.1+git20180221.d746c6f+ds-3all
sid0.3.1+git20180221.d746c6f+ds-3all
bookworm0.3.1+git20180221.d746c6f+ds-3all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Dropbead offers a quick and straightforward way to explore and perform basic analysis of single cell sequencing data coming from droplet sequencing. It has been particularly tailored for Drop-seq.

Please cite: J. Alles, N. Karaiskos, S. Praktiknjo, S. Grosswendt, P. Wahle, P.-L. Ruffault, S. Ayoub, L. Schreyer, A. Boltengagen, C. Birchmeier, R. Zinzen an, C. Kocks and N. Rajewsky: Cell fixation and preservation for droplet-based single-cell transcriptomics. (PubMed,eprint) BMC Biology 15(44) (2017)
racon
consensus module for raw de novo DNA assembly of long uncorrected reads
Versions of package racon
ReleaseVersionArchitectures
buster1.3.2-1amd64
stretch-backports-sloppy1.4.10-1~bpo9+1amd64
trixie1.5.0-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.5.0-3amd64,arm64,mips64el,ppc64el,s390x
sid1.5.0-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.4.20-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports1.3.1-1~bpo9+1amd64
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Racon is intended as a standalone consensus module to correct raw contigs generated by rapid assembly methods which do not include a consensus step. The goal of Racon is to generate genomic consensus which is of similar or better quality compared to the output generated by assembly methods which employ both error correction and consensus steps, while providing a speedup of several times compared to those methods. It supports data produced by both Pacific Biosciences and Oxford Nanopore Technologies.

Racon can be used as a polishing tool after the assembly with either Illumina data or data produced by third generation of sequencing. The type of data inputed is automatically detected.

Racon takes as input only three files: contigs in FASTA/FASTQ format, reads in FASTA/FASTQ format and overlaps/alignments between the reads and the contigs in MHAP/PAF/SAM format. Output is a set of polished contigs in FASTA format printed to stdout. All input files can be compressed with gzip.

Racon can also be used as a read error-correction tool. In this scenario, the MHAP/PAF/SAM file needs to contain pairwise overlaps between reads including dual overlaps.

A wrapper script is also available to enable easier usage to the end- user for large datasets. It has the same interface as racon but adds two additional features from the outside. Sequences can be subsampled to decrease the total execution time (accuracy might be lower) while target sequences can be split into smaller chunks and run sequentially to decrease memory consumption. Both features can be run at the same time as well.

Please cite: Robert Vaser, Ivan Sovic, Niranjan Nagarajan and Mile Sikic: Fast and accurate de novo genome assembly from long uncorrected reads. (PubMed,eprint) Genome Research 27(5):737-746 (2017)
Registry entries: Bioconda 
radiant
explore hierarchical metagenomic data with zoomable pie charts
Versions of package radiant
ReleaseVersionArchitectures
trixie2.8.1+dfsg-2all
bullseye2.7.1+dfsg-4all
buster2.7+dfsg-2all
stretch-backports2.7+dfsg-2~bpo9+1all
sid2.8.1+dfsg-2all
bookworm2.8.1+dfsg-2all
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Krona allows hierarchical data to be explored with zoomable pie charts. Krona charts include support for several bioinformatics tools and raw data formats. The charts can be viewed with a recent version of any major web browser.

Please cite: Brian D Ondov, Nicholas H Bergman and Adam M Phillippy: Interactive metagenomic visualization in a Web browser. (PubMed,eprint) BMC Bioinformatics 12:385 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
ragout
Reference-Assisted Genome Ordering UTility
Versions of package ragout
ReleaseVersionArchitectures
bookworm2.3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.3-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.3-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ragout (Reference-Assisted Genome Ordering UTility) is a tool for chromosome-level scaffolding using multiple references. Given initial assembly fragments (contigs/scaffolds) and one or multiple related references (complete or draft), it produces a chromosome-scale assembly (as a set of scaffolds).

The approach is based on the analysis of genome rearrangements (like inversions or chromosomal translocations) between the input genomes and reconstructing the most parsimonious structure of the target genome.

Ragout now supports both small and large genomes (of mammalian scale and complexity). The assembly of highly polymorphic genomes is currently limited.

Please cite: Mikhail Kolmogorov, Joel Armstrong, Brian J. Raney, Ian Streeter, Matthew Dunn, Fengtang Yang, Duncan Odom, Paul Flicek, Thomas M. Keane, David Thybert, Benedict Paten and Son Pham: Chromosome assembly of large and complex genomes using multiple references. (PubMed,eprint) Genome Research 28(11):1720-1732 (2018)
Registry entries: Bioconda 
rambo-k
Read Assignment Method Based On K-mers
Versions of package rambo-k
ReleaseVersionArchitectures
stretch1.21+dfsg-1all
buster1.21+dfsg-2all
sid1.21+dfsg-4all
bullseye1.21+dfsg-3all
bookworm1.21+dfsg-4all
trixie1.21+dfsg-4all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

RAMBO-K is a tool for rapid and sensitive removal of background sequences from Next Generation Sequencing data.

RAMBO-K is a reference-based tool for rapid and sensitive extraction of one organisms reads from a mixed dataset. It is based on a Markov chain implementation, which uses genomic characteristics of each reference to assign reads to the associated set.

Please cite: Simon H. Tausch, Bernhard Y. Renard, Andreas Nitsche and Piotr Wojciech Dabrowski: RAMBO-K: Rapid and Sensitive Removal of Background Sequences from Next Generation Sequencing Data. (PubMed,eprint) PLOS one 10(9):e0137896 (20015)
Registry entries: Bio.tools 
rampler
module for sampling genomic sequences
Versions of package rampler
ReleaseVersionArchitectures
bookworm2.1.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.0.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch-backports1.1.0-1~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.1.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.1.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Standalone module for sampling genomic sequences. It supports two modes, random subsampling of sequencer data to a desired depth (given the reference length) and file splitting to desired size in bytes.

Rampler takes as first input argument a file in FASTA/FASTQ format which can be compressed with gzip. The rest of input parameters depend on the mode of operation. The output is stored into a file(s) which is in the same format as the input file but uncompressed.

rapmap
rapid sensitive and accurate DNA read mapping via quasi-mapping
Versions of package rapmap
ReleaseVersionArchitectures
stretch0.4.0+dfsg-2amd64
trixie0.15.0+dfsg-4amd64
sid0.15.0+dfsg-4amd64
buster0.12.0+dfsg-3amd64,arm64,mips64el,ppc64el
bullseye0.15.0+dfsg-1amd64
bookworm0.15.0+dfsg-3amd64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

RapMap is a testing ground for ideas in quasi-mapping / (lightweight / pseudo) transcriptome alignment. That means that, at this point, it is somewhat experimental. The develop branch will have the latest improvements and additions, but is not guaranteed to be stable between commits. Breaking changes to the master branch will be accompanied by a tag to the version before the breaking change. Currently, RapMap is a stand-alone quasi-mapper that can be used with other tools. It is also being used as part of Sailfish and Salmon. Eventually, the hope is to create and stabilize an API so that it can be used as a library from other tools.

Quasi-mapping / (lightweight / pseudo)-alignment is the term that is used here for the type of information required for certain tasks (e.g. transcript quantification) that is less "heavyweight" than what is provided by traditional alignment. For example, one may only need to know the transcripts / contigs to which a read aligns and, perhaps, the position within those transcripts rather than the optimal alignment and base-for-base CIGAR string that aligns the read and substring of the transcript. For details on RapMap (quasi-mapping in particular), please check out the associated paper. Note: RapMap implements both quasi- mapping and pseudo-alignment (originally introduced in Bray et al. 2016), these two are not the same thing. They are distinct concepts, and RapMap simply happens to implement algorithms for computing both.

Please cite: Avi Srivastava, Hirak Sarkar, Nitish Gupta and Rob Patro: RapMap: a rapid, sensitive and accurate tool for mapping RNA-seq reads to transcriptomes. (PubMed,eprint) Bioinformatics 32(12):i192-i200 (2016)
Registry entries: Bio.tools  Bioconda 
rasmol
visualisation de macromolécules biologiques
Versions of package rasmol
ReleaseVersionArchitectures
stretch2.7.5.2-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,s390x
buster2.7.6.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.7.5.2-2amd64,armel,armhf,i386
bullseye2.7.6.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.7.6.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.7.6.0-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.7.6.0-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package rasmol:
fieldchemistry
interfacex11
roleprogram
scopeutility
uitoolkitgtk
uselearning, viewing
x11application
Popcon: 20 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

RasMol est un programme graphique moléculaire destiné à la visualisation de protéines, d'acides nucléiques et de petites molécules. Le programme est destiné à l'affichage, l'apprentissage et la génération d'images de la qualité des publications.

Le programme lit un fichier de coordonnées de molécule et l'affiche interactivement à l'écran avec diverses couleurs et représentations. Les molécules chargées peuvent être montrées comme des structures filaires, des liaisons cylindriques (drieding), des sphères remplissant l'espace (CPK), des rubans macromoléculaires, des boules avec des liaisons, des rubans de biomoléculaires solides et en brins, des étiquettes d'atomes et des surfaces de points.

Sont actuellement pris en charge les formats Brookhaven Protein Databank (PDB), Tripos' Alchemy et Sybyl Mol2, les formats de fichiers Molecular Design Limited's (MDL) Mol, le format Minnesota Supercomputer Center's (MSC) XMol XYZ et les formats de fichiers CHARMm, CIF et mmCIF.

Ce paquet installe deux versions de RasMol : rasmol-gtk possède une interface moderne en GTK et rasmol-classic est la version avec l'ancienne interface graphique Xlib.

The package is enhanced by the following packages: rasmol-doc
Please cite: Roger A. Sayle and E. James Milner-White: RasMol: Biomolecular graphics for all. (PubMed) Trends in Biochemical Sciences (TIBS) 20(9):374 (1995)
Registry entries: Bio.tools 
Screenshots of package rasmol
raster3d
outils pour la génération d'images de protéines ou d'autres molécules
Versions of package raster3d
ReleaseVersionArchitectures
buster3.0-3-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.0-3-1amd64,armel,armhf,i386
trixie3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch3.0-3-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package raster3d:
fieldbiology, biology:structural
interfacecommandline
roleprogram
scopeapplication
useconverting, viewing
works-with3dmodel, image, image:raster
works-with-formatjpg, png
Popcon: 8 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Raster3D est un ensemble d'outils pour la génération d'images matricielles de protéines ou d'autres molécules. Le logiciel principal rend les sphères, les triangles, les cylindres, les surfaces quadriques avec la surbrillance spéculaire, l'ombrage de Phong et l'ombrage. Il utilise l'algorithme efficace du logiciel Z-buffer, qui est indépendant de la carte graphique. Les logiciels annexes traitent les coordonnées atomiques des fichiers Protein Data Bank (PDB) dans les descriptions de rendu pour les images composées de rubans, les atomes remplissant l'espace, les liaisons, "ball+stick", etc. Raster3D peut aussi être utilisé pour rendre des images composées dans d'autres logiciels tels que Molscript en 3D avec des surbrillances et des ombrages, etc. La sortie est en fichiers d'images avec 24 bits d'information de couleur par pixel.

Please cite: E.A. Merritt and D.J. Bacon: Raster3D Photorealistic Molecular Graphics. (PubMed) Methods in Enzymology 277:505-524 (1997)
Registry entries: Bio.tools 
rate4site
detector of conserved amino-acid sites
Versions of package rate4site
ReleaseVersionArchitectures
buster3.0.0-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch3.0.0-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.0.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.0.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm3.0.0-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.0.0-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.0.0-1amd64,armel,armhf,i386
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Rate4Site calculates the relative evolutionary rate at each site using a probabilistic-based evolutionary model. This allows taking into account the stochastic process underlying sequence evolution within protein families and the phylogenetic tree of the proteins in the family. The conservation score at a site corresponds to the site's evolutionary rate.

Please cite: I. Mayrose, D. Graur, N. Ben-Tal and T. and Pupko: Comparison of site-specific rate-inference methods: Bayesian methods are superior. (PubMed,eprint) Mol Biol Evol 21(2):1781-1791 (2004)
raxml
ressemblance maximale accélérée aléatoire d'arbres phylogénétiques
Versions of package raxml
ReleaseVersionArchitectures
buster8.2.12+dfsg-1amd64,i386
trixie8.2.13+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid8.2.13+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm8.2.12+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch8.2.9+dfsg-1amd64,i386
bullseye8.2.12+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie8.1.1-3amd64,i386
Debtags of package raxml:
fieldbiology
roleprogram
Popcon: 20 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

RAxML est un logiciel pour la déduction de grands arbres phylogénétiques, basée sur la probabilité maximale séquentielle et parallèle. Il est initialement dérivé du logiciel fastDNAml .

Please cite: Alexandros Stamatakis: RAxML version 8: a tool for phylogenetic analysis and post-analysis of large phylogenies. (PubMed,eprint) Bioinformatics Epub ahead of print (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
ray
de novo genome assemblies of next-gen sequencing data
Versions of package ray
ReleaseVersionArchitectures
stretch2.3.1-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.3.1-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.3.1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.3.1-1amd64,armel,armhf,i386
sid2.3.1-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.3.1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.3.1-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ray is a parallel software that computes de novo genome assemblies with next-generation sequencing data. Ray is written in C++ and can run in parallel on numerous interconnected computers using the message-passing interface (MPI) standard. Included:

  • Ray de novo assembly of single genomes
  • Ray Méta de novo assembly of metagenomes
  • Ray Communities microbe abundance + taxonomic profiling
  • Ray Ontologies gene ontology profiling
Please cite: Sébastien Boisvert, François Laviolette and Jacques Corbeil: Ray: Simultaneous Assembly of Reads from a Mix of High-Throughput Sequencing Technologies. (PubMed,eprint) Journal of Computational Biology 17(11):1519-1533 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
rdp-alignment
paquet d’outils d’alignement de RDP (Ribosomal Database Project)
Versions of package rdp-alignment
ReleaseVersionArchitectures
stretch1.2.0-2all
bullseye1.2.0-6all
sid1.2.0-8all
bookworm1.2.0-8all
trixie1.2.0-8all
buster1.2.0-5all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet d’outils Alignement fournit des commandes pour réaliser des analyses de communauté définie, des alignements par paire et le modèle de Markov caché (modèles HMMER3, pas d’apprentissage).

Ce paquet fournit aussi la bibliothèque Java AlignmentTools, utilisée par d’autres outils RDP.

Please cite: Jordan A. Fish, Benli Chai, Qiong Wang, Yanni Sun, C. Titus Brown, James M. Tiedje and James R Cole: FunGene: the functional gene pipeline and repository. (PubMed,eprint) Front Microbiology 4:291 (2013)
rdp-classifier
extensible sequence classifier for fungal lsu, bacterial and archaeal 16s
Versions of package rdp-classifier
ReleaseVersionArchitectures
sid2.10.2-7all
bullseye2.10.2-5all
buster2.10.2-4all
bookworm2.10.2-6all
trixie2.10.2-7all
stretch2.10.2-1all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The RDP Classifier is a naive Bayesian classifier which was developed to provide rapid taxonomic placement based on rRNA sequence data. The RDP Classifier can rapidly and accurately classify bacterial and archaeal 16s rRNA sequences, and Fungal LSU sequences. It provides taxonomic assignments from domain to genus, with confidence estimates for each assignment. The RDP Classifier likely can be adapted to additional phylogenetically coherent bacterial taxonomies.

Please cite: Qiong Wang, George M. Garrity, James M. Tiedje and James R. Cole: Naive Bayesian classifier for rapid assignment of rRNA sequences into the new bacterial taxonomy. (PubMed,eprint) Appl Environ Microbiol. 73(16):5261-7 (2007)
rdp-readseq
Ribosomal Database Project (RDP) sequence reading and writing
Versions of package rdp-readseq
ReleaseVersionArchitectures
sid2.0.2-9all
trixie2.0.2-9all
bookworm2.0.2-9all
stretch2.0.2-2all
buster2.0.2-6all
bullseye2.0.2-7all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Rdp-readseq is a simple user interface to the sequence reading library developed by the Ribosomal Database Project. It can handle genbank, embl, fasta, fastq, sff and sto files. It can read from files or streams, and can handle indexing files.

The package also contains the ReadSeq Java library which is used by other RDP tools.

Registry entries: Bioconda 
readseq
conversion entre formats de séquences
Versions of package readseq
ReleaseVersionArchitectures
trixie1-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1-13amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1-11amd64,armel,armhf,i386
stretch1-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package readseq:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useconverting
works-with-formatplaintext
Popcon: 9 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Ce logiciel lit et écrit les séquences de nucléotides/protéines dans divers formats. Les fichiers de données peuvent avoir de multiples séquences. Le logiciel Readseq est particulièrement utile car il détecte automatiquement de nombreux formats de séquences, et convertit entre les formats.

Please cite: Don Gilbert: Sequence file format conversion with command-line readseq. (PubMed,eprint) Current Protocols in Bioinformatics Appendix 1:E (2003)
Registry entries: Bio.tools  Bioconda 
readucks
Nanopore read de-multiplexer (read demux -> readux -> readucks, innit)
Versions of package readucks
ReleaseVersionArchitectures
bookworm0.0.3-5all
bullseye0.0.3-2all
sid0.0.3-5all
Popcon: 3 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

This package is inspired by the demultiplexing options in porechop but without the adapter trimming options - it just demuxes. It uses the parasail library with its Python bindings to do pairwise alignment which provides a considerable speed up over the seqan library used by porechop due to its low-level use of vector processor instructions.

reapr
outil universel pour l’évaluation d’assemblage de génomes
Versions of package reapr
ReleaseVersionArchitectures
bookworm1.0.18+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye1.0.18+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid1.0.18+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.0.18+dfsg-4amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
trixie1.0.18+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el
stretch1.0.18+dfsg-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

REAPR est un outil pour évaluer la précision d’un assemblage génomique en utilisant des lectures de séquences appariées cartographiées, sans utiliser un génome de référence pour la comparaison. Il peut être utilisé à n’importe quel stade d’une tuyauterie d’assemblage pour casser automatiquement les échafaudages incorrects et signaler d’autres erreurs dans un assemblage pour une inspection manuelle. Il rapporte les mauvais assemblages et autres avertissements, et produit un nouvel assemblage interrompu se basant sur les appels d’erreur.

Ce logiciel demande en entrée un assemblage au format FASTA et des lectures de séquences appariées cartographiées pour un assemblage dans un fichier BAM. Les informations de cartographie, telles que la couverture de fragment et la distribution de tailles d’insertions sont analysées pour localiser les mauvais assemblages. REAPR fonctionne mieux avec des paires de lectures cartographiées à partir d’une grande bibliothèque d’insertions (au moins mille paires de bases). De plus, si une courte bibliothèque Illumina d’insertions est disponible, REAPR peut la combiner avec une grande bibliothèque d’insertions pour évaluer chaque base de l’assemblage.

Please cite: Martin Hunt, Taisei Kikuchi, Mandy Sanders, Chris Newbold, Matthew Berriman and Thomas D Otto: REAPR: a universal tool for genome assembly evaluation. (PubMed,eprint) Genome Biology 14(5):R47 (2013)
recan
tracé de distances génétiques l’analyse de recombinaison d’évènements
Versions of package recan
ReleaseVersionArchitectures
bullseye0.1.2-2all
sid0.5+dfsg-1all
bookworm0.1.5+dfsg-2all
Popcon: 1 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

recan est un paquet de Python permettant de construire des tracés de distance génétique pour découvrir et explorer des évènements de recombinaison dans des génomes de virus.

Cette méthode a été précédemment mise en œuvre dans des outils logiciels : RAT, Simplot et RDP4.

relion
toolkit for 3D reconstructions in cryo-electron microscopy
Versions of package relion
ReleaseVersionArchitectures
trixie3.1.3-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm3.1.3-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.1.0-4amd64,i386
sid3.1.3-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream4.0.1
Popcon: 1 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

RELION (for REgularised LIkelihood OptimisatioN) is a stand-alone computer program for Maximum A Posteriori refinement of (multiple) 3D reconstructions or 2D class averages in cryo-electron microscopy.

RELION provides a GUI, several command-line tools in parallel (MPI) and serial versions, optionally with CUDA/GPU support.

relion provides the serial and parallel (MPI) command-line tools without CUDA/GPU support.

Please cite: Sjors H. W. Scheres: RELION: implementation of a Bayesian approach to cryo-EM structure determination. (PubMed) J. Struct. Biol. 180(3):519-30 (2012)
relion-gui
toolkit for 3D reconstructions in cryo-electron microscopy (gui apps)
Versions of package relion-gui
ReleaseVersionArchitectures
sid3.1.3-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.1.0-4amd64,i386
trixie3.1.3-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm3.1.3-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream4.0.1
Popcon: 1 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

RELION (for REgularised LIkelihood OptimisatioN) is a stand-alone computer program for Maximum A Posteriori refinement of (multiple) 3D reconstructions or 2D class averages in cryo-electron microscopy.

RELION provides a GUI, several command-line tools in parallel (MPI) and serial versions, optionally with CUDA/GPU support.

relion-gui provides the graphical user interface without CUDA/GPU support.

Please cite: Sjors H. W. Scheres: RELION: implementation of a Bayesian approach to cryo-EM structure determination. (PubMed) J. Struct. Biol. 180(3):519-30 (2012)
repeatmasker-recon
finds repeat families from biological sequences
Versions of package repeatmasker-recon
ReleaseVersionArchitectures
buster1.08-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.08-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.08-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.08-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.08-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.08-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The RECON package implements a de novo algorithm for the identification of repeat families from biological sequences.

The program implements an approach for the de novo identification and classification of repeat sequence families that is based on extensions to the usual approach of single linkage clustering of local pairwise alignments between genomic sequences. The extensions use multiple alignment information to define the boundaries of individual copies of the repeats and to distinguish homologous but distinct repeat element families. When tested on the human genome, this approach was able to properly identify and group known transposable elements. The program, should be useful for first-pass automatic classification of repeats in newly sequenced genomes.

Please cite: Zhirong Bao and Sean R. Eddy: Automated De Novo Identification of Repeat Sequence Families in Sequenced Genomes. (PubMed,eprint) Genome Research 12(8):1269-76 (2002)
reprof
prédicteur de structure secondaire de protéines et d'accessibilité
Versions of package reprof
ReleaseVersionArchitectures
bullseye1.0.1-7all
buster1.0.1-6all
stretch1.0.1-4all
bookworm1.0.1-8all
trixie1.0.1-8all
jessie1.0.1-1all
sid1.0.1-8all
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Le logiciel reprof est une implémentation améliorée du logiciel « prof », un prédicteur populaire de structure secondaire de protéines et d'accessibilité. La prédiction est réalisée à partir d'une séquence seule de protéines ou d'un alignement - la dernière devrait être utilisée pour une performance optimale.

Ce paquet fournit la commande reprof. Il s'agit seulement d'une interface en ligne de commande pour la fonctionnalité fournie par les modules dans librg-reprof-bundle-perl.

Registry entries: Bio.tools 
resfinder
identify acquired antimicrobial resistance genes
Versions of package resfinder
ReleaseVersionArchitectures
sid4.4.2-1all
bookworm4.3.0-1all
bullseye3.2-3all
upstream4.5.0
Popcon: 2 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

ResFinder identifies acquired antimicrobial resistance genes in total or partial sequenced isolates of bacteria.

ResFinder that uses BLAST for identification of acquired antimicrobial resistance genes in whole-genome data. As input, the method can use both pre-assembled, complete or partial genomes, and short sequence reads from four different sequencing platforms. The method was evaluated on 1862 GenBank files containing 1411 different resistance genes, as well as on 23 de-novo-sequenced isolates.

Please cite: Ea Zankari, Henrik Hasman, Salvatore Cosentino, Martin Vestergaard, Simon Rasmussen, Ole Lund, Frank M. Aarestrup and Mette Voldby Larsen: Identification of acquired antimicrobial resistance genes. (PubMed,eprint) Journal of Antimicrobial Chemotherapy 67(11):2640-4 (2012)
rna-star
aligneur universel et ultra-rapide de RNA-seq
Versions of package rna-star
ReleaseVersionArchitectures
stretch-backports2.7.0a+dfsg-1~bpo9+1amd64,arm64,mips64el,ppc64el
stretch2.5.2b+dfsg-1amd64,arm64,mips64el,ppc64el
sid2.7.11b+dfsg-1amd64,arm64,mips64el,ppc64el
trixie2.7.11b+dfsg-1amd64,arm64,mips64el,ppc64el
buster2.7.0a+dfsg-1amd64,arm64,mips64el,ppc64el
bullseye2.7.8a+dfsg-2amd64,arm64,mips64el,ppc64el
bookworm2.7.10b+dfsg-2amd64,arm64,mips64el,ppc64el
Popcon: 6 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit du logiciel STAR (Spliced Transcripts Alignment to a Reference) basé sur un algorithme, non décrit auparavant, d'alignement de RNA-seq qui utilise la recherche séquentielle de « graines  » pour une cartographie maximale dans des tableaux de suffixes non compressés suivis par le regroupement de graines (seed clustering) et la procédure de ligature (stitching). STAR surpasse les autres aligneurs d’un facteur supérieur à cinquante dans la vitesse de cartographie, alignant pour le génome humain 550 millions de lectures « paired-end » 2 × 76 pb par heure sur un modeste serveur de douze cœurs, tout en améliorant la sensibilité et la précision. En plus de la détection de novo neutre de jonctions canoniques, STAR peut découvrir les transcriptions de ligature non canonique et de fusion, et il peut aussi réaliser une cartographie des séquences d’ARN complètes. En utilisant le séquençage Roche 454 d’amplicons de réaction en chaîne par polymérase et transcription inverse, les auteurs ont validé expérimentalement 1960 nouvelles jonctions de ligature intergénique avec un taux de succès de 80- 90 %, corroborant la précision élevée de la stratégie de cartographie de STAR.

The package is enhanced by the following packages: multiqc
Please cite: Alexander Dobin, Carrie A. Davis, Felix Schlesinger, Jorg Drenkow, Chris Zaleski, Sonali Jha, Philippe Batut, Mark Chaisson and Thomas R. Gingeras: STAR: ultrafast universal RNA-seq aligner. (PubMed,eprint) Bioinformatics 29(1):15-21 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
rnahybrid
prédiction rapide et efficace des complexes microARN/cible
Versions of package rnahybrid
ReleaseVersionArchitectures
bookworm2.1.2-7amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.1.1-2amd64,armel,armhf,i386
stretch2.1.2-1amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.1.2-8amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.1.2-5amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.1.2-8amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
bullseye2.1.2-6amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package rnahybrid:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

RNAhybrid est un outil permettant de déterminer l'hybridation d'énergie minimale entre deux brins d'ARN, l'un court et l'autre long. L'hybridation est réalisée en quelque sorte sur la base de la reconnaissance d'un domaine, c'est-à-dire que la séquence courte est hybridée sur le domaine de la séquence longue présentant la plus grande similarité. Cet outil est principalement destiné à la prédiction de cibles pour microARNs.

Please cite: Marc Rehmsmeier, Peter Steffen, Matthias Höchsmann and Robert Giegerich: Fast and effective prediction of microRNA/target duplexes. (PubMed,eprint) RNA 10(10):1507-1517 (2004)
Registry entries: Bio.tools  SciCrunch 
roary
pipeline de pangénome autonome et très rapide
Versions of package roary
ReleaseVersionArchitectures
bookworm3.13.0+dfsg-1all
trixie3.13.0+dfsg-1all
sid3.13.0+dfsg-1all
bullseye3.13.0+dfsg-1all
buster3.12.0+dfsg-2all
stretch3.8.0+dfsg-1all
stretch-backports3.12.0+dfsg-2~bpo9+1all
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Roary est un pipeline de pangénome autonome et très rapide, prenant des assemblages annotés au format GFF3 (comme produits, par exemple, par Prokka) et calculant le pangénome. En utilisant un ordinateur de bureau courant, il est possible d’analyser des ensembles de données ayant des milliers d’échantillons, chose infaisable de manière informatique avec les méthodes existantes, et ce sans compromettre la qualité des résultats. 128 échantillons peuvent être analysés en une heure et avec un gigaoctet de RAM et un processeur unique. Pour réaliser cette analyse, l’utilisation des méthodes existantes prendrait des semaines et demanderait des centaines de gigaoctets de RAM. Roary n’est pas prévu pour la métagénomique ou pour comparer des ensembles extrêmement divers de génomes.

Please cite: Andrew J. Page, Carla A. Cummins, Martin Hunt, Vanessa K. Wong, Sandra Reuter, Matthew T. G. Holden, Maria Fookes, Daniel Falush, Jacqueline A. Keane and Julian Parkhill: Roary: Rapid large-scale prokaryote pan genome analysis. (PubMed,eprint) Bioinformatics 31(22):3691-3693 (2015)
Registry entries: Bioconda 
rockhopper
system for analyzing bacterial RNA-seq data
Versions of package rockhopper
ReleaseVersionArchitectures
sid2.0.3+dfsg2-4all
trixie2.0.3+dfsg2-4all
bookworm2.0.3+dfsg2-3all
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Rockhopper is a comprehensive and user-friendly system for computational analysis of bacterial RNA-seq data. As input, Rockhopper takes RNA sequencing reads output by high-throughput sequencing technology (FASTQ, QSEQ, FASTA, SAM, or BAM files). Rockhopper supports the following tasks:

  • Reference based transcript assembly (when one or more reference genomes are available)
  • Aligning reads to genomes
  • Assembling transcripts
  • Identifying transcript boundaries and novel transcripts such as small RNAs
  • De novo transcript assembly (when reference genomes are unavailable)
  • Normalizing data from different experiments
  • Quantifying transcript abundance
  • Testing for differential gene expression
  • Characterizing operon structures
  • Visualizing results in a genome browser
The package is enhanced by the following packages: multiqc
Please cite: Brian Tjaden: De novo assembly of bacterial transcriptomes from RNA-seq data. (PubMed,eprint) Genome Biology (2015)
roguenarok
versatile and scalable algorithm for rogue taxon identification
Versions of package roguenarok
ReleaseVersionArchitectures
bookworm1.0.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.0.1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

RogueNaRok is a versatile and scalable algorithm for rogue taxon identification. It also includes implementations of the maximum agreement subtree, leaf stability index and taxonomic instability index.

Please cite: Andre J. Aberer, Denis Krompass and Alexandros Stamatakis: Pruning Rogue Taxa Improves Phylogenetic Accuracy: An Efficient Algorithm and Webservice. (PubMed,eprint) Systematic Biology 62(1):162-166 (2013)
rsem
RNA-Seq by Expectation-Maximization
Versions of package rsem
ReleaseVersionArchitectures
bullseye1.3.3+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
buster1.3.1+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
stretch1.2.31+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
sid1.3.3+dfsg-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.3.3+dfsg-3amd64,arm64,mips64el,ppc64el,s390x
bookworm1.3.3+dfsg-2amd64,arm64,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

RSEM is a software package for estimating gene and isoform expression levels from RNA-Seq data. The RSEM package provides an user-friendly interface, supports threads for parallel computation of the EM algorithm, single-end and paired-end read data, quality scores, variable-length reads and RSPD estimation. In addition, it provides posterior mean and 95% credibility interval estimates for expression levels. For visualization, It can generate BAM and Wiggle files in both transcript-coordinate and genomic-coordinate. Genomic-coordinate files can be visualized by both UCSC Genome browser and Broad Institute’s Integrative Genomics Viewer (IGV). Transcript-coordinate files can be visualized by IGV. RSEM also has its own scripts to generate transcript read depth plots in pdf format. The unique feature of RSEM is, the read depth plots can be stacked, with read depth contributed to unique reads shown in black and contributed to multi-reads shown in red. In addition, models learned from data can also be visualized. Last but not least, RSEM contains a simulator.

The package is enhanced by the following packages: multiqc
Please cite: Bo Li and Colin Dewey: RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. (PubMed,eprint) BMC Bioinformatics 12(1):323 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
rtax
Classification of sequence reads of 16S ribosomal RNA gene
Versions of package rtax
ReleaseVersionArchitectures
trixie0.984-8all
sid0.984-8all
buster0.984-6all
stretch0.984-5all
jessie0.984-2all
bookworm0.984-8all
bullseye0.984-7all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Short-read technologies for microbial community profiling are increasingly popular, yet previous techniques for assigning taxonomy to paired-end reads perform poorly. RTAX provides rapid taxonomic assignments of paired-end reads using a consensus algorithm.

Please cite: David A. W. Soergel, Neelendu Dey, Rob Knight and Steven E. Brenner: Selection of primers for optimal taxonomic classification of environmental 16S rRNA gene sequences. (PubMed,eprint) The ISME Journal 6:1440–1444 (2012)
runcircos-gui
outil graphique pour exécuter circos
Versions of package runcircos-gui
ReleaseVersionArchitectures
sid0.0+git20200528.82dda8c-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.0+git20200528.82dda8c-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports0.0+git20180828.97703b9-1~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.0+git20180828.97703b9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.0+git20200528.82dda8c-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.0+git20200528.82dda8c-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

RunCircos-gui est un logiciel multi-plateforme, simple et cependant complet, pour exécuter Circos à partir d’une interface graphique. Le logiciel supprime le besoin d’utiliser la ligne de commande pour exécuter Circos sans compromis sur l’utilisation de tous les paramètres et options de la ligne de commande.

RunCircos-gui maximise les paramètres en cours d’utilisation (options de bascule et options avec arguments) et installe les paquets de Perl sans besoin de la ligne de commande.

saint
Significance Analysis of INTeractome
Versions of package saint
ReleaseVersionArchitectures
sid2.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.5.0+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.5.0+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.4.0+dfsg-1amd64,armel,armhf,i386
trixie2.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SAINT implements the scoring algorithm for protein-protein interaction data using label free quantitative proteomics data in AP-MS experiments. It was used for spectral count data in the yeast kinase interactome work not incorporating control purification, as well as a generalized implementation for spectral count data with and without control purification.

Alternatively, you can also run SAINT in combination with ProHits.

The package was written for either doing analysis without or with control IPs and

Please cite: A. Breitkreutz, H. Choi, J.R. Sharom, L. Boucher, V. Neduva, B. Larsen, Z.Y. Lin, B.J. Breitkreutz, C. Stark, G. Liu, J. Ahn, D. Dewar-Darch, T. Reguly, X. Tang, R. Almeida, Z.S. Qin, T. Pawson, A.-C. Gingras, A.I. Nesvizhskii and M. Tyers: A global protein kinase and phosphatase interaction network in yeast. (PubMed) Science 328(5981):1043-6 (2010)
Registry entries: Bio.tools 
salmid
rapid Kmer based Salmonella identifier from sequence data
Versions of package salmid
ReleaseVersionArchitectures
sid0.1.23-5all
buster0.1.23-1all
stretch-backports0.1.23-1~bpo9+1all
trixie0.1.23-5all
bookworm0.1.23-5all
bullseye0.1.23-2all
Popcon: 8 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

SalmID enables rapid confirmation of Salmonella spp. and subspp. from sequence data. This is done by checking taxonomic ID of single isolate samples. Currently only IDs Salmonella species and subspecies, and some common contaminants (Listeria, Escherichia).

salmon
wicked-fast transcript quantification from RNA-seq data
Versions of package salmon
ReleaseVersionArchitectures
stretch0.7.2+ds1-2amd64
bullseye1.4.0+ds1-1amd64,arm64
buster0.12.0+ds1-1amd64
trixie1.10.2+ds1-1amd64,arm64
sid1.10.2+ds1-1amd64,arm64
bookworm1.10.1+ds1-1amd64,arm64
upstream1.10.3
Popcon: 4 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

Salmon is a wicked-fast program to produce a highly-accurate, transcript-level quantification estimates from RNA-seq data. Salmon achieves is accuracy and speed via a number of different innovations, including the use of lightweight alignments (accurate but fast-to-compute proxies for traditional read alignments) and massively-parallel stochastic collapsed variational inference. The result is a versatile tool that fits nicely into many different pipelines. For example, you can choose to make use of the lightweight alignments by providing Salmon with raw sequencing reads, or, if it is more convenient, you can provide Salmon with regular alignments (e.g. computed with your favorite aligner), and it will use the same wicked-fast, state-of-the-art inference algorithm to estimate transcript-level abundances for your experiment.

The package is enhanced by the following packages: multiqc
Please cite: Rob Patro, Geet Duggal, Michael I Love, Rafael A Irizarry and Carl Kingsford: Salmon provides fast and bias-aware quantification of transcript expression. (eprint) Nature Methods 14(4):417-419 (2017)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sambamba
tools for working with SAM/BAM data
Versions of package sambamba
ReleaseVersionArchitectures
trixie1.0.1+dfsg-1amd64,arm64
sid1.0.1+dfsg-1amd64,arm64,riscv64
bullseye0.8.0-1amd64,arm64
bookworm1.0+dfsg-1amd64,arm64
Popcon: 5 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Sambamba positions itself as a performant alternative to samtools and provides tools for

  • Powerful filtering with sambamba view --filter
  • Picard-like SAM header merging in the merge tool
  • Optional for operations on whole BAMs
  • Fast copying of a region to a new file with the slice tool
  • Duplicate marking/removal, using the Picard criteria
Please cite: Artem Tarasov, Albert J. Vilella, Edwin Cuppen, Isaac J. Nijman and Pjotr Prins: Sambamba: fast processing of NGS alignment formats. (PubMed,eprint) Bioinformatics 31(12):2032-2034 (2015)
Registry entries: Bio.tools  Bioconda 
samblaster
marks duplicates, extracts discordant/split reads
Versions of package samblaster
ReleaseVersionArchitectures
bullseye0.1.26-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.24-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.1.26-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.1.26-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.1.26-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Current "next-generation" sequencing technologies cannot tell what exact sequence they will be reading. They take what is available. And if some sequences are read very often, then this needs some extra biomedical thinking. The genome could for instance be duplicated.

samblaster is a fast and flexible program for marking duplicates in read-id grouped paired-end SAM files. It can also optionally output discordant read pairs and/or split read mappings to separate SAM files, and/or unmapped/clipped reads to a separate FASTQ file. When marking duplicates, samblaster will require approximately 20MB of memory per 1M read pairs.

The package is enhanced by the following packages: multiqc
Please cite: Gregory G. Faust and Ira M. Hall: SAMBLASTER: fast duplicate marking and structural variant read extraction. (PubMed,eprint) Bioinformatics 30(17):2503-2505 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
samclip
filter SAM file for soft and hard clipped alignments
Versions of package samclip
ReleaseVersionArchitectures
sid0.4.0-4all
bookworm0.4.0-4all
bullseye0.4.0-2all
trixie0.4.0-4all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Most short read aligners perform local alignment of reads to the reference genome. Examples includes bwa mem, minimap2, and bowtie2 (unless in --end-to-end mode). This means the ends of the read may not be part of the best alignment.

This can be caused by:

  • adapter sequences (aren't in the reference)
  • poor quality bases (mismatches only make the alignment score worse)
  • structural variation in your sample compared to the reference
  • reads overlapping the start and end of contigs (including circular genomes)

Read aligners output a SAM file. Column 6 in this format stores the CIGAR string. which describes which parts of the read aligned and which didn't. The unaligned ends of the read can be "soft" or "hard" clipped, denoted with S and H at each end of the CIGAR string. It is possible for both types to be present, but that is not common. Soft and hard don't mean anything biologically, they just refer to whether the full read sequence is in the SAM file or not.

Registry entries: Bioconda 
samtools
traitement d'alignements de séquence pour les formats SAM et BAM et CRAM
Versions of package samtools
ReleaseVersionArchitectures
bullseye1.11-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports1.7-2~bpo9+1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
sid1.19.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.19.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch1.3.1-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
jessie0.1.19-1amd64,armhf,i386
bookworm1.16.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.9-4amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package samtools:
fieldbiology
interfacecommandline
networkclient
roleprogram
scopeutility
uitoolkitncurses
useanalysing, calculating, filtering
works-withbiological-sequence
Popcon: 77 users (26 upd.)*
Versions and Archs
License: DFSG free
Git

Samtools est un ensemble d'utilitaires qui manipulent les alignements de séquence de nucléotides dans le format binaire BAM. Il est capable d'importer et d'exporter à partir des formats ASCII SAM (Sequence Alignment/Map) et CRAM, de trier, de fusionner, d'indexer et de récupérer des enregistrements dans n'importe quelle région facilement. Il est conçu pour travailler sur un flux de données et est capable d'ouvrir un fichier BAM ou CRAM (mais pas SAM) sur un serveur HTTP ou FTP distant.

The package is enhanced by the following packages: libbio-samtools-perl multiqc
Please cite: Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan, Nils Homer, Gabor Marth, Goncalo Abecasis, Richard Durbin and 1000 Genome Project Data Processing Subgroup: The Sequence Alignment/Map (SAM) Format and SAMtools. (PubMed,eprint) Bioinformatics 25(16):2078-2079 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package samtools
savvy-util
conversion tool for SAV file format
Versions of package savvy-util
ReleaseVersionArchitectures
trixie2.1.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.1.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.1.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Savvy is the official C++ interface for the SAV file format and offers seamless support for BCF and VCF files.

The binary sav can be used to handle SAV filed.

Registry entries: Bioconda 
scoary
pangenome-wide association studies
Versions of package scoary
ReleaseVersionArchitectures
stretch-backports1.6.16-1~bpo9+1all
trixie1.6.16-6all
buster1.6.16-1all
bullseye1.6.16-2all
bookworm1.6.16-5all
sid1.6.16-6all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Scoary is designed to take the gene_presence_absence.csv file from Roary as well as a traits file created by the user and calculate the associations between all genes in the accessory genome and the traits. It reports a list of genes sorted by strength of association per trait.

Please cite: Ola Brynildsrud, Jon Bohlin, Lonneke Scheffer and Vegard Eldholm: Rapid scoring of genes in microbial pan-genome-wide association studies with Scoary. (PubMed,eprint) Genome Biology 17(238) (2016)
Registry entries: Bio.tools  Bioconda 
scrappie
basecaller for Nanopore sequencer
Versions of package scrappie
ReleaseVersionArchitectures
sid1.4.2-8amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
experimental1.4.2-9~0exp0simdeamd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.4.2-8amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
bookworm1.4.2-8amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
bullseye1.4.2-7amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The Nanopore is a device for DNA/RNA sequencing that does not require an amplification of the material. The polynucleotides are threaded through a pore and while these pass through, the change in the electrostatic potential allows one to identify ("call") the actual base that resides in the pore. Scrappie goes a step further and also attempts to describe modifications to the nucleic acid.

Please cite: Ryan R. Wick, Louise M. Judd and Kathryn E. Holt: Performance of neural network basecalling tools for Oxford Nanopore sequencing.. (eprint) Genome Biol. 20:129 (2019)
Registry entries: Bioconda 
scrm
simulator of evolution of genetic sequences
Versions of package scrm
ReleaseVersionArchitectures
stretch1.7.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.7.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.7.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.7.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.7.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.7.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

scrm simulates the evolution of genetic sequences.

It takes a neutral evolutionary model as input, and generates random sequences that evolved under the model. As coalescent simulator, it traces the ancestry of the sampled sequences backwards in time and is therefore extremely efficient. Compared to other coalescent simulators, it can simulate chromosome-scale sequences without a measureable reduction of genetic linkage between different sites.

Please cite: Paul R. Staab, Sha Zhu, Dirk Metzler and Gerton Lunter: scrm: efficiently simulating long sequences using the approximated coalescent with recombination.. (2015)
Registry entries: Bioconda 
scythe
élagage bayésien d’adaptateurs pour des lectures de séquence
Versions of package scythe
ReleaseVersionArchitectures
trixie0.994+git20141017.20d3cff-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.994+git20141017.20d3cff-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.994+git20141017.20d3cff-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.994+git20141017.20d3cff-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0.994-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.994+git20141017.20d3cff-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Scythe utilise une approche bayésienne naïve pour classifier des sous-chaines contaminantes dans les lectures de séquences. Il considère la qualité de l’information, ce qui le rend robuste en retirant les adaptateurs d’extrémité 3', ce qui inclut souvent des bases de pauvre qualité.

Registry entries: SciCrunch 
seaview
interface multiplateforme pour l’alignement de séquences et la phylogénie
Versions of package seaview
ReleaseVersionArchitectures
bookworm5.0.5-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye5.0.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster4.7-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie5.0.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid5.0.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie4.5.3.1-2amd64,armel,armhf,i386
stretch4.6.1.2-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package seaview:
fieldbiology, biology:bioinformatics
interfacex11
networkclient
roleprogram
scopeutility
uitoolkitfltk
usecomparing, editing, printing, viewing
works-withbiological-sequence
works-with-formatplaintext
x11application
Popcon: 7 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

SeaView est un visualisateur et un éditeur pour des alignements multiples de séquence, c'est-à-dire, des séquences d’ADN ou de protéines sont chacune positionnées dans leur propre ligne distincte, de telle façon les acides aminés ou nucléiques à une position particulière (colonne) sont supposées avoir les mêmes propriétés biochimiques.

SeaView lit et écrit divers formats de fichiers (NEXUS, MSF, CLUSTAL, FASTA, PHYLIP, MASE, Newick) de séquences d’ADN et de protéines et d’arbres phylogénétiques. Les alignements peuvent être édités manuellement. Il pilote les programmes Muscle ou Clustal Omega pour des alignements multiples de séquences, et permet aussi d’utiliser n’importe quel algorithme externe d’alignement capable de lire et d'écrire des fichiers au format FASTA. Il calcule les arbres phylogénétiques selon la parcimonie en utilisant les algorithmes dnapars et protpars de PHYLIP, selon la distance avec les algorithmes NJ ou BioNJ pour diverses distances d’évolution, ou selon le maximum de vraisemblance en utilisant le programme PhyML 3.0.

SeaView dessine les arbres phylogénétiques sur l’écran ou dans des fichiers PostScript, et permet de télécharger des séquences d’EMBL, GenBank ou UniProt grâce à Internet.

The package is enhanced by the following packages: muscle muscle3
Please cite: Manolo Gouy, Stephane Guindon and Olivier Gascuel: SeaView version 4: a multiplatform graphical user interface for sequence alignment and phylogenetic tree building. (PubMed,eprint) Mol Biol Evol 27(2):221-224 (2010)
Registry entries: Bio.tools  SciCrunch 
Screenshots of package seaview
seer
genomic sequence element (kmer) enrichment analysis
Versions of package seer
ReleaseVersionArchitectures
sid1.1.4-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.1.4-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports1.1.4-2~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.1.4-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.1.2-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.1.4-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.1.4-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Bacterial genomes vary extensively in terms of both gene content and gene sequence - this plasticity hampers the use of traditional SNP-based methods for identifying all genetic associations with phenotypic variation. SEER provides a computationally scalable and widely applicable statistical method for the identification of sequence elements that are significantly enriched in a phenotype of interest. SEER is applicable to even tens of thousands of genomes by counting variable- length k-mers using a distributed string-mining algorithm. Robust options are provided for association analysis that also correct for the clonal population structure of bacteria. Using large collections of genomes of the major human pathogen Streptococcus pneumoniae, SEER identifies relevant previously characterised resistance determinants for several antibiotics.

Please cite: John A Lees, Minna Vehkala, Niko Välimäki, Simon R Harris, Claire Chewapreecha, Nicholas J Croucher, Pekka Marttinen, Mark R Davies, Andrew C Steer, Stephen Y C Tong, Antti Honkela, Julian Parkhill, Stephen D Bentley and Jukka Corander: Sequence element enrichment analysis to determine the genetic basis of bacterial phenotypes. (eprint) bioRxiv (2016)
Registry entries: SciCrunch  Bioconda 
segemehl
associations de lectures courtes avec des trous
Versions of package segemehl
ReleaseVersionArchitectures
buster0.3.4-1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
sid0.3.4-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.3.4-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.3.4-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.3.4-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Segemehl est un logiciel pour associer des lectures courtes de séquençage à des génomes de référence. Segemehl met en œuvre une stratégie d'association basée sur ESA (enhanced suffix array — tableau des suffixes amélioré). Segemehl accepte des requêtes fasta et fastq (compressées avec gzip ou bzip). En plus de l’alignement des lectures à partir des protocoles standard DNA- et RNA-seq, il permet aussi l'association des lectures de séquençage avec bisulfite (Lister et Cokus) et met en œuvre une stratégie d’association de lectures « split ». La sortie de segemehl est un fichier d’alignement au format SAM ou BAM. Dans le cas d'une association « split-read », des fichiers BED supplémentaires sont écrits sur le disque. Ces fichiers BED peuvent être synthétisés avec l’outil de post-traitement haarz. Dans le cas d’alignement de lectures de transformées au bisulfite, les taux de méthylation bruts peuvent aussi être appelés avec haarz.

En résumé, pour chaque suffixe de lecture, segemehl cherche la graine (seed) de plus haut score. Les graines peuvent contenir des insertions, suppressions et écarts (différences). Le nombre de différences permises à l’intérieur d’une graine seule est contrôlé par l’utilisateur et est crucial pour l’exécution du programme. Consécutivement, les graines qui affaiblissent les « E-value » définies par l’utilisateur sont transmises à une procédure d’alignement semi- global précis. Finalement les lectures avec une précision minimale de pourcentage sont rapportées à l’utilisateur.

Please cite: Steve Hoffmann, Christian Otto, Stefan Kurtz, Cynthia M. Sharma, Philipp Khaitovich, Jörg Vogel, Peter F. Stadler and Jörg Hackermüller: Fast Mapping of Short Sequences with Mismatches, Insertions and Deletions Using Index Structures. (PubMed,eprint) PLoS Computational Biology 5(9):e1000502 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sepp
phylogeny with ensembles of Hidden Markov Models
Versions of package sepp
ReleaseVersionArchitectures
sid4.5.1+really4.5.1+dfsg-5amd64,arm64
bullseye4.3.10+dfsg-5amd64
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

The tool SEPP implementing these methods uses ensembles of Hidden Markov Models (HMMs) in different ways, each focusing on a different problem.

SEPP stands for "SATe-enabled Phylogenetic Placement", and addresses the problem of phylogenetic placement of short reads into reference alignments and trees.

Registry entries: Bioconda 
seqan-apps
C++ library for the analysis of biological sequences
Versions of package seqan-apps
ReleaseVersionArchitectures
stretch-backports2.4.0+dfsg-11~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.4.0+dfsg-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.4.1+dfsg-2amd64,armhf,i386
trixie2.4.0+dfsg-16amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye2.4.0+dfsg-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.4.0+dfsg-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.3.1+dfsg-4amd64,arm64,i386,mips64el,ppc64el,s390x
sid2.4.0+dfsg-16amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package seqan-apps:
devellibrary
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SeqAn is a C++ template library of efficient algorithms and data structures for the analysis of sequences with the focus on biological data. This library applies a unique generic design that guarantees high performance, generality, extensibility, and integration with other libraries. SeqAn is easy to use and simplifies the development of new software tools with a minimal loss of performance. This package contains the applications dfi, pair_align, micro_razers, seqan_tcoffee, seqcons, razers and tree_recon.

Please cite: Andreas Doring, David Weese, Tobias Rausch and Knut Reinert: SeqAn An efficient, generic C++ library for sequence analysis. (PubMed,eprint) BMC Bioinformatics 9(1):11 (2008)
Registry entries: Bio.tools  Bioconda 
seqan-needle
pre-filter for the counting of very large collections of nucleotide sequences
Versions of package seqan-needle
ReleaseVersionArchitectures
trixie1.0.2+ds-2amd64,arm64,mips64el,ppc64el
bookworm1.0.1.0.0.git.3011926+ds-4amd64,arm64,mips64el,ppc64el
sid1.0.2+ds-2amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Needle is a tool for semi-quantitative analysis of very large collections of nucleotide sequences.

Needle stores its data in multiple interleaved Bloom filter, a fast and space efficient probabilistic data structure and uses a windowing scheme (also called minimisers) to reduce the amount of data to store. How many interleaved Bloom filter are used is defined by the user. Each interleaved Bloom filter has a so called expression threshold and stores minimisers with an occurrence greater than or equal to its own expression threshold and smaller than the next biggest expression threshold (if there is no bigger expression threshold, all greater than or equal to the threshold are stored). These expression thresholds are then used during the query (called estimate) to approximate the expression values of given transcripts.

Registry entries: Bioconda 
seqan-raptor
pre-filter for querying very large collections of nucleotide sequences
Versions of package seqan-raptor
ReleaseVersionArchitectures
sid3.0.1+ds-5amd64,arm64,mips64el,ppc64el,riscv64
trixie3.0.1+ds-5amd64,arm64,mips64el,ppc64el
bookworm2.0.0.0.git.fecfbca+ds-3amd64,arm64,mips64el,ppc64el
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Raptor is a system for approximately searching many queries such as next-generation sequencing reads or transcripts in large collections of nucleotide sequences. Raptor uses winnowing minimizers to define a set of representative k-mers, an extension of the interleaved Bloom filters (IBFs) as a set membership data structure and probabilistic thresholding for minimizers. This approach allows compression and partitioning of the IBF to enable the effective use of secondary memory.

Please cite: Enrico Seiler, Svenja Mehringer, Mitra Darvish, Etienne Turc and Knut Reinert: Raptor: A fast and space-efficient pre-filter for querying very large collections of nucleotide sequences. iScience 24(7) (2021)
Registry entries: Bio.tools  Bioconda 
seqkit
cross-platform and ultrafast toolkit for FASTA/Q file manipulation
Versions of package seqkit
ReleaseVersionArchitectures
trixie2.3.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.3.1+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.15.0+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.3.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream2.8.0
Popcon: 4 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

SeqKit describes a cross-platform ultrafast comprehensive toolkit for FASTA/Q processing. SeqKit provides executable binary files for all major operating systems, including Windows, Linux, and Mac OS X, and can be directly used without any dependencies or pre-configurations. SeqKit demonstrates competitive performance in execution time and memory usage compared to similar tools. The efficiency and usability of SeqKit enable researchers to rapidly accomplish common FASTA/Q file manipulations.

Please cite: Wei Shen, Shuai Le, Yan Li and Fuquan Hu: SeqKit: A Cross-Platform and Ultrafast Toolkit for FASTA/Q File Manipulation. (PubMed,eprint) PlosOne 11(10):e0163962 (2016)
Registry entries: Bio.tools  Bioconda 
seqmagick
imagemagick-like frontend to Biopython SeqIO
Versions of package seqmagick
ReleaseVersionArchitectures
trixie0.8.6-1all
bullseye0.8.4-1all
sid0.8.6-2all
bookworm0.8.4-3all
buster0.7.0-1all
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Seqmagick is a little utility to expose the file format conversion in BioPython in a convenient way.

Features include:

  • Modifying sequences:
  • Remove gaps
  • Reverse & reverse complement
  • Trim to a range of residues
  • Change case
  • Sort by length or ID
  • Displaying information about sequence files
  • Subsetting sequence files by:
  • Position
  • ID
  • Deduplication
  • Filtering sequences by quality score
  • Trimming alignments to a region of interest defined by the forward and reverse primers
Registry entries: Bioconda 
seqprep
stripping adaptors and/or merging paired reads of DNA sequences with overlap
Versions of package seqprep
ReleaseVersionArchitectures
trixie1.3.2-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.3.2-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.3.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.3.2-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.3.2-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.3.2-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

SeqPrep is a program to merge paired end Illumina reads that are overlapping into a single longer read. It may also just be used for its adapter trimming feature without doing any paired end overlap. When an adapter sequence is present, that means that the two reads must overlap (in most cases) so they are forcefully merged. When reads do not have adapter sequence they must be treated with care when doing the merging, so a much more specific approach is taken. The default parameters were chosen with specificity in mind, so that they could be ran on libraries where very few reads are expected to overlap. It is always safest though to save the overlapping procedure for libraries where you have some prior knowledge that a significant portion of the reads will have some overlap.

Registry entries: Bio.tools  SciCrunch  Bioconda 
seqsero
Salmonella serotyping from genome sequencing data
Versions of package seqsero
ReleaseVersionArchitectures
stretch-backports1.0-2~bpo9+1all
buster1.0.1+dfsg-1all
bullseye1.0.1+dfsg-4all
bookworm1.0.1+dfsg-6amd64,arm64
sid1.0.1+dfsg-6amd64,arm64
Popcon: 2 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

SeqSero is a pipeline for Salmonella serotype determination from raw sequencing reads or genome assemblies.

SeqSero is a novel tool for determining Salmonella serotypes using high- throughput genome sequencing data. SeqSero is based on curated databases of Salmonella serotype determinants (rfb gene cluster, fliC and fljB alleles) and is predicted to determine serotype rapidly and accurately for nearly the full spectrum of Salmonella serotypes (more than 2,300 serotypes), from both raw sequencing reads and genome assemblies. The performance of SeqSero was evaluated by testing

 1. raw reads from genomes of 308 Salmonella isolates of known serotype
 2. raw reads from genomes of 3,306 Salmonella isolates sequenced and
    made publicly available by GenomeTrakr, a U.S. national monitoring
    network operated by the Food and Drug Administration; and
 3. 354 other publicly available draft or complete Salmonella genomes.
SeqSero can help to maintain the well-established utility of Salmonella

serotyping when integrated into a platform of WGS-based pathogen subtyping and characterization.

Please cite: Shaokang Zhang, Yanlong Yin, Marcus B. Jones, Zhenzhen Zhang, Brooke L. Deatherage Kaiser, Blake A. Dinsmore, Collette Fitzgerald, Patricia I. Fields and Xiangyu Deng: Salmonella Serotype Determination Utilizing High-throughput Genome Sequencing Data. (PubMed,eprint) Journal of Clinical Microbiology 53(5):1685-92 (2015)
seqtk
Fast and lightweight tool for processing sequences in the FASTA or FASTQ format
Versions of package seqtk
ReleaseVersionArchitectures
bookworm1.3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.4-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.0-1amd64,armel,armhf,i386
buster1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.4-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 8 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Currently, seqtk supports quality based trimming with the phred algorithm, converting fastq to fasta, reverse complementing sequences, extracting or masking subsequences in regions given in a BED/name list file, and more. It contains a subsampling module to sample exactly n sequences or a fraction of sequences.

Seqtk supports both fasta and fastq input files, which can be optionally gzip compressed.

Registry entries: Bio.tools  Bioconda 
Screenshots of package seqtk
sga
de novo genome assembler that uses string graphs
Versions of package sga
ReleaseVersionArchitectures
bookworm0.10.15-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
stretch0.10.15-2amd64,arm64,mips64el,ppc64el
sid0.10.15-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
buster0.10.15-4amd64,arm64,mips64el,ppc64el
trixie0.10.15-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bullseye0.10.15-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The major goal of SGA is to be very memory efficient, which is achieved by using a compressed representation of DNA sequence reads.

SGA is a de novo assembler for DNA sequence reads. It is based on Gene Myers' string graph formulation of assembly and uses the FM-index/Burrows-Wheeler transform to efficiently find overlaps between sequence reads.

Please cite: Jared T. Simpson and Richard Durbin: Efficient de novo assembly of large genomes using compressed data structures.. (PubMed,eprint) Genome Res 22(3):549-555 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
shasta
nanopore whole genome assembly (binaries and scripts)
Versions of package shasta
ReleaseVersionArchitectures
bullseye0.7.0-3amd64,arm64
sid0.11.1-4amd64,arm64
bookworm0.11.1-1amd64,arm64
trixie0.11.1-4amd64,arm64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

De novo assembly from Oxford Nanopore reads. The goal of the Shasta long read assembler is to rapidly produce accurate assembled sequence using as input DNA reads generated by Oxford Nanopore flow cells.

Computational methods used by the Shasta assembler include:

  • Using a run-length representation of the read sequence. This makes the assembly process more resilient to errors in homopolymer repeat counts, which are the most common type of errors in Oxford Nanopore reads.

  • Using in some phases of the computation a representation of the read sequence based on markers, a fixed subset of short k-mers (k ≈ 10).

Shasta assembly quality is comparable or better than assembly quality achieved by other long read assemblers.

This package contains the executable binaries (tools) and accommodating scripts.

Please cite: K. Shafin, T. Pesout and R. Lorig-Roach et al.: Nanopore sequencing and the Shasta toolkit enable efficient de novo assembly of eleven human genomes. Nature Biotechnology (2020)
shovill
assemblage de génomes d’isolats bactériens à partir de lectures paired-end Illumina
Versions of package shovill
ReleaseVersionArchitectures
trixie1.1.0-9amd64
bullseye1.1.0-4amd64
bookworm1.1.0-9amd64
sid1.1.0-9amd64
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Shovill est un pipeline qui utilise SPAdes comme cœur, mais qui modifie les étapes avant et après la première étape d’assemblage pour obtenir des résultats similaires en moins de temps. Shovill prend en charge d’autres assembleurs tels que SKESA, Velvet et Megahit, aussi il est possible avec ceux-ci de profiter des avantages de pré et post-traitement fournis par Shovill.

sibelia
comparative genomics tool
Versions of package sibelia
ReleaseVersionArchitectures
bullseye3.0.7+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.0.7+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.0.7+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.0.7+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Sibelia (Synteny Block ExpLoration tool) is a comparative genomics tool: It assists biologists in analysing the genomic variations that correlate with pathogens, or the genomic changes that help microorganisms adapt in different environments. Sibelia will also be helpful for the evolutionary and genome rearrangement studies for multiple strains of microorganisms.

Sibelia is useful in finding:

 1) shared regions,
 2) regions that present in one group of genomes but not in others,
 3) rearrangements that transform one genome to other genomes.
Please cite: Ilya Minkin, Anand Patel, Mikhail Kolmogorov, Nikolay Vyahhi and Son Pham: Sibelia: A Scalable and Comprehensive Synteny Block Generation Tool for Closely Related Microbial Genomes. Lecture Notes in Computer Science (2013)
Registry entries: Bio.tools  Bioconda 
sibsim4
Alignement de séquences d'ARN sur une séquence d'ADN
Versions of package sibsim4
ReleaseVersionArchitectures
sid0.20-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.20-2amd64,armel,armhf,i386
stretch0.20-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.20-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.20-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.20-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.20-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package sibsim4:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing, searching
works-with-formatplaintext
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le projet SIBsim4 est basé sur sim4, un programme pour aligner une séquence d'ADNc sur une séquence génomique, en tenant compte de l'existence d'introns. Dans SIBsim4, le code source original a été fortement remanié avec comme buts :

  • l'amélioration de la vitesse ;
  • l'utilisation de séquences d'ADN de l'ordre de grandeur d'un chromosome ;
  • une meilleure description des variants d'épissage ;
  • une meilleure description des sites de polyadénylation ;
  • des corrections et améliorations de code.
Registry entries: Bio.tools 
sickle
outil de réduction adaptative à des fenêtres pour des fichiers FASTQ utilisant la qualité
Versions of package sickle
ReleaseVersionArchitectures
stretch1.33-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.33+git20150314.f3d6ae3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

La plupart des technologies de séquençage produisent des lectures dont la qualité diminue vers l’extrémité 3'. Les bases appelées incorrectement ont un impact négatif sur les assemblages, les correspondances et les analyses bioinformatiques en aval.

Sickle est un outil qui utilise des fenêtres coulissantes selon des seuils de qualité et de longueur pour déterminer quand la qualité est suffisamment basse pour couper l’extrémité 3' des lectures. Il supprime aussi des lectures en se basant sur le seuil de longueur. Il prend les valeurs de qualité et fait coulisser une fenêtre parmi celles dont la longueur est 0,1 fois la longueur de la lecture. Si la longueur est inférieure à 1, alors la fenêtre est définie pour être égale à la longueur de la lecture. Sinon, la fenêtre coulisse le long des valeurs de qualité jusqu’à ce que la qualité moyenne descend en dessous du seuil. À ce point, l’algorithme détermine où dans la fenêtre la baisse se produit et coupe à cet endroit les chaines de lecture et de qualité. Cependant, si le point de coupure est inférieur au seuil de longueur minimale alors la lecture est entièrement rejetée.

Sickle prend en charge quatre type de valeurs de qualité : Illumina, Solexa, Phred et Sanger. Remarquez que le réglage de qualité Solexa est une approximation (la conversion réelle est une transformation non linéaire). L’approximation d’extrémité est bonne.

Sickle prend aussi en charge des fichiers d’entrée compressés.

The package is enhanced by the following packages: multiqc
Registry entries: Bio.tools  SciCrunch  Bioconda 
sigma-align
alignement de multiples séquences d'ADN non codant
Versions of package sigma-align
ReleaseVersionArchitectures
bullseye1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.1.3-3amd64,armel,armhf,i386
stretch1.1.3-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.1.3-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.1.3-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package sigma-align:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

SIGMA (« SImple Greedy Multiple Alignment ») est un logiciel d'alignement. Son algorithme et schéma de notation sont conçus spécialement pour une séquence d'ADN non codant.

Il utilise une stratégie de recherche d'alignements locaux avec le moins d'espacement possible. Ceci se produit à chaque étape, ce qui rend le meilleur alignement possible compatible avec les alignements existants. Il note l'importance de l'alignement sur ​​la base des longueurs des fragments alignés et un modèle de fond. Ceux-ci peuvent être communiqués ou estimés à partir d'un fichier complémentaire de l'ADN intergénique.

Please cite: Siddharthan, Rahul: Sigma: multiple alignment of weakly-conserved non-coding DNA sequence. (PubMed) BMC Bioinformatics 7(1):143 (2006)
Registry entries: Bio.tools 
sim4
Outil d'alignement d'ADNc et d'ADN génomique
Versions of package sim4
ReleaseVersionArchitectures
buster0.0.20121010-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.0.20121010-1amd64,armel,armhf,i386
bullseye0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.0.20121010-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package sim4:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing, searching
works-with-formatplaintext
Popcon: 22 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

sim4 est un outil se basant sur les similitudes pour aligner une séquence d'ADN exprimée (EST, ADNc, ARNm) avec une séquence génomique pour un gène. Il détecte également les correspondances de terminaisons lorsque deux séquences entrées se recouvrent sur une terminaison (c.-à-d. le début d'une séquence recouvre la fin de l'autre).

sim4 emploie une technique de découpage pour d'abord déterminer les blocs de base en correspondance représentant les exons fondamentaux. Dans un premier temps, il détermine toutes les correspondances exactes possibles entre W-mères (c.-à-d. les séquences d'ADN de taille W) des deux séquences et les étend jusqu'à une taille maximale de segment sans lacune. Dans un second temps, les exons fondamentaux sont étendus aux fragments adjacents n'ayant pas encore de correspondance en utilisant des algorithmes d'alignement gourmands, et des approches heuristiques sont utilisées pour privilégier les configurations conformes aux signaux de reconnaissance de site soudé (GT-AG, CT-AC). Si nécessaire, le traitement est répété avec des paramètres moins contraignants sur les fragments sans correspondance.

Please cite: Liliana Florea, George Hartzell, Zheng Zhang, Gerald M. Rubin and Webb Miller: A Computer Program for Aligning a cDNA Sequence with a Genomic DNA Sequence. (PubMed,eprint) Genome Research 8:967-974 (1998)
Registry entries: Bio.tools 
sim4db
alignement par lot d’épissages de séquences de cDNA pour un génome cible
Versions of package sim4db
ReleaseVersionArchitectures
stretch0~20150903+r2013-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0~20150903+r2013-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Sim4db réalise un alignement rapide par lot de grands ensembles de séquences cDNA (EST, mRNA) de régions génomiques d’eucaryotes. Il utilise les algorithmes sim4 et sim4cc pour déterminer les alignements, mais il intègre un mécanisme rapide d’extraction et d’indexation de séquences implémenté dans le paquet frère « leaff », pour traiter rapidement de grandes quantités de séquences.

Bien que sim4db produise des alignements de la même manière que sim4 ou sim4cc, il possède d’autres fonctionnalités pour le rendre plus ouvert à une utilisation pour toutes les tuyauteries d’annotation pour tout le génome. Un fichier de script peut être utilisé pour les appariements de groupes entre des cDNA et leurs régions génomiques à aligner en une seule exécution et en utilisant le même ensemble de paramètres. Facultativement, Sim4db rapporte aussi plus d’un alignement pour le même cDNA à l’intérieur d’une région génomique aussi longtemps qu’ils se conforment à un critère défini par l’utilisateur, tel qu’une longueur minimale, un pourcentage d’identité ou de couverture de séquence. Cette fonction est importante pour trouver tous les alignements d’une famille de gènes à un même locus. Enfin, la sortie est présentée sous forme d’alignements sim4db ou sous forme de caractères de gène GFF3.

Ce paquet fait partie de la suite Kmer.

The package is enhanced by the following packages: kmer-examples
Please cite: B. Walenz and L. Florea: Sim4db and leaff: Utilities for fast batched spliced alignment and sequence indexing. (PubMed) Bioinformatics 27(13):1869-1870 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
simka
comparative metagenomics method dedicated to NGS datasets
Versions of package simka
ReleaseVersionArchitectures
trixie1.5.3-8amd64,arm64,mips64el,ppc64el
bullseye1.5.3-4amd64,arm64,i386,ppc64el,s390x
sid1.5.3-8amd64,arm64,mips64el,ppc64el,riscv64
bookworm1.5.3-7amd64,arm64,mips64el,ppc64el
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Simka is a de novo comparative metagenomics tool. Simka represents each dataset as a k-mer spectrum and compute several classical ecological distances between them.

Please cite: Gaëtan Benoit, Pierre Peterlongo, Mahendra Mariadassou, Erwan Drezen, Sophie Schbath, Domonique Lavenier and Claire Lemaitre: Multiple comparative metagenomics using multiset k-mer counting. :25 (2016)
Registry entries: Bioconda 
simkamin
approximate comparative metagenomics method dedicated to NGS datasets
Versions of package simkamin
ReleaseVersionArchitectures
bookworm1.5.3-7all
sid1.5.3-8all
bullseye1.5.3-4all
trixie1.5.3-8all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Simka is a de novo comparative metagenomics tool. Simka represents each dataset as a k-mer spectrum and compute several classical ecological distances between them.

The difference with Simka stands in the fact that SimkaMin outputs approximate (but very similar) results by subsampling the kmer space. With this strategy, and with default parameters, SimkaMin is an order of magnitude faster, uses 10 times less memory and 70 times less disk than Simka.

Please cite: Gaëtan Benoit, Pierre Peterlongo, Mahendra Mariadassou, Erwan Drezen, Sophie Schbath, Domonique Lavenier and Claire Lemaitre: Multiple comparative metagenomics using multiset k-mer counting. :25 (2016)
Registry entries: Bioconda 
ska
Split Kmer Analysis
Versions of package ska
ReleaseVersionArchitectures
sid1.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SKA (Split Kmer Analysis) is a toolkit for prokaryotic (and any other small, haploid) DNA sequence analysis using split kmers. A split kmer is a pair of kmers in a DNA sequence that are separated by a single base. Split kmers allow rapid comparison and alignment of small genomes, and is particulalry suited for surveillance or outbreak investigation. SKA can produce split kmer files from fasta format assemblies or directly from fastq format read sequences, cluster them, align them with or without a reference sequence and provide various comparison and summary statistics. Currently all testing has been carried out on high-quality Illumina read data, so results for other platforms may vary.

Registry entries: Bioconda 
skesa
strategic Kmer extension for scrupulous assemblies
Versions of package skesa
ReleaseVersionArchitectures
sid2.4.0-6amd64,arm64
bookworm2.4.0-6amd64,arm64
bullseye2.4.0-1amd64,i386
trixie2.4.0-6amd64,arm64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SKESA is a DeBruijn graph-based de-novo assembler designed for assembling reads of microbial genomes sequenced using Illumina. Comparison with SPAdes and MegaHit shows that SKESA produces assemblies that have high sequence quality and contiguity, handles low-level contamination in reads, is fast, and produces an identical assembly for the same input when assembled multiple times with the same or different compute resources. SKESA has been used for assembling over 272,000 read sets in the Sequence Read Archive at NCBI and for real-time pathogen detection.

Please cite: Alexandre Souvorov, Richa Agarwala and David J. Lipman: SKESA: strategic k-mer extension for scrupulous assemblies. (PubMed,eprint) Genome Biology 19(1):153 (2018)
Registry entries: Bioconda 
skewer
post-processing of high-throughput DNA sequence reads
Versions of package skewer
ReleaseVersionArchitectures
bullseye0.2.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.2.2-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.2.2-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.2.2-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

skewer implements the bit-masked k-difference matching algorithm dedicated to the task of adapter trimming and it is specially designed for processing next-generation sequencing (NGS) paired-end sequences.

Features

  • Detection and removal of adapter sequences
  • Insertion and deletion allowed in pattern matching
  • Targeted at Single End, Paired End (PE), and Long Mate Pair (LMP) reads
  • Demultiplexing of barcoded sequencing runs
  • Multi-threading support
  • Trimming based on phred quality scores
  • IUPAC characters for barcodes and adapters
  • Compressed input and output support
The package is enhanced by the following packages: multiqc
Please cite: H. Jiang, R. Lei, S. W. Ding and S. Zhu: Skewer: a fast and accurate adapter trimmer for next-generation sequencing paired-end reads.. (eprint) BMC Bioinformatics 15:182 (2014)
Registry entries: Bio.tools  Bioconda 
smalt
Sequence Mapping and Alignment Tool
Versions of package smalt
ReleaseVersionArchitectures
bookworm0.7.6-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.7.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.7.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.7.6-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.7.6-8amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
stretch0.7.6-6amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
jessie0.7.6-4amd64,armhf,i386
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SMALT efficiently aligns DNA sequencing reads with a reference genome. Reads from a wide range of sequencing platforms, for example Illumina, Roche-454, Ion Torrent, PacBio or ABI-Sanger, can be processed including paired reads.

The software employs a perfect hash index of short words (< 20 nucleotides long), sampled at equidistant steps along the genomic reference sequences.

For each read, potentially matching segments in the reference are identified from seed matches in the index and subsequently aligned with the read using a banded Smith-Waterman algorithm.

The best gapped alignments of each read is reported including a score for the reliability of the best mapping. The user can adjust the trade-off between sensitivity and speed by tuning the length and spacing of the hashed words.

A mode for the detection of split (chimeric) reads is provided. Multi-threaded program execution is supported.

Registry entries: Bio.tools  SciCrunch  Bioconda 
Remark of Debian Med team: This can be regarded as successor of ssaha2

This program is from the same author as ssaha2 and according to its author faster and more precise than ssaha2 (except for sequences > 2000bp).

smithwaterman
determination de régions similaires entre deux chaines de séquences génomiques
Versions of package smithwaterman
ReleaseVersionArchitectures
stretch-backports0.0+git20160702.2610e25-4~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el
stretch0.0+20160702-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el
trixie0.0+git20160702.2610e25-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.0+git20160702.2610e25-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.0+git20160702.2610e25-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.0+git20160702.2610e25-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.0+git20160702.2610e25-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

L’algorithme de Smith–Waterman réalise un alignement de séquences, c’est-à-dire qu’il détermine les régions similaires entre deux chaines représentant des séquences de nucléotide ou de protéine. Au lieu d’examiner la séquence entière, l’algorithme de Smith–Waterman compare les segments de toutes les longueurs possibles et optimise les mesures de similarité.

smrtanalysis
software suite for single molecule, real-time sequencing
Versions of package smrtanalysis
ReleaseVersionArchitectures
sid0~20210112all
bullseye0~20210111all
bookworm0~20210112all
stretch0~20161126all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

SMRT® Analysis is a powerful, open-source bioinformatics software suite available for analysis of DNA sequencing data from Pacific Biosciences’ SMRT technology. Users can choose from a variety of analysis protocols that utilize PacBio® and third-party tools. Analysis protocols include de novo genome assembly, cDNA mapping, DNA base-modification detection, and long-amplicon analysis to determine phased consensus sequences.

This is a metapackage that depends on the components of SMRT Analysis.

Registry entries: Bio.tools  SciCrunch 
snap
location of genes from DNA sequence with hidden markov model
Versions of package snap
ReleaseVersionArchitectures
buster2013-11-29-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch2013-11-29-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2013-11-29-1amd64,armel,armhf,i386
sid2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1267 users (98 upd.)*
Versions and Archs
License: DFSG free
Git

SNAP is a general purpose gene finding program suitable for both eukaryotic and prokaryotic genomes. SNAP is an acroynm for Semi-HMM-based Nucleic Acid Parser.

Please cite: Ian Korf: Gene finding in novel Genomes. (PubMed,eprint) BMC Bioinformatics 5:59 (2004)
Registry entries: Bio.tools 
Screenshots of package snap
snap-aligner
Scalable Nucleotide Alignment Program
Versions of package snap-aligner
ReleaseVersionArchitectures
sid2.0.3+dfsg-2amd64,arm64,mips64el,ppc64el,riscv64
stretch1.0~beta.18+dfsg-1amd64,arm64,mips64el,ppc64el
bullseye1.0.0+dfsg-2amd64,arm64,mips64el,ppc64el
bookworm2.0.2+dfsg-1amd64,arm64,mips64el,ppc64el
trixie2.0.3+dfsg-2amd64,arm64,mips64el,ppc64el
buster1.0~beta.18+dfsg-3amd64,arm64,mips64el,ppc64el
Popcon: 3 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

SNAP is a new sequence aligner that is 3-20x faster and just as accurate as existing tools like BWA-mem, Bowtie2 and Novoalign. It runs on commodity x86 processors, and supports a rich error model that lets it cheaply match reads with more differences from the reference than other tools. This gives SNAP up to 2x lower error rates than existing tools (in some cases) and lets it match larger mutations that they may miss. SNAP also natively reads BAM, FASTQ, or gzipped FASTQ, and natively writes SAM or BAM, with built-in sorting, duplicate marking, and BAM indexing.

Please cite: Matei Zaharia, William J. Bolosky, Kristal Curtis, Armando Fox, David Patterson, Scott Shenker, Ion Stoica, Richard M. Karp and Taylor Sittler: Faster and More Accurate Sequence Alignment with SNAP. (eprint) arXiv preprint arXiv:1111.5572 (2011)
Registry entries: SciCrunch 
sniffles
structural variation caller using third-generation sequencing
Versions of package sniffles
ReleaseVersionArchitectures
bullseye1.0.12b+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2-1all
trixie2.2-1all
bookworm2.0.7-1all
buster1.0.11+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.2+ds-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Sniffles is a structural variation (SV) caller using third-generation sequencing data such as those from Pacific Biosciences or Oxford Nanopore platforms. It detects all types of SVs using evidence from split-read alignments, high-mismatch regions, and coverage analysis.

Please cite: Fritz J. Sedlazeck, Philipp Rescheneder, Moritz Smolka, Han Fang, Maria Nattestad, Arndt von Haeseler and Michael Schatz: Accurate detection of complex structural variations using single molecule sequencing. (eprint) bioRxiv (2017)
Registry entries: Bio.tools  Bioconda 
snippy
rapid haploid variant calling and core genome alignment
Versions of package snippy
ReleaseVersionArchitectures
trixie4.6.0+dfsg-4all
sid4.6.0+dfsg-4all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Snippy finds SNPs between a haploid reference genome and your NGS sequence reads. It will find both substitutions (snps) and insertions/deletions (indels). It will use as many CPUs as you can give it on a single computer (tested to 64 cores). It is designed with speed in mind, and produces a consistent set of output files in a single folder. It can then take a set of Snippy results using the same reference and generate a core SNP alignment (and ultimately a phylogenomic tree).

Registry entries: Bioconda 
snp-sites
code binaire pour le paquet snp-sites
Versions of package snp-sites
ReleaseVersionArchitectures
sid2.5.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.3.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.5.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.5.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye2.5.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.5.0-1amd64,armel,armhf,i386
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ce programme découvre les positions de polymorphisme d'un seul nucléotide (SNP) dans les fichiers d’entrée au format multi-fasta (pouvant être compressés). Sa sortie peut être dans divers formats largement utilisés (Multi Fasta Alignment, Vcf, phylip).

Ce logiciel a été développé à l’institut Wellcome Trust Sanger.

Un polymorphisme d’un seul nucléotide (SNP, prononcé snip, pluriel snips) est une variation de séquence d’ADN se produisant lorsque un seul nucléotide — A, T, C ou G — dans le génome (ou une autre séquence partagée) diffère entre membres d’une espèce biologique ou de paire de chromosomes. Par exemple, deux fragments d’ADN séquencés de deux individus différents, AAGCCTA à AAGCTTA, contiennent une différence dans un seul nucléotide. Dans ce cas, il y a deux allèles. La plupart des SNP communs ont seulement deux allèles.

Please cite: Andrew J. Page, Ben Taylor, Aidan J. Delaney, Jorge Soares, Torsten Seemann, Jacqueline A. Keane and Simon R. Harris: SNP-sites: rapid efficient extraction of SNPs from multi-FASTA alignments. (eprint) Microbial Genomics 2(4) (2016)
Topics: Genetic variation
Screenshots of package snp-sites
snpeff
genetic variant annotation and effect prediction toolbox - tool
Versions of package snpeff
ReleaseVersionArchitectures
bookworm5.1+d+dfsg-3all
trixie5.2.b+dfsg-1all
sid5.2.b+dfsg-1all
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

"We are all different!" Geneticists agree to this. Even twins, who are said to be identical are on a molecular level only "mostly" identical. And even within the exact same individual, healthy cells acquire mutations such that we are all genetic mosaics. Changes to individual cells may be induced by environmental factors, e.g. like UV light, or happen sporadically as mishaps during cellular divisions.

Because there are so many genetic differences, and most have just no particular meaning for the development of a phenotype, i.e. most have no effect, it would be nice to have heuristics implemented that direct the researcher towards single-nucleotide polymorphisms (SNPs) that are most likely to be relevant. This identifies the gene that causes or contributes to, e.g, an illness, and possibly also genes that are affected by that change. Such mechanistic understanding of a disease, particularly when multiple genes and multiple genetic variants are contributing to the then "polygenic" phenotype, is at the onset of drug development and increasingly also for selecting individualized therapies in the clinic.

SnpEff is a variant annotation and effect prediction tool. It annotates and predicts the effects of variants on genes (such as amino acid changes). The inputs are predicted variants (SNPs, insertions, deletions and MNPs). The input file is usually obtained as a result of a sequencing experiment, and it is usually in variant call format (VCF).

SnpEff analyzes the input variants. It annotates the variants and calculates the effects they produce on known genes (e.g. amino acid changes).

This package contains the command line tool.

The package is enhanced by the following packages: multiqc
Please cite: Pablo Cingolani, Adrian Platts, Le Lily Wang, Melissa Coon, Tung Nguyen, Luan Wang, Susan J. Land, Douglas M. Ruden and Xiangyi Lu: A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w^1118; iso-2; iso-3. (PubMed,eprint) Fly 6(2):80-92 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
snpomatic
logiciel de mappage strict et rapide de « lectures courtes »
Versions of package snpomatic
ReleaseVersionArchitectures
buster1.0-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Les technologies de séquençage à haut débit génèrent de grandes quantités de courtes lectures. Leur mappage vers une séquence de référence consomme de grandes quantités de temps de processeur et de mémoire et les erreurs de mappage de lectures peuvent conduire à des alignements bruités ou incorrects.

SNP-o-matic est un logiciel de mappage strict de « lectures courtes ». Il gère un grand nombre de types et de formats de sortie pour des utilisations dans le filtrage de lectures, les alignements, les appels de création de génotypes basés sur les séquences, le réassemblage assisté de contigs, etc.

Please cite: Heinrich Magnus Manske and Dominic P. Kwiatkowski: SNP-o-matic. (PubMed,eprint) Bioinformatics 25(18):2434-2435 (2009)
Registry entries: Bio.tools  Bioconda 
Topics: Genetic variation; Mapping
snpsift
tool to annotate and manipulate genome variants - tool
Versions of package snpsift
ReleaseVersionArchitectures
bookworm5.1+dfsg2-2all
trixie5.1+dfsg2-2all
sid5.1+dfsg2-2all
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SnpSift is a toolbox that allows one to filter and manipulate annotated files. Once the genomic variants have been annotated, one needs to filter them out in order to find the "interesting / relevant variants". Given the large data files, this is not a trivial task (e.g. one cannot load all the variants into XLS spreadsheet). SnpSift helps to perform this VCF file manipulation and filtering required at this stage in data processing pipelines.

This package contains the command line tool.

soapaligner
aligner of short reads of next generation sequencers
Versions of package soapaligner
ReleaseVersionArchitectures
bookworm2.20-5amd64
buster2.20-3amd64
bullseye2.20-5amd64
sid2.20-5amd64
trixie2.20-5amd64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

This package addresses a common problem in bioinformatics that has become routine now also in clinical research: the assembly and comparison of the very long genomic DNA sequences from many short reads that the machines provide.

SOAPaligner/soap2 is a member of the Short Oligonucleotide Analysis Package (SOAP) and an updated version of SOAP software for short oligonucleotide alignment (soap v1). The new program features in super fast and accurate alignment for huge amounts of short reads generated by Illumina/Solexa Genome Analyzer. Compared to soap v1, it is one order of magnitude faster. It require only 2 minutes aligning one million single-end reads onto the human reference genome. Another remarkable improvement of SOAPaligner is that it now supports a wide range of the read length.

SOAPaligner/soap2 benefitted in time and space efficiency by a revolution in the basic data structures and algorithms used. The core algorithms and the indexing data structures (2way-BWT) are developed by the algorithms research group of the Department of Computer Science, the University of Hong Kong (T.W. Lam, Alan Tam, Simon Wong, Edward Wu and S.M. Yiu).

Please cite: Ruiqiang Li, Yingrui Li, Karsten Kristiansen and Jun Wang: SOAP: short oligonucleotide alignment program. (PubMed,eprint) Genome Res. 24(5):713-714 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
soapdenovo
short-read assembly method to build de novo draft assembly
Versions of package soapdenovo
ReleaseVersionArchitectures
jessie1.05-2amd64
sid1.05-6amd64
trixie1.05-6amd64
bookworm1.05-6amd64
bullseye1.05-6amd64
buster1.05-5amd64
stretch1.05-3amd64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SOAPdenovo is a novel short-read assembly method that can build a de novo draft assembly for the human-sized genomes. The program is specially designed to assemble Illumina GA short reads.

It creates new opportunities for building reference sequences and carrying out accurate analyses of unexplored genomes in a cost effective way.

This version is not maintained anymore, consider using soapdenovo2.

Please cite: Ruiqiang Li, Hongmei Zhu, Jue Ruan, Wubin Qian, Xiaodong Fang, Zhongbin Shi, Yingrui Li, Shengting Li, Gao Shan, Karsten Kristiansen, Songgang Li, Huanming Yang, Jian Wang and Jun Wang: De novo assembly of human genomes with massively parallel short read sequencing. (PubMed,eprint) Genome Research 20(2):265-72 (2009)
Registry entries: Bio.tools  SciCrunch 
soapdenovo2
méthode d'assemblage de lectures courtes pour construire un assemblage brouillon de novo
Versions of package soapdenovo2
ReleaseVersionArchitectures
stretch240+dfsg1-2amd64
jessie240+dfsg-2amd64
bullseye242+dfsg-1amd64
buster241+dfsg-3amd64
trixie242+dfsg-3amd64
sid242+dfsg-3amd64
bookworm242+dfsg-3amd64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le logiciel SOAPdenovo est une nouvelle méthode d'assemblage à lectures courtes qui peut construire un assemblage brouillon de novo pour les génomes de taille humaine. Le logiciel est spécialement conçu pour assembler les lectures courtes de la machine Genome Analyzer IIx de l'entreprise Illumina.

Il crée de nouvelles opportunités pour la construction de séquences de référence et la réalisation des analyses précises des génomes inexplorés de manière économique.

Please cite: Ruibang Luo, Binghang Liu, Yinlong Xie, Zhenyu Li, Weihua Huang, Jianying Yuan, Guangzhu He, Yanxiang Chen, Qi Pan, Yunjie Liu, Jingbo Tang, Gengxiong Wu, Hao Zhang, Yujian Shi, Yong Liu, Chang Yu, Bo Wang, Yao Lu, Changlei Han, David W Cheung, Siu-Ming Yiu, Shaoliang Peng, Zhu Xiaoqian, Guangming Liu, Xiangke Liao, Yingrui Li, Huanming Yang, Jian Wang, Tak-Wah Lam and Jun Wang: SOAPdenovo2: an empirically improved memory-efficient short-read de novo assembler. Giga Science 1(1):18 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
soapsnp
resequencing utility that can assemble consensus sequence of genomes
Versions of package soapsnp
ReleaseVersionArchitectures
bullseye1.03-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.03-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.03-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.03-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.03-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

For getting ideas on the cause of diseases or their response to therapy, and for understanding either for a particular patient, doctors around the globe are starting to look at the genes or the whole genome and how that sequence is different from a healthy / well responding individual.

SOAPsnp is a member of the SOAP (Short Oligonucleotide Analysis Package). The program is a resequencing utility. It assembles the consensus sequence for the genome of a newly sequenced individual based on the alignment of the raw sequencing reads on a known reference. SNPs can then be identified on the consensus sequence through the comparison with the reference.

SOAPsnp uses a method based on Bayes' theorem (the reverse probability model) to call consensus genotype by carefully considering the data quality, alignment, and recurring experimental errors. All these kinds of information was integrated into a single quality score for each base in PHRED scale to measure the accuracy of consensus calling. Currently, it supports the alignment format of SOAPaligner (soap2).

Please cite: Li R, Li Y, Fang X, Yang H, Wang J, Kristiansen K and Wang J.: SNP detection for massively parallel whole-genome resequencing. (PubMed,eprint) Genome Res. 19(6):1124-1132 (2009)
Registry entries: Bio.tools  SciCrunch 
sortmerna
tool for filtering, mapping and OTU-picking NGS reads
Versions of package sortmerna
ReleaseVersionArchitectures
bookworm4.3.6-2amd64,i386
bullseye2.1-5amd64,i386
buster2.1-3amd64,i386
trixie4.3.6-3amd64,i386
sid4.3.6-3amd64,i386
stretch2.1-1amd64,i386
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SortMeRNA is a biological sequence analysis tool for filtering, mapping and OTU-picking NGS reads. The core algorithm is based on approximate seeds and allows for fast and sensitive analyses of nucleotide sequences. The main application of SortMeRNA is filtering rRNA from metatranscriptomic data. Additional applications include OTU-picking and taxonomy assignation available through QIIME v1.9+ (http://qiime.org - v1.9.0-rc1). SortMeRNA takes as input a file of reads (fasta or fastq format) and one or multiple rRNA database file(s), and sorts apart rRNA and rejected reads into two files specified by the user. Optionally, it can provide high quality local alignments of rRNA reads against the rRNA database. SortMeRNA works with Illumina, 454, Ion Torrent and PacBio data, and can produce SAM and BLAST-like alignments.

The package is enhanced by the following packages: multiqc
Please cite: Evguenia Kopylova, Laurent Noé and Hélène Touzet: SortMeRNA: fast and accurate filtering of ribosomal RNAs in metatranscriptomic data". (PubMed,eprint) Bioinformatics 28(24):3211-3217 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
spaced
alignment-free sequence comparison using spaced words
Versions of package spaced
ReleaseVersionArchitectures
bullseye1.2.0-201605+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.0-201605+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.0-201605+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.2.0-201605+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2.0-201605+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.0.2+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Spaced (Words) is a new approach to alignment-free sequence comparison. While most alignment-free algorithms compare the word-composition of sequences, spaced uses a pattern of care and don't care positions. The occurrence of a spaced word in a sequence is then defined by the characters at the match positions only, while the characters at the don't care positions are ignored. Instead of comparing the frequencies of contiguous words in the input sequences, this new approach compares the frequencies of the spaced words according to the pre-defined pattern. An information-theoretic distance measure is then used to define pairwise distances on the set of input sequences based on their spaced-word frequencies. Systematic test runs on real and simulated sequence sets have shown that, for phylogeny reconstruction, this multiple-spaced-words approach is far superior to the classical alignment-free approach based on contiguous word frequencies.

Please cite: Burkhard Morgenstern, Bingyao Zhu, Sebastian Horwege and Chris-Andre Leimeister: Estimating evolutionary distances between genomic sequences from spaced-words matches. (PubMed,eprint) Algorithms for Molecular Biology 10(1):1-12 (2015)
spades
assembleur génomique pour des ensembles de données de « single-cell » et « isolates »
Versions of package spades
ReleaseVersionArchitectures
bookworm3.15.5+dfsg-2amd64
bullseye3.13.1+dfsg-2amd64
stretch-backports-sloppy3.13.1+dfsg-2~bpo9+1amd64
buster3.13.0+dfsg2-2amd64
stretch-backports3.12.0+dfsg-1~bpo9+1amd64
stretch3.9.1+dfsg-1amd64
sid3.15.5+dfsg-7amd64
trixie3.15.5+dfsg-7amd64
Popcon: 6 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

SPAdes (assembleur de génome de Saint-Pétersbourg) est conçu pour à la fois les assemblages de MDA bactériens isolés standard et ceux de cellule unique. Il fonctionne avec les lectures d’Illumina ou IonTorrent et peut fournir des assemblages hybrides en utilisant des lectures de PacBio ou Sanger. Des contigs supplémentaires peuvent être fournis pour être utilisés comme lectures longues.

Ce paquet fournit aussi les tuyauteries supplémentaires suivantes :

 – metaSPAdes, tuyauterie pour des ensembles de données métagénomiques ;
 – plasmidSPAdes, tuyauterie pour l’extraction et l’assemblage de
   plasmides à partir d’ensembles de données WGS ;
 – metaplasmidSPAdes, tuyauterie pour l’extraction et l’assemblage de
   plasmides à partir d’ensembles de données métagénomiques ;
 – rnaSPAdes, assembleur de novo de transcriptome à partir le données de
   séquençages d’ARN ;
 – truSPAdes, module pour l’assemblage de codages à barres TruSeq ;
 – biosyntheticSPAdes, module pour l’assemblage de groupes de gènes
   biosynthétique avec des lectures appariés.

SPAdes fournit plusieurs exécutables autonomes avec une interface en ligne de commande relativement simple : comptage k-mer (spades-kmercounter), construction de graphe d’assemblages (spades-gbuilder) et lectures longues vers un alignement de graphe (spades-gmapper).

Please cite: Anton Bankevich, Sergey Nurk, Dmitry Antipov, Alexey A. Gurevich, Mikhail Dvorkin, Alexander S. Kulikov, Valery M. Lesin, Sergey I. Nikolenko, Son Pham, Andrey D. Prjibelski, Alexey V. Pyshkin, Alexander V. Sirotkin, Nikolay Vyahhi, Glenn Tesler, Max A. Alekseyev and Pavel A. Pevzner: SPAdes: A New Genome Assembly Algorithm and Its Applications to Single-Cell Sequencing. (PubMed,eprint) Journal of Computational Biology 19(5):455-477 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
spaln
alignement de transcriptions selon les épissures pour l’ADN génomique
Versions of package spaln
ReleaseVersionArchitectures
bookworm2.4.13f+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
bullseye2.4.1+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.0.2+dfsg-2amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie3.0.2+dfsg-2amd64,arm64,mips64el,ppc64el,s390x
upstream3.0.3
Popcon: 1 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Spaln (space-efficient spliced alignment) est un programme autonome qui cartographie et aligne un ensemble de séquences d’ADNc ou de protéines en une séquence générale en une seule passe. Il réalise aussi des alignements épissés ou ordinaires après une recherche rapide de similarité par rapport à une base de données de séquences de protéines si un segment génomique ou une séquence d’acides aminés est fourni en requête.

Spaln gère la combinaison de base de données de séquences de protéines et d’un segment génomique et réalise des recherches rapides de similarité et des alignements (semi)-globaux d’un ensemble de requêtes de séquences de protéines par rapport à une base de données de séquences de protéines. Spaln adopte une heuristique multiphase rendant le travail possible sur un ordinateur personnel conventionnel.

Registry entries: Bioconda 
spoa
SIMD partial order alignment tool
Versions of package spoa
ReleaseVersionArchitectures
bullseye4.0.7+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports1.1.3-2~bpo9+1amd64
bookworm4.0.8-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports-sloppy3.0.1-1~bpo9+1amd64
trixie4.1.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.1.5-1amd64
sid4.1.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Spoa (SIMD POA) is a c++ implementation of the partial order alignment (POA) algorithm (as described in 10.1093/bioinformatics/18.3.452) which is used to generate consensus sequences (as described in 10.1093/bioinformatics/btg109). It supports three alignment modes: local (Smith-Waterman), global (Needleman-Wunsch) and semi-global alignment (overlap).

Registry entries: Bioconda 
sprai
single-pass sequencing read accuracy improver
Versions of package sprai
ReleaseVersionArchitectures
bookworm0.9.9.23+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.9.9.23+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch0.9.9.22+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.9.9.23+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.9.9.23+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.9.9.23+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Sprai is a tool to correct sequencing errors in single-pass reads for de novo assembly. It is originally designed for correcting sequencing errors in single-molecule DNA sequencing reads, especially in Continuous Long Reads (CLRs) generated by PacBio RS sequencers. The goal of Sprai is not maximizing the accuracy of error-corrected reads. Instead, Sprai aims at maximizing the continuity (i.e., N50 contig length) of assembled contigs after error correction.

spread-phy
analyze and visualize phylogeographic reconstructions
Versions of package spread-phy
ReleaseVersionArchitectures
stretch1.0.7+dfsg-1all
sid1.0.7+dfsg-5all
trixie1.0.7+dfsg-5all
buster1.0.7+dfsg-2all
bullseye1.0.7+dfsg-3all
bookworm1.0.7+dfsg-5all
jessie1.0.5+dfsg-1 (contrib)all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SPREAD is a user-friendly application to analyze and visualize phylogeographic reconstructions resulting from Bayesian inference of spatio-temporal diffusion.

There is a tutorial for SPREAD online at http://www.kuleuven.be/aidslab/phylogeography/tutorial/spread_tutorial.html

Originally this program is named "spread". However, there is just such a package inside Debian and thus a 'phy' for phylogeny was prepended.

Please cite: Filip Bielejec, Andrew Rambaut, Marc A. Suchard and Philippe Lemey: SPREAD: spatial phylogenetic reconstruction of evolutionary dynamics. (PubMed,eprint) Bioinformatics 27(20):2910-2912 (2011)
squizz
convertisseur pour les séquences génétiques et les alignements
Versions of package squizz
ReleaseVersionArchitectures
bookworm0.99d+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.99d+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.99d+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.99d+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.99d+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0.99c+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.99b+dfsg-3amd64,armel,armhf,i386
Debtags of package squizz:
fieldbiology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useconverting
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le logiciel Squizz est un vérificateur de format de séquence/alignement et a certaines capacités de conversion. Les formats les plus courants de séquences et d'alignements sont pris en charge :

  • EMBL, FASTA, GCG, GDE, GENBANK, IG, NBRF, PIR (codata), RAW, et SWISSPROT ;
  • CLUSTAL, FASTA, MEGA, MSF, NEXUS, PHYLIP (entrelacé et séquentiel) et STOCKHOLM.
Registry entries: Bioconda 
sra-toolkit
utilities for the NCBI Sequence Read Archive
Versions of package sra-toolkit
ReleaseVersionArchitectures
bookworm3.0.3+dfsg-6~deb12u1amd64,arm64
trixie3.0.3+dfsg-6amd64,arm64
sid3.0.3+dfsg-6amd64,arm64
stretch2.8.1-2+dfsg-2amd64,i386
buster2.9.3+dfsg-1amd64
bullseye2.10.9+dfsg-2amd64
jessie2.3.5-2+dfsg-1amd64,i386
upstream3.1.0
Popcon: 13 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

Tools for reading the SRA archive, generally by converting individual runs into some commonly used format such as fastq.

The textual dumpers "sra-dump" and "vdb-dump" are provided in this release as an aid in visual inspection. It is likely that their actual output formatting will be changed in the near future to a stricter, more formalized representation[s]. PLEASE DO NOT RELY UPON THE OUTPUT FORMAT SEEN IN THIS RELEASE.

Other tools distributed in this package are:

 abi-dump, abi-load
 align-info
 bam-load
 cache-mgr
 cg-load
 copycat
 fasterq-dump
 fastq-dump, fastq-load
 helicos-load
 illumina-dump, illumina-load
 kar
 kdbmeta
 latf-load
 pacbio-load
 prefetch
 rcexplain
 remote-fuser
 sff-dump, sff-load
 sra-pileup, sra-sort, sra-stat, srapath
 srf-load
 test-sra
 vdb-config, vdb-copy, vdb-decrypt, vdb-encrypt, vdb-get, vdb-lock,
 vdb-passwd, vdb-unlock, vdb-validate

The "help" information will be improved in near future releases, and the tool options will become standardized across the set. More documentation will also be provided documentation on the NCBI web site.

Tool options may change in the next release. Version 1 tool options will remain supported wherever possible in order to preserve operation of any existing scripts.

Please cite: Rasko Leinonen, Ruth Akhtar, Ewan Birney, James Bonfield, Lawrence Bower, Matt Corbett, Ying Cheng, Fehmi Demiralp, Nadeem Faruque, Neil Goodgame, Richard Gibson, Gemma Hoad, Christopher Hunter, Mikyung Jang, Steven Leonard, Quan Lin, Rodrigo Lopez, Michael Maguire, Hamish McWilliam, Sheila Plaister, Rajesh Radhakrishnan, Siamak Sobhany, Guy Slater, Petra Ten Hoopen, Franck Valentin, Robert Vaughan, Vadim Zalunin, Daniel Zerbino and Guy Cochrane: Improvements to services at the European Nucleotide Archive. (PubMed,eprint) Nucleic Acids Research 38(Database issue):D39-45 (2010)
Registry entries: Bio.tools  Bioconda 
srst2
Short Read Sequence Typing for Bacterial Pathogens
Versions of package srst2
ReleaseVersionArchitectures
bullseye0.2.0-8amd64,arm64,mips64el,ppc64el
stretch0.2.0-4amd64
buster0.2.0-6amd64
bookworm0.2.0-9amd64,arm64,mips64el,ppc64el
sid0.2.0-11amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 3 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

This program is designed to take Illumina sequence data, a MLST database and/or a database of gene sequences (e.g. resistance genes, virulence genes, etc) and report the presence of STs and/or reference genes.

Please cite: Michael Inouye, Harriet Dashnow, Lesley-Ann Raven, Mark B Schultz, Bernard J Pope, Takehiro Tomita, Justin Zobel and Kathryn E Holt: SRST2: Rapid genomic surveillance for public health and hospital microbiology labs. (PubMed,eprint) Genome Medicine 6(11):90 (2014)
Registry entries: Bioconda 
ssake
application de génomique pour assembler des millions de séquences très courtes d’ADN
Versions of package ssake
ReleaseVersionArchitectures
buster4.0-2all
sid4.0.1-1all
stretch3.8.4-1all
trixie4.0.1-1all
jessie3.8.2-1all
bookworm4.0.1-1all
bullseye4.0-3all
Debtags of package ssake:
biologynuceleic-acids
fieldbiology
interfaceshell
roleprogram
scopeutility
useanalysing
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Short Sequence Assembly par recherche de K-mer et l’extension de troisième lecture (SSAKE) est une application de génomique pour assembler énergiquement des millions de séquences courtes de nucléotides en recherchant progressivement les « 3′-most k-mers » en utilisant un arbre de préfixes d’ADN. SSAKE est conçu pour aider à exploiter les informations de lectures de courtes séquences en les regroupant rigoureusement dans des contigs pouvant être utilisés pour caractériser les cibles de séquençage nouvelles.

Please cite: Rene L. Warren, Granger G. Sutton, Steven J. M. Jones and Robert A. Holt: Assembling millions of short DNA sequences using SSAKE. (PubMed,eprint) Bioinformatics 23(4):500-501 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence assembly
sspace
scaffolding pre-assembled contigs after extension
Versions of package sspace
ReleaseVersionArchitectures
stretch2.1.1+dfsg-2all
trixie2.1.1+dfsg-7all
sid2.1.1+dfsg-7all
bullseye2.1.1+dfsg-5all
buster2.1.1+dfsg-4all
bookworm2.1.1+dfsg-7all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SSAKE-based Scaffolding of Pre-Assembled Contigs after Extension (SSPACE) is a script able to extend and scaffold pre-assembled contigs using one or more mate pairs or paired-end libraries, or even a combination.

SSPACE is built based on SSAKE. Code of SSAKE is changed to be able to extend and scaffold pre-assembled contigs for multiple paired reads libraries.

This is the free 'basic' version of SSPACE. The non-free 'standard' version is available directly from Baseclear.

Please cite: Marten Boetzer, Christiaan V. Henkel, Hans J. Jansen, Derek Butler and Walter Pirovano: Scaffolding pre-assembled contigs using SSPACE. (PubMed,eprint) Bioinformatics 27(4):578-579 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
ssw-align
Smith-Waterman aligner based on libssw
Versions of package ssw-align
ReleaseVersionArchitectures
bullseye1.1-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
experimental1.2.5-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.1-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch1.1-1amd64
sid1.1-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.1-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1-2amd64
upstream1.2.5
Popcon: 2 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

This package provides a command-line aligner based on the libssw library, a fast SIMD accelerated implementation of the Smith-Waterman algorithm. The input files can be in FASTA or FASTQ format. Both target and query files can contain multiple sequences. Each sequence in the query file will be aligned with all sequences in the target file. Output is provided in SAM or BLAST-like text format.

stacks
pipeline for building loci from short-read DNA sequences
Versions of package stacks
ReleaseVersionArchitectures
sid2.66+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.2+dfsg-1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
stretch1.44-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
bullseye2.55+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.62+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.66+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Stacks is a software pipeline for building loci from short-read sequences, such as those generated on the Illumina platform. Stacks was developed to work with restriction enzyme-based data, such as RAD-seq, for the purpose of building genetic maps and conducting population genomics and phylogeography.

Note that this package installs Stacks such that all commands must be run as: $ stacks

The package is enhanced by the following packages: multiqc
Please cite: Julian Catchen, Paul A. Hohenlohe, Susan Bassham, Angel Amores and William A. Cresko: Stacks: an analysis tool set for population genomics. (PubMed) Molecular Ecology 22(11):3124-40 (2013)
Registry entries: Bio.tools  SciCrunch  Bioconda 
staden
DNA sequence assembly (Gap4/Gap5), editing and analysis tools
Versions of package staden
ReleaseVersionArchitectures
buster2.0.0+b11-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.0.0+b11-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.0.0+b11-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.0.0+b11-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.0.0+b11-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie2.0.0+b10-1.1amd64,armel,armhf,i386
stretch2.0.0+b11-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Staden is a fully developed set of DNA sequence assembly (Gap4 and Gap5), editing and analysis tools (Spin).

Gap4 performs sequence assembly, contig ordering based on read pair data, contig joining based on sequence comparisons, assembly checking, repeat searching, experiment suggestion, read pair analysis and contig editing. It has graphical views of contigs, templates, readings and traces which all scroll in register. Contig editor searches and experiment suggestion routines use confidence values to calculate the confidence of the consensus sequence and hence identify only places requiring visual trace inspection or extra data. The result is extremely rapid finishing and a consensus of known accuracy.

Pregap4 provides a graphical user interface to set up the processing required to prepare trace data for assembly or analysis, and automates these processes.

Trev is a rapid and flexible viewer and editor for ABI, ALF, SCF and ZTR trace files.

Prefinish analyses partially completed sequence assemblies and suggests the most efficient set of experiments to help finish the project.

Tracediff and hetscan automatically locate mutations by comparing trace data against reference traces. They annotate the mutations found ready for viewing in gap4.

Spin analyses nucleotide sequences to find genes, restriction sites, motifs, etc. It can perform translations, find open reading frames, count codons, etc. Many results are presented graphically and a sliding sequence window is linked to the graphics cursor. Spin also compares pairs of sequences in many ways. It has very rapid dot matrix analysis, global and local alignment algorithms, plus a sliding sequence window linked to the graphical plots. It can compare nucleic acid against nucleic acid, protein against protein, and protein against nucleic acid.

Please cite: James K. Bonfield and Andrew Whitwham: Gap5--editing the billion fragment sequence assembly. (PubMed,eprint) Bioinformatics 26(14):1699-1703 (2010)
Registry entries: Bio.tools  SciCrunch 
staden-io-lib-utils
programs for manipulating DNA sequencing files
Versions of package staden-io-lib-utils
ReleaseVersionArchitectures
buster1.14.11-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.14.15-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.15.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.15.0-1.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.13.7-1amd64,armel,armhf,i386
stretch1.14.8-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.14.13-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package staden-io-lib-utils:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The io_lib from the Staden package is a library of file reading and writing code to provide a general purpose trace file (and Experiment File) reading interface. It has been compiled and tested on a variety of unix systems, MacOS X and MS Windows.

This package contains the programs that are distributed with the Staden io_lib for manipulating and converting sequencing data files, and in particular files to manipulate short reads generated by second and third generation sequencers and stored in SRF format.

Registry entries: Bioconda 
stringtie
assemble short RNAseq reads to transcripts
Versions of package stringtie
ReleaseVersionArchitectures
bookworm2.2.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.1.4+ds-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2.1+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.2.1+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The abundance of transcripts in a human tissue sample can be determined by RNA sequencing. The exact sequence sampled may be random, depending on the technology used. And it may be short, i.e. shorter than the transcript. At some point, many shorter reads need to be assembled to the model the complete transcripts.

StringTie knows how to assemble of RNA-Seq into potential transcripts without the need of a reference genome and provides a quantification also of the splice variants.

Please cite: Mihaela Pertea, Geo M. Pertea, Corina .M. Antonescu, Tsung-Cheng Chang, Joshua T. Mendell and Steven L. Salzberg: StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology 33:290–295 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
subread
boite à outils pour le traitement de données de séquençage de nouvelle génération
Versions of package subread
ReleaseVersionArchitectures
buster-backports2.0.0+dfsg-1~bpo10+1amd64,arm64,armel,armhf,i386,ppc64el
bullseye2.0.1+dfsg-1amd64,arm64,armel,armhf,i386,ppc64el
buster1.6.3+dfsg-1amd64,arm64,armel,armhf,i386,ppc64el
sid2.0.6+dfsg-2amd64,arm64,armel,armhf,i386,ppc64el,riscv64
bookworm2.0.3+dfsg-1amd64,arm64,armel,armhf,i386,ppc64el
trixie2.0.6+dfsg-2amd64,arm64,armel,armhf,i386,ppc64el
stretch1.5.1+dfsg-4amd64,arm64,armel,armhf,i386,ppc64el
Popcon: 7 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

L’aligneur Subread peut être utilisé pour les lectures de gDNA-seq et RNA-seq. L’aligneur Subjunc a été conçu particulièrement pour la détection de jonction exon-exon. Pour le mappage de lectures RNA-seq, Subread réalise des alignements locaux et Subjunc réalise des alignements globaux.

Please cite: Yang Lian, Gordon K. Smyth and Wei Shi: The R package Rsubread is easier, faster, cheaper and better for alignment and quantification of RNA sequencing reads. (PubMed) Nucleic Acids Research 47(8):e47-e47 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
suitename
categorize each suite in an RNA backbone
Versions of package suitename
ReleaseVersionArchitectures
bullseye0.3.070919+git20180613.ebb1325-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.4.130509+git20210223.ebb1325-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.4.130509+git20210223.ebb1325-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.3.070628-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.4.130509+git20210223.ebb1325-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.3.070628-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Suitename is a program that supports the ROC RNA Ontology Consortium consensus RNA backbone nomenclature and conformer-list development.

From dihedral-angle input for a specific RNA structure (usually from Dangle), Suitename categorizes the RNA backbone geometry of each suite (the sugar-to-sugar version of a residue) either as an outlier or as belonging to one of the 53 defined conformer bins. The output is either a one-line-per-suite report, or a linear conformer string (as shown below the image here) in one of several variant formats. Suitename is built into MolProbity, producing entries in the multi-criterion chart for an RNA model and also a suitestring file.

Please cite: Jane S. Richardson, Bohdan Schneider, Laura W. Murray, Gary J. Kapral, Robert M. Immormino, Jeffrey J. Headd, David C. Richardson, Daniela Ham, Eli Hershkovits, Loren Dean Williams, Kevin S. Keating, Anna Marie Pyle, David Micallef, John Westbrook and Helen M. Berman: RNA backbone: Consensus all-angle conformers and modular string nomenclature (an RNA Ontology Consortium contribution). (PubMed,eprint) RNA 14(3):465-481 (2008)
sumaclust
fast and exact clustering of genomic sequences
Versions of package sumaclust
ReleaseVersionArchitectures
trixie1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.0.36+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.20-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.31-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

With the development of next-generation sequencing, efficient tools are needed to handle millions of sequences in reasonable amounts of time. Sumaclust is a program developed by the LECA. Sumaclust aims to cluster sequences in a way that is fast and exact at the same time. This tool has been developed to be adapted to the type of data generated by DNA metabarcoding, i.e. entirely sequenced, short markers. Sumaclust clusters sequences using the same clustering algorithm as UCLUST and CD- HIT. This algorithm is mainly useful to detect the 'erroneous' sequences created during amplification and sequencing protocols, deriving from 'true' sequences.

Registry entries: Bioconda 
sumatra
fast and exact comparison and clustering of sequences
Versions of package sumatra
ReleaseVersionArchitectures
trixie1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.0.31-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.0.20-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0.36+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

With the development of next-generation sequencing, efficient tools are needed to handle millions of sequences in reasonable amounts of time. Sumatra is a program developed by the LECA. Sumatra aims to compare sequences in a way that is fast and exact at the same time. This tool has been developed to be adapted to the type of data generated by DNA metabarcoding, i.e. entirely sequenced, short markers. Sumatra computes the pairwise alignment scores from one dataset or between two datasets, with the possibility to specify a similarity threshold under which pairs of sequences that have a lower similarity are not reported. The output can then go through a classification process with programs such as MCL or MOTHUR.

Registry entries: SciCrunch 
sumtrees
Phylogenetic Tree Summarization and Annotation
Versions of package sumtrees
ReleaseVersionArchitectures
sid4.6.1-1all
buster4.4.0-1all
stretch4.2.0+dfsg-1all
bullseye4.5.1-1all
trixie4.6.1-1all
bookworm4.5.2-1all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SumTrees is a program to summarize non-parameteric bootstrap or Bayesian posterior probability support for splits or clades on phylogenetic trees.

The basis of the support assessment is typically given by a set of non-parametric bootstrap replicate tree samples produced by programs such as GARLI or RAxML, or by a set of MCMC tree samples produced by programs such as Mr. Bayes or BEAST. The proportion of trees out of the samples in which a particular split is found is taken to be the degree of support for that split as indicated by the samples. The samples that are the basis of the support can be distributed across multiple files, and a burn-in option allows for an initial number of trees in each file to be excluded from the analysis if they are not considered to be drawn from the true support distribution.

Please cite: Jeet Sukumaran and Mark T. Holder: DendroPy: a Python library for phylogenetic computing. (PubMed,eprint) Bioinformatics 26(12):1569-1571 (2010)
surankco
Supervised Ranking of Contigs in de novo Assemblies
Versions of package surankco
ReleaseVersionArchitectures
stretch0.0.r5+dfsg-1all
bookworm0.0.r5+dfsg-3all
trixie0.0.r5+dfsg-4all
bullseye0.0.r5+dfsg-3all
buster0.0.r5+dfsg-2all
sid0.0.r5+dfsg-4all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SuRankCo is a machine learning based software to score and rank contigs from de novo assemblies of next generation sequencing data. It trains with alignments of contigs with known reference genomes and predicts scores and ranking for contigs which have no related reference genome yet.

Please cite: Mathias Kuhring, Piotr Wojtek Dabrowski, Vitor C. Piro, Andreas Nitsche and Bernhard Y. Renard: SuRankCo: supervised ranking of contigs in de novo assemblies. (PubMed,eprint) BMC Bioinformatics 16(1):240 (2015)
surpyvor
modification of VCF files with SURVIVOR
Versions of package surpyvor
ReleaseVersionArchitectures
sid0.5-2all
trixie0.5-2all
bookworm0.5-2all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SURVIVOR is a tool set for simulating/evaluating structural variations, merging and comparing SVs within and among samples, and includes various methods to reformat or summarize structural variations.

This package provides a Python wrapper to help with its integration in various Python-based workflows.

Registry entries: Bioconda 
survivor
tool set for simulating/evaluating SVs
Versions of package survivor
ReleaseVersionArchitectures
sid1.0.7-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.7-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.7-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.0.7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SURVIVOR is a tool set for simulating/evaluating structural variantions, merging and comparing SVs within and among samples, and includes various methods to reformat or summarize structural variantions.

Registry entries: Bioconda 
svim
Structural variant caller for long sequencing reads
Versions of package svim
ReleaseVersionArchitectures
bullseye1.4.2+ds-1all
trixie2.0.0-3all
bookworm2.0.0-3all
sid2.0.0-3all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SVIM is a structural variant caller for long sequencing reads. It is able to detect, classify and genotype five different classes of structural variants. Unlike existing methods, SVIM integrates information from across the genome to precisely distinguish similar events, such as tandem and interspersed duplications and simple insertions.

Please cite: David Heller and Martin Vingron: Link to publication (PubMed,eprint) Bioinformatics 35(17):2907-2915 (2019)
Registry entries: Bioconda 
swarm
robust and fast clustering method for amplicon-based studies
Versions of package swarm
ReleaseVersionArchitectures
buster2.2.2+dfsg-2amd64
trixie3.1.4+dfsg-1amd64,arm64,ppc64el
bookworm3.1.2+dfsg-1amd64,arm64,ppc64el
stretch2.1.12+dfsg-1amd64
sid3.1.4+dfsg-1amd64,arm64,ppc64el
bullseye3.0.0+dfsg-2amd64
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The purpose of swarm is to provide a novel clustering algorithm to handle large sets of amplicons. Traditional clustering algorithms results are strongly input-order dependent, and rely on an arbitrary global clustering threshold. swarm results are resilient to input-order changes and rely on a small local linking threshold d, the maximum number of differences between two amplicons. swarm forms stable high-resolution clusters, with a high yield of biological information.

Please cite: Frédéric Mahé, Torbjørn Rognes, Christopher Quince, Colomban de Vargas and Micah Dunthorn: Swarm v2: highly-scalable and high-resolution amplicon clustering. (PubMed,eprint) PeerJ 3(e1420) (2015)
Registry entries: Bio.tools 
sweed
assessment of SNPs for their evolutionary advantage
Versions of package sweed
ReleaseVersionArchitectures
trixie3.2.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster3.2.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.2.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.2.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.2.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Biological sequences are available in ever increasing abundance across ever larger populations for ever increasing fractions of the genome. This tool sorts the SNPs for their active or passive contribution to a genetic drift, i.e. to see particular sequences at a higher fraction over time.

Please cite: Pavlos Pavlidis, Daniel Živković, Alexandros Stamatakis and Nikolaos Alachiotis: SweeD: Likelihood-Based Detection of Selective Sweeps in Thousands of Genomes. (eprint) Molecular Biology and Evolution 30(9):2224–2234 (2013)
Registry entries: Bio.tools 
t-coffee
alignement multiple de séquences
Versions of package t-coffee
ReleaseVersionArchitectures
buster12.00.7fb08c2-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie13.45.0.4846264+really13.41.0.28bdc39+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid13.45.0.4846264+really13.41.0.28bdc39+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye13.41.0.28bdc39+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm13.45.0.4846264+really13.41.0.28bdc39+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch11.00.8cbe486-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie11.00.8cbe486-1amd64,armel,armhf,i386
Debtags of package t-coffee:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 25 users (15 upd.)*
Versions and Archs
License: DFSG free
Git

T-Coffee est un programme d'alignement multiple de séquences. À partir d'un ensemble de séquences (protéines ou ADN), T-Coffee crée un alignement multiple. Les versions 2.00 et supérieures peuvent mélanger les séquences et les structures.

T-Coffee permet la combinaison de collection d'alignements multiples ou par paires de séquences, globaux ou locaux, dans un modèle unique. Il peut aussi estimer le niveau de cohérence de chaque position dans le nouvel alignement avec les autres alignements. Veuillez vous référer à l'épreuve incluse pour plus d'informations.

T-Coffee dispose d'une variante appelée M-Coffee qui permet la combinaison de sorties de nombreux paquets d'alignement de séquences. Dans sa version publiée, il utilise MUSCLE, PROBCONS, POA, DiAlign-TS, MAFFT, Clustal W, PCMA et T-Coffee. Une version spéciale, DM-Coffee, a été faite pour Debian. Cette version n'utilise que des logiciels libres grâce au remplacement de Clustal W par Kalign. L'utilisation des huit méthodes proposées par M-Coffee peut parfois s'avérer lourde. Il est néanmoins possible de n'en utiliser qu'un sous-ensemble de son choix.

The package is enhanced by the following packages: clustalw dialign-tx kalign mafft muscle muscle3 ncbi-blast+ poa prank probcons tm-align
Please cite: Cédric Notredame, Desmond G. Higgins and Jaap Heringa: T-coffee: a novel method for fast and accurate multiple sequence alignment. (PubMed) Journal of Molecular Biology 302(1):205-217 (2000)
Registry entries: Bio.tools  SciCrunch  Bioconda 
tabix
indexeur générique pour fichiers de positions de génome, délimités par des tabulations
Versions of package tabix
ReleaseVersionArchitectures
bullseye1.11-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.3.2-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
buster1.9-12~deb10u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.1-1amd64,armel,i386
trixie1.19+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.19+ds-1.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch-backports1.7-2~bpo9+1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.16+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.2.6-2armhf
upstream1.19.1
Debtags of package tabix:
roleprogram
works-with-formathtml
Popcon: 29 users (18 upd.)*
Newer upstream!
License: DFSG free
Git

Tabix indexe des fichiers où certaines colonnes indiquent les coordonnées de séquence : nom (habituellement un chromosome), départ et fin. Le fichier de données d'entrée doit être trié en fonction du positionnement et compressé par bgzip (fourni dans ce paquet), qui a une interface similaire à celle de gzip. Après indexation, tabix est en mesure de récupérer rapidement les lignes de données par coordonnées chromosomiques. La récupération rapide des données fonctionne aussi sur le réseau si une URI est donnée comme nom de fichier.

Ce paquet a été compilé à partir du code source de HTSlib et fournit les outils bgzip, htsfile et tabix.

Please cite: Heng Li: Tabix: fast retrieval of sequence features from generic TAB-delimited files. (PubMed,eprint) Bioinformatics 27(5):718-719 (2011)
Registry entries: Bio.tools  Bioconda 
Screenshots of package tabix
tantan
masqueur de répétitions en tandem peu complexes pour bioséquences
Versions of package tantan
ReleaseVersionArchitectures
buster22-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye23-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid49-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie49-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm40-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch13-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Tantan est un outil pour masquer des régions simples (peu complexes et avec peu de répétitions en tandem sur une période courte) dans des séquences d'ADN, d'ARN et de protéines. Le but de tantan est d'empêcher les prédictions fausses lorsqu'on cherche des régions homologues entre deux séquences. Les répétitions simples s'alignent souvent fortement, créant de fausses prévisions d'homologie.

Please cite: Frith, Martin C.: A new repeat-masking method enables specific detection of homologous sequences. (PubMed) Nucleic Acids Research 39(4):e23 (2011)
Registry entries: Bioconda 
Topics: Sequence composition, complexity and repeats
terraphast
enumerate terraces in phylogenetic tree space
Versions of package terraphast
ReleaseVersionArchitectures
trixie0.0+git20200413.8af2e4c+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.0+git20200413.8af2e4c+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.0+git20200413.8af2e4c+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Terraphast takes a .nkw file in Newick format and a genes/sites file, which denotes whether (1) or not (0) gene i is present in species j.

Program output states some imput data properties, the species whose leaf edge is used as a new tree root, and the resulting supertree in compressed newick format.

Please cite: Michael J. Sanderson, Michelle M. McMahon and Mike Steel: Terraces in phylogenetic tree space. (PubMed) Science 333(6041):448-450 (2011)
theseus
superposition de macromolécules par maximum de vraisemblance
Versions of package theseus
ReleaseVersionArchitectures
bookworm3.3.0-14amd64,i386
jessie3.0.0-1amd64,armel,armhf,i386
stretch3.3.0-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster3.3.0-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.3.0-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.3.0-14amd64,i386
sid3.3.0-14amd64,i386
Debtags of package theseus:
biologypeptidic
fieldbiology, biology:bioinformatics, biology:structural
interfacecommandline
roleprogram
useanalysing, comparing
works-with-formatplaintext
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Theseus est un programme qui superpose simultanément plusieurs structures macromoléculaires. Theseus trouve la solution optimale du problème de superposition en utilisant la méthode du maximum de vraisemblance. En abaissant le poids de zones variables de la superposition et en rectifiant pour des corrélations parmi les atomes, la méthode de superposition par maximum de vraisemblance produit des alignements de structures très justes.

Lorsque des macromolécules avec des séquences résiduelles différentes sont superposées, d’autres programmes et algorithmes remplacent ces résidus alignés par des trous. Theseus, cependant, utilise un nouvel algorithme de superposition qui inclut toutes les données.

The package is enhanced by the following packages: theseus-examples
Please cite: Douglas L. Theobald and Deborah S. Wuttke: THESEUS: maximum likelihood superpositioning and analysis of macromolecular structures. (eprint) Bioinformatics 22(17):2171-2172 (2006)
thesias
test des effets d’haplotypes dans les études d’associations
Versions of package thesias
ReleaseVersionArchitectures
bookworm3.1.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.1.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid3.1.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster-backports3.1.1-1~bpo10+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.1.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

L’objectif du programme THESIAS est de réaliser des analyses d’association basées sur les haplotypes d’individus non apparentés. Ce programme est basé sur le modèle de maximum de vraisemblance décrit dans Trégouët et al. 2002 (Hum Mol Genet 2002,11 : p. 2015-2023) et est lié à l’algorithme SEM (Trégouët et al. Ann Hum Genet 2004,68 : p. 165-177). THESIAS permet d’estimer simultanément les fréquences d’haplotypes et leurs effets associés sur le phénotype étudié. Dans cette nouvelle version de THESIAS, les résultats quantitatifs, qualitatifs (analyse de comparaison par paires et logistique), catégoriels et de survie peuvent être étudiés. L’analyse d’haplotypes X est aussi réalisable. Les effets d’haplotypes en fonction de la covariance ainsi que les interactions entre haplotypes et covariance peuvent être étudiées.

Please cite: David-Alexandre Trégouët and Valérie Garelle: "A new JAVA interface implementation of THESIAS: testing haplotype effects in association studies". (eprint) Bioinformatics 23(8):1038-1039 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package thesias
tiddit
structural variant calling
Versions of package tiddit
ReleaseVersionArchitectures
bullseye2.12.0+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.6.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm3.5.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie3.6.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

TIDDIT is a tool to used to identify chromosomal rearrangements using Mate Pair or Paired End sequencing data. TIDDIT identifies intra and inter- chromosomal translocations, deletions, tandem-duplications and inversions, using supplementary alignments as well as discordant pairs.

TIDDIT has two analysis modules. The sv mode, which is used to search for structural variants. And the cov mode that analyse the read depth of a bam file and generates a coverage report.

Registry entries: Bio.tools  Bioconda 
tigr-glimmer
Détection de gènes dans des archées et des bactéries
Versions of package tigr-glimmer
ReleaseVersionArchitectures
stretch3.02b-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.02-3amd64,armel,armhf,i386
sid3.02b-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.02b-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye3.02b-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.02b-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm3.02b-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package tigr-glimmer:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usesearching
works-with-formatplaintext
Popcon: 15 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Ce logiciel, développé par l'institut TIGR, détecte les séquences codantes dans les bactéries et les archées.

Glimmer est un système permettant de trouver des gènes dans l'ADN microbien, en particulier dans les génomes des bactéries et des archées. Glimmer (« Gene Locator and Interpolated Markov Modeler ») utilise des modèles d'interpolation de Markov (IMM) pour identifier les régions codantes et les distinguer de l'ADN non codant.

Please cite: Steven L. Salzberg, Arthur L. Delcher, S. Kasif and O. White: Microbial gene identification using interpolated Markov models. (PubMed,eprint) Nucleic Acids Research 26(2):544-8 (1998)
Registry entries: Bio.tools  SciCrunch  Bioconda 
tipp
tool for Taxonomic Identification and Phylogenetic Profiling
Versions of package tipp
ReleaseVersionArchitectures
sid1.0+dfsg-3amd64,arm64
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

TIPP is a modification of SEPP for classifying query sequences (i.e. reads) using phylogenetic placement.

TIPP inserts each read into a taxonomic tree and uses the insertion location to identify the taxonomic lineage of the read. The novel idea behind TIPP is that rather than using the single best alignment and placement for taxonomic identification, it uses a collection of alignments and placements and considers statistical support for each alignment and placement.

TIPP can also be used for abundance estimation by computing an abundance profile on the reads binned to marker genes in a reference dataset.

tm-align
alignement structurel de protéines
Versions of package tm-align
ReleaseVersionArchitectures
sid20190822+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie20140601+dfsg-1amd64,armel,armhf,i386
stretch20160521+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster20170708+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye20190822+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm20190822+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie20190822+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package tm-align:
roleprogram
Popcon: 18 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

TM-align est un algorithme pour l'alignement de structures de protéines utilisant la programmation dynamique. L'évaluation est effectuée par la matrice de rotation TM-score. L'algorithme est similaire à RMSD dans le fait que les portions non alignées de la structure influencent moins l'évaluation que les régions conservées plus structurées.

Please cite: Yang Zhang and Jeffrey Skolnick: TM-align: A protein structure alignment algorithm based on TM-score. (PubMed,eprint) Nucleic Acids Research 33(7):2302-2309 (2005)
Screenshots of package tm-align
tnseq-transit
statistical calculations of essentiality of genes or genomic regions
Versions of package tnseq-transit
ReleaseVersionArchitectures
trixie3.3.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid3.3.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.3.4-1amd64
stretch-backports2.2.1-2~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.2.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.2.7-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

This is a software that can be used to analyze Tn-Seq datasets. It includes various statistical calculations of essentiality of genes or genomic regions (including conditional essentiality between 2 conditions). These methods were developed and tested as a collaboration between the Sassetti lab (UMass) and the Ioerger lab (Texas A&M)

TRANSIT is capable of analyzing TnSeq libraries constructed with Himar1 or Tn5 datasets.

TRANSIT assumes you have already done pre-processing of raw sequencing files (.fastq) and extracted read counts into a .wig formatted file. The .wig file should contain the counts at all sites where an insertion could take place (including sites with no reads). For Himar1 datasets this is all TA sites in the genome. For Tn5 datasets this would be all nucleotides in the genome.

Please cite: Michael A. DeJesus, Chaitra Ambadipudi, Richard Baker, Christopher Sassetti and Thomas R. Ioerger: TRANSIT - A Software Tool for Himar1 TnSeq Analysis. (PubMed,eprint) PLOS 11(10):e1004401 (2015)
Registry entries: Bio.tools  Bioconda 
toil
cross-platform workflow engine
Versions of package toil
ReleaseVersionArchitectures
trixie6.1.0-3all
bullseye5.2.0-5all
buster3.18.0-2all
sid6.1.0-3all
bookworm5.9.2-2+deb12u1all
Popcon: 6 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Toil is a scalable, efficient, cross-platform and easy-to-use workflow engine in pure Python. It works with several well established load balancers like Slurm or the Sun Grid Engine. Toil is also compatible with the Common Workflow Language (CWL) via the "toil-cwl-runner" interface, which this package make available via the Debian alternativess system under the alias "cwl-runner".

Please cite: John Vivian, Arjun Arkal Rao, Frank Austin Nothaft, Christopher Ketchum, Joel Armstrong, Adam Novak, Jacob Pfeil, Jake Narkizian Alden D. Deran, Audrey Musselman-Brown, Hannes Schmidt, Peter Amstutz, Brian Craft, Mary Goldman, Kate Rosenbloom, Melissa Cline, Brian O'Connor, Megan Hanna, Chet Birger, W. James Kent David A. Patterson, Anthony D. Joseph, Jingchun Zhu, Sasha Zaranek, Gad Getz, David Haussler and Benedict Paten: Toil enables reproducible, open source, big biomedical data analyses. Nature Biotechnology 35(4):314–316 (2017)
Registry entries: Bioconda 
tombo
identification of modified nucleotides from raw nanopore sequencing data
Versions of package tombo
ReleaseVersionArchitectures
trixie1.5.1-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.5.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.5.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.5.1-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Tombo is a suite of tools primarily for the identification of modified nucleotides from nanopore sequencing data. Tombo also provides tools for the analysis and visualization of raw nanopore signal.

Please cite: Marcus Stoiber, Joshua Quick, Rob Egan, Ji Eun Lee, Susan Celniker, Robert K. Neely, Nicholas Loman, Len A Pennacchio and James Brown: De novo Identification of DNA Modifications Enabled by Genome-Guided Nanopore Signal Processing. (eprint) bioRxiv (2016)
Registry entries: Bioconda 
tophat
fast splice junction mapper for RNA-Seq reads
Versions of package tophat
ReleaseVersionArchitectures
jessie2.0.13+dfsg-1amd64
buster2.1.1+dfsg1-2amd64,arm64,mips64el,ppc64el,s390x
stretch2.1.1+dfsg-2amd64
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

TopHat aligns RNA-Seq reads to mammalian-sized genomes using the ultra high-throughput short read aligner Bowtie, and then analyzes the mapping results to identify splice junctions between exons. TopHat is a collaborative effort between the University of Maryland Center for Bioinformatics and Computational Biology and the University of California, Berkeley Departments of Mathematics and Molecular and Cell Biology.

The package is enhanced by the following packages: cufflinks multiqc
Please cite: Cole Trapnell, Lior Pachter and Steven L. Salzberg: TopHat: discovering splice junctions with RNA-Seq. (PubMed,eprint) Bioinformatics 25(9):1105-1111 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
tophat-recondition
post-processor for TopHat unmapped reads
Versions of package tophat-recondition
ReleaseVersionArchitectures
bullseye1.4-3all
bookworm1.4-3all
trixie1.4-3all
sid1.4-3all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

tophat-recondition is a post-processor for TopHat unmapped reads (contained in unmapped.bam), making them compatible with downstream tools (e.g., the Picard suite, samtools, GATK) (TopHat issue #17). It also works around bugs in TopHat:

  • the "mate is unmapped" SAM flag is not set on any reads in the unmapped.bam file (TopHat issue #3)
  • the mapped mate of an unmapped read can be absent from accepted_hits.bam, creating a mismatch between the file and the unmapped read's flags (TopHat issue #16)
Please cite: Christian Brueffer and Lao H. Saal: A post-processor for TopHat unmapped reads. Bioinformatics 17(1):199 (2016)
Registry entries: Bio.tools  Bioconda 
topp
ensemble de programmes implémentant The OpenMS Proteomic Pipeline
Versions of package topp
ReleaseVersionArchitectures
bookworm2.6.0+cleaned1-3amd64,arm64,i386,mips64el,mipsel,ppc64el,s390x
buster2.4.0-real-1amd64,arm64,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.11.1-5amd64,armel,armhf,i386
sid2.6.0+cleaned1-4amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.6.0+cleaned1-3amd64,arm64,i386,mips64el,mipsel,ppc64el,s390x
trixie2.6.0+cleaned1-4amd64,arm64,i386,mips64el,ppc64el,s390x
Debtags of package topp:
uitoolkitqt
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

TOPP (the OpenMS proteomic pipeline) est un pipeline d'analyse de données HPLC/MS. C'est un ensemble de nombreuses petites applications qu'on peut chaîner pour créer des pipelines d'analyse adapés à un problème particulier. Les applications utilisent la bibliothèque libopenms. Certains exemples de ces explications sont :

  • TOPPView : un visionneur de données spectométriques de masse.
  • TOPPAS : un assistant pour concevoir graphiquement des flux TOPP
  • DTAExtractor : extrait des spectres d'un fichier MS run en plusieurs fichiers au format DTA.
  • FileConverter : Conversion entre divers formats de fichiers MS.
  • FileFilter : Extrait ou manipule des morceaux de données issues de fichiers peak, feature ou consensus feature.
  • SpectraMerger : Fusionne des spectres issus d'un plan LC/MS, en précurseur ou en blocs RT.
  • BaselineFilter : supprime la ligne d'un profil de spectre en utilisant un filtre top-hat.
  • InternalCalibration : Utilisé pour une calibration intrne.
  • PTModel : Entraîne un modèle de prédiction des peptides protéotypiques à partir d'un plan d'entraînement.
  • RTPredict : Prédit des temps de rétention pour des peptides en utilisant un modèle entraîné par RTModel.
  • ExecutePipeline : Exécute des flux de travail créés par TOPPAS.
Please cite: Marc Sturm, Andreas Bertsch, Clemens Gröpl, Andreas Hildebrandt, Rene Hussong, Eva Lange, Nico Pfeifer, Ole Schulz-Trieglaff, Alexandra Zerck, Knut Reinert and Oliver Kohlbacher: OpenMS – an Open-Source Software Framework for Mass Spectrometry. (PubMed,eprint) BMC Bioinformatics 9(163) (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
toppred
transmembrane topology prediction
Versions of package toppred
ReleaseVersionArchitectures
buster1.10-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.10-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.10-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.10-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.10-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.10-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Toppred is a program to determine the topology of a transmembrane protein based on G. von Heijne algorithm.

Each sequence from seq data in fasta format is processed, and toppred generate the Hydrophobycity profile of the sequence, and the corresponding hydrophobycities values in the file sequence-ID.hydro.

Furthermore, the predicted topologies are represented as png images. Each topology is stored in file sequence-ID-number.png

The hydrophobicity profile is computed using a window formed by a core rectangular window of size n, flanked by 2 triangular windows of size q. NB rectangular and triangular mean that the ponderation values inside those windows are respectively constant and variable.

This program is a new implementation of the original toppred program, based on G. von Heijne algorithm

Please cite: Gunnar von Heijne: Membrane protein structure prediction. Hydrophobicity analysis and the positive-inside rule. (PubMed) Journal of Molecular Biology 225(2):487-94 (1992)
tortoize
Application to calculate ramachandran z-scores
Versions of package tortoize
ReleaseVersionArchitectures
trixie2.0.11-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.0.11-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.0.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.0.11-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream2.0.13
Popcon: 0 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

Tortoize validates protein structure models by checking the Ramachandran plot and side-chain rotamer distributions. Quality Z-scores are given at the residue level and at the model level (ramachandran-z and torsions-z). Higher scores are better. To compare models or to describe the reliability of the model Z-scores jackknife- based standard deviations are also reported (ramachandran-jackknife-sd and torsion-jackknife-sd).

Please cite: Oleg V. Sobolev, Pavel V. Afonine, Nigel W. Moriarty and Robbie P. Joosten: A Global Ramachandran Score Identifies Protein Structures with Unlikely Stereochemistry, Structure. (2020)
trace2dbest
bulk submission of chromatogram data to dbEST
Versions of package trace2dbest
ReleaseVersionArchitectures
buster3.0.1-1all
bullseye3.0.1-2all
sid3.0.1-2all
trixie3.0.1-2all
bookworm3.0.1-2all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ESTs are short sequences derived from reverse-transcribed RNA. Their abundances yield insights in the expression of genes across tissues, support the discovery of new genes and allow one to assess the coverage of whole genome sequencing projects. Public databases like dbEST at the NCBI collect this data.

trace2dbEST process raw sequenceing chromatograph trace files from EST projects into quality-checked sequences, ready for submission to dbEST. trace2dbEST guides you through the creation of all the necessary files for submission of ESTs to dbEST. trace2dbest makes use of other software (available free under academic licence) that you will need to have installed, namely phred, cross_match and (optionally) BLAST.

Please cite: John Parkinson, Alasdair Anthony, James Wasmuth, Ralf Schmid, Ann Hedley and Mark Blaxter: PartiGene—constructing partial genomes. (eprint) Bioinformatics 20(9):1398–1404 (2004)
tracetuner
interpretation of DNA Sanger sequencing data
Versions of package tracetuner
ReleaseVersionArchitectures
trixie3.0.6~beta+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm3.0.6~beta+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.0.6~beta+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.0.6~beta+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.0.6~beta+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Tracetuner is a tool for base and quality calling of trace files from DNA sequencing instruments. Traditional DNA sequencing yields curves from four different channels or light frequencies that human or (preferably) machines are interpreting to determine the actual base (A,C,G or T) and the confidence with which this is determined.

TraceTuner is a DNA sequencing quality value, base calling and trace processing software application originally developed by Paracel, Inc. While providing a flexible interface and capability to adopt the "pure" base calls produced by Phred, KB or any other "original" caller, it offers competitive features not currently available in other tools, such as customized calibration of quality values, advanced heterozygote and mixed base calling and deconvolving the "mixed" electropherograms resulting from the presence of indels into a couple of "pure" electropherograms.

Later versions Previous versions of TraceTuner were used by Celera Genomics to process over 27 million reads from both Drosophila and human genome projects. In 2000, Applied Biosystems bundled TraceTuner with ABI3700 Genome Analyzers and shipped it to the customers of these capillary electrophoresis sequencers. its SNP detection and genotyping software product SeqScape.

TraceTuner implements an advanced peak processing technology for resolving overlapping peaks of the same dye color into individual, or "intrinsic" peaks. TraceTuner, for its support of mixed base calling, have been used by the research community, the private biotech sector, and the U.S. government as components of different variant detection, genotyping and forensic software applications (e.g. Applied Biosystems SeqScape, Paracel Genome Assembler, MTexpert, etc.).

This technology was protected by US Patent #6,681,186. Currently, TraceTuner is an open source software, which has been used by J. Craig Venter Institute's DNA Sequencing and Resequencing pipelines.

This package prepares an important piece of human history to be used with new data on new machines or to revisit older observations..

Please cite: G.A.Denisov, A.B.Arehart and M.D.Curtin: A system and method for improving the accuracy of DNA sequencing and error probability estimation through application of a mathematical model to the analysis of electropherograms. US Patent 6681186. (2004)
Registry entries: SciCrunch 
Screenshots of package tracetuner
transdecoder
recherche de séquences codantes dans des séquences de transcriptions d’ARN
Versions of package transdecoder
ReleaseVersionArchitectures
trixie5.7.1-2all
stretch3.0.1+dfsg-1all
buster5.0.1-2all
bullseye5.0.1-3all
bookworm5.0.1-5all
sid5.7.1-2all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

TransDecoder identifie les séquences codantes candidates dans des séquences de transcription, telles que celles générées par des assemblages de novo de transcriptions de séquences d’ARN en utilisant Trinity ou construits basés sur des alignements de séquences d’ARN du génome en utilisant Tophat et Cufflinks.

TransDecoder identifie des séquences codantes probables en se basant sur les critères suivants :

 – un cadre de lecture ouvert de longueur minimale (ORF) est trouvé dans
   la séquence de transcription ;
 – un score de log-vraisemblance, similaire à ce qui est calculé par le
   logiciel GeneID est supérieur à zéro ;
 – le score ci-dessus est supérieur quand l’ORF est un résultat dans le
   premier cadre comparé aux scores dans les cinq autres cadres ;
 – si un ORF candidat est trouvé complètement enveloppé par les
   coordonnées d’un autre ORF candidat, le plus long est rapporté.
   Cependant, une transcription unique peut rapporter plusieurs ORF
   (autorisant les opérons, les chimères, etc) ;
 – optionnellement, le peptide putatif a une correspondance pour un
   domaine Pfam au-dessus du score de bruit limite.
Registry entries: Bioconda 
transrate-tools
assistant pour Transrate
Versions of package transrate-tools
ReleaseVersionArchitectures
bookworm1.0.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.0.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Transrate est une bibliothèque et un outil en ligne de commande pour l’évaluation qualitative des assemblages de transcriptomes de novo.

Ce paquet fournit les outils en ligne de commande utilisés pas Transrate pour le traitement les fichiers BAM.

Please cite: Richard Smith-Unna, Chris Boursnell, Rob Patro, Julian M. Hibberd and Steven Kelly: TransRate: reference-free quality assessment of de novo transcriptome assemblies.. (PubMed,eprint) Genome Research 26(8):1134-1144 (2016)
Registry entries: Bioconda 
transtermhp
trouve les terminateurs de transcription dans les génomes bactériens
Versions of package transtermhp
ReleaseVersionArchitectures
stretch2.09-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.09-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.09-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.09-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.09-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.09-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.09-2amd64,armel,armhf,i386
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

TransTermHP trouve les terminateurs de transcription intrinsèques dans les génomes bactériens. Chaque terminateur trouvé par le logiciel est affecté à une valeur de confiance qui estime sa probabilité d'être un vrai terminateur. TransTermHP est le successeur de TransTerm qui utilisait des algorithmes de recherche et d'évaluation très différents.

Please cite: Carleton L Kingsford, Kunmi Ayanbule and Steven L Salzberg: Rapid, accurate, computational discovery of Rho-independent transcription terminators illuminates their relationship to DNA uptake. (PubMed,eprint) Genome Biology 8(2):R22 (2007)
Registry entries: SciCrunch  Bioconda 
tree-ppuzzle
Reconstruction d'arbres phylogéniques par ressemblance maximum
Versions of package tree-ppuzzle
ReleaseVersionArchitectures
sid5.3~rc16+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie5.2-7amd64,armel,armhf,i386
stretch5.2-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster5.2-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye5.3~rc16+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm5.3~rc16+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie5.3~rc16+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Debtags of package tree-ppuzzle:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

TREE-PUZZLE (le nouveau nom pour PUZZLE) est un programme interactif en console qui intègre un algorithme rapide de recherche par arborescence, sur 4 niveaux, qui permet l'analyse de grands jeux de données et qui fournit un support d'estimations à chaque branche interne. TREE-PUZZLE calcule aussi des distances maximales entre des paires semblables, ainsi que la longueur des branches spécifiées par les utilisateurs. Les branches peuvent aussi être calculées durant un temps donné. De plus, TREE-PUZZLE offre une nouvelle méthode, la cartographie par similitude, pour rechercher le support d'une hypothétique branche interne sans calculer l'arbre complet et pour visualiser l'enchaînement d'un alignement de séquence apparentées.

Ceci est la version parallélisée de tree-puzzle.

Please cite: Heiko A. Schmidt, Korbinian Strimmer, Martin Vingron and Arndt von Haeseler: TREE-PUZZLE: maximum likelihood phylogenetic analysis using quartets and parallel computing. (PubMed,eprint) Bioinformatics 18(3):502-504 (2002)
Registry entries: Bio.tools 
tree-puzzle
reconstruction d’arbres phylogénétiques par la vraisemblance maximale
Versions of package tree-puzzle
ReleaseVersionArchitectures
bullseye5.3~rc16+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch5.2-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie5.2-7amd64,armel,armhf,i386
trixie5.3~rc16+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid5.3~rc16+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm5.3~rc16+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster5.2-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package tree-puzzle:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 7 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

TREE-PUZZLE (le nouveau nom pour PUZZLE) est un programme interactif en console qui intègre un algorithme rapide de recherche dans une arborescence par la méthode de quadruplets «⋅Quartet Puzzling⋅», qui permet l'analyse de grands jeux de données et qui attribue automatiquement des estimations de prise en charge à chaque branche interne. TREE-PUZZLE calcule aussi des distances maximales vraisemblables entre des paires, ainsi que la longueur des branches spécifiées par l’utilisateur. Les branches peuvent aussi être calculées suivant le postulat de l'horloge moléculaire. De plus, TREE-PUZZLE offre une méthode novatrice, la cartographie par vraisemblance, pour étudier la prise en charge d'une hypothétique branche interne sans calculer l'arbre complet et pour visualiser le contenu phylogénétique d’un alignement de séquences.

Please cite: Heiko A. Schmidt, Korbinian Strimmer, Martin Vingron and Arndt von Haeseler: TREE-PUZZLE: maximum likelihood phylogenetic analysis using quartets and parallel computing. (PubMed,eprint) Bioinformatics 18(3):502-504 (2002)
Registry entries: Bio.tools 
treeview
réimplémentation en Java de TreeView de Michael Eisen
Versions of package treeview
ReleaseVersionArchitectures
buster1.1.6.4+dfsg1-4all
bullseye1.2.0+dfsg-1all
bookworm1.2.0+dfsg-1all
trixie1.2.0+dfsg-1all
sid1.2.0+dfsg-1all
jessie1.1.6.4+dfsg-1 (contrib)all
stretch1.1.6.4+dfsg1-2all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

TreeView crée un affichage ressemblant à une matrice de données d’expression, connu sous l’appellation de « groupement d’Eisen » (Eisen clustering). L’implémentation originale est un programme Windows appelé TreeView de Michael Eisen. Ce paquet TreeView, quelques fois mentionné en tant que jTreeView, a été réécrit en Java sous licence libre.

TreeView en Java est un visualisateur extensible pour des données de biopuce au format PCL ou CDT.

Please cite: Alok J. Saldanha: Java Treeview -- extensible visualization of microarray data. (PubMed,eprint) Bioinformatics 20(17):3246-3248 (2004)
Registry entries: Bio.tools  SciCrunch 
treeviewx
affiche et imprime les arbres phylogénétiques
Versions of package treeviewx
ReleaseVersionArchitectures
trixie0.5.1+git20100823.7e4d0e9-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.5.1+git20100823.7e4d0e9-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.5.1+20100823-3amd64,armel,armhf,i386
stretch0.5.1+20100823-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.5.1+git20100823.7e4d0e9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.5.1+git20100823.7e4d0e9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.5.1+git20100823.7e4d0e9-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package treeviewx:
fieldbiology, biology:bioinformatics
interfacex11
roleprogram
scopeutility
uitoolkitwxwidgets
useviewing
works-with-formatpdf, plaintext, postscript, svg
x11application
Popcon: 4 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

TreeView X est un logiciel libre et multiplate-forme pour les arbres phylogénétiques. Il peut lire et afficher les fichiers d'arbres aux formats de données Nexus et Newick (tels que ceux produits par les logiciels PAUP*, clustalX, tree-puzzle, et d'autres). Il permet d'ordonner les branches des arbres et d'exporter les arbres au format SVG.

Please cite: Page, Roderic D. M.: TreeView: an application to display phylogenetic trees on personal computers. (PubMed) Comput. Appl. Biosci. 12(4):357-8 (1996)
Registry entries: Bio.tools 
Screenshots of package treeviewx
trf
locate and display tandem repeats in DNA sequences
Versions of package trf
ReleaseVersionArchitectures
bookworm4.09.1-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.09.1-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye4.09.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.09.1-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

A tandem repeat in DNA is two or more adjacent, approximate copies of a pattern of nucleotides. Tandem Repeats Finder is a program to locate and display tandem repeats in DNA sequences. In order to use the program, the user submits a sequence in FASTA format. There is no need to specify the pattern, the size of the pattern or any other parameter. The output consists of two files: a repeat table file and an alignment file. The repeat table, viewable in a web browser, contains information about each repeat, including its location, size, number of copies and nucleotide content. Clicking on the location indices for one of the table entries opens a second browser page that shows an alignment of the copies against a consensus pattern. The program is very fast, analyzing sequences on the order of .5Mb in just a few seconds. Submitted sequences may be of arbitrary length. Repeats with pattern size in the range from 1 to 2000 bases are detected.

The package is enhanced by the following packages: trf-examples
Please cite: Gary Benson: Tandem repeats finder: a program to analyze DNA sequences. (PubMed,eprint) Nucleic Acids Research 27(2):573–580 (1999)
Registry entries: Bioconda 
trim-galore
automate quality and adapter trimming for DNA sequencing
Versions of package trim-galore
ReleaseVersionArchitectures
bookworm0.6.10-1all
bullseye0.6.6-1all
sid0.6.10-1all
trixie0.6.10-1all
Popcon: 8 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Trim Galore! is a wrapper script to automate quality and adapter trimming as well as quality control, with some added functionality to remove biased methylation positions for RRBS sequence files (for directional, non-directional (or paired-end) sequencing). It's main features are:

  • For adapter trimming, Trim Galore! uses the first 13 bp of Illumina standard adapters ('AGATCGGAAGAGC') by default (suitable for both ends of paired-end libraries), but accepts other adapter sequence, too
  • For MspI-digested RRBS libraries, Trim Galore! performs quality and adapter trimming in two subsequent steps. This allows it to remove 2 additional bases that contain a cytosine which was artificially introduced in the end-repair step during the library preparation
  • For any kind of FastQ file other than MspI-digested RRBS, Trim Galore! can perform single-pass adapter- and quality trimming
  • The Phred quality of basecalls and the stringency for adapter removal can be specified individually
  • Trim Galore! can remove sequences if they become too short during the trimming process. For paired-end files Trim Galore! removes entire sequence pairs if one (or both) of the two reads became shorter than the set length cutoff. Reads of a read-pair that are longer than a given threshold but for which the partner read has become too short can optionally be written out to single-end files. This ensures that the information of a read pair is not lost entirely if only one read is of good quality
  • Trim Galore! can trim paired-end files by 1 additional bp from the 3' end of all reads to avoid problems with invalid alignments with Bowtie 1
  • Trim Galore! accepts and produces standard or gzip compressed FastQ files
  • FastQC can optionally be run on the resulting output files once trimming has completed
Registry entries: Bio.tools  Bioconda 
trimmomatic
outil flexible de découpage de lecture pour les données Illumina NGS
Versions of package trimmomatic
ReleaseVersionArchitectures
sid0.39+dfsg-2all
trixie0.39+dfsg-2all
bookworm0.39+dfsg-2all
bullseye0.39+dfsg-2all
buster0.38+dfsg-1all
stretch0.36+dfsg-1all
jessie0.32+dfsg-4all
Popcon: 11 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet Trimmomatic réalise diverses tâches de découpage utile pour les données par paires ou seules d'un séquenceur Illumina. La sélection des étapes de découpage et leurs paramètres associés sont fournis en ligne de commande.

Les étapes de découpage actuelles sont :

  • ILLUMINACLIP : coupe l'adaptateur et d'autres séquences spécifiques du séquenceur Illumina à partir de la lecture ;
  • SLIDINGWINDOW : réalise un découpage de la fenêtre glissante, coupant dès que la qualité moyenne à l'intérieur de la fenêtre tombe en dessous d'un seuil ;
  • LEADING : coupe le début des bases d'une lecture, si en dessous d'un seuil de qualité ;
  • TRAILING : coupe la fin des bases d'une lecture, si en dessous d'un seuil de qualité ;
  • CROP : coupe la lecture à une longueur indiquée ;
  • HEADCROP : coupe le nombre indiqué de bases à partir du début de la lecture ;
  • MINLENGTH : abandonne la lecture si elle est inférieure à une longueur indiquée ;
  • TOPHRED33 : convertit les scores de qualité en Phred-33 ;
  • TOPHRED64 : convertit les scores de qualité en Phred-64. Cela fonctionne avec le format FASTQ (en utilisant les scores de qualité phred + 33 ou phred + 64, suivant le pipeline Illumina utilisé), soit non compressé ou au format FASTQ gzippé. L'utilisation du format gzip est liée à l'extension .gz.
The package is enhanced by the following packages: multiqc
Please cite: A.M. Bolger, M. Lohse and B. Usadel: Trimmomatic: a flexible trimmer for Illumina sequence data. (PubMed,eprint) Bioinformatics 30(15):2114-2120 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing
Screenshots of package trimmomatic
trinityrnaseq
assemblage de novo de séquences d’Arn
Versions of package trinityrnaseq
ReleaseVersionArchitectures
sid2.15.1+dfsg-5amd64,arm64,ppc64el,riscv64
stretch2.2.0+dfsg-2amd64
bullseye2.11.0+dfsg-6amd64,arm64
buster2.6.6+dfsg-6amd64
trixie2.15.1+dfsg-5amd64,arm64,ppc64el
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Trinity représente une méthode originale pour une reconstruction efficace et robuste de transcriptomes à partir de données de séquences d’ARN. Trinity combine trois modules logiciels indépendants : Inchworm, Chrysalis et Butterfly, appliqués séquentiellement à de grandes quantités de lectures de séquences d’ARN. Trinity sépare les données de séquence en plusieurs graphes de De Bruijn individualisés, chacun représentant la complexité transcriptionnelle pour un gène ou un locus donné, et puis traite chaque graphe séparément pour extraire les isoformes d’épissage en totalité et pour séparer les transcriptions obtenues de gènes paralogues.

Please cite: Manfred G Grabherr, Brian J Haas, Moran Yassour, Joshua Z Levin, Dawn A Thompson, Ido Amit, Xian Adiconis, Lin Fan, Raktima Raychowdhury, Qiandong Zeng, Zehua Chen, Evan Mauceli, Nir Hacohen, Andreas Gnirke, Nicholas Rhind, Federica di Palma, Bruce W Birren, Chad Nusbaum, Kerstin Lindblad-Toh, Nir Friedman and Aviv Regev: Full-length transcriptome assembly from RNA-Seq data without a reference genome.. (PubMed) Nature Biotechnology 29(7):644-652 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
tvc
genetic variant caller for Ion Torrent sequencing platforms
Versions of package tvc
ReleaseVersionArchitectures
bullseye5.0.3+git20151221.80e144e+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster5.0.3+git20151221.80e144e+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid5.0.3+git20151221.80e144e+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie5.0.3+git20151221.80e144e+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm5.0.3+git20151221.80e144e+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Torrent Variant Caller (TVC) is a genetic variant caller for Ion Torrent sequencing platforms, and is specially optimized to exploit the underlying flow signal information in the statistical model to evaluate variants. Torrent Variant Caller is designed to call single-nucleotide polymorphisms (SNPs), multi-nucleotide polymorphisms (MNPs), insertions, deletions, and block substitutions.

twopaco
construction des graphes de de Bruijn à partir de plusieurs génomes complets
Versions of package twopaco
ReleaseVersionArchitectures
sid1.0.0+dfsg-1amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.0+dfsg-1amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
trixie1.0.0+dfsg-1amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

TwoPaCo est une implémentation de l’algorithme décrit dans la publication « TwoPaCo : An efficient algorithm to build the compacted de Bruijn graph from many complete genomes ».

Ce paquet fournit deux programmes :

 – twopaco : outil pour la construction directe de graphes compressés pour
             plusieurs génomes complets ;
 – graphdump : utilitaire transformant la sortie de twopaco en format
               textuel.
Please cite: Ilia Minkin, Son Pham and Paul Medvedev: TwoPaCo: an efficient algorithm to build the compacted de Bruijn graph from many complete genomes. (PubMed,eprint) Bioinformatics 33(24):4024-4032 (2017)
Registry entries: Bioconda 
uc-echo
algorithme de correction d'erreurs pour les lectures courtes réalisées à partir de NGS
Versions of package uc-echo
ReleaseVersionArchitectures
sid1.12-18amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.12-7amd64,armel,armhf,i386
trixie1.12-18amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch1.12-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.12-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.12-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.12-18amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ECHO est un algorithme de correction d'erreurs conçu pour les lectures courtes réalisées à partir des plateformes de séquençage de nouvelle génération, telles que Genome Analyzer II de l'entreprise Illumina. L'algorithme utilise un modèle de Bayes pour améliorer la qualité des lectures dans un ensemble de données en utilisant autant que possible une estimation a posteriori.

Please cite: W.-C. Kao, A.H. Chan and Y.S. Song: ECHO: A reference-free short-read error correction algorithm. (PubMed,eprint) Genome Research 21:1181-1192 (2011)
Registry entries: Bio.tools  SciCrunch 
Topics: Data management; Sequencing
ugene
integrated bioinformatics toolkit
Versions of package ugene
ReleaseVersionArchitectures
sid49.1+dfsg-2amd64,arm64,mips64el
buster-backports33.0+dfsg-1~bpo10+1 (non-free)amd64
bullseye34.0+dfsg-2 (non-free)amd64
stretch1.25.0+dfsg-1 (non-free)amd64
jessie1.12.3+dfsg-1 (non-free)amd64
trixie49.1+dfsg-2amd64,arm64,mips64el
Debtags of package ugene:
uitoolkitqt
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Unipro UGENE is a cross-platform visual environment for DNA and protein sequence analysis. UGENE integrates the most important bioinformatics computational algorithms and provides an easy-to-use GUI for performing complex analysis of the genomic data. One of the main features of UGENE is a designer for custom bioinformatics workflows.

Please cite: Konstantin Okonechnikov, Olga Golosova, Mikhail Fursov and the UGENE team: Unipro UGENE: a unified bioinformatics toolkit. (PubMed,eprint) Bioinformatics 28(8):1166-1167 (2012)
Registry entries: Bio.tools  SciCrunch 
umap-learn
Uniform Manifold Approximation and Projection
Versions of package umap-learn
ReleaseVersionArchitectures
bookworm0.5.3+dfsg-2all
sid0.5.4+dfsg-1all
bullseye0.4.5+dfsg-2all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Uniform Manifold Approximation and Projection (UMAP) is a dimension reduction technique that can be used for visualisation similarly to t- SNE, but also for general non-linear dimension reduction. The algorithm is founded on three assumptions about the data:

 1. The data is uniformly distributed on a Riemannian manifold;
 2. The Riemannian metric is locally constant (or can be
    approximated as such);
 3. The manifold is locally connected.

From these assumptions it is possible to model the manifold with a fuzzy topological structure. The embedding is found by searching for a low dimensional projection of the data that has the closest possible equivalent fuzzy topological structure.

Please cite: Leland McInnes, John Healy and James Melville: UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction. (eprint) arXiv (2018)
umis
tools for processing UMI RNA-tag data
Versions of package umis
ReleaseVersionArchitectures
bullseye1.0.7-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid1.0.9-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie1.0.9-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm1.0.8-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Umis provides tools for estimating expression in RNA-Seq data which performs sequencing of end tags of transcript, and incorporate molecular tags to correct for amplification bias.

There are four steps in this process.

 1. Formatting reads
 2. Filtering noisy cellular barcodes
 3. Pseudo-mapping to cDNAs
 4. Counting molecular identifiers
Please cite: Valentine Svensson, Kedar Nath Natarajan, Lam-Ha Ly, Ricardo J Miragaia, Charlotte Labalette, Iain C Macaulay, Ana Cvejic and Sarah A Teichmann: Power analysis of single-cell RNA-sequencing experiments. (PubMed) Nature methods 14:381–387 (2017)
Registry entries: Bioconda 
uncalled
Utility for Nanopore Current Alignment to Large Expanses of DNA
Versions of package uncalled
ReleaseVersionArchitectures
sid2.3+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.3+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm2.2+ds1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Streaming algorithm for mapping raw nanopore signal to DNA references

Enables real-time enrichment or depletion on Oxford Nanopore Technologies (ONT) MinION runs via ReadUntil.

Also supports standalone signal mapping of fast5 reads

Please cite: Sam Kovaka, Yunfan Fan, Bohan Ni, Winston Timp and Michael C. Schatz: Targeted nanopore sequencing by real-time mapping of raw electrical signal with UNCALLED. (eprint) Nature Biotechnology (2020)
unicycler
hybrid assembly pipeline for bacterial genomes
Versions of package unicycler
ReleaseVersionArchitectures
sid0.5.0+dfsg-1amd64
bullseye0.4.8+dfsg-2amd64
bookworm0.5.0+dfsg-1amd64
trixie0.5.0+dfsg-1amd64
buster0.4.7+dfsg-2amd64
stretch-backports0.4.7+dfsg-1~bpo9+1amd64
stretch-backports-sloppy0.4.8+dfsg-1~bpo9+1amd64
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Unicycler is an assembly pipeline for bacterial genomes. It can assemble Illumina-only read sets where it functions as a SPAdes-optimiser. It can also assembly long-read-only sets (PacBio or Nanopore) where it runs a miniasm+Racon pipeline. For the best possible assemblies, give it both Illumina reads and long reads, and it will conduct a hybrid assembly.

Please cite: Ryan R. Wick, Louise M. Judd, Claire L. Gorrie and Kathryn E. Holt: Unicycler: Resolving bacterial genome assemblies from short and long sequencing reads. (PubMed,eprint) PLOS Computational Biology 13(6):e1005595 (2017)
Registry entries: Bio.tools  Bioconda 
unikmer
Toolkit for nucleic acid k-mer analysis
Versions of package unikmer
ReleaseVersionArchitectures
bookworm0.19.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.19.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.19.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

unikmer is a golang package and a toolkit for nucleic acid k-mer analysis, providing functions including set operation k-mers optional with TaxIDs but without count information.

K-mers are either encoded (k<=32) or hashed (arbitrary k) into uint64, and serialized in binary file with extension .unik.

TaxIDs can be assigned when counting k-mers from genome sequences, and LCA (Lowest Common Ancestor) is computed during set opertions including computing union, intersecton, set difference, unique and repeated k-mers.

varna
appliquette de visualisation d’ARN
Versions of package varna
ReleaseVersionArchitectures
bullseye3-93+ds-3all
stretch3-93+ds-1all
buster3-93+ds-2all
trixie3-93+ds-5all
bookworm3-93+ds-4all
sid3-93+ds-5all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

VARNA est une appliquette légère Java destinée au dessin de la structure secondaire de l’ARN. C’est aussi un composant Swing pouvant être facilement intégré dans du code Java existant, traitant des structures secondaires de l’ARN, pour fournir une visualisation rapide et interactive.

Étant détachée de toute dépendance sophistiquée de bibliothèque externe ou d’un accès réseau, l’appliquette VARNA peut être utilisée comme base pour une appliquette autonome. Elle semble raisonnablement bonne et agrandit ou rétrécit comme il faut pour s'adapter à l’espace disponible sur une page web, grâce aux primitives d’anticrénelage de dessin de Swing.

Please cite: Kévin Darty, Alain Denise and Yann Ponty: VARNA: Interactive drawing and editing of the RNA secondary structure. (eprint) Bioinformatics 25(15):1974-1975 (2009)
vcfanno
annotate a VCF with other VCFs/BEDs/tabixed files
Versions of package vcfanno
ReleaseVersionArchitectures
sid0.3.5+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.3.5+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.3.5+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.3.2+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Vcfanno allows you to quickly annotate your VCF with any number of INFO fields from any number of VCFs or BED files. It uses a simple conf file to allow the user to specify the source annotation files and fields and how they will be added to the info of the query VCF.

  • For VCF, values are pulled by name from the INFO field with special cases of ID and FILTER to pull from those VCF columns.
  • For BED, values are pulled from (1-based) column number.
  • For BAM, depth (count), "mapq" and "seq" are currently supported.

Vcfanno is written in go and it supports custom user-scripts written in Lua. It can annotate more than 8000 variants per second with 34 annotations from 9 files on a modest laptop and over 30K variants per second using 12 processes on a server.

Please cite: Brent S. Pedersen, Ryan M. Layer and Aaron R. Quinlan: Vcfanno: fast, flexible annotation of genetic variants. (PubMed,eprint) Genome Biology 17(1):118 (2016)
Registry entries: Bio.tools  Bioconda 
vcftools
ensemble d'outils pour travailler avec les fichiers VCF
Versions of package vcftools
ReleaseVersionArchitectures
jessie0.1.12+dfsg-1amd64,armel,armhf,i386
bookworm0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie-security0.1.12+dfsg-1+deb8u1amd64,armel,armhf,i386
bullseye0.1.16-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.1.14+dfsg-4+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.1.16-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package vcftools:
roleprogram
Popcon: 11 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

VCFtools est un paquet conçu pour travailler avec les fichiers au format VCF, tels que ceux générés par le projet « 1000 Genomes ». L'objectif de VCFtools est de fournir des méthodes pour travailler avec les fichiers au format VCF : valider, fusionner, comparer et calculer certaines statistiques génétiques de la population représentative.

The package is enhanced by the following packages: multiqc
Please cite: Petr Danecek, Adam Auton, Goncalo Abecasis, Cornelis A. Albers, Eric Banks, Mark A. DePristo, Robert E. Handsaker, Gerton Lunter, Gabor T. Marth, Stephen T. Sherry, Gilean McVean and Richard Durbin: The variant call format and VCFtools. (PubMed,eprint) Bioinformatics 27(15):2156-8 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
velvet
assembleur de séquences d'acides nucléiques pour de très courtes lectures
Versions of package velvet
ReleaseVersionArchitectures
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.2.10+dfsg1-1amd64,armel,armhf,i386
trixie1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.2.10+dfsg1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package velvet:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet est un assembleur génomique de type de novo (assemblage de lectures courtes pour créer des séquences de pleine longueur) spécialement conçu pour les technologies de séquençage à lecture courte, telles que Solexa de l'entreprise Illumina ou 454 de l'entreprise Roche, développées par Daniel Zerbino et Ewan Birney au centre de recherche European Bioinformatics Institute (EBI) qui fait partie du European Molecular Biology Laboratory (EMBL), proche de Cambridge, au Royaume-Uni .

Le logiciel Velvet prend actuellement des séquences de lectures courtes, enlève les erreurs puis produit des contigs uniques de haute qualité. Il utilise alors les informations de lecture des paires, si elles sont disponibles, pour extraire les zones répétées entre les contigs.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
velvet-long
assembleur de séquences d’acide nucléique pour des très courtes lectures, version longue
Versions of package velvet-long
ReleaseVersionArchitectures
jessie1.2.10+dfsg1-1amd64,armel,armhf,i386
sid1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.2.10+dfsg1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet est un assembleur génomique de type de novo (assemblage de lectures courtes pour créer des séquences de pleine longueur) spécialement conçu pour les technologies de séquençage à lecture courte, telles que Solexa de l'entreprise Illumina ou 454 de l'entreprise Roche, développées par Daniel Zerbino et Ewan Birney au centre de recherche European Bioinformatics Institute (EBI) qui fait partie de l'European Molecular Biology Laboratory (EMBL), proche de Cambridge, au Royaume-Uni .

Le logiciel Velvet prend actuellement des séquences de lectures courtes, enlève les erreurs puis produit des contigs uniques de haute qualité. Il utilise alors les informations de lecture des paires, si elles sont disponibles, pour extraire les zones répétées entre les contigs.

Ce paquet installe les versions spéciales « long-mode », comme préconisé dans les tutoriels de Velvet.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
velvetoptimiser
optimisation automatique de paramètres pour Velvet, assembleur génomique de type de novo
Versions of package velvetoptimiser
ReleaseVersionArchitectures
bookworm2.2.6-5all
buster2.2.6-2all
bullseye2.2.6-3all
sid2.2.6-5all
trixie2.2.6-5all
stretch2.2.5-5all
jessie2.2.5-2all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

VelvetOptimiser est un script Perl multiprocessus pour optimiser automatiquement les trois options du paramètre principal (K, -exp_cov et -cov_cutoff) pour l’assembleur génomique de type de novo, Velvet.

Registry entries: Bio.tools  Bioconda 
veryfasttree
Speeding up the estimation of phylogenetic trees from sequences
Versions of package veryfasttree
ReleaseVersionArchitectures
sid4.0.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.0.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

VeryFastTree is a highly efficient implementation inspired by the FastTree-2 tool, designed to expedite the inference of approximately-maximum-likelihood phylogenetic trees from nucleotide or protein sequence alignments. It is an optimized implementation designed to accelerate the estimation of phylogenies for large alignments. By leveraging parallelization and vectorization strategies, VeryFastTree significantly improves the performance and scalability of phylogenetic analysis, allowing it to construct phylogenetic trees in a fraction of the time previously required.

Maintaining the integrity of FastTree-2, VeryFastTree retains the same phases, methods, and heuristics used for estimating phylogenetic trees. This ensures that the topological accuracy of the trees produced by VeryFastTree remains equivalent to that of FastTree-2. Moreover, unlike the parallel version of FastTree-2, VeryFastTree guarantees deterministic results, eliminating any potential variations in the output.

To facilitate a seamless transition for users, VeryFastTree adopts the exact same command line arguments as FastTree-2. This means that by simply substituting FastTree-2 with VeryFastTree, and using the same set of options, users can significantly enhance the overall performance of their phylogenetic analyses.

vg
tools for working with genome variation graphs
Versions of package vg
ReleaseVersionArchitectures
bullseye1.30.0+ds-1amd64,mips64el
sid1.30.0+ds-1amd64,mips64el
upstream1.55.0
Popcon: 1 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

variation graph data structures, interchange formats, alignment, genotyping, and variant calling methods

Variation graphs provide a succinct encoding of the sequences of many genomes. A variation graph (in particular as implemented in vg) is composed of:

  • nodes, which are labeled by sequences and ids
  • edges, which connect two nodes via either of their respective ends
  • paths, describe genomes, sequence alignments, and annotations (such as gene models and transcripts) as walks through nodes connected by edges

This model is similar to a number of sequence graphs that have been used in assembly and multiple sequence alignment. Paths provide coordinate systems relative to genomes encoded in the graph, allowing stable mappings to be produced even if the structure of the graph is changed.

Please cite: Erik Garrison, Jouni Sirén, Adam M Novak, Glenn Hickey, Jordan M Eizenga, Eric T Dawson, William Jones, Shilpa Garg, Charles Markello, Michael F Lin, Benedict Paten and Richard Durbin: Variation graph toolkit improves read mapping by representing genetic variation in the reference. (PubMed) Nature Biotechnology 36(9):875–879 (2018)
Registry entries: Bioconda 
viewmol
interface graphique pour les programmes de calculs de chimie
Versions of package viewmol
ReleaseVersionArchitectures
jessie2.4.1-22amd64,armel,armhf,i386
buster2.4.1-25amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch2.4.1-24amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package viewmol:
fieldchemistry
interface3d, x11
roleprogram
uitoolkitmotif
uselearning, viewing
x11application
Popcon: 8 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Viewmol peut aider graphiquement à la génération de structures moléculaires pour les calculs et à visualiser les résultats.

Actuellement, Viewmol inclut des filtres d'entrée pour les sorties Discover, DMol3, Gamess, Gaussian 9x/03, Gulp, Mopac, PQS, Turbomole et Vamp de même que pour les fichiers PDB. Les structures peuvent être sauvegardées comme fichiers .car d'Accelrys, fichiers MDL et fichiers de coordonnées Turbomole. Viewmol peut générer des fichiers d'entrée pour Gaussian 9x/03. Le format de fichier viewmol a été ajouté à OpenBabel de telle manière que ce dernier puisse servir aussi bien comme filtre d'entrée que comme filtre de sortie pour les coordonnées.

Registry entries: SciCrunch 
Screenshots of package viewmol
virulencefinder
identify virulence genes in total or partial sequenced isolates of bacteria
Versions of package virulencefinder
ReleaseVersionArchitectures
bullseye2.0.3+git20190809.dde157a-3all
sid2.0.5-1all
bookworm2.0.4-3all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The VirulenceFinder service contains one Python script virulencefinder.py which is the script of the latest version of the VirulenceFinder service. VirulenceFinder identifies viruelnce genes in total or partial sequenced isolates of bacteria - at the moment only E. coli, Enterococcus, S. aureus and Listeria are available.

Please cite: Katrine Grimstrup Joensen, Flemming Scheutz, Ole Lund, Henrik Hasman, Rolf S. Kaas, Eva M. Nielsen and Frank M. Aarestrup: Real-Time Whole-Genome Sequencing for Routine Typing, Surveillance, and Outbreak Detection of Verotoxigenic Escherichia coli. (PubMed,eprint) Journal of Clinical Microbiology 52(5):1501-10 (2014)
vmatch
large scale sequence analysis software
Versions of package vmatch
ReleaseVersionArchitectures
sid2.3.1+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.3.1+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.3.1+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye2.3.1+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Vmatch is a versatile software tool for efficiently solving large scale sequence matching tasks. It subsumes the software tool REPuter, but is much more general, with a very flexible user interface, and improved space and time requirements.

Registry entries: Bio.tools  Bioconda 
vsearch
outil pour le traitement de séquences métagénomiques
Versions of package vsearch
ReleaseVersionArchitectures
sid2.27.0-1amd64,arm64,ppc64el
bookworm2.22.1-1amd64,arm64,ppc64el
bullseye2.15.2-3amd64,arm64,ppc64el
buster2.10.4-1amd64
stretch2.3.4-1amd64
trixie2.27.0-1amd64,arm64,ppc64el
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Il s’agit d’un outil polyvalent 64 bits multiprocessus pour le traitement de séquences métagénomiques, incluant la recherche, la mise en grappe, la détection de chimère, la déréplication, le tri, le masquage et le brassage.

Le but de ce projet est de créer une alternative à l’outil USEARCH développé par Robert C. Edgar (2010). Ce nouvel outil devrait :

 – avoir une conception 64 bits prenant en charge de très grandes bases de
   données et bien plus que 4 Go de mémoire ;
 – être aussi précis, sinon plus que usearch ;
 – être aussi rapide, sinon plus que usearch.
The package is enhanced by the following packages: vsearch-examples
Please cite: Torbjørn Rognes, Tomáš Flouri, Ben Nichols, Christopher Quince and Frédéric Mahé: VSEARCH: a versatile open source tool for metagenomics. (eprint) PeerJ 4:e2584
Registry entries: Bio.tools  Bioconda 
vt
toolset for short variant discovery in genetic sequence data
Versions of package vt
ReleaseVersionArchitectures
bookworm0.57721+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.57721+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.57721+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.57721+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

vt is a variant tool set that discovers short variants from Next Generation Sequencing data.

Vt-normalize is a tool to normalize representation of genetic variants in the VCF. Variant normalization is formally defined as the consistent representation of genetic variants in an unambiguous and concise way. In vt a simple general algorithm to enforce this is implemented.

The package is enhanced by the following packages: vt-examples
Please cite: Adrian Tan, Gonçalo R. Abecasis and Hyun Min Kang: Unified representation of genetic variants. (PubMed,eprint) Bioinformatics 31(13):2202–2204 (2015)
Registry entries: Bio.tools  Bioconda 
wham-align
méthode Wisconsin d’alignement à haut débit
Versions of package wham-align
ReleaseVersionArchitectures
bullseye0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit une fonction analogue à BWA ou bowtie dans l’alignement de lectures de séquençage à haut débit d’ADN par rapport à un génome de référence.

Please cite: Yinan Li, Allie Terrell and Jignesh M. Patel: WHAM: A High-throughput Sequence Alignment Method (eprint) Proceedings of the ACM SIGMOD International Conference on Management of Data, SIGMOD 2011, Athens, Greece (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
wigeon
réimplémentation de l'utilitaire de détection d'anomalies de l'ADN 16S Pintail
Versions of package wigeon
ReleaseVersionArchitectures
trixie20101212+dfsg1-5all
jessie20101212+dfsg-1all
stretch20101212+dfsg1-1all
sid20101212+dfsg1-5all
bullseye20101212+dfsg1-4all
bookworm20101212+dfsg1-5all
buster20101212+dfsg1-2all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

WigeoN examine la conservation des séquences entre une séquence demandée et une séquence de référence, toutes les deux avec l'algorithme NAST (« Nearest Alignment Space Termination »). Basé sur l'identité de la séquence entre la séquence demandée et la séquence de référence, une quantité de variation parmi l'alignement est attendue. Si la variation observée est supérieure à 95 % de la variation observée du quantile de la distribution entre les séquences sans anomalies, alors elle est marquée comme ayant une anomalie.

WigeoN est un utilitaire flexible basé sur la nouvelle implémentation de l'algorithme Pintail. Applied and Environmental Microbiology. Décembre 2005; 71 (12): 7724-7736 .

Le paquet WigeoN est pratique pour marquer seulement les chimères et les anomalies dans les séquences d'ARNr 16S de pleine longueur. Le paquet WigeoN manque de sensibilité avec les séquences de moins de 1 000 paires de bases.

Pour exécuter WigeoN, vous avez besoin de séquences formatées NAST générées par l'utilitaire nast-ier.

Le paquet WigeoN fait partie de l'ensemble de paquets microbiomeutil.

The package is enhanced by the following packages: microbiomeutil-data
Please cite: Brian J. Haas, Dirk Gevers, Ashlee M. Earl, Mike Feldgarden, Doyle V. Ward, Georgia Giannoukos, Dawn Ciulla, Diana Tabbaa, Sarah K. Highlander, Erica Sodergren, Barbara Methé, Todd Z. DeSantis, The Human Microbiome Consortium, Joseph F. Petrosino, Rob Knight and Bruce W. Birren: Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. (PubMed,eprint) Genome Research 21(3):494-504 (2011)
Registry entries: SciCrunch 
wise
comparaison de biopolymères, tels les séquences d'ADN et de protéines
Versions of package wise
ReleaseVersionArchitectures
jessie2.4.1-17amd64,armel,armhf,i386
buster2.4.1-21amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.4.1-23amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.4.1-23amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.4.1-24amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.4.1-23amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch2.4.1-19amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package wise:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
Popcon: 28 users (17 upd.)*
Versions and Archs
License: DFSG free
Git

Wise2 est un paquet spécialisé dans la comparaison de biopolymères, communément de séquences d'ADN et de protéines. Beaucoup d'autres paquets ont des fonctions similaires, comme le paquet le plus connu BLAST (du NCBI) ou le paquet Fasta (de Bill Pearson). D'autres encore, comme le paquet HMMER (de Sean Eddy) ou le paquet SAM (de l'Université de Californie, Santa Cruz) se concentrent sur la modélisation des biopolymères avec le modèle automate de Markov à états cachés (abrégé HMM en anglais).

Le point fort de Wise2 est la comparaison de séquences d'ADN au niveau de la traduction en protéines. Ce type de comparaison permet la prédiction simultanée de la structure d'un gène avec l'alignement basé sur l’homologie.

Wise2 contient aussi d'autres algorithmes, comme le vénérable Smith-Waterman, de plus récents comme la pénalité de trou généralisée de Stephen Altschul (gap), ou encore des algorithmes expérimentaux en propre tel que dba. Le développement de ces algorithmes est le résultat des facilités de travail apportés par Wise2.

Wise2 a été écrit de manière à être réutilisable et maintenable. Bien qu'il soit écrit en pur langage C, on peut accéder à ses fonctionnalités avec Perl. Des parties de ce paquet, voire le paquet entier, peuvent être utilisées par d'autres programmes en C ou en C++ sans risquer des collisions de noms de variables car chaque variable exportée est préfixée avec le seul identifiant Wise2.

Please cite: Ewan Birney, Michele Clamp and Richard Durbin: GeneWise and Genomewise. (PubMed,eprint) Genome Research 14(5):988-95 (2004)
Registry entries: Bio.tools  Bioconda 
xpore
Nanopore analysis of differential RNA modifications
Versions of package xpore
ReleaseVersionArchitectures
sid2.1-2all
bookworm2.1-1all
Popcon: 1 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

RNA is transcribed from DNA, possibly spliced and exported to the cytoplasm - fine - but its bases can also be modified, edited, and not all such modifications are visible by Sanger sequencing methods and its derivatives.

The Nanopore measures potentials, and if the bases have a different shape then this is measured - not necessarily in an interpretable manner, something must be left for mass spectrometry, but one may be pointed to a difference. And maybe one can even statistically associate such differences with a molecular or clinical phenotype.

yaha
find split-read mappings on single-end queries
Versions of package yaha
ReleaseVersionArchitectures
sid0.1.83-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.1.83-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.1.83-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.1.83-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.83-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

yaha is an open source, flexible, sensitive and accurate DNA aligner designed for single-end reads. It supports three major modes of operation:

  • The default “Optimal Query Coverage” (-OQC) mode reports the best set of alignments that cover the length of each query.
  • Using “Filter By Similarity” (-FBS), along with the best set of alignments, yaha will also output alignments that are highly similar to an alignment in the best set.
  • Finally, yaha can output all the alignments found for each query. The -OQC and -FBS modes are specifically tuned to form split read mappings that can be used to accurately identify structural variation events (deletions, duplications, insertions or inversions) between the subject query and the reference genome.
Please cite: Gregory G. Faust and Ira M. Hall: YAHA: fast and flexible long-read alignment with optimal breakpoint detection. (PubMed,eprint) Bioinformatics 28(19):2417–2424 (2012)
Registry entries: Bioconda 
yanagiba
filter low quality Oxford Nanopore reads basecalled with Albacore
Versions of package yanagiba
ReleaseVersionArchitectures
bookworm1.0.0-5all
bullseye1.0.0-2all
sid1.0.0-5all
Popcon: 2 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Yanagiba is used to filter short or low quality Oxford Nanopore reads which have been basecalled with Albacore. It takes fastq.gz and an Albacore summary file as input. If no Albacore summary file is provided attempt to calculate mean qscore from directly from fastq file using NanoMath. Note: Calculated quality scores appear to be lower for reads called with Metrichor, you may need to lower your minqual setting in this case.

yanosim
simulateur de lectures pour des ensembles de données DRS de nanopore
Versions of package yanosim
ReleaseVersionArchitectures
bullseye0.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie0.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el
sid0.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm0.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Yanosim possède trois options :

  1. yanosim model :

    créer un modèle d’inadéquation, d’insertions et de suppressions basé sur l’alignement de lectures de nanopore DRS à une référence. Les lectures doivent être alignées avec un transcriptome, c’est-à-dire sans alignement épissés, en utilisant minimap2. Elles doivent avoir le tag cs. 2. yanosim quantify :

    Quantification du nombre de lectures correspondant à chaque transcription dans une référence, de façon que le bon nombre de lectures puissent être simulées. 3. yanosim simulate :

    Étant donné un modèle créé en utilisant yanosim model et des comptes de lectures par transcription créés en utilisant yanosim simulate, simuler des lectures longues sources d’erreur pour le fichier fasta indiqué.

Official Debian packages with lower relevance

adun.app
simulateur moléculaire pour GNUstep − interface graphique
Versions of package adun.app
ReleaseVersionArchitectures
jessie0.81-6amd64,armel,armhf,i386
sid0.81-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.81-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.81-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.81-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.81-13amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0.81-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package adun.app:
fieldbiology, biology:structural
interfacex11
roleprogram
scopeapplication
suitegnustep
uitoolkitgnustep
useanalysing, organizing, viewing
works-with3dmodel, db
x11application
Popcon: 10 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Adun est un simulateur bio-moléculaire qui inclut aussi une gestion des données et des capacités d'analyse. Il a été développé au « Computational Biophysics and Biochemistry Laboratory », qui fait partie de l'unité de recherche sur l'informatique biomédicale de l'UPF.

Ce paquet fournit UL, le frontal graphique d'Adun.

Please cite: Michael A. Johnston, Ignacio Fdez. Galván and Jordi Villà-Freixa: Framework-based design of a new all-purpose molecular simulation application: The Adun simulator. (PubMed) J. Comp. Chem. 26(15):1647-1659 (2005)
Screenshots of package adun.app
catfishq
concatenates fastq files
Versions of package catfishq
ReleaseVersionArchitectures
sid1.4.0+ds-1all
bookworm1.4.0+ds-1all
trixie1.4.0+ds-1all
Popcon: 1 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

FASTQ is the most common format to store the reads from high-throughput biological sequencing. This tool takes paths to an arbritary number of zipped and unzipped FASTQ files and/or folders containing zipped or unzipped FASTQ files, concatenates them and prints them to standard out (default) or an unzipped output file.

Supported file extensions are: '.fastq', '.fastq.gz', '.fasta', '.fasta.gz', '.fa', '.fa.gz', '.fq', '.fq.gz'

conda-package-handling
création et extraction de paquets conda de différents formats
Versions of package conda-package-handling
ReleaseVersionArchitectures
sid2.2.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.0.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.2.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.7.2-2+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 16 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Cph est une abstraction de « conda package handling » et un outil pour extraire, créer et convertir des paquets de différents formats.

Au moment de cette écriture, le format standard de conda est un fichier .tar.bz2. Conda a été entretenu depuis longtemps, merci aux nombreuses personnes qui utilisent les anciennes versions de conda. Un nouveau format de conda, décrit sur https://docs.google.com/document/d/1HGKsbg_j69rKXP- ihhpCb1kNQSE8Iy3yOsUU2x68x8uw/edit?usp=sharing, existe. Ce nouveau format est conçu pour permettre un accès beaucoup plus rapide aux métadonnées et utilise des algorithmes de compression plus modernes, tout en facilitant la signature de paquet sans ajout de fichiers auxiliaires.

Remark of Debian Med team: Dead upstream

The homepage of this project vanished as well as the Download area. An old unmaintained version remained at code.google.com. Please drop the maintainer a note if you have any news of this project.

dascrubber
alignment-based scrubbing pipeline for DNA sequencing reads
Versions of package dascrubber
ReleaseVersionArchitectures
stretch0~20160601-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The Dazzler Scrubbing Suite produces a set of edited reads that are guaranteed to

  • be continuous stretches of the underlying genome (i.e. no unremoved adapters and not chimers)
  • have no very low quality stretches (i.e. the error rate never exceeds some reasonable maximum, 20% or so in the case of Pacbio data). Its secondary goal is to do so with the minimum removal of data and splitting of reads.
dnapi
prédiction d’adaptateur pour de petits séquençages d’ARN – outils
Versions of package dnapi
ReleaseVersionArchitectures
bookworm1.1-3all
bullseye1.1-3all
sid1.1-3all
trixie1.1-3all
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit un algorithme de prédiction (itérative) d’adaptateur de novo pour de petites données de séquençage d’ARN.

DNApi peut prédire la plupart des adaptateurs 3' correctement avec les paramètres par défaut. Les paramètres peuvent être ajustés pour exécuter d’autres modes de prédiction.

Please cite: Junko Tsuji and Zhiping Weng: DNApi: A De Novo Adapter Prediction Algorithm for Small RNA Sequencing Data. (PubMed,eprint) PLoS One 11(10):e0164228 (2016)
Registry entries: Bioconda 
emboss-explorer
interface web graphique pour EMBOSS
Versions of package emboss-explorer
ReleaseVersionArchitectures
sid2.2.0-12all
buster2.2.0-10all
stretch2.2.0-8all
jessie2.2.0-8all
bullseye2.2.0-11all
bookworm2.2.0-11all
trixie2.2.0-12all
Debtags of package emboss-explorer:
biologyemboss
fieldbiology, biology:bioinformatics
interfaceweb
roleplugin
webapplication, cgi
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

EMBOSS Explorer est une interface web pour la suite d'outils bio-informatiques EMBOSS. Elle est écrite en Perl.

Si un serveur HTTP Apache est utilisé, il sera au maximum nécessaire de le redémarrer avant d’utiliser l’explorateur d’EMBOSS. Concernant les autres serveurs web, l’utilisateur devra réaliser la configuration lui-même.

epigrass
Outil scientifique pour la simulation et l'analyse de sénarios dans des réseaux épidémiologiques
Versions of package epigrass
ReleaseVersionArchitectures
sid3.0.3+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.0.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.4.7-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.4.0-2all
Debtags of package epigrass:
fieldmedicine
interfacex11
roleprogram
scopeapplication
uitoolkitqt
useanalysing, viewing
works-withdb
x11application
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Epigrass est un logiciel pour visualiser, analyser et simuler les processus épidémiques sur des réseaux géo-référencés.

EpiGrass peut interagir avec le SIG (Système d'Information Géographique) GRASS à partir duquel il peut obtenir des cartes et autres informations géo-référencées. Cependant, EpiGrass ne requiert pas l'installation du SIG GRASS pour la plupart de ses fonctionnalités.

The package is enhanced by the following packages: epigrass-doc
Please cite: Flavio Coelho, Oswaldo Cruz and Claudia Codeco: Epigrass: a tool to study disease spread in complex networks. (PubMed) Source Code for Biology and Medicine 3(1):3 (2008)
getdata
management of external databases
Versions of package getdata
ReleaseVersionArchitectures
bookworm0.2-4all
jessie0.2-1all
stretch0.2-1all
sid0.2-4all
buster0.2-3all
bullseye0.2-4all
trixie0.2-4all
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Many scientific communities share the problem of regularly updating external databases. With every update, also various tasks need to be performed for the update of indices that need to be recreated. This work depends on the tools that are available locally and is not always completely simple.

This package provides the getData Perl script, which in some not so complicated manner performs the invocation to wget to download data and then knows how to perform the indexing. There is only a hash table to be filled with the commands to be executed. Maintainers of scientific packages that are strongly coupled to public datasets are invited to add a runtime dependency to this package and add instructions for getData to follow.

hts-nim-tools
tools biological sequences: bam-filter, count-reads, vcf-check
Versions of package hts-nim-tools
ReleaseVersionArchitectures
trixie0.2.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
sid0.2.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm0.2.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye0.2.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides several tools that (at least at the time of their creation) provide functionalities beyond the routine provided by samtools and other reverse dependencies of the htslib.

These new tools are

 • bam-filter : filter BAM/CRAM/SAM files with a simple expression language
 • count-reads: count BAM/CRAM reads in regions given in a BED file
 • vcf-check  : check regions of a VCF against a background for missing chunks

and yes, as the name suggests, these tools are all implemented in nim, using the nim-hts (upstream: hts-nim) wrapper for the htslib.

Registry entries: Bioconda 
idseq-bench
Benchmark generator for the IDseq Portal
Versions of package idseq-bench
ReleaseVersionArchitectures
sid0.0~git20210602.27fb6dc-1all
bookworm0.0~git20210602.27fb6dc-1all
bullseye0.0~git20200902.8241a9a-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

IDseq (Infectious Disease Sequencing Platform) is an unbiased global software platform that helps scientists identify pathogens in metagenomic sequencing data.

  • Discover - Identify the pathogen landscape
  • Detect - Monitor and review potential outbreaks
  • Decipher - Find potential infecting organisms in large datasets

This package provides the benchmark generator for the IDseq Portal.

illustrate
cartoonish representations of large biological molecules
Versions of package illustrate
ReleaseVersionArchitectures
bookworm0.0+git20200923.217db48-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.0+git20200923.217db48-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.0+git20200923.217db48-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides a binary to transform PDF-formatted proteins into simplified but instructive graphics. The software has been used for the Protein-of-the-month's biomolecular illustrations for the past 20 years.

Please cite: D.S. Goodsell and A.J. Olson: Molecular Illustration in Black and White. (PubMed) J. Mol. Graphics 10(4):235-240 (1992)
Registry entries: Bio.tools 
libhdf5-dev
HDF5 - development files - serial version
Versions of package libhdf5-dev
ReleaseVersionArchitectures
experimental1.12.2+repack-1~exp1armel,armhf,mips64el,riscv64
jessie1.8.13+docs-15+deb8u1amd64,armel,armhf,i386
jessie-security1.8.13+docs-15+deb8u1amd64,armel,armhf,i386
experimental1.14.3+repack1-1~exp2amd64,arm64,i386,ppc64el,s390x
stretch1.10.0-patch1+docs-3+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.10.4+repack-10amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster-security1.10.4+repack-10+deb10u1amd64,arm64,armhf,i386
bullseye1.10.6+repack-4+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.10.8+repack1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.10.10+repack-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.10.10+repack-3.2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream1.14.3
Debtags of package libhdf5-dev:
devellibrary
roledevel-lib
Popcon: 338 users (238 upd.)*
Newer upstream!
License: DFSG free
Git

Hierarchical Data Format 5 (HDF5) is a file format and library for storing scientific data. HDF5 was designed and implemented to address the deficiencies of HDF4.x. It has a more powerful and flexible data model, supports files larger than 2 GB, and supports parallel I/O.

This package contains development files for serial platforms.

libhnswlib-dev
fast approximate nearest neighbor search
Versions of package libhnswlib-dev
ReleaseVersionArchitectures
sid0.8.0-1all
bullseye0.4.0-3+deb11u1all
trixie0.8.0-1all
bookworm0.6.2-2+deb12u1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Header-only C++ HNSW implementation with Python bindings.

A common task in data analysis but also in scientific computations is to find data that is very close (multi-dimensional space) or similar (same thing) to a given data point. Also as heuristics for physics engines, it is the objects closest to you that you are most likely to collide with. This library knows how to do this fast.

Please cite: Yu. A. Malkov and D. A. Yashunin: Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs. (eprint) arXiv.org arXiv(1603.0932) (2016)
maude
cadriciel logique de haute performance
Versions of package maude
ReleaseVersionArchitectures
buster2.7-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm3.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.7-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.6-6amd64,armel,armhf,i386
sid3.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
upstream3.4
Debtags of package maude:
uitoolkitncurses
Popcon: 4 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Maude est un langage et un système réflexif haute performance gérant à la fois la spécification et la programmation de la réécriture logique et équationnelle d'une large gamme d'applications. Maude a été influencé dans une large mesure par le langage OBJ3, qui peut être considéré comme un sous-langage de logique équationnelle. Outre la prise en charge de la spécification et la programmation équationnelle, Maude gère aussi la réécriture de calcul logique.

La réécriture logique suit une logique de changements concurrents qui peut traiter naturellement l'état et des calculs concurrents. Il comporte des propriétés intéressantes, en tant que cadriciel sémantique généraliste, pour donner des sémantiques d'exécutable à une large gamme de langages et de modèles de concurrence. En particulier, il gère très bien le calcul concurrent orienté objet. C'est parce qu'une réécriture logique donne un bon cadriciel sémantique que cela donne aussi un bon cadriciel logique, c'est-à-dire une métalogique où de nombreuses autres logiques peuvent être représentées et exécutées naturellement.

Maude gère de manière systématique et efficace la réflexion logique. Cela rend Maude notablement extensible et puissant, gérant une algèbre extensible d'opérations de création de module et permettant de faire beaucoup de métaprogrammation d’applications de métalangage avancées. En effet, parmi les applications les plus intéressantes de Maude, on trouve les applications en métalangage, où Maude est utilisé pour créer des environnements exécutables pour une variété de logiques, de démonstrateurs automatiques de théorèmes, de langages et de modèles de calcul.

Maude trouve tout son intérêt auprès de la communauté biomédicale pour modéliser et analyser des systèmes biologiques.

Please cite: M. Matsumoto and T. Nishimura: Mersenne Twister: A 623-Dimensionally Equidistributed Uniform Pseudo-Random Number Generator. ACM Transactions on Modeling and Computer Simulation 8(1):3-30 (1998)
metastudent-data
predictor of Gene Ontology terms from protein sequence - data files
Versions of package metastudent-data
ReleaseVersionArchitectures
stretch2.0.1-2all
jessie1.0.1-2all
bookworm2.0.1-8all
trixie2.0.1-8all
bullseye2.0.1-7all
buster2.0.1-4all
sid2.0.1-8all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Often, only the sequence of a protein is known, but not its functions. Metastudent will try to predict missing functional annotations through homology searches (BLAST).

All predicted functions correspond to Gene Ontology (GO) terms from the Molecular Function Ontology (MFO) and the Biological Process Ontology (BPO) and are associated with a reliability score.

This package contains data files for metastudent.

Please cite: Tobias Hamp, Rebecca Kassner, Stefan Seemayer, Esmeralda Vicedo, Christian Schaefer, Dominik Achten, Florian Auer, Ariane Boehm, Tatjana Braun, Maximilian Hecht, Mark Heron, Peter Hönigschmid, Thomas A. Hopf, Stefanie Kaufmann, Michael Kiening, Denis Krompass, Cedric Landerer, Yannick Mahlich, Manfred Roos and Burkhard Rost: Homology-based inference sets the bar high for protein function prediction. (PubMed) BMC Bioinformatics 14(Suppl 3):S7 (2013)
Registry entries: Bio.tools 
metastudent-data-2
predictor of Gene Ontology terms from protein sequence - data #2
Versions of package metastudent-data-2
ReleaseVersionArchitectures
sid1.0.0-6all
trixie1.0.0-6all
bookworm1.0.0-6all
buster1.0.0-4all
jessie1.0.0-1all
bullseye1.0.0-5all
stretch1.0.0-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Often, only the sequence of a protein is known, but not its functions. Metastudent will try to predict missing functional annotations through homology searches (BLAST).

All predicted functions correspond to Gene Ontology (GO) terms from the Molecular Function Ontology (MFO) and the Biological Process Ontology (BPO) and are associated with a reliability score.

This package contains additional data files for metastudent.

Please cite: Tobias Hamp, Rebecca Kassner, Stefan Seemayer, Esmeralda Vicedo, Christian Schaefer, Dominik Achten, Florian Auer, Ariane Boehm, Tatjana Braun, Maximilian Hecht, Mark Heron, Peter Hönigschmid, Thomas A. Hopf, Stefanie Kaufmann, Michael Kiening, Denis Krompass, Cedric Landerer, Yannick Mahlich, Manfred Roos and Burkhard Rost: Homology-based inference sets the bar high for protein function prediction. (PubMed) BMC Bioinformatics 14(Suppl 3):S7 (2013)
mrs
système de recherche d'information pour les banques de données
Versions of package mrs
ReleaseVersionArchitectures
buster6.0.5+dfsg-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch6.0.5+dfsg-2amd64
jessie6.0.5+dfsg-1amd64
Popcon: users ( upd.)*
Versions and Archs
License: DFSG free
Git

Le paquet MRS est un système complet de recherche, indexation et consultation de banques de données biologiques et médicales. Il est fourni avec tout le code nécessaire pour récupérer les données en utilisant le protocole FTP ou l'utilitaire rsync, puis crée une banque de données locale avec des indexes en utilisant un analyseur syntaxique spécifique de banque de données écrit en Perl. Il peut alors servir ces données en utilisant une application web intégrée et des services web.

La recherche peut être réalisée sur des demandes de mots ou des variables booléennes. En bonus, vous pouvez rechercher des séquences de protéines en utilisant un algorithme personnalisé Blast (« Basic Local Alignment Search Tool »).

Please cite: Maarten L. Hekkelman and Gert Vriend: MRS: a fast and compact retrieval system for biological data. (PubMed,eprint) Nucleic Acids Res. 33:W766-W769 (2005)
Registry entries: Bio.tools 
Remark of Debian Med team: mrs might occupy a lot of space on users disk - so you want to avoid this package from the metapackage recommends
python3-alignlib
edit and Hamming distances for biological sequences
Versions of package python3-alignlib
ReleaseVersionArchitectures
bullseye0.1.1+dfsg-1.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.1.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.1.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

A small Python module providing edit distance and Hamming distance computation. It is a dependency for the IgDiscover package and likely future others.

python3-anndata
annotated gene by sample numpy matrix
Versions of package python3-anndata
ReleaseVersionArchitectures
sid0.8.0-4all
bullseye0.7.5+ds-3all
bookworm0.8.0-4all
upstream0.10.6
Popcon: 3 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

AnnData provides a scalable way of keeping track of data together with learned annotations. It is used within Scanpy, for which it was initially developed. Both packages have been introduced in Genome Biology (2018).

Please cite: F. Alexander Wolf, Philipp Angerer and Fabian J. Theis: SCANPY: large-scale single-cell gene expression data analysis.. (PubMed) Genome Biol. 19:15 (2018)
Registry entries: Bioconda 
python3-cgecore
Python3 module for the Center for Genomic Epidemiology
Versions of package python3-cgecore
ReleaseVersionArchitectures
bookworm1.5.6+ds-1all
bullseye1.5.6+ds-1all
sid1.5.6+ds-1all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

This Python3 module contains classes and functions needed to run the service wrappers and pipeline scripts developed by the Center for Genomic Epidemiology.

Registry entries: Bioconda 
python3-cyvcf2
VCF parser based on htslib (Python 3)
Versions of package python3-cyvcf2
ReleaseVersionArchitectures
bullseye0.30.4-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.10.4-1amd64,arm64,armel,armhf,i386,mips64el
trixie0.30.28-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.30.28-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.30.18-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

This modules allows fast parsing of VCF and BCF including region-queries with Python. This is essential for efficient analyses of nucleotide variation with Python on high-throughput sequencing data.

cyvcf2 is a cython wrapper around htslib. Attributes like variant.gt_ref_depths return a numpy array directly so they are immediately ready for downstream use.

This package installs the library for Python 3.

Please cite: Brent S. Pedersen and Aaron R. Quinlan: cyvcf2: fast, flexible variant analysis with Python. (eprint) Bioinformatics 33(12):1867–1869 (2017)
Registry entries: Bio.tools  Bioconda 
python3-deeptools
platform for exploring biological deep-sequencing data
Versions of package python3-deeptools
ReleaseVersionArchitectures
bullseye3.5.0-1all
trixie3.5.4+dfsg-1all
bookworm3.5.1-3all
sid3.5.4+dfsg-1all
upstream3.5.5
Popcon: 5 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Aiming for compatibility with the Galaxy worklfow environment, but also independently contributing to a series of workflows in genomics, this package provides a series of tools to address common tasks for the processing of high-throughput DNA/RNA sequencing.

Please cite: Fidel Ramirez, Devon P. Ryan, Björn Grüning, Sarah Diehl, Vivek Bhardwaj, Fabian Kilpert, Andreas S Richter, Steffen Heyne, Friederike Dündar and Thomas Manke: deepTools2: a next generation web server for deep-sequencing data analysis. (eprint) Nucleic Acids Research :W160–W165 (2016)
Registry entries: Bio.tools  Bioconda 
python3-deeptoolsintervals
gestion de style GTF de séquences, intervalles associés, annotations
Versions of package python3-deeptoolsintervals
ReleaseVersionArchitectures
bullseye0.1.9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.9-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.1.9-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.1.9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Les régions dans des séquences biologiques sont décrites (annotées) comme gènes, sites de facteur de transcription, régions de basse complexité… et tout ce qui se rapporte à la recherche en biologie.

Ce paquet fournit une bonne exploitation de ces informations.

python3-htseq
Python3 high-throughput genome sequencing read analysis utilities
Versions of package python3-htseq
ReleaseVersionArchitectures
bookworm1.99.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster0.11.2-1amd64,arm64,mips64el,ppc64el
sid2.0.5-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye0.13.5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie2.0.5-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
Popcon: 39 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

HTSeq can be used to performing a number of common analysis tasks when working with high-throughput genome sequencing reads:

  • Getting statistical summaries about the base-call quality scores to study the data quality.
  • Calculating a coverage vector and exporting it for visualization in a genome browser.
  • Reading in annotation data from a GFF file.
  • Assigning aligned reads from an RNA-Seq experiments to exons and genes.

This package contains the Python 3 module.

Please cite: Simon Anders, Paul Theodor Pyl and Wolfgang Huber: HTSeq—a Python framework to work with high-throughput sequencing data. (PubMed,eprint) Bioinformatics 31(2):166-169 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
python3-intake
lightweight package for finding and investigating data
Versions of package python3-intake
ReleaseVersionArchitectures
trixie0.6.6-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.6.6-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.6.6-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream2.0.4
Popcon: 2 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

Intake is a lightweight set of tools for loading and sharing data in data science projects. Intake helps you:

 1. Load data from a variety of formats into containers you already know,
    like Pandas dataframes, Python lists, NumPy arrays and more.
 2. Convert boilerplate data loading code into reusable intake plugins.
 3. Describe data sets in catalog files for easy reuse and sharing
    between projects and with others.
 4. Share catalog information (and data sets) over the network with the
    Intake server.
python3-loompy
access loom formatted files for bioinformatics
Versions of package python3-loompy
ReleaseVersionArchitectures
sid3.0.7+dfsg-3amd64,arm64,mips64el,ppc64el,s390x
bookworm3.0.7+dfsg-2amd64,arm64,mips64el,ppc64el,s390x
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Loom is an efficient file format for very large omics datasets, consisting of a main matrix, optional additional layers, a variable number of row and column annotations. Loom also supports sparse graphs. Loom files are used to store single-cell gene expression data: the main matrix contains the actual expression values (one column per cell, one row per gene); row and column annotations contain metadata for genes and cells, such as Name, Chromosome, Position (for genes), and Strain, Sex, Age (for cells).

Loom files (.loom) are created in the HDF5 file format, which supports an internal collection of numerical multidimensional datasets. HDF5 is supported by many computer languages, including Java, MATLAB, Mathematica, Python, R, and Julia. .loom files are accessible from any language that supports HDF5.

Registry entries: Bioconda 
python3-nanoget
extract information from Oxford Nanopore sequencing data and alignments
Versions of package python3-nanoget
ReleaseVersionArchitectures
sid1.19.3-1all
bullseye1.12.2-4all
trixie1.19.3-1all
bookworm1.16.1-2all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The Python3 module nanoget provides functions to extract useful metrics from Oxford Nanopore sequencing reads and alignments.

Data can be presented in the following formats, using the following functions:

  • sorted bam file process_bam(bamfile, threads)
  • standard fastq file process_fastq_plain(fastqfile, 'threads')
  • fastq file with metadata from MinKNOW or Albacore process_fastq_rich(fastqfile)
  • sequencing_summary file generated by Albacore process_summary(sequencing_summary.txt, 'readtype')

Fastq files can be compressed using gzip, bzip2 or bgzip. The data is returned as a pandas DataFrame with standardized headernames for convenient extraction. The functions perform logging while being called and extracting data.

The package is enhanced by the following packages: python3-nanoget-examples
python3-nanomath
simple math function for other Oxford Nanopore processing scripts
Versions of package python3-nanomath
ReleaseVersionArchitectures
bullseye1.2.0+ds-1all
bookworm1.2.1+ds-1all
trixie1.2.1+ds-1all
sid1.2.1+ds-1all
upstream1.3.0
Popcon: 4 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

This Python3 module provides a few simple math and statistics functions for other scripts processing Oxford Nanopore sequencing data.

  • Calculate read N50 from a set of lengths get_N50(readlenghts)
  • Remove extreme length outliers from a dataset remove_length_outliers(dataframe, columname)
  • Calculate the average Phred quality of a read ave_qual(qualscores)
  • Write out the statistics report after calling readstats function write_stats(dataframe, outputname)
  • Compute a number of statistics, return a dictionary calc_read_stats(dataframe)
python3-ncls
datastructure for interval overlap queries
Versions of package python3-ncls
ReleaseVersionArchitectures
sid0.0.63-hotfix+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.0.63-hotfix+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.0.57+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.0.63-hotfix+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The Nested Containment List is a datastructure for interval overlap queries, like the interval tree. It is usually an order of magnitude faster than the interval tree both for building and query lookups.

The implementation here is a revived version of the one used in the now defunct PyGr library, which died of bitrot. It was now made less memory-consuming and wrapper functions allow batch-querying the NCLS for further speed gains.

This package was implemented to be the cornerstone of the PyRanges project, but was made available to the Python community as a stand-alone library.

Please cite: Endre Bakken Stovner and Pål Sætrom: PyRanges: efficient comparison of genomic intervals in Python. Bioinformatics 36(3):918–919 (2020)
python3-py2bit
access to 2bit files
Versions of package python3-py2bit
ReleaseVersionArchitectures
bullseye0.3.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid0.3.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie0.3.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm0.3.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

From https://genome.ucsc.edu/FAQ/FAQformat.html#format7: A .2bit file stores multiple DNA sequences (up to 4 Gb total) in a compact randomly-accessible format. The file contains masking information as well as the DNA itself.

Registry entries: Bioconda 
python3-pybel
Biological Expression Language
Versions of package python3-pybel
ReleaseVersionArchitectures
bullseye0.14.10-1all
bookworm0.14.10-1all
trixie0.14.10-1all
buster0.12.1-1all
sid0.14.10-1all
upstream0.15.5
Popcon: 2 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

PyBEL is a pure Python package for parsing and handling biological networks encoded in the Biological Expression Language (BEL) version 2. It also facilitates data interchange between common formats and databases such as NetworkX, JSON, CSV, SIF, Cytoscape, CX, NDEx, SQL, and Neo4J.

This package installs the library for Python 3.

Please cite: Charles Tapley Hoyt, Andrej Konotopez and Christian Ebeling: PyBEL: a computational framework for Biological Expression Language. (eprint) Bioinformatics 34(4):703–704 (2018)
Registry entries: Bio.tools  Bioconda 
python3-pychopper
identify, orient and trim full-length Nanopore cDNA reads
Versions of package python3-pychopper
ReleaseVersionArchitectures
bullseye2.5.0-1all
sid2.7.9-1all
bookworm2.7.2-1all
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Pychopper v2 is a Python module to identify, orient and trim full-length Nanopore cDNA reads. It is also able to rescue fused reads and provides the script 'pychopper.py'. The general approach of Pychopper v2 is the following:

  • Pychopper first identifies alignment hits of the primers across the length of the sequence. The default method for doing this is using nhmmscan with the pre-trained strand specific profile HMMs, included with the package. Alternatively, one can use the edlib backend, which uses a combination of global and local alignment to identify the primers within the read.
  • After identifying the primer hits by either of the backends, the reads are divided into segments defined by two consecutive primer hits. The score of a segment is its length if the configuration of the flanking primer hits is valid (such as SPP,-VNP for forward reads) or zero otherwise.
  • The segments are assigned to rescued reads using a dynamic programming algorithm maximizing the sum of used segment scores (hence the amount of rescued bases). A crucial observation about the algorithm is that if a segment is included as a rescued read, then the next segment must be excluded as one of the primer hits defining it was "used up" by the previous segment. This put constraints on the dynamic programming graph. The arrows in read define the optimal path for rescuing two fused reads with the a total score of l1 + l3.

A crucial parameter of Pychopper v2 is -q, which determines the stringency of primer alignment (E-value in the case of the pHMM backend). This can be explicitly specified by the user, however by default it is optimized on a random sample of input reads to produce the maximum number of classified reads.

Registry entries: Bioconda 
python3-pyfaidx
efficient random access to fasta subsequences for Python 3
Versions of package python3-pyfaidx
ReleaseVersionArchitectures
bullseye0.5.9.2-1all
buster0.5.5.2-1all
stretch0.4.8.1-1all
trixie0.8.1.1-1all
bookworm0.7.1-2all
sid0.8.1.1-1all
Popcon: 9 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Samtools provides a function "faidx" (FAsta InDeX), which creates a small flat index file ".fai" allowing for fast random access to any subsequence in the indexed FASTA file, while loading a minimal amount of the file in to memory. This Python module implements pure Python classes for indexing, retrieval, and in-place modification of FASTA files using a samtools compatible index. The pyfaidx module is API compatible with the pygr seqdb module. A command-line script "faidx" is installed alongside the pyfaidx module, and facilitates complex manipulation of FASTA files without any programming knowledge.

This package provides the Python 3 modules to access fasta files.

Please cite: Matthew D. Shirley, Zhaorong Ma, Brent S. Pedersen and Sarah J. Wheelan: Efficient "pythonic" access to FASTA files using pyfaidx. PeerJ PrePrints 3:e1196 (2015)
Registry entries: Bio.tools 
python3-pyflow
lightweight parallel task engine for Python
Versions of package python3-pyflow
ReleaseVersionArchitectures
trixie1.1.20-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.1.20-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.1.20-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.20-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

pyFlow is a tool to manage tasks in the context of a task dependency graph. It has some similarities to make. pyFlow is not a program – it is a Python module, and workflows are defined using pyFlow by writing regular Python code with the pyFlow API.

python3-pyranges
2D representation of genomic intervals and their annotations
Versions of package python3-pyranges
ReleaseVersionArchitectures
trixie0.0.111+ds-7all
sid0.0.111+ds-7all
bullseye0.0.85+ds-1all
bookworm0.0.111+ds-4all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

A PyRanges object must have the columns Chromosome, Start and End. These describe the genomic position and function as implicit row labels. A Strand column is optional and adds strand information to the intervals. Any other columns are allowed and are considered metadata.

The structure can be filled from .bed, .bam or .gff files, also from tabular or textual representations.

Please cite: Endre Bakken Stovner and Pål Sætrom: PyRanges: efficient comparison of genomic intervals in Python. Bioinformatics 36(3):918–919 (2020)
Registry entries: Bio.tools  Bioconda 
python3-pyrle
run length arithmetic in Python
Versions of package python3-pyrle
ReleaseVersionArchitectures
bullseye0.0.31-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.0.33-4.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.0.33-4.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.0.33-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

As opposed to S4Vectors, pyrle does not rotate the shortest vector, but rather extends the shorter Rle with zeroes. This is likely the desired behavior in almost all cases.

python3-pysam
interface for the SAM/BAM sequence alignment and mapping format (Python 3)
Versions of package python3-pysam
ReleaseVersionArchitectures
bookworm0.20.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
stretch-backports0.14+ds-2~bpo9+1amd64,arm64,mips64el,ppc64el
bullseye0.15.4+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid0.22.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
stretch0.10.0+ds-2amd64,arm64,mips64el,ppc64el
trixie0.22.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
buster0.15.2+ds-2amd64,arm64,mips64el,ppc64el
Popcon: 52 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Pysam is a Python module for reading and manipulating Samfiles. It's a lightweight wrapper of the samtools C-API. Pysam also includes an interface for tabix.

This package installs the module for Python 3.

The package is enhanced by the following packages: python-pysam-tests
Registry entries: Bio.tools  Bioconda 
python3-tinyalign
numerical representation of differences between strings
Versions of package python3-tinyalign
ReleaseVersionArchitectures
trixie0.2.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.2.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.2-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.2.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

A small Python module providing edit distance (aka Levenshtein distance, that is, counting insertions, deletions and substitutions) and Hamming distance computation.

Its main purpose is to speed up computation of edit distance by allowing to specify a maximum number of differences maxdiff (banding). If that parameter is provided, the returned edit distance is anly accurate up to maxdiff. That is, if the actual edit distance is higher than maxdiff, a value larger than maxdiff is returned, but not necessarily the actual edit distance.

Registry entries: Bioconda 
q2-alignment
QIIME 2 plugin for generating and manipulating alignments
Versions of package q2-alignment
ReleaseVersionArchitectures
bookworm2022.11.1-2all
sid2024.2.0-1all
trixie2024.2.0-1all
bullseye2020.11.1-2all
Popcon: 32 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-cutadapt
QIIME 2 plugin to work with adapters in sequence data
Versions of package q2-cutadapt
ReleaseVersionArchitectures
sid2024.2.0-1amd64,arm64,mips64el,ppc64el,riscv64
bullseye2020.11.1-1amd64,arm64,mips64el,ppc64el
bookworm2022.11.1-2amd64,arm64,mips64el,ppc64el
trixie2023.9.0-1amd64,arm64,mips64el,ppc64el
Popcon: 36 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-dada2
QIIME 2 plugin to work with adapters in sequence data
Versions of package q2-dada2
ReleaseVersionArchitectures
bookworm2022.11.2-2amd64
sid2024.2.0-1amd64
trixie2024.2.0-1amd64
bullseye2020.11.1-3amd64
Popcon: 32 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

This package wraps the dada2 R package in BioConductor for modeling and correcting Illumina-sequenced amplicon errors. This was shown to improve the sensitivity of diversity analyses.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-demux
QIIME 2 plugin for demultiplexing of sequence reads
Versions of package q2-demux
ReleaseVersionArchitectures
bookworm2022.11.1+dfsg-2all
sid2024.2.0+dfsg-1all
bullseye2020.11.1-1all
Popcon: 35 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-emperor
QIIME2 plugin for display of ordination plots
Versions of package q2-emperor
ReleaseVersionArchitectures
sid2024.2.0-1all
trixie2023.9.0-1all
bookworm2022.11.1-2all
Popcon: 32 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-feature-classifier
classification taxinomique gérant le greffon QIIME 2
Versions of package q2-feature-classifier
ReleaseVersionArchitectures
bookworm2022.11.1-2all
bullseye2020.11.1-2all
sid2024.2.0-1all
Popcon: 36 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 est un paquet pour l’analyse de microbiome, extensible et décentralisée avec une attention particulière sur la transparence des données et analyses. QIIME 2 permet aux chercheurs de commencer une analyse avec des données de séquences d’ADN et de terminer avec des figures et des résultats statistiques de qualité professionnelle. Principales caractéristiques :

 — suivi intégré et automatique de la provenance des données ;
 — système de type sémantique ;
 — système de greffons pour étendre les fonctionnalités d’analyse de
   microbiome ;
 — prise en charge de plusieurs types d’interface (par exemple, API,
   ligne de commande, graphique) ;

QIIME 2 est une nouvelle conception et une réécriture de la tuyauterie d’analyse de microbiome, QIIME 1. QIIME 2 corrigera la plupart des limitations de QIIME 1, tout en conservant les fonctions qui font de QIIME 1 une tuyauterie d’analyse puissante et largement utilisée.

QIIME 2 actuellement prend en charge une première tuyauterie d’analyse de microbiome de bout en bout. De nouvelles fonctionnalités seront régulièrement disponibles à travers des greffons de QIIME 2. Une liste de greffons peut être consultée sur la page de disponibilité de greffons de QIIME 2. La page des futurs greffons liste les greffons en cours de développement.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
Registry entries: Bio.tools 
q2-feature-table
QIIME 2 plugin supporting operations on feature tables
Versions of package q2-feature-table
ReleaseVersionArchitectures
sid2024.2.0+dfsg-1all
trixie2023.9.0+dfsg-1all
bullseye2020.11.1+dfsg-1all
bookworm2022.11.1+dfsg-2all
upstream2024.2.2
Popcon: 35 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-fragment-insertion
QIIME 2 plugin for fragment insertion
Versions of package q2-fragment-insertion
ReleaseVersionArchitectures
sid2024.2.0-1amd64,arm64,mips64el,ppc64el,riscv64
bookworm2022.11.1-3amd64,arm64,mips64el,ppc64el
trixie2023.9.0-1amd64,arm64,mips64el,ppc64el
Popcon: 32 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-metadata
QIIME 2 plugin for working with and visualizing Metadata
Versions of package q2-metadata
ReleaseVersionArchitectures
trixie2023.9.0+dfsg-1amd64,arm64,mips64el,ppc64el
bullseye2020.11.1+dfsg-1amd64,arm64,mips64el,ppc64el
sid2024.2.0+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64
bookworm2022.8.0-1amd64,arm64,mips64el,ppc64el
Popcon: 35 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-phylogeny
QIIME 2 plugin for phylogeny
Versions of package q2-phylogeny
ReleaseVersionArchitectures
sid2024.2.0-1amd64
experimental2022.11.1-1all
bookworm2022.11.1-3amd64
trixie2023.9.0-1amd64
Popcon: 32 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 plugin for phylogenetic reconstruction, and operations on phylogenetic trees.

q2-quality-control
QIIME 2 plugin for quality assurance of feature and sequence data
Versions of package q2-quality-control
ReleaseVersionArchitectures
bookworm2022.11.1-2all
bullseye2020.11.1-3all
sid2024.2.0-2all
Popcon: 36 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-quality-filter
QIIME2 plugin for PHRED-based filtering and trimming
Versions of package q2-quality-filter
ReleaseVersionArchitectures
trixie2023.9.0-1all
bullseye2020.11.1-2all
bookworm2022.11.1-2all
sid2024.2.0-1all
Popcon: 35 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-sample-classifier
QIIME 2 plugin for machine learning prediction of sample data
Versions of package q2-sample-classifier
ReleaseVersionArchitectures
bullseye2020.11.1-3all
sid2024.2.0-1all
bookworm2022.11.1-3all
trixie2023.9.0-1all
Popcon: 32 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Microbiome studies often aim to predict outcomes or differentiate samples based on their microbial compositions, tasks that can be efficiently performed by supervised learning methods. The q2-sample-classifier plugin makes these methods more accessible, reproducible, and interpretable to a broad audience of microbiologists, clinicians, and others who wish to utilize supervised learning methods for predicting sample characteristics based on microbiome composition or other "omics" data

Registry entries: Bio.tools 
q2-taxa
QIIME 2 plugin for working with feature taxonomy annotations
Versions of package q2-taxa
ReleaseVersionArchitectures
sid2024.2.0+dfsg-1all
trixie2024.2.0+dfsg-1all
bookworm2022.11.1+dfsg-2all
bullseye2020.11.1+dfsg-2all
Popcon: 35 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-types
QIIME 2 plugin defining types for microbiome analysis
Versions of package q2-types
ReleaseVersionArchitectures
trixie2024.2.0-1all
bullseye2020.11.1-1all
bookworm2022.11.1-2all
sid2024.2.0-1all
Popcon: 37 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2cli
Click-based command line interface for QIIME 2
Versions of package q2cli
ReleaseVersionArchitectures
bookworm2022.11.1-2all
sid2024.2.0-1all
trixie2022.11.1-2all
bullseye2020.11.1-1all
Popcon: 36 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2templates
Design template package for QIIME 2 Plugins
Versions of package q2templates
ReleaseVersionArchitectures
sid2024.2.0+ds-1all
trixie2024.2.0+ds-1all
bookworm2022.11.1+ds-2all
bullseye2020.11.1+dfsg-1all
Popcon: 39 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

This package provides templates for QIIME 2 plugins.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
r-bioc-annotationhub
client GNU R pour accéder aux ressources d'AnnotationHub
Versions of package r-bioc-annotationhub
ReleaseVersionArchitectures
stretch2.6.4-1all
buster2.14.3+dfsg-1all
bullseye2.22.0+dfsg-1all
sid3.10.0+dfsg-1all
trixie3.10.0+dfsg-1all
bookworm3.6.0+dfsg-1all
Popcon: 8 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit un client pour les ressources web d'AnnotationHub pour BioConductor. Les ressources web d'AnnotationHub fournissent un lieu centralisé où des fichiers génomiques (par exemple, VCF, bed, wig) et d'autres ressources d'emplacements standards (UCSC, Ensembl) peuvent être découvertes. Les ressources incluent des métadonnées sur chaque ressource, par exemple, une description textuelle, des étiquettes et les dates de modification. Le client crée et gère un cache local des fichiers récupérés par l’utilisateur, ce qui aide à un accès rapide et reproductible.

Registry entries: Bio.tools 
r-bioc-aroma.light
méthodes de BioConductor de normalisation et de visualisation de données de puces à ADN
Versions of package r-bioc-aroma.light
ReleaseVersionArchitectures
buster3.12.0-1all
stretch3.4.0-1all
bookworm3.28.0-1all
sid3.32.0-1all
bullseye3.20.0-1all
trixie3.32.0-1all
Popcon: 5 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Ce module de BioConductor fournit des méthodes légères pour la normalisation et la visualisation de données de puces à ADN utilisant seulement des types de données de base de R.

Les méthodes pour l'analyse de puces à ADN prennent des types de données de base comme les matrices et les listes de vecteurs. Ces méthodes peuvent être utilisées de façon autonome, utilisées dans d'autres paquets ou enveloppées dans des classes de plus haut niveau.

Please cite: Henrik Bengtsson, Pierre Neuvial and Terence P. Speed: TumorBoost: Normalization of allele-specific tumor copy numbers from a single pair of tumor-normal genotyping microarrays. (PubMed,eprint) BMC Bioinformatics 11:245 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-beachmat
E/S pour plusieurs formats de stockage de données de matrice
Versions of package r-bioc-beachmat
ReleaseVersionArchitectures
bookworm2.14.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.18.1+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.18.1+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye2.6.4+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 14 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit une interface de classe C++ cohérente pour lire à partir de ou écrire des données vers une certaine variété de types de matrice fréquemment utilisés. Les matrices ordinaires et plusieurs classes de matrices creuses ou denses sont directement prises en charge, les classes S4 de tiers peuvent être prises en charge par un lien externe, tandis que tous les autres types de matrice sont gérés par le traitement de bloc de DelayedArray.

r-bioc-biocneighbors
Nearest Neighbor Detection for Bioconductor Packages
Versions of package r-bioc-biocneighbors
ReleaseVersionArchitectures
bookworm1.16.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.20.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.20.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.8.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 13 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Implements exact and approximate methods for nearest neighbor detection, in a framework that allows them to be easily switched within Bioconductor packages or workflows. Exact searches can be performed using the k-means for k-nearest neighbors algorithm or with vantage point trees. Approximate searches can be performed using the Annoy or HNSW libraries. Searching on either Euclidean or Manhattan distances is supported. Parallelization is achieved for all methods by using BiocParallel. Functions are also provided to search for all neighbors within a given distance.

r-bioc-biocsingular
décomposition en valeurs singulières pour les paquets de Bioconductor
Versions of package r-bioc-biocsingular
ReleaseVersionArchitectures
bullseye1.6.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.14.0+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.18.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.18.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 13 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet met en œuvre des méthodes exactes et approximatives pour la décomposition en valeurs singulières et l’analyse en composantes principales dans un cadriciel qui leur permet d’être facilement intégrées dans des paquets de Bioconductor ou dans un flux de production. Lorsque c’est possible la parallélisation est réalisée en utilisant le cadriciel BiocParallel.

r-bioc-ctc
Cluster and Tree Conversion
Versions of package r-bioc-ctc
ReleaseVersionArchitectures
bookworm1.72.0-1all
bullseye1.64.0-1all
trixie1.76.0-1all
sid1.76.0-1all
Popcon: 3 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Tools for export and import classification trees and clusters to other programs.

Registry entries: Bioconda 
r-bioc-dnacopy
paquet de R : analyse des données de nombre de copies d'ADN
Versions of package r-bioc-dnacopy
ReleaseVersionArchitectures
bullseye1.64.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.48.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.72.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.56.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.76.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.76.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 6 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet met en œuvre l’algorithme CBS (« circular binary segmentation » – segmentation binaire circulaire) pour segmenter les données de nombres de copies d’ADN et identifier les régions génomiques avec un nombre de copies anormal.

Ce paquet sert à analyser des données de nombres de copies de puces à ADN, qui sont habituellement (mais pas toujours) appelées données de puce d'hybridation génomique comparative (« Comparative Genomic Hybridization », array CGH). Il met en œuvre une méthodologie pour trouver les points de rupture dans ces données qui sont des points après lesquels le test (log) comparé aux ratios de référence ont changé l’emplacement. Le modèle est que les points de rupture correspondent aux positions où le nombre de copies d’ADN sous-jacente a changé. Pas conséquent, les points de rupture peuvent être utilisés pour identifier les régions du nombre de copies gagné ou perdu. Une fonction est aussi fournie pour faire des tracés relatifs à ces données.

Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-ensembldb
GNU R utilities to create and use an Ensembl based annotation database
Versions of package r-bioc-ensembldb
ReleaseVersionArchitectures
bullseye2.14.0+dfsg-1all
stretch1.6.2-1all
buster2.6.5+dfsg-1all
bookworm2.22.0+dfsg-1all
sid2.26.0+dfsg-1all
Popcon: 11 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

The package provides functions to create and use transcript centric annotation databases/packages. The annotation for the databases are directly fetched from Ensembl using their Perl API. The functionality and data is similar to that of the TxDb packages from the GenomicFeatures package, but, in addition to retrieve all gene/transcript models and annotations from the database, the ensembldb package provides also a filter framework allowing to retrieve annotations for specific entries like genes encoded on a chromosome region or transcript models of lincRNA genes.

Registry entries: Bio.tools  Bioconda 
r-bioc-experimenthub
client BioConductor pour accéder aux ressources d’ExperimentHub
Versions of package r-bioc-experimenthub
ReleaseVersionArchitectures
sid2.10.0+ds-1all
trixie2.10.0+ds-1all
bookworm2.6.0+ds-1all
bullseye1.16.0+ds-1all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit un client pour les ressources web client ExperimentHub de Bioconductor. ExperimentHub fournit un emplacement central où des données soigneusement sélectionnées d’expérimentation, de publications ou de cours de formation, peuvent être accédées. Chaque ressource a ses propres métadonnées, étiquettes et date de modification. Le client crée et gère un cache local de fichiers récupérés, procurant un accès rapide et reproductible.

r-bioc-geneplotter
R package of functions for plotting genomic data
Versions of package r-bioc-geneplotter
ReleaseVersionArchitectures
buster1.60.0-1all
bullseye1.68.0-1all
trixie1.80.0+dfsg-1all
bookworm1.76.0-1all
sid1.80.0+dfsg-1all
stretch1.52.0-2all
Popcon: 17 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Geneplotter contains plotting functions for microarrays.

The functions cPlot and cColor allow the user to associate microarray expression data with chromosomal location. The plots can include any subset (by default all chromosomes are shown) of chromosomes for the organism being considered.

Registry entries: Bio.tools  Bioconda 
r-bioc-genomicalignments
BioConductor representation and manipulation of short genomic alignments
Versions of package r-bioc-genomicalignments
ReleaseVersionArchitectures
jessie1.0.6-1amd64,armel,armhf,i386
bookworm1.34.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.26.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.18.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.10.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.38.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.38.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 43 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

This BioConductor package provides efficient containers for storing and manipulating short genomic alignments (typically obtained by aligning short reads to a reference genome). This includes read counting, computing the coverage, junction detection, and working with the nucleotide content of the alignments.

Please cite: Michael Lawrence, Wolfgang Huber, Hervé Pagès, Patrick Aboyoun, Marc Carlson, Robert Gentleman, Martin T. Morgan and Vincent J. Carey: Software for Computing and Annotating Genomic Ranges. (PubMed,eprint) PLoS Computational Biology 9(8):e1003118 (2013)
Registry entries: Bio.tools  Bioconda 
r-bioc-genomicfiles
Distributed computing by file or by range
Versions of package r-bioc-genomicfiles
ReleaseVersionArchitectures
bookworm1.34.0-1all
sid1.38.0+dfsg-1all
bullseye1.26.0-1all
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides infrastructure for parallel computations distributed 'by file' or 'by range'. User defined MAPPER and REDUCER functions provide added flexibility for data combination and manipulation.

Registry entries: Bio.tools  Bioconda 
r-bioc-genomicranges
BioConductor representation and manipulation of genomic intervals
Versions of package r-bioc-genomicranges
ReleaseVersionArchitectures
bullseye1.42.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.26.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.34.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.50.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.54.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie1.16.4-2amd64,armel,armhf,i386
sid1.54.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 52 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

The ability to efficiently store genomic annotations and alignments is playing a central role when it comes to analyze high-throughput sequencing data (a.k.a. NGS data). The package defines general purpose containers for storing genomic intervals as well as more specialized containers for storing alignments against a reference genome.

Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-go.db
annotation maps describing the entire Gene Ontology
Versions of package r-bioc-go.db
ReleaseVersionArchitectures
bookworm3.16.0-1all
sid3.18.0-1all
bullseye3.12.1-1all
buster3.7.0-1all
stretch3.4.0-1all
trixie3.18.0-1all
Popcon: 19 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

This package is part of BioConductor and provides a set of annotation maps describing the entire Gene Ontology assembled using data from GO.

The package helps running the test suites of some BioConductor packages.

Registry entries: Bioconda 
r-bioc-grohmm
GRO-seq Analysis Pipeline
Versions of package r-bioc-grohmm
ReleaseVersionArchitectures
sid1.36.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm1.32.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.24.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This BioConductor package provides a pipeline for the analysis of GRO- seq data. Among the more advanced features, r-bioc-grohmm predicts the boundaries of transcriptional activity across the genome de novo using a two-state hidden Markov model (HMM).

The used model essentially divides the genome into transcribed and non- transcribed regions in a strand specific manner. HMMs are used to identify the leading edge of Pol II at genes activated by a stimulus in GRO-seq time course data. This approach allows the genome-wide interrogation of transcription rates in cells.

Please cite: Minho Chae, Charles G. Danko and and W. Lee Kraus: groHMM: a computational tool for identifying unannotated and cell type-specific transcription units from global run-on sequencing data. (PubMed) BMC Bioinformatics 16:222.0 (2015)
Registry entries: Bio.tools  Bioconda 
r-bioc-gviz
Plotting data and annotation information along genomic coordinates
Versions of package r-bioc-gviz
ReleaseVersionArchitectures
sid1.46.1+dfsg-1all
bookworm1.42.1+dfsg-1all
stretch1.18.1-1all
buster1.26.4-1all
jessie1.8.4-1all
bullseye1.34.0+dfsg-1all
Popcon: 8 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Genomic data analyses requires integrated visualization of known genomic information and new experimental data. Gviz uses the biomaRt and the rtracklayer packages to perform live annotation queries to Ensembl and UCSC and translates this to e.g. gene/transcript structures in viewports of the grid graphics package. This results in genomic information plotted together with your data.

Please cite: Michael Lawrence, Robert Gentleman and "Vincent Carey: rtracklayer: an R package for interfacing with genome browsers. (PubMed,eprint) Bioinformatics 25(14):1841-1842 (2009)
Registry entries: Bio.tools  Bioconda 
r-bioc-isoformswitchanalyzer
Identify, Annotate and Visualize Alternative Splicing and
Versions of package r-bioc-isoformswitchanalyzer
ReleaseVersionArchitectures
bookworm1.20.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2.0+ds-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Isoform Switches with Functional Consequences from both short- and long-read RNA-seq data. Analysis of alternative splicing and isoform switches with predicted functional consequences (e.g. gain/loss of protein domains etc.) from quantification of all types of RNASeq by tools such as Kallisto, Salmon, StringTie, Cufflinks/Cuffdiff etc.

Registry entries: Bio.tools  Bioconda 
r-bioc-org.hs.eg.db
genome-wide annotation for Human
Versions of package r-bioc-org.hs.eg.db
ReleaseVersionArchitectures
bookworm3.16.0-1all
bullseye3.12.0-1all
sid3.18.0-1all
trixie3.18.0-1all
Popcon: 12 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides descriptions of parts of the human genome that have been identified to be coding for RNA, and likely also for proteins. It also offers links to entries of equivalent (orthologous) genes in other species.

This package is prepared from the BioConductor community and contributes to many workflows and routine analyses in computational biology.

Registry entries: Bioconda 
r-bioc-qusage
qusage: Quantitative Set Analysis for Gene Expression
Versions of package r-bioc-qusage
ReleaseVersionArchitectures
trixie2.36.0-1all
bookworm2.32.0-1all
bullseye2.24.0-1all
sid2.36.0-1all
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This package is an implementation the Quantitative Set Analysis for Gene Expression (QuSAGE) method described in (Yaari G. et al, Nucl Acids Res, 2013). This is a novel Gene Set Enrichment-type test, which is designed to provide a faster, more accurate, and easier to understand test for gene expression studies. qusage accounts for inter-gene correlations using the Variance Inflation Factor technique proposed by Wu et al. (Nucleic Acids Res, 2012). In addition, rather than simply evaluating the deviation from a null hypothesis with a single number (a P value), qusage quantifies gene set activity with a complete probability density function (PDF). From this PDF, P values and confidence intervals can be easily extracted. Preserving the PDF also allows for post-hoc analysis (e.g., pair-wise comparisons of gene set activity) while maintaining statistical traceability. Finally, while qusage is compatible with individual gene statistics from existing methods (e.g., LIMMA), a Welch-based method is implemented that is shown to improve specificity. For questions, contact Chris Bolen (cbolen1@gmail.com) or Steven Kleinstein (steven.kleinstein@yale.edu)

Please cite: Gur Yaari, Christopher R. Bolen, Juilee Thakar and Steven H. Kleinstein: Quantitative set analysis for gene expression: a method to quantify gene set differential expression including gene-gene correlations. (PubMed,eprint) Nucleic Acids Res. 41(18):e170 (2013)
Registry entries: Bioconda 
r-bioc-savr
GNU R parse and analyze Illumina SAV files
Versions of package r-bioc-savr
ReleaseVersionArchitectures
bullseye1.28.0-1all
bookworm1.36.0-2all
buster1.20.0-1all
sid1.37.0-2all
trixie1.37.0-2all
stretch1.12.0-1all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

This BioConductor module enables to parse Illumina Sequence Analysis Viewer (SAV) files, access data, and generate QC plots.

Registry entries: Bio.tools  Bioconda 
r-bioc-singlecellexperiment
S4 Classes for Single Cell Data
Versions of package r-bioc-singlecellexperiment
ReleaseVersionArchitectures
bullseye1.12.0+ds-1all
bookworm1.20.0+ds-1all
trixie1.24.0+ds-1all
sid1.24.0+ds-1all
Popcon: 15 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Defines a S4 class for storing data from single-cell experiments. This includes specialized methods to store and retrieve spike-in information, dimensionality reduction coordinates and size factors for each cell, along with the usual metadata for genes and libraries.

r-bioc-structuralvariantannotation
Variant annotations for structural variants
Versions of package r-bioc-structuralvariantannotation
ReleaseVersionArchitectures
sid1.18.0+ds-1all
bookworm1.13.0+ds-1all
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

StructuralVariantAnnotation contains useful helper functions for dealing with structural variants in VCF format. The packages contains functions for parsing VCFs from a number of popular callers as well as functions for dealing with breakpoints involving two separate genomic loci encoded as GRanges objects.

Registry entries: Bio.tools  Bioconda 
r-bioc-tximport
estimations au niveau transcription de séquences biologiques
Versions of package r-bioc-tximport
ReleaseVersionArchitectures
trixie1.30.0+dfsg-1all
bullseye1.18.0+dfsg-1all
bookworm1.26.1+dfsg-1all
sid1.30.0+dfsg-1all
Popcon: 14 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Imports transcript-level abundance, estimated counts and transcript lengths, and summarizes into matrices for use with downstream gene-level analysis packages. Average transcript length, weighted by sample-specific transcript abundance estimates, is provided as a matrix which can be used as an offset for different expression of gene-level counts.

Please cite: Charlotte Soneson, Michael I. Love and Mark D. Robinson: Differential analyses for RNA-seq: transcript-level estimates improve gene-level inferences. F1000Research 4:1521 (2015)
Registry entries: Bio.tools  Bioconda 
r-cran-amap
Another Multidimensional Analysis Package
Versions of package r-cran-amap
ReleaseVersionArchitectures
bookworm0.8-19-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.8-18-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.8-19-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.8-19-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Tools for Clustering and Principal Component Analysis (With robust methods, and parallelized functions).

r-cran-biwt
biweight mean vector and covariance and correlation
Versions of package r-cran-biwt
ReleaseVersionArchitectures
trixie1.0.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye1.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Compute multivariate location, scale, and correlation estimates based on Tukey's biweight M-estimator.

r-cran-boolnet
assembling, analyzing and visualizing Boolean networks
Versions of package r-cran-boolnet
ReleaseVersionArchitectures
bullseye2.1.5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.1.7-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.1.9-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster2.1.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.1.9-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.0-1amd64,armel,armhf,i386
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

BoolNet is an R package that provides tools for assembling, analyzing and visualizing synchronous and asynchronous Boolean networks as well as probabilistic Boolean networks.

Please cite: Christoph Muessel, Martin Hopfensitz and Hans A. Kestler: BoolNet -- an R package for generation, reconstruction and analysis of Boolean networks. (eprint) Bioinformatics 26(6):1378-1380 (2010)
r-cran-corrplot
Visualization of a Correlation Matrix
Versions of package r-cran-corrplot
ReleaseVersionArchitectures
bookworm0.92-1all
trixie0.92-1all
bullseye0.84-3all
buster-backports0.84-3~bpo10+1all
sid0.92-1all
Popcon: 54 users (17 upd.)*
Versions and Archs
License: DFSG free
Git

A graphical display of a correlation matrix or general matrix. It also contains some algorithms to do matrix reordering. In addition, corrplot is good at details, including choosing color, text labels, color labels, layout, etc.

r-cran-dynamictreecut
Methods for Detection of Clusters in Hierarchical Clustering
Versions of package r-cran-dynamictreecut
ReleaseVersionArchitectures
sid1.63-1-3all
bullseye1.63-1-3all
trixie1.63-1-3all
bookworm1.63-1-3all
Popcon: 14 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Dendrograms Contains methods for detection of clusters in hierarchical clustering dendrograms.

r-cran-epir
fonctions de GNU R pour l’analyse de données épidémiologiques
Versions of package r-cran-epir
ReleaseVersionArchitectures
stretch0.9-79-1all
bookworm2.0.57+dfsg-1all
buster0.9-99-1all
jessie0.9-59-1all
sid2.0.67+dfsg-1all
bullseye2.0.19-1all
trixie2.0.67+dfsg-1all
upstream2.0.70
Debtags of package r-cran-epir:
devellang:r
fieldmedicine
interfacecommandline
roleprogram
useanalysing
Popcon: 44 users (33 upd.)*
Newer upstream!
License: DFSG free
Git

Il s’agit d’un paquet pour l’analyse de données épidémiologiques. Il contient des fonctions pour directement ou indirectement ajuster les fréquences de maladies, quantifier les mesures d’association sur la base d’une ou plusieurs couches de données de comptage présentées dans un tableau de contingence, et calculer l’intervalle de confiance entre le risque d’incidence et le taux d’incidence estimés. Il fournit aussi diverses fonctions pour la méta-analyse, l’interprétation de diagnostics et le calcul de taille d’échantillon.

r-cran-fitdistrplus
support fit of parametric distribution
Versions of package r-cran-fitdistrplus
ReleaseVersionArchitectures
bullseye1.1-3-1all
bookworm1.1-8-1all
trixie1.1-11-1all
sid1.1-11-1all
stretch-backports-sloppy1.1-1-1~bpo9+1all
buster-backports1.1-3-1~bpo10+1all
Popcon: 8 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Extends the fitdistr() function (of the MASS package) with several functions to help the fit of a parametric distribution to non-censored or censored data. Censored data may contain left censored, right censored and interval censored values, with several lower and upper bounds. In addition to maximum likelihood estimation (MLE), the package provides moment matching (MME), quantile matching (QME) and maximum goodness-of-fit estimation (MGE) methods (available only for non-censored data). Weighted versions of MLE, MME and QME are available. See e.g. Casella & Berger (2002). Statistical inference. Pacific Grove.

Please cite: Marie Laure Delignette-Muller Christophe Dutang: fitdistrplus: An R Package for Fitting Distributions. Journal of Statistical Software 64(4):1-34 (2015)
r-cran-forecast
GNU R forecasting functions for time series and linear models
Versions of package r-cran-forecast
ReleaseVersionArchitectures
bullseye8.13-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm8.20-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid8.21.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie8.21.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
upstream8.22.0
Popcon: 47 users (24 upd.)*
Newer upstream!
License: DFSG free
Git

Methods and tools for displaying and analysing univariate time series forecasts including exponential smoothing via state space models and automatic ARIMA modelling.

r-cran-gprofiler2
Interface to the 'g:Profiler' Toolset
Versions of package r-cran-gprofiler2
ReleaseVersionArchitectures
bookworm0.2.1+dfsg-1all
sid0.2.2+dfsg-2all
trixie0.2.2+dfsg-2all
upstream0.2.3
Popcon: 4 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

A toolset for functional enrichment analysis and visualization, gene/protein/SNP identifier conversion and mapping orthologous genes across species via 'g:Profiler' (https://biit.cs.ut.ee/gprofiler). The main tools are: (1) 'g:GOSt' - functional enrichment analysis and visualization of

    gene lists;
(2) 'g:Convert' - gene/protein/transcript identifier conversion across
    various namespaces;
(3) 'g:Orth' - orthology search across species;

(4) 'g:SNPense' - mapping SNP rs identifiers to chromosome positions,

    genes and variant effects This package is an R interface
    corresponding to the 2019 update of 'g:Profiler' and provides access
    to 'g:Profiler' for versions 'e94_eg41_p11' and higher. See the
    package 'gProfileR' for accessing older versions from the
    'g:Profiler' toolset.
Registry entries: Bio.tools  SciCrunch 
r-cran-minerva
Maximal Information-Based Nonparametric Exploration
Versions of package r-cran-minerva
ReleaseVersionArchitectures
trixie1.5.10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid1.5.10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.5.8-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.5.10-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Wrapper for 'minepy' implementation of Maximal Information-based Nonparametric Exploration statistics (MIC and MINE family). Detailed information of the ANSI C implementation of 'minepy' can be found at http://minepy.readthedocs.io/en/latest.

r-cran-optimalcutpoints
Computing Optimal Cutpoints in Diagnostic Tests
Versions of package r-cran-optimalcutpoints
ReleaseVersionArchitectures
bookworm1.1-5-1all
trixie1.1-5-1all
bullseye1.1-4-2all
sid1.1-5-1all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Computes optimal cutpoints for diagnostic tests or continuous markers. Various approaches for selecting optimal cutoffs have been implemented, including methods based on cost-benefit analysis and diagnostic test accuracy measures (Sensitivity/Specificity, Predictive Values and Diagnostic Likelihood Ratios). Numerical and graphical output for all methods is easily obtained.

Please cite: Mónica López-Ratón María Xosé Rodríguez-Álvarez, Carmen Cadarso Suárez and Francisco Gude Sampedro: OptimalCutpoints: An R Package for Selecting Optimal Cutpoints in Diagnostic Tests. Journal of Statistical Software 61(8):1-36 (2014)
r-cran-parmigene
information mutuelle en parrallèle pour établir des réseaux géniques
Versions of package r-cran-parmigene
ReleaseVersionArchitectures
bookworm1.1.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.1.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.1.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 3 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit une estimation en parallèle de l’information mutuelle en se basant sur une évaluation de l’entropie des distances des k plus proches voisins et des algorithmes de reconstruction de réseaux de régulation génique.

r-cran-pheatmap
GNU R package to create pretty heatmaps
Versions of package r-cran-pheatmap
ReleaseVersionArchitectures
trixie1.0.12-2all
sid1.0.12-2all
stretch1.0.8-1all
bookworm1.0.12-2all
bullseye1.0.12-2all
buster1.0.12-1all
Popcon: 21 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

GNU R implementation of heatmaps that offers more control over dimensions and appearance.

Registry entries: Bio.tools 
r-cran-qqman
R package for visualizing GWAS results using Q-Q and manhattan plots
Versions of package r-cran-qqman
ReleaseVersionArchitectures
bookworm0.1.8+dfsg-1all
stretch0.1.2-1all
sid0.1.9+dfsg-1all
trixie0.1.9+dfsg-1all
buster0.1.4-6all
bullseye0.1.4-7all
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

qqman is an add-on package for the R statistical environment. This package provides functions for visualizing Genome-Wide Association Studies (GWAS) results using Manhattan plots and Quantile-Quantile plots.

r-cran-rcpphnsw
R bindings for a Library for Approximate Nearest Neighbors
Versions of package r-cran-rcpphnsw
ReleaseVersionArchitectures
trixie0.5.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.3.0.9001+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.4.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.5.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream0.6.0
Popcon: 14 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

'Hnswlib' is a C++ library for Approximate Nearest Neighbors. This package provides a minimal R interface by relying on the 'Rcpp' package. See https://github.com/nmslib/hnswlib for more on 'hnswlib'. 'hnswlib' is released under Version 2.0 of the Apache License.

r-cran-rentrez
interface GNU R pour l’API EUtils du NCBI
Versions of package r-cran-rentrez
ReleaseVersionArchitectures
trixie1.2.3+dfsg-1all
buster1.2.1-2all
bullseye1.2.3+dfsg-1all
sid1.2.3+dfsg-1all
bookworm1.2.3+dfsg-1all
stretch1.0.4-1all
Popcon: 9 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet fournit une interface R pour l’API EUtils du NCBI qui permet une recherche dans les bases de données telles que GenBank et PubMed, de traiter le résultat des recherches et d’intégrer les données dans une session R.

r-cran-sctransform
Variance Stabilizing Transformations for Single Cell UMI Data
Versions of package r-cran-sctransform
ReleaseVersionArchitectures
sid0.4.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.3.5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.3.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 6 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

A normalization method for single-cell UMI count data using a variance stabilizing transformation. The transformation is based on a negative binomial regression model with regularized parameters. As part of the same regression framework, this package also provides functions for batch correction, and data correction. See Hafemeister and Satija 2019 for more details.

Registry entries: Bio.tools 
resfinder-db
ResFinder database is a curated database of acquired resistance genes
Versions of package resfinder-db
ReleaseVersionArchitectures
trixie0.0+git20220524.fa32d9a-1all
bookworm0.0+git20220524.fa32d9a-1all
bullseye0.0+git20200408.0322c0d-1all
sid0.0+git20220524.fa32d9a-1all
upstream0.0+git20240325.8aad1d2
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

ResFinder identifies acquired antimicrobial resistance genes in total or partial sequenced isolates of bacteria.

ResFinder that uses BLAST for identification of acquired antimicrobial resistance genes in whole-genome data. As input, the method can use both pre-assembled, complete or partial genomes, and short sequence reads from four different sequencing platforms. The method was evaluated on 1862 GenBank files containing 1411 different resistance genes, as well as on 23 de-novo-sequenced isolates.

This package provides the database needed for resfinder.

Please cite: Ea Zankari, Henrik Hasman, Salvatore Cosentino, Martin Vestergaard, Simon Rasmussen, Ole Lund, Frank M. Aarestrup and Mette Voldby Larsen: Identification of acquired antimicrobial resistance genes. (PubMed,eprint) Journal of Antimicrobial Chemotherapy 67(11):2640-4 (2012)
science-workflow
workflow management systems useful for scientific research
Versions of package science-workflow
ReleaseVersionArchitectures
sid1.14.5all
stretch1.7all
buster1.10all
bullseye1.14.2all
bookworm1.14.5all
trixie1.14.5all
Popcon: 3 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This task lists some packages providing workflow management systems useful for scientific research.

Debian packages in contrib or non-free

arb
phylogenetic sequence analysis suite - main program
Versions of package arb
ReleaseVersionArchitectures
stretch6.0.6-1 (non-free)amd64,i386
bullseye6.0.6-4 (non-free)amd64,i386
jessie6.0.2-1+deb8u1 (non-free)amd64,i386
bookworm6.0.6-5 (non-free)amd64,i386
trixie6.0.6-7 (non-free)amd64,arm64,armel,armhf,i386,mips64el,s390x
sid6.0.6-7 (non-free)amd64,arm64,armel,armhf,i386,mips64el,riscv64,s390x
buster6.0.6-4 (non-free)amd64,i386
upstream7.0
Debtags of package arb:
fieldbiology
roleprogram
uitoolkitmotif
x11application
Popcon: 3 users (1 upd.)*
Newer upstream!
License: non-free
Git

ARB is a graphical suite of tools for sequence database handling and data analysis. A central database of processed (aligned) sequences and any type of additional data linked to the sequence entries is structured according to phylogeny or other user-defined criteria.

The ARB project (from the Latin "arbor", a tree) is a joint initiative of the Lehrstuhl für Mikrobiologie and the LRR of the Technische Universität München in 1992. Since 2014 the ARB project is continued by the Department of Molecular Ecology http://www.mpi-bremen.de/en/Department_of_Molecular_Ecology.html at the Max Planck Institute for Marine Microbiology in Bremen in cooperation with Ribocon GmbH http://www.ribocon.com .

bcbio
toolkit for analysing high-throughput sequencing data
Versions of package bcbio
ReleaseVersionArchitectures
sid1.2.9-2 (contrib)all
buster1.1.2-3all
bookworm1.2.9-2 (contrib)all
bullseye1.2.5-1 (contrib)all
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free, but needs non-free components
Git

This package installs the command line tools of the bcbio-nextgen toolkit implementing best-practice pipelines for fully automated high throughput sequencing analysis.

A high-level configuration file specifies inputs and analysis parameters to drive a parallel pipeline that handles distributed execution, idempotent processing restarts and safe transactional steps. The project contributes a shared community resource that handles the data processing component of sequencing analysis, providing researchers with more time to focus on the downstream biology.

This package builds and having it in Debian unstable helps the Debian developers to synchronize their efforts. But unless a series of external dependencies are not installed manually, the functionality of bcbio in Debian is only a shadow of itself. Please use the official distribution of bcbio for the time being, which means "use conda". The TODO file in the Debian directory should give an overview on progress for Debian packaging.

Registry entries: Bio.tools  Bioconda 
blimps-utils
blocks database improved searcher
Versions of package blimps-utils
ReleaseVersionArchitectures
bullseye3.9+ds-1 (non-free)amd64
bookworm3.9+ds-1 (non-free)amd64
jessie3.9-1 (non-free)amd64
stretch3.9-1 (non-free)amd64
buster3.9+ds-1 (non-free)amd64
sid3.9+ds-1 (non-free)amd64
trixie3.9+ds-1 (non-free)amd64
Popcon: 2 users (0 upd.)*
Versions and Archs
License: non-free
Git

BLIMPS (BLocks IMProved Searcher) is a searching tool that scores a protein sequence against blocks or a block against sequences.

This package contains the binaries.

The package is enhanced by the following packages: blimps-examples
Please cite: J. G. Henikoff, S. Pietrokovski, C. M. McCallum and S. Henikoff: Blocks-based methods for detecting protein homology. (PubMed,eprint) Electrophoresis 21(9):1700-6 (2000)
caftools
maintenance of DNA sequence assemblies
Maintainer: Steffen Moeller
Versions of package caftools
ReleaseVersionArchitectures
bullseye2.0.3-1 (non-free)amd64
Popcon: users ( upd.)*
Versions and Archs
License: non-free
Git

This package contains code from different authors that allow sequence assemblies to be converted into formats such as CAF (Common Assembly Format) or GAP4.

CAF is a text format for describing sequence assemblies. It is acedb-compliant and is an extension of the ace-file format used earlier, but with support for base quality measures and a more extensive description of the Sequence data. CAF was designed during the Sanger sequencing era. Its modern-day successor is the SAM format, or its binary equivalents BAM and CRAM.

Please cite: Simon Dear, Richard Durbin, LaDeana Hillier, Gabor Marth, Jean Thierry-Mieg and and Richard Mott: Sequence assembly with CAFTOOLS. (PubMed,eprint) Genome research 8(3):260-267 (1998)
Registry entries: Bio.tools 
cluster3
Reimplementation of the Eisen-clustering software
Versions of package cluster3
ReleaseVersionArchitectures
bullseye1.59+ds-3 (non-free)amd64
sid1.59+ds-5 (non-free)amd64
jessie1.52a-1 (non-free)amd64
stretch1.52a-1 (non-free)amd64
buster1.57-1 (non-free)amd64
trixie1.59+ds-5 (non-free)amd64
bookworm1.59+ds-5 (non-free)amd64
Popcon: 2 users (0 upd.)*
Versions and Archs
License: non-free
Git

The open source clustering software available here contains clustering routines that can be used to analyze gene expression data. Routines for hierarchical (pairwise simple, complete, average, and centroid linkage) clustering, k-means and k-medians clustering, and 2D self-organizing maps are included. The routines are available in the form of a C clustering library, an extension module to Python, a module to Perl, as well as an enhanced version of Cluster, which was originally developed by Michael Eisen of Berkeley Lab. The C clustering library and the associated extension module for Python was released under the Python license. The Perl module was released under the Artistic License. Cluster 3.0 is covered by the original Cluster/TreeView license.

This package only contains the command line and motif gui versions of Cluster 3.0.

Please cite: M. J. L. de Hoon, S. Imoto, J. Nolan and S. Miyano: Open Source Clustering Software. (PubMed,eprint) Bioinformatics 20(9):1453-1454 (2004)
cufflinks
Transcript assembly, differential expression and regulation for RNA-Seq
Versions of package cufflinks
ReleaseVersionArchitectures
trixie2.2.1+dfsg.1-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid2.2.1+dfsg.1-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.2.1+dfsg.1-3 (non-free)amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.2.1+dfsg.1-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.2.1-3 (non-free)amd64
jessie2.2.1-1 (non-free)amd64
bullseye2.2.1+dfsg.1-8 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (0 upd.)*
Versions and Archs
License: non-free
Git

Cufflinks assembles transcripts, estimates their abundances, and tests for differential expression and regulation in RNA-Seq samples. It accepts aligned RNA-Seq reads and assembles the alignments into a parsimonious set of transcripts. Cufflinks then estimates the relative abundances of these transcripts based on how many reads support each one.

This package provides the binary of cufflinks and associated tools, i.e. compress_gtf, cuffcompare, cuffdiff, cuffmerge, cuffnorm, cuffquant and gtf_to_sam.

Please cite: Cole Trapnell, Brian A Williams, Geo Pertea, Ali Mortazavi, Gordon Kwan, Marijke J van Baren, Steven L Salzberg, Barbara J Wold and Lior Pachter: Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. (PubMed) Nature Biotechnology 28(5):511-515 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
embassy-phylip
EMBOSS conversions of the programs in the phylip package
Versions of package embassy-phylip
ReleaseVersionArchitectures
stretch3.69.660-1 (non-free)amd64
buster3.69.660-3 (non-free)amd64
jessie3.69.650-2 (non-free)amd64
Popcon: 0 users (0 upd.)*
Versions and Archs
License: non-free
Git

This package is the adaptation of the PHYLIP package in which its programs can operate with the biological sequence formats and databases of the European Molecular Biology Open Software Suite (EMBOSS). The software packages adapted for EMBOSS are called EMBASSY.

PHYLIP (the PHYLogeny Inference Package) is a package of programs for inferring phylogenies (evolutionary trees). Methods that are available in the package include parsimony, distance matrix, and likelihood methods, including bootstrapping and consensus trees. Data types that can be handled include molecular sequences, gene frequencies, restriction sites and fragments, distance matrices, and discrete characters.

The EMBASSY PHYLIP programs all have the prefix "f" to distinguish them from the original programs and avoid namespace conflict.

raccoon
preparation of in silico drug screening projects
Versions of package raccoon
ReleaseVersionArchitectures
jessie1.0b-1 (contrib)all
Popcon: users ( upd.)*
Versions and Archs
License: DFSG free, but needs non-free components
Svn

The field of computational biology is all about modeling physiochemical entities. Structural biology is about how those entities look in 3D and behave. And we have a drug when we can change that behaviour in a way that we want it to be changed - and only that behaviour.

Some good part of the characterisation of promising drug-like compounds for their interaction with a larger protein can be done on computers. This package helps with getting collections of small ligands prepared to be fitted against a particular protein of known structure. That docking itself is then to be performed by autodock or autodock-vina.

Raccoon may not find the drug, but it may well find a lead to it. To have this package with Debian shall help smaller biochemistry labs and grants an opportunity for the general public to educate itself and/or actively join in to help the world .... just a bit.

Please cite: Sandro Cosconati, Stefano Forli, Alex L. Perryman, Rodney Harris, David S. Goodsell and Arthur J. Olson: Virtual screening with AutoDock: theory and practice. (PubMed,eprint) Expert Opinion on Drug Discovery 5(6):597–607 (2010)
relion-cuda
parallel toolkit for 3D reconstructions in cryo-electron microscopy
Versions of package relion-cuda
ReleaseVersionArchitectures
sid3.1.3-2 (contrib)amd64
bullseye3.1.0-2 (contrib)amd64
bookworm3.1.3-2 (contrib)amd64
upstream4.0.1
Popcon: 1 users (0 upd.)*
Newer upstream!
License: DFSG free, but needs non-free components
Git

RELION (for REgularised LIkelihood OptimisatioN) is a stand-alone computer program for Maximum A Posteriori refinement of (multiple) 3D reconstructions or 2D class averages in cryo-electron microscopy.

RELION provides a GUI, several command-line tools in parallel (MPI) and serial versions, optionally with CUDA/GPU support.

relion-cuda provides the serial and parallel (MPI) command-line tools with CUDA/GPU support.

relion-gui-cuda
toolkit for 3D reconstructions in cryo-electron microscopy (gui apps)
Versions of package relion-gui-cuda
ReleaseVersionArchitectures
sid3.1.3-2 (contrib)amd64
bookworm3.1.3-2 (contrib)amd64
bullseye3.1.0-2 (contrib)amd64
upstream4.0.1
Popcon: 1 users (0 upd.)*
Newer upstream!
License: DFSG free, but needs non-free components
Git

RELION (for REgularised LIkelihood OptimisatioN) is a stand-alone computer program for Maximum A Posteriori refinement of (multiple) 3D reconstructions or 2D class averages in cryo-electron microscopy.

RELION provides a GUI, several command-line tools in parallel (MPI) and serial versions, optionally with CUDA/GPU support.

relion-gui-cuda provides the graphical user interface with CUDA/GPU support.

seq-gen
simulate the evolution of nucleotide or amino acid sequences
Versions of package seq-gen
ReleaseVersionArchitectures
jessie1.3.3-1 (non-free)amd64,armel,armhf,i386
sid1.3.4-2 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.3.4-2 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch1.3.3-1 (non-free)amd64,armel,armhf,i386,mips,mipsel,s390x
bookworm1.3.4-2 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.3.4-2 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.3.4-2 (non-free)amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package seq-gen:
roleprogram
Popcon: 2 users (0 upd.)*
Versions and Archs
License: non-free
Git

Seq-Gen is a program that will simulate the evolution of nucleotide or amino acid sequences along a phylogeny, using common models of the substitution process. A range of models of molecular evolution are implemented including the general reversible model. State frequencies and other parameters of the model may be given and site-specific rate heterogeneity may also be incorporated in a number of ways. Any number of trees may be read in and the program will produce any number of data sets for each tree. Thus large sets of replicate simulations can be easily created. It has been designed to be a general purpose simulator that incorporates most of the commonly used (and computationally tractable) models of molecular sequence evolution.

Please cite: A. Rambaut and N. C. Grassly: Seq-Gen: An application for the Monte Carlo simulation of DNA sequence evolution along phylogenetic trees. (PubMed,eprint) Comput. Appl. Biosci. 13(3):235-238 (1997)
Registry entries: SciCrunch  Bioconda 
seqcluster
analysis of small RNA in NGS data
Versions of package seqcluster
ReleaseVersionArchitectures
bookworm1.2.9+ds-3 (contrib)all
sid1.2.9+ds-3 (contrib)all
bullseye1.2.7+ds-1 (contrib)all
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free, but needs non-free components
Git

Seqcluster investigates small RNA sequences of all sorts in RNA sequencing data. This is especially helpful for the identification of RNA that is neither coding nor belonging to the already well-established group of miRNA, towards many tools feel constrained to.

Please cite: Lorena Pantano, Marc R. Friedländer, Georgia Escaramís, Esther Lizano, Joan Pallarès-Albanell, Isidre Ferrer, Xavier Estivill and Eulàlia Martí: Specific small-RNA signatures in the amygdala at premotor and motor stages of Parkinson's disease revealed by deep sequencing analysis. (PubMed) Bioinformatics (2015)
Registry entries: Bio.tools 
sift
predicts if a substitution in a protein has a phenotypic effect
Versions of package sift
ReleaseVersionArchitectures
sid4.0.3b-6 (non-free)amd64
jessie4.0.3b-4 (non-free)amd64
stretch4.0.3b-4 (non-free)amd64
buster4.0.3b-6 (non-free)amd64
bullseye4.0.3b-6 (non-free)amd64
bookworm4.0.3b-6 (non-free)amd64
trixie4.0.3b-6 (non-free)amd64
Popcon: 2 users (0 upd.)*
Versions and Archs
License: non-free
Git

SIFT is a sequence homology-based tool that sorts intolerant from tolerant amino acid substitutions and predicts whether an amino acid substitution in a protein will have a phenotypic effect. SIFT is based on the premise that protein evolution is correlated with protein function. Positions important for function should be conserved in an alignment of the protein family, whereas unimportant positions should appear diverse in an alignment.

Please cite: Prateek Kumar, Steven Henikoff and Pauline C Ng: Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. (PubMed,eprint) Nature Protocols 4(7):1073-81 (2009)
Registry entries: Bio.tools  SciCrunch 
solvate
arranges water molecules around protein structures
Versions of package solvate
ReleaseVersionArchitectures
buster1.0-2 (non-free)amd64
sid1.0-3 (non-free)amd64
trixie1.0-3 (non-free)amd64
bookworm1.0-3 (non-free)amd64
bullseye1.0-3 (non-free)amd64
Popcon: 1 users (0 upd.)*
Versions and Archs
License: non-free
Git

For molecular dynamics simulations it is sometimes appropriate not to model in the vacuum but to have the proteins surrounded by their solvent. This program computes the location of water molecules such that the resulting PDB files become suitable for further analyses.

trnascan-se
detection of transfer RNA genes in genomic sequence
Versions of package trnascan-se
ReleaseVersionArchitectures
bookworm2.0.10+ds-1 (non-free)amd64,i386
trixie2.0.12+ds-1 (non-free)amd64,arm64,i386
buster2.0.0-3 (non-free)amd64
bullseye2.0.7+ds-1 (non-free)amd64,i386
sid2.0.12+ds-1 (non-free)amd64,arm64,i386
Popcon: 1 users (0 upd.)*
Versions and Archs
License: non-free
Git

tRNAscan-SE identifies 99-100% of transfer RNA genes in DNA sequence while giving less than one false positive per 15 gigabases. Two previously described tRNA detection programs are used as fast, first-pass prefilters to identify candidate tRNAs, which are then analyzed by a highly selective tRNA covariance model. This work represents a practical application of RNA covariance models, which are general, probabilistic secondary structure profiles based on stochastic context-free grammars. tRNAscan-SE searches at ~ 30 000 bp/s. Additional extensions to tRNAscan-SE detect unusual tRNA homologues such as selenocysteine tRNAs, tRNA-derived repetitive elements and tRNA pseudogenes.

Please cite: Todd M Lowe and Sean R Eddy: tRNAscan-SE: A program for improved detection of transfer RNA genes in genomic sequence. (PubMed,eprint) Nucleic Acids Research 25(5):955-964 (1997)
Registry entries: Bio.tools  SciCrunch  Bioconda 
varscan
variant detection in next-generation sequencing data
Versions of package varscan
ReleaseVersionArchitectures
trixie2.4.3+dfsg-4 (non-free)amd64
stretch2.4.3+dfsg-1 (non-free)amd64
buster2.4.3+dfsg-3 (non-free)amd64
bullseye2.4.3+dfsg-3 (non-free)amd64
bookworm2.4.3+dfsg-4 (non-free)amd64
jessie2.3.7+dfsg-1 (non-free)amd64
sid2.4.3+dfsg-4 (non-free)amd64
Popcon: 1 users (0 upd.)*
Versions and Archs
License: non-free
Git

Variant detection in massively parallel sequencing. For one sample, calls SNPs, indels, and consensus genotypes. For tumor-normal pairs, further classifies each variant as Germline, Somatic, or LOH, and also detects somatic copy number changes.

Please cite: Daniel C. Koboldt, Qunyuan Zhang, David E. Larson, Dong Shen, Michael D. McLellan, Ling Lin, Christopher A. Miller, Elaine R. Mardis, Li Ding and Richard K. Wilson: VarScan 2: somatic mutation and copy number alteration discovery in cancer by exome sequencing". (PubMed,eprint) Genome Res. 22(3):568-576 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
vdjtools
framework for post-analysis of B/T cell repertoires
Versions of package vdjtools
ReleaseVersionArchitectures
bookworm1.2.1+git20190311+repack-1 (non-free)all
sid1.2.1+git20190311+repack-2 (non-free)all
trixie1.2.1+git20190311+repack-2 (non-free)all
bullseye1.2.1+git20190311-5 (non-free)all
Popcon: 1 users (0 upd.)*
Versions and Archs
License: non-free
Git

VDJtools is an open-source Java/Groovy-based framework designed to facilitate analysis of immune repertoire sequencing (RepSeq) data. VDJtools computes a wide set of statistics and is able to perform various forms of cross-sample analysis. Both comprehensive tabular output and publication-ready plots are provided.

The main aims of the VDJtools Project are:

  • To ensure consistency between post-analysis methods and results
  • To save the time of bioinformaticians analyzing RepSeq data
  • To create an API framework facilitating development of new RepSeq analysis applications
  • To provide a simple enough command line tool so it could be used by immunologists and biologists with little computational background
Please cite: M Shugay, D.V. Bagaev, M.A. Turchaninova, D.A. Bolotin, O.V. Britanova, E.V. Putintseva, M.V. Pogorelyy, V.I. Nazarov VI, I.V. Zvyagin, V.I. Kirgizova, K.I. Kirgizov, E.V. Skorobogatova and D.M. Chudakov: VDJtools: Unifying Post-analysis of T Cell Receptor Repertoires. (PubMed,eprint) PLoS Comput Biol. 11(11):e1004503 (2015)
vienna-rna
RNA sequence analysis
Versions of package vienna-rna
ReleaseVersionArchitectures
bookworm2.5.1+dfsg-1 (non-free)amd64,arm64,mips64el,ppc64el,s390x
bullseye2.4.17+dfsg-2 (non-free)amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
trixie2.5.1+dfsg-1 (non-free)amd64,arm64,mips64el,ppc64el,s390x
sid2.5.1+dfsg-1 (non-free)amd64,arm64,mips64el,ppc64el,riscv64,s390x
upstream2.6.4
Popcon: 2 users (0 upd.)*
Newer upstream!
License: non-free
Git

The Vienna RNA Package consists of a C code library and several stand-alone programs for the prediction and comparison of RNA secondary structures. It is developed and maintained by the group of Ivo Hofacker in Vienna.

RNA secondary structure prediction through energy minimization is the most used function in the package. It provides three kinds of dynamic programming algorithms for structure prediction:

  • the minimum free energy algorithm of (Zuker & Stiegler 1981) which yields a single optimal structure,
  • the partition function algorithm of (McCaskill 1990) which calculates base pair probabilities in the thermodynamic ensemble, and the suboptimal folding algorithm of (Wuchty et.al 1999) which generates all suboptimal structures within a given energy range of the optimal energy.

For secondary structure comparison, the package contains several measures of distance (dissimilarities) using either string alignment or tree-editing (Shapiro & Zhang 1990). Finally, is provided an algorithm to design sequences with a predefined structure (inverse folding). The RNAforester package is a tool for aligning RNA secondary structures and it's user interface integrates to those of the tools of the Vienna RNA package.

Please cite: Ronny Lorenz, Stephan H. Bernhart, Christian Höner zu Siederdissen, Hakim Tafer, Christoph Flamm, Peter F. Stadler and Ivo L. Hofacker: ViennaRNA Package 2.0. (eprint) Algorithms for Molecular Biology 6(1):26 (2011)
Registry entries: Bio.tools  SciCrunch 

Packaging has started and developers might try the packaging code in VCS

acacia
Error-corrector for pyrosequenced amplicon reads.
Versions of package acacia
ReleaseVersionArchitectures
VCS1.53-0biolinux3all
Versions and Archs
License: GPL-3
Debian package not available
Git
Version: 1.53-0biolinux3

Acacia is a java program developed to quickly and conservatively correct errors, whilst simultaneously de-replicating, amplicon sequences.

The main purpose of Acacia is to correct the over-call, under-call errors prevalent in Roche 454 GS-FLX data, and more recently, with the Titanium chemistry. Acacia will only ectively correct errors in amplicons - as it assumes that the 5' end of the sequences start at the same position, the MID, followed by the primer. Acacia uses empirically-derived models to identify homopolymer regions where there are more `errors' than expected by chance - these imply that the differences are due to population differences rather than error-induced polymorphisms.

Nat Methods. 2012 Apr 27;9(5):425-6. doi: 10.1038/nmeth.1990. Fast, accurate error-correction of amplicon pyrosequences using Acacia. Bragg L, Stone G, Imelfort M, Hugenholtz P, Tyson GW.

Please cite: Lauren Bragg, Glenn Stone, Michael Imelfort, Philip Hugenholtz and Gene W. Tyson: Fast, accurate error-correction of amplicon pyrosequences using Acacia. (PubMed) Nature Methods 9(5):425-426 (2012)
Registry entries: SciCrunch 
agat
another GFF analysis toolkit
Versions of package agat
ReleaseVersionArchitectures
VCS0.5.0-1all
Versions and Archs
License: GPL-3
Debian package not available
Git
Version: 0.5.0-1

Suite of tools to handle gene annotations in any GTF/GFF format.

It has the power to check, fix, pad missing information of any kind of gtf and gff to create complete, sorted and standardised gff3 format.

Registry entries: Bioconda 
amos-assembler
modular whole genome assembler
Versions of package amos-assembler
ReleaseVersionArchitectures
VCS3.1.0-1all
Versions and Archs
License: Artistic
Debian package not available
Git
Version: 3.1.0-1

The AMOS consortium is committed to the development of open-source whole genome assembly software. The project acronym (AMOS) represents our primary goal - to produce A Modular, Open-Source whole genome assembler. Open-source so that everyone is welcome to contribute and help build outstanding assembly tools, and modular in nature so that new contributions can be easily inserted into an existing assembly pipeline. This modular design will foster the development of new assembly algorithms and allow the AMOS project to continually grow and improve in hopes of eventually becoming a widely accepted and deployed assembly infrastructure. In this sense, AMOS is both a design philosophy and a software system.

Please cite: Michael C. Schatz, Adam M. Phillippy, Daniel D. Sommer, Arthur L. Delcher, Daniela Puiu, Giuseppe Narzisi, Steven L. Salzberg and Mihai Pop: Hawkeye and AMOS: visualizing and assessing the quality of genome assemblies. (PubMed,eprint) Briefings in Bioinformatics (2011)
Registry entries: Bio.tools  SciCrunch 
apollo
genome annotation viewer and editor
Versions of package apollo
ReleaseVersionArchitectures
VCS2.3.1-1all
Versions and Archs
License: Artistic
Debian package not available
Git
Version: 2.3.1-1

Apollo is a genome annotation viewer and editor. It was developed as a collaboration between the Berkeley Drosophila Genome Project (part of the FlyBase consortium) and The Sanger Institute in Cambridge, UK. Apollo allows researchers to explore genomic annotations at many levels of detail, and to perform expert annotation curation, all in a graphical environment. It was used by the FlyBase biologists to construct the Release 3 annotations on the finished Drosophila melanogaster genome, and is also a primary vehicle for sharing these annotations with the community. The Generic Model Organism Database (GMOD) project, which aims to provide a complete ready-to-use toolkit for analyzing whole genomes, has adopted Apollo as its annotation workbench.

Please cite: Susanna E. Lewis, Steve M. J. Searle, Naomi Harris, M. Gibson, V Lyer, J. Richter, C. Wiel, L. Bayraktaroglir, Ewan Birney, M. A. Crosby, J. S. Kaminker, B. B. Matthews, S. E. Prochnik, C. D. Smithy, J. L. Tupy, G. M. Rubin, S. Misra, Chris J. Mungall and Michelle E. Clamp: Apollo: a sequence annotation editor. (PubMed,eprint) Genome Biology 3(12):research0082-0082.14 (2002)
Registry entries: Bio.tools  SciCrunch 
arvados
managing and analyzing biomedical big data
Versions of package arvados
ReleaseVersionArchitectures
VCS2.0.3-1all
Versions and Archs
License: Apache-2.0 #FIXME
Debian package not available
Git
Version: 2.0.3-1

Arvados is an open source platform for managing, processing, and sharing genomic and other large scientific and biomedical data. With Arvados, bioinformaticians run and scale compute-intensive workflows, developers create biomedical applications, and IT administrators manage large compute and storage resources.

axparafit
optimized statistical analysis of host-parasite coevolution
Versions of package axparafit
ReleaseVersionArchitectures
VCS1.0-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 1.0-1

AxParafit is a highly optimized version of Pierre Legendre's Parafit program for statistical analysis of host-parasite coevolution. AxParafit has been parallelized with MPI (Message Passing Interface) for compute clusters and was used to carry out the largest co-evolutionary analysis to date for the paper describing the software.

axpcoords
highly optimized and parallelized porting of pcoords
Versions of package axpcoords
ReleaseVersionArchitectures
VCS1.0-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 1.0-1

AxPcoords is an highly optimized versions of Pierre Legendre's DistPCoA program for statistical analysis of host-parasite coevolution.

AxPcoords is a fast, LAPACK-based implementation of DistPCoA (see http://www.bio.umontreal.ca/Casgrain/en/labo/distpcoa.html) which is another program by Pierre Legendre, it conducts a principal coordinates analysis. This program is required for the pipeline that conducts a full host-parasite co-phylogenetic analysis in combination with AxParafit.

bagpipe
genomewide LD mapping
Versions of package bagpipe
ReleaseVersionArchitectures
VCS2012.02.15-1all
Versions and Archs
License: GPL3+
Debian package not available
Git
Version: 2012.02.15-1

Bagpipe is a program for performing genomewide linkage disequilibrium mapping of quantitative trait loci in populations whose genome structure can be accommodated in the HAPPY framework [Mott00]. This includes most diploid crosses where the founders of the individuals have known genotypes.

  • Bagpipe is a simplified and streamlined version of Bagphenotype that does not currently include resample model averaging (RMA) capabilities.
  • Bagpipe can help fit single locus regression models (with or without random effects) to marker intervals whose genetic ancestry is inferred using the HAPPY software.
  • Bagpipe cannot help you decide what is a sensible model to fit.
  • Bagpipe does not currently accommodate populations with significant population structure, except through the specification of simple random intercepts based on unpatterned covariance matrices.
  • Bagpipe is named after the Scottish wind instrument "the bagpipes" and after Bagphenotype, which in turn was a PIPEline for BAGging-based multiple QTL analysis of phenoTYPEs. Bagphenotype was in turn based on software written by Richard Mott and William Valdar to analyze heterogeneous stock mice in [Valdar06].
  • Bagpipe is experimental software, is provided free of charge subject to copyleft restrictions, and comes with no guarantees whatsoever.
Please cite: Richard Mott, Christopher J. Talbot, Maria G. Turri, Allan C. Collins and Jonathan Flint: A method for fine mapping quantitative trait loci in outbred animal stocks. (PubMed) Proc Natl Acad Sci U S A. 97(23):12649-54 (200)
bax2bam
Convert legacy PacBio Bax.H5, Bas.H5, and Ccs.H5 files to the new PacBio BAM format
Versions of package bax2bam
ReleaseVersionArchitectures
VCS0.0.9-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 0.0.9-1

The program bax2bam converts the legacy PacBio basecall format (bax.h5) into the BAM basecall format.

biceps
error-tolerant peptide identification
Versions of package biceps
ReleaseVersionArchitectures
VCS0.0.201401-1all
Versions and Archs
License: BSDlike
Debian package not available
Git
Version: 0.0.201401-1

BICEPS is tool for the error-tolerant identification of peptides based on a statistical regularization scheme. It balances possible improvements in peptide-spectrum-matches by allowing substitutions against the increased risk of false positives. BICEPS can identify peptides containing two or more substitutions as occuring e.g. in cross-species searches.

Please cite: Bernhard Y. Renard‡and Buote Xu, Marc Kirchner, Franziska Zickmann‡and Dominic Winter, Simone Korten‡and Norbert W. Brattig‡and Amit Tzur, Fred A. Hamprecht and Hanno Steen: Overcoming Species Boundaries in Peptide Identification with Bayesian Information Criterion-driven Error-tolerant Peptide Search (BICEPS). (PubMed,eprint) Mol Cell Proteomics ;11(7):M111.014167 (2012)
Remark of Debian Med team: Mentioned at http://www.renard.it/, developed in RKI
bigsdb
Bacterial Isolate Genome Sequence Database
Versions of package bigsdb
ReleaseVersionArchitectures
VCS1.18.1-1all
Versions and Archs
License: GPL2+
Debian package not available
Git
Version: 1.18.1-1

The Bacterial Isolate Genome Sequence Database (BIGSdb) is a scalable, web-accessible database system designed to store and analyse linked phenotypic and genotypic information in a computationally efficient manner. Sequence data can range from single sequence reads to multiple contigs generated by whole genome sequencing technologies. The system incorporates the capacity to define and identify any number of loci and genetic variants at those loci within the stored nucleotide sequences. These loci can be further organised into schemes for isolate characterisation or for evolutionary or functional analyses.

Please cite: Keith A. Jolley and Martin C.J. Maiden: BIGSdb: Scalable analysis of bacterial genome variation at the population level. (PubMed,eprint) BMC Bioinformatics 11:595 (2010)
bismark
bisulfite read mapper and methylation caller
Versions of package bismark
ReleaseVersionArchitectures
VCS0.22.3-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 0.22.3-1

Bismark is a program to map bisulfite treated sequencing reads to a genome of interest and perform methylation calls in a single step. The output can be easily imported into a genome viewer, such as SeqMonk, and enables a researcher to analyse the methylation levels of their samples straight away. It's main features are:

  • Bisulfite mapping and methylation calling in one single step
  • Supports single-end and paired-end read alignments
  • Supports ungapped and gapped alignments
  • Alignment seed length, number of mismatches etc. are adjustable
  • Output discriminates between cytosine methylation in CpG, CHG and CHH context
Please cite: Felix Krueger and Simon R. Andrews: Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. (PubMed,eprint) Bioinformatics 27(11):1571-1572 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
blat
BLAST-Like Alignment Tool
Versions of package blat
ReleaseVersionArchitectures
VCS35-1all
Versions and Archs
License: FreeForScientificUse
Debian package not available
Git
Version: 35-1

BLAT on DNA is designed to quickly find sequences of 95% and greater similarity of length 25 bases or more. It may miss more divergent or shorter sequence alignments. It will find perfect sequence matches of 25 bases, and sometimes find them down to 20 bases. BLAT on proteins finds sequences of 80% and greater similarity of length 20 amino acids or more. In practice DNA BLAT works well on primates, and protein blat on land vertebrates.

BLAT is not BLAST. DNA BLAT works by keeping an index of the entire genome in memory. The index consists of all non-overlapping 11-mers except for those heavily involved in repeats. The index takes up a bit less than a gigabyte of RAM. The genome itself is not kept in memory, allowing BLAT to deliver high performance on a reasonably priced Linux box. The index is used to find areas of probable homology, which are then loaded into memory for a detailed alignment. Protein BLAT works in a similar manner, except with 4-mers rather than 11-mers. The protein index takes a little more than 2 gigabytes.

Please cite: W. Jim Kent: BLAT--the BLAST-like alignment tool. (PubMed,eprint) Genome Research 12(4):656-64 (2002)
Registry entries: Bio.tools  SciCrunch 
blobology
tool set for the visualisation of genome assemblies
Versions of package blobology
ReleaseVersionArchitectures
VCS0.0+20151216-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 0.0+20151216-1

Tools for making blobplots or Taxon-Annotated-GC-Coverage plots (TAGC plots) to visualise the contents of genome assembly data sets as a QC step.

blobtools consist of a series of tools that can be used to

  • collate information associated with an assembly file, such as:
    • sequence ID
    • sequence length
    • GC-content
    • coverage information
    • taxonomy information (sequence similarity search hits)
    • user-defined categories
  • visualise information using blobplots, covplots and/or readcovplots.
  • extract information into human- and computer-readable files
  • produce paper-ready figures
Please cite: Sujai Kumar, Martin Jones, Georgios Koutsovoulos, Michael Clarke and Mark Blaxter: Blobology: exploring raw genome data for contaminants, symbionts, and parasites using taxon-annotated GC-coverage plots. (PubMed,eprint) frontiers in Genetics 4:237 (2013)
braker
annotating protein coding genes in genomes.
Versions of package braker
ReleaseVersionArchitectures
VCS2.1.2+dfsg-1all
Versions and Archs
License: Artistic-1.0
Debian package not available
Git
Version: 2.1.2+dfsg-1

Genomic DNA controls the behaviour of biological cells. Understanding it, and its variations, facilitates the molecular pathology of diseases. braker.pl can either run with a genome sequence, only; or with additional alignments for short transcriptome reads against the genome; or with additional protein sequences of closely related species; or with evidence from the alignment of protein sequences of distantly related species. The package provides the means to interpret genomic sequences in FASTA format from fungi, plants and animals.

Please cite: Katharina J. Hoff, Simone Lange, Alexandre Lomsadze, Mark Borodovsky and Mario Stanke: BRAKER1: Unsupervised RNA-Seq-Based Genome Annotation with GeneMark-ET and AUGUSTUS.. (PubMed,eprint) Bioinformatics. 32(5):767-769 (2016)
Registry entries: Bio.tools 
card-rgi
analysis of genome sequences using the Resistance Gene Identifier
Versions of package card-rgi
ReleaseVersionArchitectures
VCS4.2.2-1all
Versions and Archs
License: non-free
Debian package not available
Git
Version: 4.2.2-1

The Comprehensive Antibiotic Resistance Database ("CARD") provides data, models, and algorithms relating to the molecular basis of antimicrobial resistance. The CARD provides curated reference sequences and SNPs organized via the Antibiotic Resistance Ontology ("ARO"). These data can be browsed on the website or downloaded in a number of formats. These data are additionally associated with detection models, in the form of curated homology cut-offs and SNP maps, for prediction of resistome from molecular sequences. These models can be downloaded or can be used for analysis of genome sequences using the Resistance Gene Identifier ("RGI"), either online or as a stand-alone tool.

Please cite: Baofeng Jia, Amogelang R. Raphenya, Brian Alcock, Nicholas Waglechner, Peiyao Guo, Kara K. Tsang, Briony A. Lago, Biren M. Dave, Sheldon Pereira, Arjun N. Sharma, Sachin Doshi, Mélanie Courtot, Raymond Lo, Laura E. Williams, Jonathan G. Frye, Tariq Elsayegh, Daim Sardar, Erin L. Westman, Andrew C. Pawlowski, Timothy A. Johnson, Fiona S.L. Brinkman, Gerard D. Wright and Andrew G. McArthur: CARD 2017: expansion and model-centric curation of the comprehensive antibiotic resistance database. (PubMed,eprint) Nucleic Acids Research 45(D1):D566-D573 (2017)
cellprofiler
quantitatively measure phenotypes from images automatically
Versions of package cellprofiler
ReleaseVersionArchitectures
VCS3.0.0-1all
Versions and Archs
License: GPL-2
Debian package not available
Git
Version: 3.0.0-1

CellProfiler is cell image analysis software designed to enable biologists without training in computer vision or programming to quantitatively measure phenotypes from thousands of images automatically.

cinema
multi-sequence alignment editor and viewer
Versions of package cinema
ReleaseVersionArchitectures
VCS3.0.23-1all
Versions and Archs
License: LGPL
Debian package not available
Git
Version: 3.0.23-1

It has been designed to be as extensible as possible. Notes of this extensibility can be found in "EXTENDING_CINEMA", and the "cinema-module" sub-directory.

Cinema currently has limited support for various sequence formats, although its easy to add new ones. A large number of alignments in the appropriate format can be found as part of the align compendium at

condetri
straight-forward trimming of FASTQ sequences
Versions of package condetri
ReleaseVersionArchitectures
VCS2.3-1all
Versions and Archs
License: <license>
Debian package not available
Git
Version: 2.3-1

This package is a simplistic contribution to the wealth of tools for trimming of sequences of current Next-Generation-Sequencing data. It was developed in the context of de novo whole-genome assembly.

The tool reads from the 3'-end and extract reads (or read pairs) of good quality. If the reads are paired, the filtering is done pairwise, and if one read in a pair has low quality, the remaining read is saved as single end.

Please cite: Linnéa Smeds and Axel Künstner: ConDeTri - A Concent Dependent Read Trimmer for Illumina Data. (PubMed,eprint) PLoS ONE 6(10):e26314 (2011)
Registry entries: Bio.tools 
contrafold
CONditional TRAining for RNA Secondary Structure Prediction
Versions of package contrafold
ReleaseVersionArchitectures
VCS2.02-1all
Versions and Archs
License: BSD-3-Clause
Debian package not available
Git
Version: 2.02-1

For several decades, free energy minimization methods have been the dominant strategy for single sequence RNA secondary structure prediction. More recently, stochastic context-free grammars (SCFGs) have emerged as an alternative probabilistic methodology for modeling RNA structure. Unlike physics-based methods, which rely on thousands of experimentally-measured thermodynamic parameters, SCFGs use fully-automated statistical learning algorithms to derive model parameters. Despite this advantage, however, probabilistic methods have not replaced free energy minimization methods as the tool of choice for secondarystructure prediction, as the accuracies of the best current SCFGs have yet to match those of the best physics-based models.

CONTRAfold is a novel secondary structure prediction method based on conditional log-linear models (CLLMs), a flexible class of probabilistic models which generalize upon SCFGs by using discriminative training and feature-rich scoring. By incorporating most of the features found in typical thermodynamic models, CONTRAfold achieves the highest single sequence prediction accuracies to date, outperforming currently available probabilistic and physics-based techniques. Our result thus closes the gap between probabilistic and thermodynamic models, demonstrating that statistical learning procedures provide an effective alternative to empirical measurement of thermodynamic parameters for RNA secondary structure prediction.

Please cite: Chuong B. Do, Daniel A. Woods1 and Serafim Batzoglou: CONTRAfold: RNA secondary structure prediction without physics-based models. (PubMed,eprint) Bioinformatics 22(14):e90-e98 (2006)
coot
model building program for macromolecular crystallography
Versions of package coot
ReleaseVersionArchitectures
VCS1.1.07-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 1.1.07-1

This is a program for constructing atomic models of macromolecules from x-ray diffraction data. Coot displays electron density maps and molecular models and allows model manipulations such as idealization, refinement, manual rotation/translation, rigid-body fitting, ligand search, solvation, mutations, rotamers. Validation tools such as Ramachandran and geometry plots are available to the user. This package provides a Coot build with embedded Python support.

Please cite: P. Emsley, B. Lohkamp, W. G. Scott and K. Cowtan: Features and development of Coot. (eprint) Acta Crystallographica Section D 66(4):486-501 (2010)
covpipe
pipeline to generate consensus sequences from NGS reads
Versions of package covpipe
ReleaseVersionArchitectures
VCS3.0.6-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 3.0.6-1

CovPipe is a pipeline to generate consensus sequences from NGS reads based on a reference sequence. The pipeline is tailored to be used for SARS-CoV-2 data, but may be used for other viruses.

Genomic variants of your NGS data in comparison to a reference will be determined. These variants will be included into the reference and form the consensus sequences. See below for further details on the determined set of consensus sequences.

crossbow
Genotyping from short reads using cloud computing
Versions of package crossbow
ReleaseVersionArchitectures
VCS1.2.0-1all
Versions and Archs
License: Artistic
Debian package not available
Git
Version: 1.2.0-1

Crossbow is a scalable software pipeline for whole genome resequencing analysis. It combines Bowtie, an ultrafast and memory efficient short read aligner, and SoapSNP, an accurate genotyper, within Hadoop to distribute and accelerate the computation with many nodes. The pipeline can accurately analyze over 35x coverage of a human genome in one day on a 10-node local cluster, or in 3 hours for about $100 using a 40-node, 320-core cluster rented from Amazon's EC2 utility computing service.

Please cite: Ben Langmead, Michael C Schatz, Jimmy Lin, Mihai Pop and Steven L Salzberg: Searching for SNPs with cloud computing. (PubMed,eprint) Genome Biology 10:R134 (2009)
Registry entries: Bio.tools  SciCrunch 
crux-toolkit
toolkit for tandem mass spectrometry analysis
Versions of package crux-toolkit
ReleaseVersionArchitectures
VCS3.1-1all
Versions and Archs
License: Apache-2.0
Debian package not available
Git
Version: 3.1-1

The Crux mass spectrometry analysis toolkit is an open source project that aims to provide users with a cross-platform suite of analysis tools for interpreting protein mass spectrometry data. The toolkit includes several search engines for both standard and cross-linked database search, as well as a variety of pre- and post-processing engines for assigning high-resolution precursor masses to spectra, assigning statistical confidence estimates to spectra, peptides and proteins, and performing label free quantification.

Please cite: Sean McIlwain, Kaipo Tamura, Attila Kertesz-Farkas, Charles E. Grant, Benjamin Diament, Barbara Frewen, J. Jeffry Howbert, Michael R. Hoopmann, Lukas Käll, Jimmy K. Eng, Michael J. MacCoss and William Stafford Noble: Crux: rapid open source protein tandem mass spectrometry analysis. (PubMed) 2014 13(10):4488-4491 (Journal of Proteome Research)
Registry entries: Bio.tools  SciCrunch 
cytoscape
visualizing molecular interaction networks
Versions of package cytoscape
ReleaseVersionArchitectures
VCS3.1.0-1all
Versions and Archs
License: LGPL-2.1
Debian package not available
Git
Version: 3.1.0-1

Cytoscape is an open source bioinformatics software platform for visualizing molecular interaction networks and biological pathways and integrating these networks with annotations, gene expression profiles and other state data. Although Cytoscape was originally designed for biological research, now it is a general platform for complex network analysis and visualization. Cytoscape core distribution provides a basic set of features for data integration and visualization.

dazzle
Java-based DAS server
Versions of package dazzle
ReleaseVersionArchitectures
VCS1.01r3643-1all
Versions and Archs
License: LGP-2+
Debian package not available
Git
Version: 1.01r3643-1

Dazzle is a general purpose server for the Distributed Annotation System (DAS) protocol. It is implemented as a Java servlet, using the BioJava APIs. Dazzle is a modular system which uses small "datasource" plugins to provide access to a range of databases. Several general-purpose plugins are included in the package, and it it straightforward to develop new plugins to connect to your own databases.

Information on DAS is available from http://www.biodas.org/

deepbinner
demultiplexing barcoded Oxford Nanopore sequencing reads
Versions of package deepbinner
ReleaseVersionArchitectures
VCS0.2.0-1all
Versions and Archs
License: GPL-3
Debian package not available
Git
Version: 0.2.0-1

Deepbinner is a tool for demultiplexing barcoded Oxford Nanopore sequencing reads. It does this with a deep convolutional neural network classifier, using many of the architectural advances that have proven successful in image classification. Unlike other demultiplexers (e.g. Albacore and Porechop), Deepbinner identifies barcodes from the raw signal (a.k.a. squiggle) which gives it greater sensitivity and fewer unclassified reads.

Reasons to use Deepbinner:

  • To minimise the number of unclassified reads (use Deepbinner by itself).
  • To minimise the number of misclassified reads (use Deepbinner in conjunction with Albacore demultiplexing).
  • You plan on running signal-level downstream analyses, like Nanopolish. Deepbinner can demultiplex the fast5 files which makes this easier. Reasons to not use Deepbinner:
  • You only have basecalled reads not the raw fast5 files (which Deepbinner requires).
  • You have a small/slow computer. Deepbinner is more computationally intensive than Porechop.
  • You used a sequencing/barcoding kit other than the ones Deepbinner was trained on.
Please cite: Ryan R Wick, Louise M Judd and Kathryn E Holt: Deepbinner: Demultiplexing barcoded Oxford Nanopore reads with deep convolutional neural networks. (PubMed,eprint) bioRxiv 14(11):e1006583 (2018)
Registry entries: Bioconda 
dendroscope
analyzing and visualizing rooted phylogenetic trees and networks
Versions of package dendroscope
ReleaseVersionArchitectures
VCS3.0+git20190219.a00d9b9+dfsg-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 3.0+git20190219.a00d9b9+dfsg-1

Dendroscope 3 is a new program for working with rooted phylogenetic trees and networks. It provides a number of methods for drawing and comparing rooted phylogenetic networks, and for computing them from rooted trees. The program can be used interactively or in command-line mode.

Please cite: Daniel H. Huson and Celine Scornavacca: Dendroscope 3: An Interactive Tool for Rooted Phylogenetic Trees and Networks. (PubMed,eprint) Systematic Biology 61(6):1061–1067 (2012)
diann
data-independent acquisition (DIA) proteomics data processing
Versions of package diann
ReleaseVersionArchitectures
VCS1.8+dfsg-1all
Versions and Archs
License: AS-IS
Debian package not available
Git
Version: 1.8+dfsg-1

DIA-NN - a universal software for data-independent acquisition (DIA) proteomics data processing by Demichev, Ralser and Lilley labs. In 2018, DIA-NN opened a new chapter in proteomics, introducing a number of algorithms which enabled reliable, robust and quantitatively accurate large-scale experiments using high-throughput methods.

Please cite: Vadim Demichev, Christoph B. Messner, Spyros I. Vernardis, Kathryn S. Lilley and Markus Ralser: DIA-NN: neural networks and interference correction enable deep proteome coverage in high throughput. (PubMed) Nature Methods 17(1):41-44 (2019)
ecell
Concept and environment for constructing virtual cells on computers
Versions of package ecell
ReleaseVersionArchitectures
VCS3.2.2-1all
Versions and Archs
License: GPL
Debian package not available
Git
Version: 3.2.2-1

The E-Cell Project is an international research project aiming at developing necessary theoretical supports, technologies and software platforms to allow precise whole cell simulation.

The E-Cell System is an object-oriented software suite for modeling, simulation, and analysis of large scale complex systems such as biological cells, architected by Kouichi Takahashi and written by a team of developers.

The core part of the system, E-Cell Simulation Environment version 3, allows many components driven by multiple algorithms with different timescales to coexist.

E-Cell System consists of the following three major parts:

  • E-Cell Simulation Environment (or E-Cell SE)
  • E-Cell Modeling Environment (or E-Cell ME)
  • E-Cell Analysis Toolkit

This package contains all these parts, only the documentation is distributed separately.

ensembl
basic Ensembl genome browser
Versions of package ensembl
ReleaseVersionArchitectures
VCS98+git20190619.e98e194-1all
Versions and Archs
License: free
Git
Version: 98+git20190619.e98e194-1

Ensembl is a joint project of the Sanger Center and the European Bioinformatics Institute, an outstation of the European Molecular Biology Laboratory, (EMBL-EBI) that are sharing a campus in Hinxton near Cambridge, UK. It presents the sequence data for the yet available complete genomes of many vertebrates and is helped by many sister-projects to cover also plants, invertebrates and bacteria.

This package provides a basic installation of Ensembl. It comprises a full copy of the public Ensembl website, minus Blast and SSAHA, and minus BioMart. It uses UniSearch instead of the engine used on the public site for searching by keyword. It connects directly to the public databases hosted by the EBI/Sanger.

This is meant as an easy way to get a basic Ensembl installation working on Debian. It can then be customised to local requirements.

Note that Ensembl has two odd dependencies: bioperl1.2.3 and libparallel-useragent-perl. Those are not required for routine browsing, but the bioperl1.2.3 library performs the parsing of BLAST outputs. Version 1.2.3 is in conflict with any other existing bioperl installation and forces you to effectively downgrade.

libwww-perl5.808 will conflict with the latest libwww-perl installation and thus force a downgrade to 5.808, which will disable many other tools on your system. Therefore it is advisable NOT to install this package in parallel with any other software, and/or use a virtual machine or dedicated machine.

WARNING: Requires internet connection both to install and to run, as it connects to the Sanger/EBI database servers during both installation and at runtime.

Remark of Debian Med team: Ensembl was removed from Debian due #645487

Ensembl used to be in Debian experimental branch but was removed for formal reasons which are explained in http://bugs.debian.org/645487

ensembl-vep
Variant Effect Predictor predicting the functional effects of genomic variants
Versions of package ensembl-vep
ReleaseVersionArchitectures
VCS100.2-1all
Versions and Archs
License: Apache-2.0
Debian package not available
Git
Version: 100.2-1

The Ensembl Variant Effect Predictor predicts the functional effects of genomic variants. It has three components:

  • VEP (Variant Effect Predictor) predicts the functional effects of genomic variants.
  • Haplosaurus uses phased genotype data to predict whole-transcript haplotype sequences.
  • Variant Recoder translates between different variant encodings.
Please cite: William McLaren, Laurent Gil, Sarah E. Hunt, Harpreet Singh Riat, Graham R. S. Ritchie, Anja Thormann, Paul Flicek and Fiona Cunningham: The Ensembl Variant Effect Predictor. (PubMed,eprint) Genome Biology 17(1):122 (2016)
Registry entries: Bioconda 
euler-sr
correcting errors in short gene sequence reads and assembling them
Versions of package euler-sr
ReleaseVersionArchitectures
VCS1.1.2-1all
Versions and Archs
License: non_profit
Debian package not available
Git
Version: 1.1.2-1

The EULER-SR assembly package contains a suite of programs for correcting errors in short reads and assembling them. Our assembler may take as input classical Sanger reads, 454 sequences, and Illumina reads.

Please cite: Mark J. Chaisson and Pavel A. Pevzner: Short read fragment assembly of bacterial genomes. (PubMed,eprint) Genome Research 18(2):324-30 (2008)
Registry entries: SciCrunch 
euler2
de novo repeat classification and fragment assembly
Versions of package euler2
ReleaseVersionArchitectures
VCS2.0-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 2.0-1

Repetitive sequences make up a significant fraction of almost any genome and an important and still open question in bioinformatics is how to represent all repeats in DNA sequences. We propose a radically new approach to repeat classification that is motivated by the fundamental topological notion of quotient spaces. A torus or Klein bottle are examples of quotient spaces that can be obtained from a square by gluing some points. Our new repeat classification algorithm is based on the observation that the alignment-induced quotient space of a DNA sequence compactly represents all sequence repeats. This observation leads to a simple and efficient solution of the repeat classification problem as well as new approaches to fragment assembly and multiple alignment.

Please cite: Pavel A. Pevzner, Haixu Tang and Glenn Tesler: De novo repeat classification and fragment assembly. RECOMB '04 Proceedings of the eighth annual international conference on Research in computational molecular biology :213-222 (2004)
exabayes
bayesian phylogenetic tree inference for large-scale analyses
Versions of package exabayes
ReleaseVersionArchitectures
VCS1.5+dfsg-1all
Versions and Archs
License: <license>
Debian package not available
Git
Version: 1.5+dfsg-1

ExaBayes is a tool for Bayesian phylogenetic analyses. It implements a Markov chain Monte Carlo sampling approach that allows to determine the posterior probability of a tree (resp., topology) and various evolutionary model parameters, for instance, branch lengths or substitution rates. Similar approaches are implemented in beast-mcmc or mrbayes. ExaBayes has heavily drawn inspiration specifically from the latter one.

ExaBayes comes with the most commonly used evolutionary models, such as the generalized time reversible model (GTR) of character substitution, the discretized Gamma-model of among site rate heterogeneity and estimates trees with unconstrained branch lengths. For clocked tree models or less parameter-rich substitution models, we refer you to the established tools.

The distinguishing feature of ExaBayes is its capability to handle enormous datasets efficiently. ExaBayes provides an implementation of data parallelism using the Message Passing Interface (MPI). This means, that if you conduct your analysis on a computing cluster composed of several machines (a.k.a. nodes), the memory needed to evaluate the likelihood of trees and parameters given a large alignment can be spread out across multiple computing nodes. In conclusion, the size of the concatenated alignment ExaBayes can handle is only limited by the combined main memory of your entire computing cluster.

Please cite: Andre J. Aberer, Kassian Kobert and Alexandros Stamatakis: ExaBayes: Massively Parallel Bayesian Tree Inference for the Whole-Genome Era. (PubMed,eprint) Molecular Biology and Evolution 31(10):2553-2556 (2014)
ffp
Feature Frequency Profile Phylogeny
Versions of package ffp
ReleaseVersionArchitectures
VCS3.19-1all
Versions and Archs
License: non-free
Debian package not available
Git
Version: 3.19-1

FFP (Feature frequency profile) is an alignment free comparison tool for phylogenetic analysis and text comparison. It can be applied to nucleotide sequences, complete genomes, proteomes and even used for text comparison.

Please cite: Gregory E. Sims and Sung-Hou Kim: Whole-genome phylogeny of Escherichia coli/Shigella group by feature frequency profiles (FFPs). (PubMed,eprint) Proc Natl Acad Sci U S A. 108(20):8329-34 (2011)
fieldbioinformatics
pipeline with virus identification with Nanopore sequencer
Versions of package fieldbioinformatics
ReleaseVersionArchitectures
VCS1.1.3-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 1.1.3-1

This is the ARTIC bioinformatics pipeline for working with virus sequencing data, sequenced with nanopore. It implements a complete bioinformatics protocol to take the output from the Nanopore sequencer and determine consensus genome sequences. Includes basecalling, de-multiplexing, mapping, polishing and consensus generation.

An outbreak of SARS-CoV-2, Ebola, ... something unknown? This software is field-proven.

Registry entries: Bio.tools  Bioconda 
flappie
flip-flop basecaller for Oxford Nanopore reads
Versions of package flappie
ReleaseVersionArchitectures
VCS2.1.3+ds-1all
Versions and Archs
License: Oxford-Nanopore-PL-1.0
Debian package not available
Git
Version: 2.1.3+ds-1

Basecall Fast5 reads using flip-flop basecalling.

Features

  • Flip-flop basecalling for the MinION platform

  • R9.4.1 (Native or PCR libraries)

  • R10C (PCR libraries only)
  • Basecalling of 5mC in CpG context for R9.4.1, PromethION platform
forester
Graphical vizualiation tool Archaeopteryx
Versions of package forester
ReleaseVersionArchitectures
VCS0.0+20180205-1all
Versions and Archs
License: LGPL 2.1+
Git
Version: 0.0+20180205-1

Archaeopteryx is a software tool for the visualization, analysis, and editing of potentially large and highly annotated phylogenetic trees. It can be used both as applet (ArchaeopteryxA and ArchaeopteryxE) and as a standalone application.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html

BioLinux was following the upstream name change to archaeopteryx and thus the package is called bio-linux-archaeopteryx there.

The binary package is full of JARs without source.

galaxy
scientific workflow and data integration platform for computational biology
Versions of package galaxy
ReleaseVersionArchitectures
VCS16.10-1all
Versions and Archs
License: TODO
Debian package not available
Git
Version: 16.10-1

Galaxy is a scientific workflow, data integration, and data and analysis persistence and publishing platform that aims to make computational biology accessible to research scientists that do not have computer programming or systems administration experience. Although it was initially developed for genomics research, it is largely domain agnostic and is now used as a general bioinformatics workflow management system.

Please cite: Marcel Martin: Cutadapt removes adapter sequences from high-throughput sequencing reads. (eprint) EMBnet.journal 17(1):10-12 (2015)
gatk
The Genome Analysis Toolkit
Versions of package gatk
ReleaseVersionArchitectures
VCS4.2.0.0+dfsg-1all
Versions and Archs
License: Apache-2.0
Debian package not available
Git
Version: 4.2.0.0+dfsg-1

The Genome Analysis Toolkit or GATK is a software package developed at the Broad Institute to analyze high-throughput sequencing data. The toolkit offers a wide variety of tools, with a primary focus on variant discovery and genotyping as well as strong emphasis on data quality assurance. Its robust architecture, powerful processing engine and high-performance computing features make it capable of taking on projects of any size.

Please cite: Aaron McKenna, Matthew Hanna, Eric Banks, Andrey Sivachenko, Kristian Cibulskis, Andrew Kernytsky, Kiran Garimella, David Altshuler, Stacey Gabriel, Mark Daly and Mark A. DePristo: The Genome Analysis Toolkit: A MapReduce framework for analyzing next-generation DNA sequencing data. (PubMed,eprint) Genome Research 20(9):1297-303 (2010)
Registry entries: Bioconda 
gerp++
identifies constrained elements in multiple alignments
Versions of package gerp++
ReleaseVersionArchitectures
VCS2.1-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 2.1-1

GERP is a package for analyzing evolutionary rates and finding constrained elements in a multiple alignment. It uses the notion of "rejected substitutions" (RS) in order to quantify constraint at individual positions as well as over elements spanning multiple positions.

GERP consists of two main components: gerpcol, which analyzes multiple alignments and computes RS scores for all positions, and gerpelem, which finds constrained elements given the RS scores produced by gerpcol.

Please cite: Eugene V. Davydov, David L. Goode, Marina Sirota, Gregory M. Cooper, Arend Sidow and Serafim Batzoglou: Identifying a High Fraction of the Human Genome to be under Selective Constraint Using GERP++. (PubMed,eprint) PLOS Computational Biology 6(12):1-13 (2010)
gramalign
multiple alignment of biological sequences
Versions of package gramalign
ReleaseVersionArchitectures
VCS3.0-1all
Versions and Archs
License: Free-for-adacemia
Debian package not available
Git
Version: 3.0-1

GramAlign is a time-efficient progressive Multiple Sequence Alignment (MSA) algorithm. The novelty of GramAlign comes from the sequence distance estimation step, whereby distances are determined by the natural grammar present in nucleotide and amino acid sequences.

Please cite: D. J. Russell, H. H. Otu and K. Sayood: Grammar-based distance in progressive multiple sequence alignment. (eprint) BMC Bioinformatics 9:306 (2008)
graphbin
refined binning of metagenomic contigs using assembly graphs
Versions of package graphbin
ReleaseVersionArchitectures
VCS1.1-1all
Versions and Archs
License: GPL-2.0+
Debian package not available
Git
Version: 1.1-1

GraphBin is a NGS data-based metagenomic contig bin refinment tool that makes use of the contig connectivity information from the assembly graph to bin contigs. It utilizes the binning result of an existing binning tool and a label propagation algorithm to correct mis-binned contigs and predict the labels of contigs which are discarded due to short length.

Please cite: Vijini Mallawaarachchi, Anuradha Wickramarachchi and Yu Lin: GraphBin: refined binning of metagenomic contigs using assembly graphs. (PubMed) Bioinformatics 36:3307-3313 (2020)
graphmap2
highly sensitive and accurate mapper for long, error-prone reads
Versions of package graphmap2
ReleaseVersionArchitectures
VCS0.6.4-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 0.6.4-1

GraphMap2 is a highly sensitive and accurate mapper for long, error- prone reads. The mapping algorithm is designed to analyse nanopore sequencing reads, which progressively refines candidate alignments to robustly handle potentially high-error rates and a fast graph traversal to align long reads with speed and high precision (>95%). Evaluation on MinION sequencing data sets against short- and long-read mappers indicates that GraphMap increases mapping sensitivity by 10–80% and maps

95% of bases. GraphMap alignments enabled single-nucleotide variant calling on the human genome with increased sensitivity (15%) over the next best mapper, precise detection of structural variants from length 100 bp to 4 kbp, and species and strain-specific identification of pathogens using MinION reads.

Please cite: Ivan Sović, Mile Šikić, Andreas Wilm, Shannon Nicole Fenlon, Swaine Chen and Niranjan Nagarajan: Fast and sensitive mapping of nanopore sequencing reads with GraphMap. (PubMed,eprint) Nature Communications 7(11307) (2016)
Registry entries: Bioconda 
haploview
Analysis and visualization of LD and haplotype maps
Versions of package haploview
ReleaseVersionArchitectures
VCS4.1-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 4.1-1

This tools assists in the analysis of the nucleotide variation in a population. Such investigations are performed to determine genes and genetic pathways that are associated with diseases. This is an early stage in the quest for new drugs.

Please cite: Jeffrey C. Barrett: Haploview: Visualization and analysis of SNP genotype data. (PubMed,eprint) Cold Spring Harb Protoc. 2009(10):pdb.ip71 (2009)
Registry entries: Bio.tools  SciCrunch 
hawkeye
Interactive Visual Analytics Tool for Genome Assemblies
Versions of package hawkeye
ReleaseVersionArchitectures
VCS3.1.0-1all
Versions and Archs
License: Artistic
Debian package not available
Git
Version: 3.1.0-1

Genome assembly remains an inexact science. Even when accomplished with the best software available, the assembly of a genome often contains numerous errors, both small and large. Hawkeye is a visual analytics tool for genome assembly analysis and validation, designed to aid in identifying and correcting assembly errors. Hawkeye blends the best practices from information and scientific visualization to facilitate inspection of large-scale assembly data while minimizing the time needed to detect mis-assemblies and make accurate judgments of assembly quality.

All levels of the assembly data hierarchy are made accessible to users, along with summary statistics and common assembly metrics. A ranking component guides investigation towards likely mis-assemblies or interesting features to support the task at hand. Wherever possible, high-level overviews, dynamic filtering, and automated clustering are leveraged to focus attention and highlight anomalies in the data. Hawkeyes effectiveness has been proven on several genome projects, where it has been used both to improve quality and to validate the correctness of complex genomes.

Hawkeye is compatible with most widely used assemblers, including Phrap, ARACHNE, Celera Assembler, Newbler, AMOS, and assemblies deposited in the NCBI Assembly Archive.

Please cite: Michael C. Schatz, Adam M. Phillippy, Daniel D. Sommer, Arthur L. Delcher, Daniela Puiu, Giuseppe Narzisi, Steven L. Salzberg and Mihai Pop: Hawkeye and AMOS: visualizing and assessing the quality of genome assemblies. (PubMed,eprint) Briefings in Bioinformatics (2011)
Registry entries: Bio.tools  SciCrunch 
htqc
Quality control and filtration for illumina sequencing data
Versions of package htqc
ReleaseVersionArchitectures
VCS1.92.3-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 1.92.3-1

HTQC is a toolkit including statistics tool for illumina high-throughput sequencing data, and filtration tools for sequence quality, length, tail quality, etc..

Please cite: Xi Yang, Di Liu, Fei Liu, Jun Wu, Jing Zou, Xue Xiao, Fangqing Zhao and Baoli Zhu: HTQC: a fast quality control toolkit for Illumina sequencing data. (PubMed,eprint) BMC Bioinformatics 14:33 (2013)
Registry entries: SciCrunch 
idefix
index checking for improved demultiplexing of NGS data
Versions of package idefix
ReleaseVersionArchitectures
VCS1.3-1all
Versions and Archs
License: LGPL-3+
Debian package not available
Git
Version: 1.3-1

IDeFIX is a tool for demultiplexing Illumina NGS data.

It reports inconsistencies between the raw data and the Sample Sheet, checks for duplicates of indices/ index combinations in the latter and removes unwanted characters from it. Apart from messages printed on the terminal, IDeFIX creates an IDeFIX_Report.csv containing the indices/ index combinations from the raw data and their abundance as well as their count in the Sample Sheet and the corresponding Index ID(s). This file is stored in the project folder.

inspect
mass-spectrometry database search tool
Versions of package inspect
ReleaseVersionArchitectures
VCS0.0.20120109-1all
Versions and Archs
License: non-profit
Debian package not available
Git
Version: 0.0.20120109-1

Inspect is a MS/MS database search tool specifically designed to address two crucial needs of the proteomics comminuty: post-translational modification identification and search speed. The program is available as a free download or online in the ProteoSAFe webserver. The online interface is coordinated with other proteomics software developed in the lab, like PepNovo

Typical database searches do not deal well with the dynamic nature of the proteome. Post-translational modifications, alternative splicing, and laboratory chemisty all affect protein behavior and make spectrum interpretation more challenging. The primary challenge is that the "virtual database" of all modified peptides undergoes a combinatorial explosion when a broad range of modifications is allowed. This affects search running time. A secondary challenge is that in this richer database, there are many more close "relatives" for each peptide. This affects scoring accuracy, since differentiating between correct and incorrect identifications is more difficult.

InsPecT addresses several algorithmic problems in order to identify modified proteins.

InsPecT uses peptide sequence tags (PSTs) to filter the database. InsPecT has an internal tag generator, but can accept tags generated by other tools (e.g. Pepnovo, GutenTAG). Because de novo is imperfect, multiple tags are produced for each spectrum, to ensure that (at least) one tag is corrrect. These PSTs are extremely efficient filters, even in the context of up to a dozen possible modifications. Tag-based filtering can also be combined with the "two-pass" filtering pioneered by X!Tandem, where from one search provides a list of proteins (a mini- database) for a more detailed search.

Unanticipated modifications are common in proteomics. InsPecT implements the MS-Alignment algorithm for "blind" spectral search, with no bias toward anticipated modification types. This search has been applied to annotate heavily-modified proteins such as crystallins.

Please cite: Stephen Tanner, Hongjun Shu, Ari Frank, Ling-Chi Wang, Ebrahim Zandi, Marc Mumby, Pavel A. Pevzner and Vineet Bafna: InsPecT: Fast and accurate identification of post-translationally modified peptides from tandem mass spectra. (PubMed) Anal Chem. 77(14):4626-39 (2005)
Registry entries: Bio.tools 
jbrowse
genome browser with an AJAX-based interface
Versions of package jbrowse
ReleaseVersionArchitectures
VCS1.2.3-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 1.2.3-1

JBrowse is a genome browser with an AJAX-based interface. JBrowse renders most tracks using client side JavaScript and JSON as its data transfer format. JBrowse is the official successor to GBrowse.

kempbasu
significance tests for comparing digital gene expression profiles
Versions of package kempbasu
ReleaseVersionArchitectures
VCS0.9.1-1all
Versions and Archs
License: GPL-3
Debian package not available
Git
Version: 0.9.1-1

This package implements the significance tests for comparing digital gene profiles described in the article:

Varuzza et al. "Significance tests for comparing digital gene expression profiles"

They provide two programs: kemp for the frequentist test and basu for the Bayesian test, and some auxiliary scripts.

mach-haplotyper
Markov Chain based SNP haplotyper
Versions of package mach-haplotyper
ReleaseVersionArchitectures
VCS1.0.18-1all
Versions and Archs
License: non-free
Debian package not available
Git
Version: 1.0.18-1

Recent advancements in chip-based DNA genotyping allow to infer DNA variants that are not part of the chip but known to be associated with a combination of SNPs that are measured.

Please cite: Yun Li, Cristen J. Willer, Jun Ding, Paul Scheet and Gonçalo R. Abecasis: MaCH: using sequence and genotype data to estimate haplotypes and unobserved genotypes. (PubMed) Genetic Epidemiology 34(8):816-34 (2010)
Registry entries: Bio.tools  SciCrunch 
mage2tab
MAGE-MLv1 converter and visualiser
Versions of package mage2tab
ReleaseVersionArchitectures
VCS0.9-1all
Versions and Archs
License: CBIL-1.0
Debian package not available
Git
Version: 0.9-1

This tool-kit is part of MR_T, a framework for import or export various of MAGE (MicroArray Gene Expression) documents (MAGE-MLv1, MAGE-TAB, SOFT, MINiML) from or into databases like GUS (the Genomics Unified Schema, www.gusdb.org).

This package provides the following programs:

 mage2tab     — MAGE-MLv1 to MAGE-TAB converter
 mage2graph   — GraphViz-based mage data visualisation tool
 mage-checker — Validation tool
manta
structural variant and indel caller for mapped sequencing data
Versions of package manta
ReleaseVersionArchitectures
VCS1.6.0+dfsg-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 1.6.0+dfsg-1

Manta calls structural variants (SVs) and indels from mapped paired-end sequencing reads. It is optimized for analysis of germline variation in small sets of individuals and somatic variation in tumor/normal sample pairs. Manta discovers, assembles and scores large-scale SVs, medium- sized indels and large insertions within a single efficient workflow. The method is designed for rapid analysis on standard compute hardware: NA12878 at 50x genomic coverage is analyzed in less than 20 minutes on a 20 core server, and most WGS tumor/normal analyses can be completed within 2 hours. Manta combines paired and split-read evidence during SV discovery and scoring to improve accuracy, but does not require split- reads or successful breakpoint assemblies to report a variant in cases where there is strong evidence otherwise. It provides scoring models for germline variants in small sets of diploid samples and somatic variants in matched tumor/normal sample pairs. There is experimental support for analysis of unmatched tumor samples as well. Manta accepts input read mappings from BAM or CRAM files and reports all SV and indel inferences in VCF 4.1 format.

Please cite: Xiaoyu Chen, Ole Schulz-Trieglaff, Richard Shaw, Bret Barnes, Felix Schlesinger, Morten Källberg, Anthony J. Cox, Semyon Kruglyak and Christopher T. Saunders: Manta: rapid detection of structural variants and indels for germline and cancer sequencing applications. (PubMed,eprint) Bioinformatics 32(8):1220-1222 (2015)
Registry entries: Bio.tools  Bioconda 
marginphase
simultaneous haplotyping and genotyping
Versions of package marginphase
ReleaseVersionArchitectures
VCS0.0+git20181109.cdf139e-1all
Versions and Archs
License: Expat
Debian package not available
Git
Version: 0.0+git20181109.cdf139e-1

MarginPhase is a program for simultaneous haplotyping and genotyping. It is an experimental, open source implementation written in C and developed to work primarily with nanopore data. The MarginPhase workflow includes an alignment summation step. This differentiates it from WhatsHap, which performs a local realignment around analyzed sites. MarginPhase can also phase genotypic variants simultaneously after filtering out the sites that are likely homozygous. MarginPhase’s output includes a BAM which encodes the phasing of each read, including which phase set it is in, which haplotype it belongs to, and what of the aligned portion falls into each phase set. Reads which span a phase set boundary have information for both encoded in them.

Please cite: Jana Ebler, Marina Haukness, Trevor Pesout, Tobias Marschall and Benedict Paten: Haplotype-aware diplotyping from noisy long reads. (PubMed,eprint) Genome Biol 20(1):116 (2019)
martj
distributed data integration system for biological data
Versions of package martj
ReleaseVersionArchitectures
VCS0.9+dfsg-1all
Versions and Archs
License: LGPL-2+
Debian package not available
Git
Version: 0.9+dfsg-1

BioMart is a simple, distributed data integration system with powerful query capabilities. The BioMart data model has been applied to the following data sources: UniProt Proteomes, Macromolecular Structure Database (MSD), Ensembl, Vega, and dbSNP.

It has been designed to provide researchers with an easy and interactive access to both the wealth of data available on the Internet and for in house data integration. BioMart is a successor to the generic query system originally developed for the Ensembl genome database (EnsMart). Building on its success, BioMart, has now been applied to other biological databases.

medaka
sequence correction provided by ONT Research
Versions of package medaka
ReleaseVersionArchitectures
VCS1.0.3+dfsg-1all
Versions and Archs
License: MPL-2.0
Debian package not available
Git
Version: 1.0.3+dfsg-1

Medaka is a tool to create a consensus sequence from nanopore sequencing data. This task is performed using neural networks applied from a pileup of individual sequencing reads against a draft assembly. It outperforms graph-based methods operating on basecalled data, and can be competitive with state-of-the-art signal-based methods, whilst being much faster.

Features

  • Requires only basecalled data. (.fasta or .fastq)
  • Improved accurary over graph-based methods (e.g. Racon).
  • 50X faster than Nanopolish (and can run on GPUs).
  • Methylation aggregation from Guppy .fast5 files.
  • Benchmarks are provided here.
  • Includes extras for implementing and training bespoke correction networks.
Registry entries: Bioconda 
meme
search for common motifs in DNA or protein sequences
Versions of package meme
ReleaseVersionArchitectures
VCS5.5.5-1all
Versions and Archs
License: non-free
Debian package not available
Git
Version: 5.5.5-1

MEME (Multiple EM for Motif Elicitation) is a tool for discovering motifs in a group of related DNA or protein sequences. A motif is a sequence pattern that occurs repeatedly in a group of related protein or DNA sequences. MEME represents motifs as position-dependent letter-probability matrices which describe the probability of each possible letter at each position in the pattern. Individual MEME motifs do not contain gaps. Patterns with variable-length gaps are split by MEME into two or more separate motifs.

MEME takes as input a group of DNA or protein sequences (the training set) and outputs as many motifs as requested. MEME uses statistical modeling techniques to automatically choose the best width, number of occurrences, and description for each motif.

Please cite: Timothy L. Bailey, Nadya Williams, Chris Misleh and Wilfred W. Li: MEME: discovering and analyzing DNA and protein sequence motifs. (PubMed,eprint) Nucleic Acids Research 34(Web Server issue):W369–W373 (2006)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mesquite
modular system for evolutionary analysis
Versions of package mesquite
ReleaseVersionArchitectures
VCS3.04+dfsg.1-1all
Versions and Archs
License: <license>
Debian package not available
Git
Version: 3.04+dfsg.1-1

Mesquite is modular, extendible software for evolutionary biology, designed to help biologists organize and analyze comparative data about organisms. Its emphasis is on phylogenetic analysis, but some of its modules concern population genetics, while others do non-phylogenetic multivariate analysis. Because it is modular, the analyses available depend on the modules installed.

Mesquite also has many features for managing and processing data, including processing of chromatograms, sequence alignment, editing of morphometric data, and others.

metabit
analysing microbial profiles from high-throughput sequencing shotgun data
Versions of package metabit
ReleaseVersionArchitectures
VCS0.0+git20170725.24cb3ee+dfsg-1all
Versions and Archs
License: expat
Debian package not available
Git
Version: 0.0+git20170725.24cb3ee+dfsg-1

MetaBIT is an integrative and automated metagenomic pipeline for analysing microbial profiles from high-throughput sequencing shotgun data.

The metaBIT pipeline proposes tools for visualising microbial profiles (barplots, heatmaps) and performing a range of statistical analyses (diversity indices, hierarchical clustering and principal coordinate analysis). It uses as input fastq files containing trimmed reads from shotgun high through-put sequencing.

Please cite: Guillaume Louvel, Clio Der Sarkissian, Kristian Hanghøj and Ludovic Orlando: metaBIT, an integrative and automated metagenomic pipeline for analysing microbial profiles from high-throughput sequencing shotgun data. (PubMed) Molecular Ecology Resources (2016)
modeller
Protein structure modeling by satisfaction of spatial restraints
Versions of package modeller
ReleaseVersionArchitectures
VCS9.19-1all
Versions and Archs
License: non-free_academic
Git
Version: 9.19-1

MODELLER is used for homology or comparative modeling of protein three-dimensional structures (1). The user provides an alignment of a sequence to be modeled with known related structures and MODELLER automatically calculates a model containing all non-hydrogen atoms. MODELLER implements comparative protein structure modeling by satisfaction of spatial restraints (2, 3), and can perform many additional tasks, including de novo modeling of loops in protein structures, optimization of various models of protein structure with respect to a flexibly defined objective function, multiple alignment of protein sequences and/or structures, clustering, searching of sequence databases, comparison of protein structures, etc.

Please cite: M.A. Marti-Renom, A. Stuart, A. Fiser, R. Sánchez and F. Melo, A. Sali.: Comparative protein structure modeling of genes and genomes. (PubMed) Annu Rev Biophys Biomol Struct. 29:291-325 (2000)
Remark of Debian Med team: The package is created independently from Debian Med or Debian Science.

The source code is not generally available. Hence, most users are limited to the compiled versions of MODELLER. The program is distributed as a single install file that contains scripts, libraries, examples, documentation (in PDF and HTML formats) and executables for the supported platforms and operating systems. Please refer to the relevant section below for your platform:

The program comes as closed source, only free for academia, see http://salilab.org/modeller/registration.html.

molekel
Advanced Interactive 3D-Graphics for Molecular Sciences
Versions of package molekel
ReleaseVersionArchitectures
VCS5.4-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 5.4-1

Molekel is an open-source multi-platform molecular visualization program.

Some of the features are:

  • Different methods to speed-up rendering of molecules with support for billboards and view-dependent level of detail techniques
  • Programmable shaders; standard shaders to enhance rendering quality, outline contours and perform sketch-like renderings are provided
  • Visualization of residues (ribbon or schematic)
  • Complete control over the generation of molecular surfaces (bounding box and resolution)
  • Visualization of the following surfaces:
  • Orbitals
  • Iso-surface from density matrix
  • Iso-surface from Gaussian cube grid data
  • SAS
  • SES
  • Van der Waals
  • Animation of molecular surfaces
  • Animation of vibrational modes
  • Export high resolution images for 300+ DPI printing
  • Export to PostScript and PDF
  • Export animation
  • Plane widget to visualize a scalar field: the plane can be freely moved in 3d space and the points on the plane surface will be colored according to the value of the scalar field: a cursor can be moved on the plane surface to show the exact value of the field at a specific point in space.
mosaik-aligner
reference-guided aligner for next-generation sequencing
Versions of package mosaik-aligner
ReleaseVersionArchitectures
VCS2.2.30+20140627-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 2.2.30+20140627-1

MosaikBuild converts various sequence formats into Mosaik’s native read format. MosaikAligner pairwise aligns each read to a specified series of reference sequences. MosaikSort resolves paired-end reads and sorts the alignments by the reference sequence coordinates. Finally, MosaikText converts alignments to different text-based formats.

At this time, the workflow consists of supplying sequences in FASTA, FASTQ, Illumina Bustard & Gerald, or SRF file formats and producing results in the BLAT axt, the BAM/SAM, the UCSC Genome Browser bed, or the Illumina ELAND formats.

mpsqed
alignment editor and multiplex pyrosequencing assay designer
Versions of package mpsqed
ReleaseVersionArchitectures
VCS0.9.3-1all
Versions and Archs
License: LGPL-2+
Debian package not available
Git
Version: 0.9.3-1

Molecular-based diagnostic assays are the gold standard for infectious diseases today, since they allow a rapid and sensitive identification and typing of various pathogens. While PCR can be designed to be specific for a certain pathogen, a subsequent sequence analysis is frequently required for confirmation or typing. The design of appropriate PCR-based assays is a complex task, especially when conserved discriminating polymorphisms are rare or if the number of types which need to be differentiated is high. One extremely useful but underused method for this purpose is the multiplex pyrosequencing technique. mPSQed is a program developed at the Robert Koch Institute and targeted at facilitating the creation of such assays.

Please cite: Piotr Wojtek Dabrowski and Andreas Nitsche: mPSQed: A Software for the Design of Multiplex Pyrosequencing Assays. (PubMed,eprint) PLoS One 7(6):e38140 (2012)
mugsy
multiple whole genome alignment tool
Versions of package mugsy
ReleaseVersionArchitectures
VCS1r2.3+dfsg-1all
Versions and Archs
License: Artistic-2.0
Debian package not available
Git
Version: 1r2.3+dfsg-1

Mugsy is a multiple whole genome aligner. Mugsy uses Nucmer for pairwise alignment, a custom graph based segmentation procedure for identifying collinear regions, and the segment-based progressive multiple alignment strategy from Seqan::TCoffee. Mugsy accepts draft genomes in the form of multi-FASTA files and does not require a reference genome.

Please cite: Samuel V. Angiuoli and Steven L. Salzberg: Mugsy: fast multiple alignment of closely related whole genomes. (PubMed,eprint) Bioinformatics 27(3):334-342 (2011)
Registry entries: SciCrunch  Bioconda 
mview
biological sequence alignment conversion
Versions of package mview
ReleaseVersionArchitectures
VCS1.67+dfsg1-1all
Versions and Archs
License: GPL-2.0+
Debian package not available
Git
Version: 1.67+dfsg1-1

mview is a command line utility that extracts and reformats the results of a sequence database search or a multiple alignment, optionally adding HTML markup for web page layout. It can also be used as a filter to extract and convert searches or alignments to common formats.

Inputs:

  • Sequence database search: BLAST, FASTA suites.
  • Multiple sequence alignment: CLUSTAL, HSSP, MSF, FASTA, PIR, MAF Outputs:

  • HTML, FASTA, CLUSTAL, MSF, PIR, RDB (tab-separated).

The redundancy of that source tree with existing JS packages needs to be evaluated. In the interim, the package shall remain in experimental.

Please cite: Nigel P. Brown, C. Leroy and Christian Sander: MView: A Web compatible database search or multiple alignment viewer. (PubMed,eprint) Bioinformatics 14(4):380-381 (1998)
nano-snakemake
detection of structural variants in genome sequencing data
Versions of package nano-snakemake
ReleaseVersionArchitectures
VCS1.0+git20200224.ff11b35-1all
Versions and Archs
License: Expat
Debian package not available
Git
Version: 1.0+git20200224.ff11b35-1

To "have a genetic variation" may mean many different things. Technically most straight forward to investigate are changes to single positions in the long DNA chains - every chromosome is a single polymer of nucleic acids. This is also what we have most data from for many diseases.

But sometimes, DNA that looks completely the same when looking at short reads at the time (and not feeling lucky), the position looked at may be inverted on the chromosome. Or it may be a copy of the original site and not a "real" single-nucleotide polymorphism (SNP). Or it may have translocated to another chromosome.

These are examples for structural changes to the DNA. Individuals may never notice them. Or there may be a higher chances to develop a disease or it may affect fertility. Technologies like the Nanopore have emerged that can read longer segments of the DNA, so one can see multiple copies of the same gene in the same read or at least can assemble the DNA fragments read in a way to then align the reads non-ambiguously and support the analysis of such copy-number variations (CNVs).

This snakemake pipeline on nanopore whole genome sequencing data provides a complete structural variant analysis. Steps implemented and tools wrapped comprise:

  • fast: minimap2 alignment with Sniffles and SVIM SV calling
  • precise: ngmlr alignment with Sniffles SV calling
  • minimap2: minimap2 alignment with Sniffles, SVIM, NanoSV and npInv SV calling
  • minimap2_pbsv: minimap2 alignment with pbsv-specific parameters with pbsv, SVIM, NanoSV and npInv SV calling
  • ngmlr: ngmlr with Sniffles, NanoSV, SVIM and npInv SV calling
  • last-prepare: create a LAST index and train aligner parameters using last-train
  • last: LAST alignment with tandem-genotypes STR calling
Please cite: Wouter De Coster, Peter De Rijk, Arne De Roeck, Tim De Pooter, Svenn D'Hert, Mocja Strazisar, Sleegers Kristel and Christine Van Broeckhoven: Structural variants identified by Oxford Nanopore PromethION sequencing of the human genome. Genome Res. (2019.0)
nanocall
Basecaller for Oxford Nanopore Sequencing Data
Versions of package nanocall
ReleaseVersionArchitectures
VCS0.7.4-1all
Versions and Archs
License: expat
Debian package not available
Git
Version: 0.7.4-1

The highly portable Oxford Nanopore MinION sequencer has enabled new applications of genome sequencing directly in the field. However, the MinION currently relies on a cloud computing platform, Metrichor (metrichor.com), for translating locally generated sequencing data into basecalls.

Nanocall allows offline and private analysis of MinION data. Nanocall is the first freely-available, open-source basecaller for Oxford Nanopore sequencing data and does not require an internet connection. Using R7.3 chemistry, on two E.coli and two human samples, with natural as well as PCR-amplified DNA, Nanocall reads have ~68% identity, directly comparable to Metrichor "1D" data. Further, Nanocall is efficient, processing ~2500Kbp of sequence per core hour using the fastest settings, and fully parallelized. Using a 4 core desktop computer, Nanocall could basecall a MinION sequencing run in real time. Metrichor provides the ability to integrate the "1D" sequencing of template and complement strands of a single DNA molecule, and create a "2D" read. Nanocall does not currently integrate this technology, and addition of this capability will be an important future development. In summary, Nanocall is the first open-source, freely available, off-line basecaller for Oxford Nanopore sequencing data.

Please cite: Matei David, Lewis Jonathan Dursi, Delia Yao, Paul C Boutros and Jared T Simpson: Nanocall: An Open Source Basecaller for Oxford Nanopore Sequencing Data. (PubMed,eprint) Bioinformatics (2016)
Registry entries: Bioconda 
nanocomp
compare multiple runs of long biological sequences
Versions of package nanocomp
ReleaseVersionArchitectures
VCS1.12.0-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 1.12.0-1

NanoClmp compares multiple runs of long read sequencing data and alignments. It creates violin plots or box plots of length, quality and percent identity and creates dynamic, overlaying read length histograms and a cumulative yield plot.

This package installs the 'NanoCalc' executable.

Please cite: Wouter De Coster, Svenn D’Hert, Darrin T Schultz, Marc Cruts and Christine Van Broeckhoven: NanoPack: visualizing and processing long-read sequencing data. (PubMed,eprint) Bioinformatics 34(15):2666–2669 (2018)
Registry entries: Bioconda 
nanoplot
plotting scripts for long read sequencing data
Versions of package nanoplot
ReleaseVersionArchitectures
VCS1.36.2-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 1.36.2-1

NanoPlot provides plotting scripts for long read sequencing data.

These scripts perform data extraction from Oxford Nanopore sequencing data in the following formats:

  • fastq files (optionally compressed)
  • fastq files generated by albacore, guppy or MinKNOW containing additional information (optionally compressed)
  • sorted bam files
  • sequencing_summary.txt output table generated by albacore, guppy or MinKnow basecalling (optionally compressed)
  • fasta files (optionally compressed)
  • multiple files of the same type can be offered simultaneously
Please cite: Wouter De Coster, Svenn D'Hert, Darrin T Schultz, Marc Cruts and Christine Van Broeckhoven: NanoPack: visualizing and processing long-read sequencing data. (PubMed,eprint) Bioinformatics 34(15):2666-2669 (2018)
Registry entries: Bioconda 
ncbi-magicblast
RNA-seq mapping tool
Versions of package ncbi-magicblast
ReleaseVersionArchitectures
VCS1.5.0+ds-1all
Versions and Archs
License: PD
Debian package not available
Git
Version: 1.5.0+ds-1

Magic-BLAST is a tool for mapping large next-generation RNA or DNA sequencing runs against a whole genome or transcriptome. Each alignment optimizes a composite score, taking into account simultaneously the two reads of a pair, and in case of RNA-seq, locating the candidate introns and adding up the score of all exons. This is very different from other versions of BLAST, where each exon is scored as a separate hit and read- pairing is ignored.

Please cite: Grzegorz M. Boratyn, Jean Thierry-Mieg, Danielle Thierry-Mieg, Ben Busby and Thomas L. Madden: Magic-BLAST, an accurate RNA-seq aligner for long and short reads. (PubMed,eprint) BMC Bioinformatics 20(1):405 (2019)
Registry entries: Bioconda 
nextsv
automated structural variation detection for long-read sequencing
Versions of package nextsv
ReleaseVersionArchitectures
VCS0.4.0-1all
Versions and Archs
License: GB-nonfree
Debian package not available
Git
Version: 0.4.0-1

NextSV is an computational pipeline that allows structural variant (SV) calling from PacBio sequencing data using PBhoney and Sniffles. NextSV takes FASTA or FASTQ files as input. Once the SV caller is selected by user, NextSV automatically chooses the compatible aligner and performs mapping. The alignments will be automatically sorted and then presented to the SV caller. Users can change the parameters by modifying its configuration file. When the analysis is finished, NextSV will examine the FASTA/FASTQ, BAM, and result files and generate a report showing various statistics. If more than both callers are selected, NextSV will format the raw result files (.tails, .spots, or .vcf files) into bed files and generate the intersection or union call set for the purpose of higher accuracy or sensitivity.

Please cite: Li Fang, Jiang Hu, Depeng Wang and Kai Wang: Evaluation on Detection of Structural Variants by Low-Coverage Long-Read Sequencing. bioRxiv (2016)
Registry entries: Bio.tools 
ngila
global pairwise alignments with logarithmic and affine gap costs
Versions of package ngila
ReleaseVersionArchitectures
VCS1.3-1all
Versions and Archs
License: GPLv3
Debian package not available
Git
Version: 1.3-1

Ngila is an application that will find the best alignment of a pair of sequences using log-affine gap costs, which are the most biologically realistic gap costs.

Ngila implements the Miller and Myers (1988) algorithm in order to find a least costly global alignment of two sequences given homology costs and a gap cost. Two versions of the algorithm are included: holistic and divide-and-conquer. The former is faster but the latter utilizes less memory. Ngila starts with the divide-and-conquer method but switches to the holistic method for subsequences smaller than a user-established threshold. This improves its speed without substantially increasing memory requirements. Ngila also allows users to assign costs to end gaps that are smaller than costs for internal gaps. This is important for aligning using the free-end-gap method.

Please cite: Reed A. Cartwright: Ngila: global pairwise alignments with logarithmic and affine gap costs. (PubMed,eprint) Bioinformatics 23(11):1427-1428 (2007)
ngsqctoolkit
toolkit for the quality control of next generation sequencing data
Versions of package ngsqctoolkit
ReleaseVersionArchitectures
VCS2.3.3-1all
Versions and Archs
License: to_be_clarified
Debian package not available
Git
Version: 2.3.3-1

NGS QC Toolkit: A toolkit for the quality control (QC) of next generation sequencing (NGS) data. The toolkit comprises of user-friendly stand alone tools for quality control of the sequence data generated using Illumina and Roche 454 platforms with detailed results in the form of tables and graphs, and filtering of high-quality sequence data. It also includes few other tools, which are helpful in NGS data quality control and analysis.

Please cite: Ravi K. Patel and Mukesh Jain: NGS QC Toolkit: A Toolkit for Quality Control of Next Generation Sequencing Data. (PubMed,eprint) PLoS One 7(2):e30619 (2012)
nw-align
global protein sequence alignment
Versions of package nw-align
ReleaseVersionArchitectures
VCS0.20100803-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 0.20100803-1

NWalign is simple and robust alignment program for protein sequence-to-sequence alignments based on the standard Needleman-Wunsch dynamic programming algorithm. The implementation is performed in FORTRAN.

This program was tested at 2014-02-01 by Daniel Barker at the Debian Med sprint and was not functional according to his test.

oases
de novo transcriptome assembler for very short reads
Versions of package oases
ReleaseVersionArchitectures
VCS0.2.09-1all
Versions and Archs
License: GPL-3
Debian package not available
Git
Version: 0.2.09-1

Oases is a de novo transcriptome assembler designed to produce transcripts from short read sequencing technologies, such as Illumina, SOLiD, or 454 in the absence of any genomic assembly. Oases uploads a preliminary assembly produced by Velvet, and clusters the contigs into small groups, called loci. It then exploits the paired-end read and long read information, when available, to construct transcript isoforms.

Please cite: Marcel H. Schulz, Daniel R. Zerbino, Martin Vingron and Ewan Birney: Oases: Robust de novo RNA-seq assembly across the dynamic range of expression levels. (PubMed,eprint) Bioinformatics 28(8):1086-1092 (2012)
Registry entries: Bio.tools  SciCrunch 
omegamap
describing selection and recombination in sequences
Versions of package omegamap
ReleaseVersionArchitectures
VCS0.5-1all
Versions and Archs
License: GPL-3
Debian package not available
Git
Version: 0.5-1

OmegaMap is a program for detecting natural selection and recombination in DNA or RNA sequences. It is based on a model of population genetics and molecular evolution. The signature of natural selection is determined by the relative excess of non-synonymous to synonymous polymorphisms. The signature of recombination is detected from the patterns of linkage disequilibrium.

Please cite: Daniel J. Wilson and G. McVean: Estimating diversifying selection and functional constraint in the presence of recombination.. (PubMed,eprint) Genetics 172(3):1411-1425 (2006)
Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
oncofuse
predicting oncogenic potential of gene fusions
Versions of package oncofuse
ReleaseVersionArchitectures
VCS1.1.1-1all
Versions and Archs
License: Apache-2.0
Debian package not available
Git
Version: 1.1.1-1

Oncofuse is a framework designed to estimate the oncogenic potential of de-novo discovered gene fusions. It uses several hallmark features and employs a bayesian classifier to provide the probability of a given gene fusion being a driver mutation.

Please cite: Mikhail Shugay, Iñigo Ortiz de Mendíbil, José L. Vizmanos and Francisco J. Novo: Oncofuse: a computational framework for the prediction of the oncogenic potential of gene fusions. (PubMed,eprint) Bioinformatics 29(20):2539–2546 (2013)
Registry entries: SciCrunch 
optitype
precision HLA typing from next-generation sequencing data
Versions of package optitype
ReleaseVersionArchitectures
VCS1.3.2-1all
Versions and Archs
License: <license>
Debian package not available
Git
Version: 1.3.2-1

OptiType is a novel HLA genotyping algorithm based on integer linear programming, capable of producing accurate 4-digit HLA genotyping predictions from NGS data by simultaneously selecting all major and minor HLA Class I alleles.

Please cite: András Szolek, Benjamin Schubert, Christopher Mohr, Marc Sturm, Magdalena Feldhahn and Oliver Kohlbacher: OptiType: precision HLA typing from next-generation sequencing data. (PubMed,eprint) Bioinformatics 30(23):3310–3316 (2014)
paipline
Pipeline for the Automatic Identification of Pathogens
Versions of package paipline
ReleaseVersionArchitectures
VCS0.0+git20180416.062bce7-1all
Versions and Archs
License: GPL_3+
Debian package not available
Git
Version: 0.0+git20180416.062bce7-1

This program is designed to search for pathogen nucleic acid sequences in NGS datasets. It needs databases in the format provided by the database- updater found under https://gitlab.com/andreas.andrusch/database-updater.

Please cite: Andreas Andrusch, Piotr W. Dabrowski, Jeanette Klenner, Simon H. Tausch, Claudia Kohl, Abdalla A. Osman, Bernhard Y. Renard and Andreas Nitsche: PAIPline: pathogen identification in metagenomic and clinical next generation sequencing samples. (eprint) Bioinformatics 34(17):i715-i721 (2018)
pangolin
Phylogenetic Assignment of Named Global Outbreak LINeages
Versions of package pangolin
ReleaseVersionArchitectures
VCS4.3.1-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 4.3.1-1

Pangolin runs a multinomial logistic regression model trained against lineage assignments based on GISAID data.

Legacy pangolin runs using a guide tree and alignment hosted at cov-lineages/lineages. Some of this data is sourced from GISAID, but anonymised and encrypted to fit with guidelines. Appropriate permissions have been given and acknowledgements for the teams that have worked to provide the original SARS-CoV-2 genome sequences to GISAID are also hosted here.

Registry entries: Bioconda 
partitionfinder
choses partitioning schemes and models of molecular evolution for sequence data
Responsible: Kevin Murray (Andreas Tille)
Versions of package partitionfinder
ReleaseVersionArchitectures
VCS2.1.1+dfsg-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 2.1.1+dfsg-1

PartitionFinder and PartitionFinderProtein are Python programs for simultaneously choosing partitioning schemes and models of molecular evolution for sequence data. You can use them before running a phylogenetic analysis, in order to decide how to divide up your sequence data into separate blocks before analysis, and to simultaneously perform model selection on each of those blocks.

patristic
Calculate patristic distances and comparing the components of genetic change
Versions of package patristic
ReleaseVersionArchitectures
VCS0.0.20100817-2all
Versions and Archs
License: free
Debian package not available
Git
Version: 0.0.20100817-2

Patristic overcomes some logistic barriers to analysing signals in sequences. In additional to calculating patristic distances, it provides plots for any combination of matrices, calculates commonly used statistics, allows data such as isolation dates to be entered and reorders matrices with matching species or gene labels. It will be used to analyse rates of mutation and substitutional saturation and the evolution of viruses.

Please cite: Mathieu Fourment and Mark J Gibbs: PATRISTIC: a program for calculating patristic distances and graphically comparing the components of genetic change. (PubMed,eprint) BMC Evolutionary Biology 6:1 (2006)
pcma
fast and accurate multiple sequence alignment based on profile consistency
Versions of package pcma
ReleaseVersionArchitectures
VCS2.0+20040626-1all
Versions and Archs
License: non-free for commercial
Debian package not available
Git
Version: 2.0+20040626-1

PCMA (profile consistency multiple sequence alignment) is a progressive multiple sequence alignment program that combines two different alignment strategies. Highly similar sequences are aligned in a fast way as in ClustalW, forming pre-aligned groups. The T-Coffee strategy is applied to align the relatively divergent groups based on profile–profile comparison and consistency. The scoring function for local alignments of pre-aligned groups is based on a novel profile–profile comparison method that is a generalization of the PSI-BLAST approach to profile–sequence comparison. PCMA balances speed and accuracy in a flexible way and is suitable for aligning large numbers of sequences.

Please cite: Jimin Pei, Ruslan Sadreyev and Nick V. Grishin: PCMA: fast and accurate multiple sequence alignment based on profile consistency. (PubMed,eprint) Bioinformatics 19(3):427-428 (2003)
Remark of Debian Med team: Precondition for T-Coffee

see http://wiki.debian.org/DebianMed/TCoffee

Check with authors about licensing, they adopted code from clustalw which is now free. Thus a change might be possible

phylophlan
microbial Tree of Life using 400 universal proteins
Versions of package phylophlan
ReleaseVersionArchitectures
VCS1.1.0-1all
Versions and Archs
License: expat
Debian package not available
Git
Version: 1.1.0-1

PhyloPhlAn is a computational pipeline for reconstructing highly accurate and resolved phylogenetic trees based on whole-genome sequence information. The pipeline is scalable to thousands of genomes and uses the most conserved 400 proteins for extracting the phylogenetic signal. PhyloPhlAn also implements taxonomic curation, estimation, and insertion operations.

The main features of PhyloPhlAn are:

  • completely automatic, as the user needs only to provide the (unannotated) protein sequences of the input genomes (as multifasta files of peptides - not nucleotides)
  • very high topological accuracy and resolution because of the use of up to 400 previously identified most conserved proteins
  • the possibility of integrating new genomes in the already reconstructed most comprehensive tree of life (3,171 microbial genomes)
  • taxonomy estimation for the newly inserted genomes
  • taxonomic curation for the produced phylogenetic trees
Please cite: Nicola Segata, Daniela Börnigen, Xochitl C. Morgan and Curtis Huttenhower: PhyloPhlAn is a new method for improved phylogenetic and taxonomic placement of microbes. (PubMed,eprint) Nature Communications 4:2304 (2013)
Remark of Debian Med team: usearch can not be replaced since vsearch does not work with proteins

See https://lists.debian.org/debian-med/2016/05/msg00091.html

phyloviz-core
phylogenetic inference and data visualization for sequence based typing methods
Versions of package phyloviz-core
ReleaseVersionArchitectures
VCS0.0.20111121-1all
Versions and Archs
License: GPL-3
Debian package not available
Git
Version: 0.0.20111121-1

Phyloviz allows the analysis of sequence-based typing methods that generate allelic profiles and their associated epidemiological data.

For representing the possible evolutionary relationships between strains identified by allelic profiles it uses the goeBURST algorithm, a refinement of eBURST algorithm proposed by Feil et al., and its expansion to generate a complete minimum spanning tree (MST).

Phyloviz is being developed in a modular way to allow its expansion with novel data analysis algorithms and new visualization modules.

Capabilities

  • Modularity allows the creation of plugins to analyse different types of data
  • Allows the visualization of data overlaid onto goeBURST and MST results
  • Confidence assessment of each link in the graph
  • Query the data and see the query results directly onto the graphs
  • Search your data set using regular expressions to select what to display
  • Export the results as images in various formats: eps, png, gif, pdf, etc
Please cite: Alexandre P Francisco, Cátia Vaz, Pedro T Monteiro, José Melo-Cristino, Mário Ramirez and João A Carriço: PHYLOViZ: phylogenetic inference and data visualization for sequence based typing methods. (PubMed,eprint) BMC Bioinformatics 13(1):87 (2012)
Remark of Debian Med team: There are several plugins to package

The download page http://www.phyloviz.net/wiki/plugins/ lists several plugins that should be packaged (single or as bundle) as well.

pigx-scrnaseq
pipeline for checkpointed and distributed scRNA-seq analyses
Versions of package pigx-scrnaseq
ReleaseVersionArchitectures
VCS1.1.7+ds-1all
Versions and Archs
License: <special license>
Debian package not available
Git
Version: 1.1.7+ds-1

This package provides a automated workflow for the automated analysis of single-cell RNA-seq experiments. A series of well-accecpted tools are connected in Python scripts and controlled via snakemake. This supports the parallel execution of these workflows and provides checkpointing, such that interrupted workflows can take up their work again.

pipasic
Protein Abundance Correction in Metaproteomic Data
Versions of package pipasic
ReleaseVersionArchitectures
VCS0.0.r15-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 0.0.r15-1

Metaproteomic analysis allows studying the interplay of organisms or functional groups and has become increasingly popular also for diagnostic purposes. However, difficulties arise due to the high sequence similarity between related organisms. Further, the state of conservation of proteins between species can be correlated with their expression level which can lead to significant bias in results and interpretation. These challenges are similar but not identical to the challenges arising in the analysis of metagenomic samples and require specific solutions.

pipasic (peptide intensity-weighted proteome abundance similarity correction) is a tool which corrects identification and spectral counting based quantification results using peptide similarity estimation and expression level weighting within a non-negative lasso framework. pipasic has distinct advantages over approaches only regarding unique peptides or aggregating results to the lowest common ancestor.

Please cite: Anke Penzlin, Martin S. Lindner, Joerg Doellinger, Piotr Wojtek Dabrowski, Andreas Nitsche and Bernhard Y. Renard: Pipasic: similarity and expression correction for strain-level identification and quantification in metaproteomics. (PubMed,eprint) Bioinformatics 30(12):i149–i156 (2014)
plato
Analysis, translation, and organization of large-scale genetic data
Versions of package plato
ReleaseVersionArchitectures
VCS2.0.0-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 2.0.0-1

PLATO is an acronym for "PLatform for the Analysis, Translation, and Organization of large-scale data". Recent technological advances enable the study of hundreds of thousands of human single-nucleotide polymorphisms at the population level. Because strategies for analyzing these data have not kept pace with the laboratory methods that generate the data, it is unlikely that these advances will immediately lead to an improved understanding of the genetic contribution to common human disease and drug response. Currently, no single analytical method allows us to extract all available information from a whole-genome association study. In fact, no single method can be optimal for all datasets, especially when the genetic architecture for diseases can vary substantially, as is certainly the case. Therefore, an integrative platform is needed to accommodate multiple analytical methods for analysis as we learn more about genetic architecture. As a result, we are developing a system for the analysis of genome-wide association data that will incorporate several analytical approaches as filters to allow a scientist to choose whatever analytical methods they wish to apply. PLATO (PLatform for the Analysis, Translation, and Organization of large-scale data) will incorporate a number of filters to select the important SNPs in a genome-wide association study.

Whole-genome Association Study Pipeline (WASP) has recently been absorbed into PLATO. WASP was designed to aid in retrieving, evaluating, formatting, and analyzing genotypic and clinical data from the latest large-scale genotyping studies. WASP implements a battery of quality control procedures to assess the data. Among the currently available procedures are the examination of marker and sample genotyping efficiency, allele frequency calculations, checks of Mendelian error (if applicable) and gender discrepancies (based on available chromosome X and Y genotypes), and tests of Hardy-Weinberg Equilibrium. Additionally, WASP can retrieve and format data for other software programs such as the Graphical Representation of Relationships (GRR) program, or STRUCTURE, and depending on the nature of the samples and the depth of examination the user desires to pursue. Beyond the quality control aspect of this application, WASP can perform standard tests of association using the Transmission Disequilibrium Test TDT for family-based datasets and the chi-square test of association for case-control datasets.

Please cite: Benjamin J. Grady, Eric Torstenson, Scott M. Dudek, Justin Giles, David Sexton and Marylyn D. Ritchie: Finding unique filter sets in PLATO: a precursor to efficient interaction analysis in GWAS data. (PubMed,eprint) Proceedings of the Pacific Symposium :315-26 (2010)
pomoxis
analysis components from Oxford Nanopore Research
Versions of package pomoxis
ReleaseVersionArchitectures
VCS0.3.4-1all
Versions and Archs
License: MPL-2.0
Debian package not available
Git
Version: 0.3.4-1

Pomoxis comprises a set of basic bioinformatic tools tailored to nanopore sequencing. Notably tools are included for generating and analysing draft assemblies. Many of these tools are used by the research data analysis group at Oxford Nanopore Technologies.

Features

  • Wraps third party tools with known good default parameters and methods of use.
  • Creates an isolated environment with all third-party tools.
  • Streamlines common short analysis chains.
  • Integrates into katuali for performing more complex analysis pipelines.
Registry entries: Bioconda 
profit - wnpp
Protein structure alignment
Versions of package profit
ReleaseVersionArchitectures
VCS3.1-1all
Versions and Archs
License: non-distributable
Debian package not available
Git
Version: 3.1-1

ProFit is designed to be the ultimate protein least squares fitting program. It has many features including flexible specification of fitting zones and atoms, calculation of RMS over different zones or atoms, RMS-by-residue calculation, on-line help facility, etc.

A symbolic link is provided to have the binary name back to how it is historically correct.

Remark of Debian Med team: The authors need to change the license, still.
psipred
protein secondary structure prediction
Versions of package psipred
ReleaseVersionArchitectures
VCS4.01-1all
Versions and Archs
License: custom
Debian package not available
Git
Version: 4.01-1

PSIPRED is a simple and accurate secondary structure prediction method, incorporating two feed-forward neural networks which perform an analysis on output obtained from PSI-BLAST (Position Specific Iterated - BLAST). Using a very stringent cross validation method to evaluate the method's performance, PSIPRED 2.6 achieves an average Q3 score of 80.7%.

Please cite: David T. Jones: Protein secondary structure prediction based on position-specific scoring matrices. (PubMed) Journal of Molecular Biology 292(2):195-202 (1999)
pssh2
set of scripts for mapping protein sequence to structure
Versions of package pssh2
ReleaseVersionArchitectures
VCS0.6all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 0.6

pssh2 creates sequence-to-structure alignments based on hhblits profiles built for the query sequence. pssh2 consists of scripts to run the hhblits queries and parse the output. You also need the pdb_full database downloaded from rostlab.org: ftp://rostlab.org/pssh2/pdb_full/

This package provides the script files needed to run within PredictProtein. They are all called in the correct order in pp_pssh2. It also contains scripts to run independent of PredictProtein. It assumes you have a mysql database to store information. The configuration information is kept in pssh2.conf

pufferfish
Efficient index for the colored, compacted, de Bruijn graph
Versions of package pufferfish
ReleaseVersionArchitectures
VCS1.8.0+dfsg-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 1.8.0+dfsg-1

Pufferfish is a new time and memory-efficient data structure for indexing a compacted, colored de Bruijn graph (ccdBG).

Though the de Bruijn Graph (dBG) has enjoyed tremendous popularity as an assembly and sequence comparison data structure, it has only relatively recently begun to see use as an index of the reference sequences (e.g. deBGA, kallisto). Particularly, these tools index the compacted dBG (cdBG), in which all non-branching paths are collapsed into individual nodes and labeled with the string they spell out. This data structure is particularly well-suited for representing repetitive reference sequences, since a single contig in the cdBG represents all occurrences of the repeated sequence. The original positions in the reference can be recovered with the help of an auxiliary "contig table" that maps each contig to the reference sequence, position, and orientation where it appears as a substring. The deBGA paper has a nice description how this kind of index looks (they call it a unipath index, because the contigs we index are unitigs in the cdBG), and how all the pieces fit together to be able to resolve the queries we care about. Moreover, the cdBG can be built on multiple reference sequences (transcripts, chromosomes, genomes), where each reference is given a distinct color (or colour, if you're of the British persuasion). The resulting structure, which also encodes the relationships between the cdBGs of the underlying reference sequences, is called the compacted, colored de Bruijn graph (ccdBG). This is not, of course, the only variant of the dBG that has proven useful from an indexing perspective. The (pruned) dBG has also proven useful as a graph upon which to build a path index of arbitrary variation / sequence graphs, which has enabled very interesting and clever indexing schemes like that adopted in GCSA2. Also, thinking about sequence search in terms of the dBG has led to interesting representations for variation-aware sequence search backed by indexes like the vBWT (implemented in the excellent gramtools package).

purple
Picking Unique Relevant Peptides for viraL Experiments
Versions of package purple
ReleaseVersionArchitectures
VCS0.4.1-1all
Versions and Archs
License: LGPL-3+
Debian package not available
Git
Version: 0.4.1-1

Emerging virus diseases present a global threat to public health. To detect viral pathogens in time-critical scenarios, accurate and fast diagnostic assays are required. Such assays can now be established using mass spectrometry-based targeted proteomics, by which viral proteins can be rapidly detected from complex samples down to the strain level with high sensitivity and reproducibility. Developing such targeted assays involves tedious steps of peptide candidate selection, peptide synthesis, and assay optimization. Peptide selection requires extensive preprocessing by comparing candidate peptides against a large search space of background proteins. Purple (Picking Unique Relevant Peptides for viraL Experiments) is a software tool for selecting target-specific peptide candidates directly from given proteome sequence data.

Purple enables peptide candidate selection across various taxonomic levels and filtering against backgrounds of varying complexity. Its functionality is demonstrated using data from different virus species and strains. Purple enables building taxon-specific targeted assays and paves the way to time-efficient and robust viral diagnostics using targeted proteomics.

This is the command line version of purple.

Please cite: Johanna Lechner, Felix Hartkopf, Pauline Hiort, Andreas Nitsche Marica Grossegesse, Joerg Doellinger, Bernhard Y. Renard and Thilo Muth: Purple: A Computational Workflow for Strategic Selection of Peptides for Viral Diagnostics Using MS-Based Targeted Proteomics. (PubMed,eprint) Viruses 11(6):536 (2019)
q2-composition
QIIME2 plugin for Compositional statistics
Versions of package q2-composition
ReleaseVersionArchitectures
VCS2021.8.0+ds-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 2021.8.0+ds-1

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-deblur
QIIME2 plugin to wrap the Deblur software for sequence quality control
Versions of package q2-deblur
ReleaseVersionArchitectures
VCS2023.9.0-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 2023.9.0-1

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Amnon Amir, Daniel McDonald, Jose A. Navas-Molina, Evguenia Kopylova, James T. Morton, Zhenjiang Zech Xu, Eric P. Kightley, Luke R. Thompson, Embriette R. Hyde, Antonio Gonzalez and Rob Knight: Deblur Rapidly Resolves Single-Nucleotide Community Sequence Patterns. (PubMed,eprint) mSystems 2 (2017)
q2-diversity
QIIME2 plugin for core diversity analysis
Versions of package q2-diversity
ReleaseVersionArchitectures
VCS2021.8.0-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 2021.8.0-1

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. Functionality is made available through QIIME 2 plugins.

This plugin provides the means to statistically assess the diversity of microbiota. This has direct clinical interest, since with whatever we eat or have antibiotics applied, the survival of different groups of bacteria/yeasts will be affected. From these relative abundances of strains that constribute the microbiome, most prominently, comparisons within a group of samples (or an individual) determines the alpha diversity and between (groups of) samples the beta diversity is inspected.

This package is key to most workflows in qiime.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-gneiss
QIIME2 plugin for Compositional Data Analysis and Visualization
Versions of package q2-gneiss
ReleaseVersionArchitectures
VCS2020.11.1-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 2020.11.1-1

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-longitudinal
QIIME2 plugin for longitudinal studies and paired comparisons
Versions of package q2-longitudinal
ReleaseVersionArchitectures
VCS2023.9.1+ds-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 2023.9.1+ds-1

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-vsearch
QIIME 2 plugin for clustering and dereplicating with vsearch
Versions of package q2-vsearch
ReleaseVersionArchitectures
VCS2023.9.0-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 2023.9.0-1

A QIIME 2 plugin that wraps the vsearch application, and provides methods for clustering and dereplicating features and sequences.

Please cite: Torbjørn Rognes, Tomáš Flouri, Ben Nichols, Christopher Quince and Frédéric Mahé: VSEARCH: a versatile open source tool for metagenomics. PeerJ 4 (2016)
qtlreaper
QTL analysis for expression data
Versions of package qtlreaper
ReleaseVersionArchitectures
VCS1.1.1-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 1.1.1-1

QTL Reaper is software, written in C and compiled as a Python module, for rapidly scanning microarray expression data for QTLs. It is essentially the batch-oriented version of WebQTL. It requires, as input, expression data from members of a set of recombinant inbred lines and genotype information for the same lines. It searches for an association between each expression trait and all genotypes and evaluates that association by a permutation test. For the permutation test, it performs only as many permutations as are necessary to define the empirical P-value to a reasonable precision. It also performs bootstrap resampling to estimate the confidence region for the location of a putative QTL.

The reaper module is used underneath the http://genenetwork.org site.

qualimap
evaluating next generation sequencing alignment data
Versions of package qualimap
ReleaseVersionArchitectures
VCS2.2.1+dfsg-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 2.2.1+dfsg-1

Qualimap 2 provides both a Graphical User Interface (GUI) and a command-line interface to facilitate the quality control of alignment sequencing data and its derivatives like feature counts.

Supported types of experiments include:

  • Whole-genome sequencing
  • Whole-exome sequencing
  • RNA-seq (speical mode available)
  • ChIP-seq

Qualimap examines sequencing alignment data in SAM/BAM files according to the features of the mapped reads and provides an overall view of the data that helps to the detect biases in the sequencing and/or mapping of the data and eases decision-making for further analysis.

Qualimap provides multi-sample comparison of alignment and counts data.

  • Fast analysis accross the reference of genome coverage and nucleotide distribution;
  • Easy to interpret summary of the main properties of the alignment data;
  • Analysis of the reads mapped inside/outside of the regions provided in GFF format;
  • Computation and analysis of read counts obtained from intersectition of read alignments with genomic features;
  • Analysis of the adequasy of the sequencing depth in RNA-seq experiments;
  • Multi-sample comparison of alignment and counts data;
  • Clustering of epigenomic profiles.
Please cite: Fernando García-Alcalde, Konstantin Okonechnikov, José Carbonell, Luis M. Cruz, Stefan Götz, Sonia Tarazona, Joaquín Dopazo, Thomas F. Meyer and Ana Conesa: Qualimap: evaluating next-generation sequencing alignment data. (PubMed,eprint) Bioinformatics 28(20):2678-2679 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
quast
Quality Assessment Tool for Genome Assemblies
Versions of package quast
ReleaseVersionArchitectures
VCS5.0.2+dfsg-1all
Versions and Archs
License: GPL-2
Debian package not available
Git
Version: 5.0.2+dfsg-1

QUAST evaluates genome assemblies. For metagenomes, please see MetaQUAST project. It works both with and without a given reference genome. The tool accepts multiple assemblies, thus it allows for comparisons.

Please cite: Alla Mikheenko, Andrey Prjibelski, Vladislav Saveliev, Dmitry Antipov and Alexey Gurevich: Versatile genome assembly evaluation with QUAST-LG. Bioinformatics 34(13):i142-i150 (2018)
Registry entries: Bio.tools  Bioconda 
r-bioc-mofa2
Multi-Omics Factor Analysis v2
Versions of package r-bioc-mofa2
ReleaseVersionArchitectures
VCS1.2.2+ds-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 1.2.2+ds-1

The MOFA2 package contains a collection of tools for training and analysing multi-omic factor analysis (MOFA). MOFA is a probabilistic factor model that aims to identify principal axes of variation from data sets that can comprise multiple omic layers and/or groups of samples. Additional time or space information on the samples can be incorporated using the MEFISTO framework, which is part of MOFA2. Downstream analysis functions to inspect molecular features underlying each factor, vizualisation, imputation etc are available.

Registry entries: Bio.tools  Bioconda 
r-bioc-org.mm.eg.db
genome wide annotation for Mouse
Versions of package r-bioc-org.mm.eg.db
ReleaseVersionArchitectures
VCS3.11.4-1all
Versions and Archs
License: Artistic-2.0
Debian package not available
Git
Version: 3.11.4-1

Genome wide annotation for Mouse, primarily based on mapping using Entrez Gene identifiers.

r-cran-drinsight
drug repurposing on transcriptome sequencing data
Versions of package r-cran-drinsight
ReleaseVersionArchitectures
VCS0.1.1-1all
Versions and Archs
License: GPL-2
Debian package not available
Git
Version: 0.1.1-1

The package's name is an acronym for "Drug Repurposing Integration and Systematic Investigation of Genomic High Throughput Data", which pretty much describes it: This is a connectivity mapping-based drug repurposing tool that identifies drugs that can potentially reverse query disease phenotype or have similar functions with query drugs.

Please cite: Jinyan Chan, Xuan Wang, Jacob A Turner, Nicole E Baldwin and Jinghua Gu: Breaking the paradigm: Dr Insight empowers signature-free, enhanced drug repurposing. (PubMed,eprint) Bioinformatics 35(16):2818–2826 (2019)
r-other-apmswapp
GNU R Pre- and Postprocessing For Affinity Purification Mass Spectrometry
Versions of package r-other-apmswapp
ReleaseVersionArchitectures
VCS1.0-1all
Versions and Archs
License: <license>
Debian package not available
Git
Version: 1.0-1

The reliable detection of protein-protein-interactions by affinity purification mass spectrometry (AP-MS) is a crucial stepping stone for the understanding of biological processes. The main challenge in a typical AP-MS experiment is to separate true interaction proteins from contaminants by contrasting counts of proteins binding to specific baits with counts of negative controls.

Please cite: Martina Fischer, Susann Zilkenat, Roman G. Gerlach, Samuel Wagner and Bernhard Y. Renard: Pre- and post-processing workflow for affinity purification mass spectrometry data. (PubMed) Journal of Proteome Research 13(5):2239-49 (2014)
r-other-fastbaps
A fast genetic clustering algorithm that approximates a Dirichlet Process Mixture model
Versions of package r-other-fastbaps
ReleaseVersionArchitectures
VCS1.0.4-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 1.0.4-1

Takes a multiple sequence alignment as input and clusters according to the 'no-admixture' model. It combines ideas from the Bayesian Hierarchical Clustering algorithm of Heller et al. and hierBAPS to produce a rapid and accurate clustering algorithm.

Please cite: Gerry Tonkin-Hill, John A Lees, Stephen D Bentley, Simon D W Frost and Jukka Corander: Fast hierarchical Bayesian analysis of population structure. (PubMed,eprint) Nucleic Acids Research 47(11):5539–5549 (2019)
Registry entries: Bioconda 
raxml-ng
phylogenetic tree inference tool which uses maximum-likelihood
Versions of package raxml-ng
ReleaseVersionArchitectures
VCS1.0.1-1all
Versions and Archs
License: AFFERO-3
Debian package not available
Git
Version: 1.0.1-1

RAxML Next Generation: faster, easier-to-use and more flexible

RAxML-NG is a phylogenetic tree inference tool which uses maximum-likelihood (ML) optimality criterion. Its search heuristic is based on iteratively performing a series of Subtree Pruning and Regrafting (SPR) moves, which allows to quickly navigate to the best-known ML tree. RAxML-NG is a successor of RAxML (Stamatakis 2014) and leverages the highly optimized likelihood computation implemented in libpll (Flouri et al. 2014).

RAxML-NG offers improvements in speed, flexibility and user-friendliness over the previous RAxML versions. It also implements some of the features previously available in ExaML (Kozlov et al. 2015), including checkpointing and efficient load balancing for partitioned alignments.

repeatmasker
screen DNA sequences for interspersed repeats
Versions of package repeatmasker
ReleaseVersionArchitectures
VCS4.0.7-1all
Versions and Archs
License: OpenSoftwareLicense-2.1
Debian package not available
Git
Version: 4.0.7-1

RepeatMasker is a program that screens DNA sequences for interspersed repeats and low complexity DNA sequences. The output of the program is a detailed annotation of the repeats that are present in the query sequence as well as a modified version of the query sequence in which all the annotated repeats have been masked (default: replaced by Ns). Sequence comparisons in RepeatMasker are performed by the program cross_match, an efficient implementation of the Smith-Waterman-Gotoh algorithm developed by Phil Green, or by WU-Blast developed by Warren Gish.

Please cite: Sébastien Tempel: Using and Understanding RepeatMasker. (PubMed) Methods Mol. Biol. 859:29-51 (2012)
Registry entries: Bio.tools  SciCrunch 
roadtrips
case-control association testing with unknown population and pedigree structure
Versions of package roadtrips
ReleaseVersionArchitectures
VCS2.0+dfsg-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 2.0+dfsg-1

ROADTRIPS performs single-SNP, case-control association testing in samples with partially or completely unknown population and pedigree structure. ROADTRIPS uses an empirical covariance matrix calculated from genomewide SNP data to correct for unknown population and pedigree structure, while maintaining high power by taking advantage of known pedigree information when it is available. The program is applicable to association studies with completely general combinations of related and unrelated individuals. Analysis can be performed genomewide (currently just for autosomes).

ROADTRIPS is suitable for applications such as:

  • correcting for possible population structure and/or misspecified relationships in the context of case-control association testing in samples of unrelated individuals and/or related individuals with well- characterized pedigrees
  • case-control association testing in samples from isolated populations for which pedigree information is limited or unavailable
Please cite: Timothy Thornton and Mary Sara McPeek: ROADTRIPS: Case-Control Association Testing with Partially or Completely Unknown Population and Pedigree Structure. (PubMed) American Journal of Human Genetics 86(2):172–184 (2010)
rosa
Removal of Spurious Antisense in biological RNA sequences
Versions of package rosa
ReleaseVersionArchitectures
VCS1.0-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 1.0-1

In stranded RNA-Seq experiments it is possible to detect and measure antisense transcription, important since antisense transcripts impact gene transcription in several different ways. Stranded RNA-Seq determines the strand from which an RNA fragment originates, and so can be used to identify where antisense transcription may be implicated in gene regulation.

However, spurious antisense reads are often present in experiments, and can manifest at levels greater than 1% of sense transcript levels. This is enough to disrupt analyses by causing false antisense counts to dominate the set of genes with high antisense transcription levels.

The RoSA (Removal of Spurious Antisense) tool detects the presence of high levels of spurious antisense transcripts, by:

  • analysing ERCC spike-in data to find the ratio of antisense:sense transcripts in the spike-ins; or
  • using antisense and sense counts around splice sites to provide a set of gene-specific estimates; or
  • both.

Once RoSA has an estimate of the spurious antisense, expressed as a ratio of antisense:sense counts, RoSA will calculate a correction to the antisense counts based on the ratio. Where a gene-specific estimate is available for a gene, it will be used in preference to the global estimate obtained from either spike-ins or spliced reads.

This package provides the library for the statistics suite R.

rsat
Regulatory Sequence Analysis Tools
Versions of package rsat
ReleaseVersionArchitectures
VCS2016-03-14+dfsg-1all
Versions and Archs
License: <license>
Debian package not available
Git
Version: 2016-03-14+dfsg-1

RSAT is a series of modular computer programs specifically designed for the detection of regulatory signals in non-coding sequences.

RSAT servers have been up and running since 1997. The project was initiated by Jacques van Helden, and is now pursued by the RSAT team.

Please cite: Alejandra Medina-Rivera, Matthieu Defrance, Olivier Sand, Carl Herrmann, Jaime A. Castro-Mondrago, Jeremy Delerce, Sébastien Jaeger, Christophe Blanchet, Pierre Vincens, Christophe Caron, Daniel M. Staines, Bruno Contreras-Moreira, Marie Artufel, Lucie Charbonnier-Khamvongsa, Céline Hernandez, Denis Thieffry, Morgane Thomas-Chollier and Jacques van Helden: RSAT 2015: Regulatory Sequence Analysis Tools. (PubMed,eprint) Nucleic Acids Res. 43(W1):W50-W56 (2015)
Registry entries: Bio.tools  SciCrunch 
sailfish
RNA-seq expression estimation
Versions of package sailfish
ReleaseVersionArchitectures
VCS0.10.1+dfsg-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 0.10.1+dfsg-1

RNA-seq is a technology to read at least parts of individual RNA sequences of a tissue sample. After assigning these reads to genes that are likely responsible to have coded for them (mapping), this gives an insight (estimate) about how much these genes have been active (expressed) in that sample. The trickier bits in that process to address is the similarity of genes and the genes being capable to variably but deterministically skip parts of their sequence to be read (introns). A single variantly spliced gene may then yield different sequences (isoforms) and the RNA-seq evaluation better informs about this. It may be relevant for a disease.

Sailfish is particularly good (efficient) in this process. It tricks the complexity by introducing an intermediate level of artificial very short reads to which the alternative splicing is of no concern. That can then be addressed by "telephone-book"-like hashing techniques that are easy and lightning fast. The final presentation is then found to be competitive with established mappers like eXpress and Cufflinks.

Please cite: Rob Patro, Stephen M Mount and Carl Kingsford: Sailfish enables alignment-free isoform quantification from RNA-seq reads using lightweight algorithms. (PubMed) Nature Biotechnology 32(5):462-464 (2014)
Registry entries: Bio.tools 
sap
Pairwise protein structure alignment via double dynamic programming
Versions of package sap
ReleaseVersionArchitectures
VCS1.1.3-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 1.1.3-1

In contrast to DNA, proteins exhibit an apparently unlimited variety of structure. This is a necessary requirement of the vast array of differing functions that they perform in the maintainance of life, again, in contrast to the relatively static archival function of DNA. Not only do we observe a bewildering variety of form but even within a common structure, there is variation in the lengths and orientation substructures. Such variation is both a reflection on the very long time periods over which some structures have diverged and also a consequence of the fact that proteins cannot be completely rigid bodies but must have flexibility to accommodate the structural changes that are almost always necessary for them to perform their functions. These aspects make comparing structure and finding structural similarity over long divergence times very difficult. Indeed, computationally, the problem of recognizing similarity is one of three-dimensional pattern recognition, which is a notoriously difficult problem for computers to perform. In this chapter, guidance is provided on the use of a flexible structure comparison method that overcomes many of the problems of comparing protein structures that may exhibit only weak similarity.

Please cite: William R. Taylor: Protein Structure Comparison Using SAP. (PubMed) 143:19-32 (2000)
Remark of Debian Med team: Precondition for T-Coffee

see http://wiki.debian.org/DebianMed/TCoffee

seq-seq-pan
workflow for the SEQuential alignment of SEQuences
Versions of package seq-seq-pan
ReleaseVersionArchitectures
VCS1.0.1-1all
Versions and Archs
License: BSD-2-clause
Debian package not available
Git
Version: 1.0.1-1

Seq-seq-pan is a framework that provides methods for adding or removing new genomes from a set of aligned genomes and uses these to construct a whole genome alignment. Throughout the sequential workflow the alignment is optimized for generating a representative linear presentation of the aligned set of genomes, that enables its usage for annotation and in downstream analyses.

Please cite: Christine Jandrasits, Piotr W. Dabrowski, Stephan Fuchs and Bernhard Y. Renard: seq-seq-pan: building a computational pan-genome data structure on whole genome alignment. (PubMed,eprint) BMC Genomics 19(1):47 (2018)
Remark of Debian Med team: Needs blat which is not re-distributable
seqwish
alignment to variation graph inducer
Versions of package seqwish
ReleaseVersionArchitectures
VCS0.7.1-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 0.7.1-1

Seqwish implements a lossless conversion from pairwise alignments between sequences to a variation graph encoding the sequences and their alignments. As input we typically take all-versus-all alignments, but the exact structure of the alignment set may be defined in an application specific way. This algorithm uses a series of disk-backed sorts and passes over the alignment and sequence inputs to allow the graph to be constructed from very large inputs that are commonly encountered when working with large numbers of noisy input sequences. Memory usage during construction and traversal is limited by the use of sorted disk-backed arrays and succinct rank/select dictionaries to record a queryable version of the graph.

Registry entries: Bioconda 
signalalign
HMM-HDP models for MinION signal alignments
Versions of package signalalign
ReleaseVersionArchitectures
VCS0.0+git20170131.3293fad+dfsg-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 0.0+git20170131.3293fad+dfsg-1

MinION signal-level alignment and methylation detection using hidden Markov Models with hierarchical Dirichlet process kmer learning.

Nanopore sequencing is based on the principal of isolating a nanopore in a membrane separating buffered salt solutions, then applying a voltage across the membrane and monitoring the ionic current through the nanopore. The Oxford Nanopore Technologies (ONT) MinION sequences DNA by recording the ionic current as DNA strands are enzymatically guided through the nanopore. SignalAlign will align the ionic current from the MinION to a reference sequence using a trainable hidden Markov model (HMM). The emissions model for the HMM can either be the table of parametric normal distributions provided by ONT or a hierarchical Dirichlet process (HDP) mixture of normal distributions. The HDP models enable mapping of methylated bases to your reference sequence.

Registry entries: Bio.tools 
sina
reference based multiple sequence alignment
Versions of package sina
ReleaseVersionArchitectures
VCS1.6.1-1all
Versions and Archs
License: <license>
Debian package not available
Git
Version: 1.6.1-1

SINA is a tool to add sequences to an existing multiple sequence alignment. It needs about 1 second on a single core to add one 16S full length sequence (about 100k/h on a 32-core workstation). It was developed to create the multi-million sequence alignment that is the core of the SILVA SSU and LSU rRNA databases.

Please cite: Elmar Pruesse, Jörg Peplies and Frank Oliver Glöckner: SINA: Accurate high-throughput multiple sequence alignment of ribosomal RNA genes. (PubMed,eprint) Bioinformatics 28(14):1823–1829 (2012)
Registry entries: Bio.tools  Bioconda 
sistr
Salmonella In Silico Typing Resource (SISTR)
Versions of package sistr
ReleaseVersionArchitectures
VCS1.0.2-1all
Versions and Archs
License: Apache-2.0
Debian package not available
Git
Version: 1.0.2-1

The Salmonella In Silico Typing Resource (SISTR) commandline tool allows serovar predictions from whole-genome sequence assemblies by determination of antigen gene and cgMLST gene alleles using BLAST. Mash MinHash can also be used for serovar prediction.

Please cite: Catherine E. Yoshida, Peter Kruczkiewicz, Chad R. Laing, Erika J. Lingohr, Victor P. J. Gannon, John H. E. Nash and Eduardo N. Taboada: The Salmonella In Silico Typing Resource (SISTR): An Open Web-Accessible Tool for Rapidly Typing and Subtyping Draft Salmonella Genome Assemblies. (PubMed,eprint) PLoS One 11(1):e0147101 (2016)
situs
Modeling of atomic resolution structures into low-resolution density maps
Versions of package situs
ReleaseVersionArchitectures
VCS2.7.2-1all
Versions and Archs
License: GPL.
Debian package not available
Git
Version: 2.7.2-1

Situs is an award-winning program package for the modeling of atomic resolution structures into low-resolution density maps e.g. from electron microscopy, tomography, or small angle X-ray scattering. The software supports both rigid-body and flexible docking using a variety of fitting strategies. Situs is developed by Willy Wriggers and collaborators: biomachina.org.

sourmash
tools for comparing DNA sequences with MinHash sketches
Versions of package sourmash
ReleaseVersionArchitectures
VCS4.0.0~rc1-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 4.0.0~rc1-1

Compute MinHash signatures for nucleotide (DNA/RNA) and protein sequences.

MinHash sketches provide a lightweight way to store “signatures” of large DNA or RNA sequence collections, and then compare or search them using a Jaccard index. MinHash sketches can be used to identify samples, find similar samples, identify data sets with shared sequences, and build phylogenetic trees (Ondov et al. 2015).

sourmash provides a command line script, a Python library, and a CPython module for MinHash sketches

Please cite: C. Titus Brown and Luiz Irber: sourmash: a library for MinHash sketching of DNA. (eprint) The Journal of Open Source Software 1(5):27 (2016)
Registry entries: Bio.tools  Bioconda 
sparta
automated reference-based bacterial RNA-seq Transcriptome Analysis
Versions of package sparta
ReleaseVersionArchitectures
VCS1.01+dfsg-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 1.01+dfsg-1

SPARTA is a workflow aimed at analyzing single-end Illumina RNA-seq data. The workflow combines several tools: Trimmomatic (read trimming/adapter removal), FastQC (read quality analysis), Bowtie (mapping reads to the reference genome), HTSeq (transcript/gene feature abundance counting), and edgeR (differential gene expression analysis). Within the differential gene expression analysis step, batch effects can be detected and the user is warned of the potential, unintended additional variable. The analysis procedure is outlined below.

Please cite: Benjamin K. Johnson, Matthew B. Scholz, Tracy K. Teal and Robert B. Abramovitch: SPARTA: Simple Program for Automated reference-based bacterial RNA-seq Transcriptome Analysis. (PubMed,eprint) BMC Bioinformatics 17:66 (2016)
Registry entries: Bio.tools 
ssaha
Sequence Search and Alignment by Hashing Algorithm
Versions of package ssaha
ReleaseVersionArchitectures
VCS3.1c-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 3.1c-1

SSAHA is a software tool for very fast matching and alignment of DNA sequences. It achieves its fast search speed by converting sequence information into a `hash table' data structure, which can then be searched very rapidly for matches.

SSAHA is the only free software of its category (fast search of nearly indentical sequences). The popular alternative, BLAT, is restricted to non-commercial use.

Please cite: Zemin Ning, Anthony J. Cox and James C. Mullikin: SSAHA: A Fast Search Method for Large DNA Databases. (PubMed,eprint) Genome Research 11(10):1725–1729 (2001)
Remark of Debian Med team: Successor for ssaha2 available: smalt

The program smalt is from the same author is according to its author faster and more precise than ssaha2 (except for sequences > 2000bp)

strap
Comfortable and intuitive protein alignment editor / viewer
Versions of package strap
ReleaseVersionArchitectures
VCS1.1.3-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 1.1.3-1

Strap is started from the menu "Science" in the "Applications" menu or with the shell command strap_protein_alignment. Alignments can be manually edited or computed automatically using sequence and/or structure based methods. Information can be attached to proteins and residue selections such as free text notes, balloon messages, cross-references as well as 3D and PDF display styles. Alignments can be exported in several formats: Multiple-Fasta, ClustalW, MSF, HSSP, Jalview. Decorated alignments with residue annotations and secondary structure cartoons can be exported to PDF, HTML and Word-processors to create figures in publication quality - see http://3d-alignment.eu/ for details. Strap is an integrated environment for Bioinformatics tools and resources like DAS sequence features, 3D-visualization, structure prediction and Blast search. It is scriptable and extendable and can be used by other programs to display sequence alignments and 3D-superpositions.

Registry entries: Bio.tools 
strap-base
essential files for the interactive alignment viewer and editor Strap
Versions of package strap-base
ReleaseVersionArchitectures
VCS1.1.3-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 1.1.3-1

Most users should install the package strap which in addition installs required Debian packages for alignment computation and 3D visualization. Strap-base provides utilities for protein and alignment file format conversion: strap_to_clustal, strap_to_msf, strap_to_fasta, strap_to_multiple_fasta. It also provides interactive alignment visualization and HTML export for other bioinformatics software. The command strap_base with the option

 -script=file or -script=named_pipe opens a new interactive alignment
view. Named pipes are the basis for interprocess communication. The

command strap_to_html is a command line tool to produce decorated and annotated alignments suitable for web-browsers with script commands as explained in http://www.bioinformatics.org/strap/alignment-to-html.html.

strelka
strelka2 germline and somatic small variant caller
Versions of package strelka
ReleaseVersionArchitectures
VCS2.9.10+dfsg-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 2.9.10+dfsg-1

Strelka2 is a fast and accurate small variant caller optimized for analysis of germline variation in small cohorts and somatic variation in tumor/normal sample pairs. The germline caller employs an efficient tiered haplotype model to improve accuracy and provide read-backed phasing, adaptively selecting between assembly and a faster alignment- based haplotyping approach at each variant locus. The germline caller also analyzes input sequencing data using a mixture-model indel error estimation method to improve robustness to indel noise. The somatic calling model improves on the original Strelka method for liquid and late- stage tumor analysis by accounting for possible tumor cell contamination in the normal sample. A final empirical variant re-scoring step using random forest models trained on various call quality features has been added to both callers to further improve precision.

Please cite: Sangtae Kim, Konrad Scheffler, Aaron L. Halpern, Mitchell A. Bekritsky, Eunho Noh, Morten Källberg, Xiaoyu Chen, Yeonbin Kim, Doruk Beyter, Peter Krusche and Christopher T. Saunders: Strelka2: fast and accurate calling of germline and somatic variants. (PubMed) Nature Methods 15(8):591–594 (2018)
Registry entries: Bioconda 
tab2mage
submitting large microarray experiment datasets to public repository database
Versions of package tab2mage
ReleaseVersionArchitectures
VCS20080626-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 20080626-1

Tab2MAGE is a software package written and supported by the ArrayExpress curation team, which aims to ease the process of submitting large microarray experiment datasets to our public repository database. To this end, Tab2MAGE currently includes two tools, the tab2mage.pl script itself, and a data file checking script, expt_check.pl. With these scripts it is possible to perform an initial data file validation against an array design (e.g., in the form of an "Array Description File" or ADF), and then to generate MAGE-ML using these data files alongside a separate spreadsheet providing MIAME-compliant sample annotation.

tacg
command line program for finding patterns in nucleic acids
Versions of package tacg
ReleaseVersionArchitectures
VCS4.1-1all
Versions and Archs
License: GPL+additions
Debian package not available
Git
Version: 4.1-1

tacg is a character-based, command line tool for unix-like operating systems for pattern-matching in nucleic acids and performing some of the basic protein manipulations. It was originally designed for restriction enzyme analysis of DNA, but has been extended to other types of matching. It now handles degenerate sequence input in a variety of matching approaches, as well as patterns with errors, regular expressions and TRANSFAC-formatted matrices.

It was designed to be a grep for DNA and like the original grep, its capabilities have grown so that now the author has to keep calling up the help page to figure out which flags (now ~50) mean what. tacg is NOT a GUI application in any sense. However, it's existance as a strictly command-line tool lends itself well to Webification and wrapping by various GUI tools and it is now distributed with a web interface form and a Perl CGI handler. Additionally, it can easily be integrated into editors that support shell commands such as nedit.

Please cite: Harry J Mangalam: tacg - a grep for DNA. (PubMed,eprint) BMC Bioinformatics 3:8 (2002)
tandem-genotypes
compare lengths of duplications in DNA sequences
Versions of package tandem-genotypes
ReleaseVersionArchitectures
VCS1.8.3-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 1.8.3-1

Only a fraction of the DNA in the human genome (and that of other species that are not optimised for the speed of their replication like viruses) are coding for genes. Other parts may be binding to transcription factors or direct the expression of genes in other ways - these other bits may not be fully understood, and parts may indeed be "junk", but this is only until user finds a clinical feature to be statistically associated with something statistically noteworthy in the DNA sequences.

Features that somehow seem informative when looking at the DNA are whatever does not look like random. This tool looks at a special case of repeats - short regions that are duplicated, i.e. they appear as a tandem. When these repeats are longer, then these would be referred as microsatellites.

When interested in structural variations, within a family/population or to compare cancer tissue with benign samples, you may also want to look at these repeats. This software determines the lengths (and changes to the lengths) across samples and knows how to present this graphically.

Registry entries: Bioconda 
tide
SEQUEST Searching for Peptide Identification from Tandem Mass Spectra
Versions of package tide
ReleaseVersionArchitectures
VCS0.0.r15918-1all
Versions and Archs
License: Apache-2.0
Debian package not available
Git
Version: 0.0.r15918-1

Tide implements the SEQUEST algorithm for peptide identification and that achieves a dramatic speedup over Crux and SEQUEST. The optimization strategies detailed here employ a combination of algorithmic and software engineering techniques to achieve speeds up to 170 times faster than a recent version of SEQUEST that uses indexing. For example, on a single Xeon CPU, Tide searches 10,000 spectra against a tryptic database of 27,499 C.\ elegans proteins at a rate of 1,550 spectra per second, which compares favorably with a rate of 8.8 spectra per second for a recent version of SEQUEST with index running on the same hardware.

Please cite: Benjamin J. Diament and William Stafford Noble: Faster SEQUEST Searching for Peptide Identification from Tandem Mass Spectra. (PubMed) Journal of Proteome Research 10(9):3871–3879 (2011)
tigr-glimmer-mg
finding genes in environmental shotgun DNA sequences
Versions of package tigr-glimmer-mg
ReleaseVersionArchitectures
VCS0.3.2-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 0.3.2-1

Glimmer-MG is a system for finding genes in environmental shotgun DNA sequences. Glimmer-MG (Gene Locator and Interpolated Markov ModelER - MetaGenomics) uses interpolated Markov models (IMMs) to identify the coding regions and distinguish them from noncoding DNA.

Please cite: David R. Kelley, Bo Liu, Arthur L. Delcher, Mihai Pop and Steven L. Salzberg: Gene prediction with Glimmer for metagenomic sequences augmented by classification and clustering. (PubMed) Nucleic Acids Research 40(1):e9 (2012)
tn-seqexplorer
explore and analyze Tn-seq data for prokaryotic genomes
Versions of package tn-seqexplorer
ReleaseVersionArchitectures
VCS1.5+dfsg-1all
Versions and Archs
License: GPL
Debian package not available
Git
Version: 1.5+dfsg-1

Tn-seq Explorer allows users to explore and analyze Tn-seq data for prokaryotic (bacterial or archaeal) genomes. It implements two alternative methods for identification of essential genes and provides additional tools to investigate the Tn-seq data. The primary goal of the data analysis is to study fitness by identifying genes that are essentia

Please cite: Sina Solaimanpour, Felipe Sarmiento and Jan Mrázek: Tn-Seq Explorer: A Tool for Analysis of High-Throughput Sequencing Data of Transposon Mutant Libraries. (PubMed,eprint) PLoS ONE 10(5):e0126070 (2015)
ufasta
utility to manipulate fasta files
Versions of package ufasta
ReleaseVersionArchitectures
VCS0.0.3+git20190131.85d60d1-1all
Versions and Archs
License: to_be_clarified
Debian package not available
Git
Version: 0.0.3+git20190131.85d60d1-1

Description of ufasta subcommands:

  • one: remove the new lines in the data section. Hence, all the sequences are written on one line. In some sense, it is the opposite of the format subcommand.
  • format: reformat the data sections. The data is written in lines of the same length, it can changes the content in upper/lower case.
  • sizes: print the amount of sequence in each section
  • head: like UNIX head. Display the first 10 sequences
  • tail: like UNIX tail. Display the last 10 sequences
  • rc: reverse complement every sequence
  • n50, stats: display stats about the sequences: N50, E size, total size, etc.
  • extract: extract a sequence whose header match given names
  • hsort, sort: sort file based on header content
  • dsort: sort the data sections
  • hgreap: output sequences whose header match the regular expression
  • dgresp: output sequences whose sequence match the regular expression
  • split: split a fasta file into many files
umap
quantify genome and methylome mappability
Versions of package umap
ReleaseVersionArchitectures
VCS1.0.0-1all
Versions and Archs
License: GPL-3.0
Debian package not available
Git
Version: 1.0.0-1

Umap identifies uniquely mappable regions of any genome. Its Bismap extension identifies mappability of the bisulfite converted genome (methylome).

Please cite: Mehran Karimzadeh, Carl Ernst, Anshul Kundaje and Michael M. Hoffman: Umap and Bismap: quantifying genome and methylome mappability. (PubMed,eprint) Nucleic Acids Res. 46(20):e120 (2018)
Registry entries: Bioconda 
unc-fish
Fast Identification of Segmental Homology
Versions of package unc-fish
ReleaseVersionArchitectures
VCS1.0+dfsg-1all
Versions and Archs
License: LicenseAgreementFISH
Debian package not available
Git
Version: 1.0+dfsg-1

FISH is software for identifying regions of common ancestry between genome maps. Fast identification and statistical evaluation of segmental homologies in comparative maps.

Development and maintenance of FISH is supported by funding from the National Science Foundation (Plant Genome Research Program Grants DBI-0110069 and DBI-0227314 to TJV and DMS-0102008 to PPC).

Please cite: Peter P. Calabrese, Sugata Chakravarty and Todd J. Vision: Fast identification and statistical evaluation of segmental homologies in comparative maps. (PubMed,eprint) Bioinformatics 19(Suppl 1):i74-i80 (2003)
varmatch
robust matching of small genomic variant datasets
Versions of package varmatch
ReleaseVersionArchitectures
VCS0+git20180126.5c6fed5+dfsg-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 0+git20180126.5c6fed5+dfsg-1

Small variant calling is an important component of many analyses, and, in many instances, it is important to determine the set of variants which appear in multiple callsets. Variant matching is complicated by variants that have multiple equivalent representations. Normalization and decomposition algorithms have been proposed, but are not robust to different representation of complex variants. The VarMatch algorithm is robust to different representation of complex variants and is particularly effective in low complexity regions or those dense in variants. VarMatch also provides summary statistics, annotations, and visualizations that are useful for understanding callers' performance.

Please cite: Chen Sun and Paul Medvedev: VarMatch: robust matching of small variant datasets using flexible scoring schemes. (PubMed) Bioinformatics 33(9):1301-1308 (2017)
vmd
presentation of traces of molecular dynamics runs
Versions of package vmd
ReleaseVersionArchitectures
VCS1.9.1-3all
Versions and Archs
License: University_of_Illinois_non-free
Debian package not available
Git
Version: 1.9.1-3

VMD stands for Visual Molecular Dynamics. While text books and even structure databases because of technical problems only present static pictures of proteins or DNA, for the understanding of the properties of those molecules their vibration or their movement in general is important.

The movements itself are calculated by molecular dynamics programs, such as NAMD (by the same group), Rosetta, BALLView or GROMACS. The latter two are already in the distribution, we have package build instructions for Rosetta.

VMD has a series of nice features, from displaying through animation to analysing. It can be scripted, clustered, and runs on all common OS. Its license does not allow to redistribute a Debian package. But to share these build instructions for such a package is just fine.

Please cite: W. Humphrey, A. Dalke and K. Schulten: VMD: visual molecular dynamics. (PubMed,eprint) Journal of Molecular Graphics 14(1):33-38 (1996)
zodiac-zeden
ZODIAC - Zeden's Organise DIsplay And Compute
Versions of package zodiac-zeden
ReleaseVersionArchitectures
VCS0.6.5-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 0.6.5-1

Zodiac is a molecular modelling suite for computation, analysis and display of molecular data. It features state-of-the-art tools for managing molecular databases, run molecular docking experiments, compute raytraced images and much more.

Unofficial packages built by somebody else

big-blast
Helper tool to run blast on large sequences
License: not specified

This script will chop up a large sequence, run blast on each bit and then write out an EMBL feature table and a MSPcrunch -d file containing the hits.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
estferret
processes, clusters and annotates EST data
License: to be clarified

ESTFerret processes, clusters and annotates EST data. It is user-configurable. Results are currently stored in a series of text tables. Annotation consists of searches against use r-defined blast databases, prosite, GO and allocation of EC numbers where possible.

EST-ferret is a user-configurable, automated pipeline for the convenient analysis of EST sequence data that includes all of the necessary steps for cleanup and trimming, submission to external sequence repositories, clustering, identification by BLAST homology searches and by searches of protein domain databases, annotation with computer-addressable terms and production of outputs for direct entry into microarray analysis packages. It is composed of several widely used, open-source algorithms, including PHRED, CAP3, BLAST, and a range of sequence and annotation databases, including Gene Ontology and Conserved Domain Database to deliver a putative identity and a detailed annotation of each clone. It can be run either step-by-step to track the outputs, or as a single batch process. Users can easily edit the configuration file to define parameter settings.

This package has five major components: (1) ESTs coding system; (2) sequence processing; (3) sequence clustering; (4) sequence annotating and (5) storage and reporting of results. DNA trace files are renamed and converted into FASTA format, cleaned and submitted to dbEST(Boguski, et al, 1993). Sequence assembly uses two rounds of CAP3 to assemble the ESTs into groups corresponding to separate gene families and unique genes. Sequence identification and annotation is provided by a series of BLAST homology searches (Parallel_BLAST and Priority_BLAST) against user-defined sequence databases implemented with the NCBI BLASTALL algorithm. The BLAST results are parsed and annotation terms that reflect functional attributes are captured from Gene Ontology (The Gene Ontology Consortium, 2000), KEGG and Enzyme Commission (EC) databases and applied to each of the clones. CDD (and InterPro) searches are performed for seeking protein domains in the sequences. Other options are provided to run PatSearch, RepeatMasker and BLAT to find UTRs, repeats and EST candidates in genomes. Finally, the package generates analysis reports in a variety of flat file formats, sources of which can be serve as inputs for some gene annotation and gene expression profiling tools, and also as a MySQL database or web-browsable search tool.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
maxd
data warehouse and visualisation environment for genomic expression data
License: Artistic

Maxd is a data warehouse and visualisation environment for genomic expression data. It is being developed in the University of Manchester by the Microarray Bioinformatics Group.

Software components:

 maxdLoad2 - standards-compliant, highly customisable transcriptomics
             database
 maxdView  - modular and easily extensible data visualisation and
             analysis environment
 maxdSetup - installation management utility
Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
migrate
estimation of population sizes and gene flow using the coalescent
License: to be clarified

Migrate estimates effective population sizes and past migration rates between n population assuming a migration matrix model with asymmetric migration rates and different subpopulation sizes. Migrate uses maximum likelihood or Bayesian inference to jointly estimate all parameters. It can use the followind data types: sequence data using Felsenstein's 84 model with or without site rate variation, single nucleotide polymorphism data, microsatellite data using a stepwise mutation model or a brownian motion mutation model, and electrophoretic data using an 'infinite' allele model. The output can contain: Estimates of all migration rates and all population sizes, assuming constant mutation rates among loci or a gamma distributed mutation rate among loci. Profile likelihood tables, Percentiles, Likelihood-ratio tests, and simple plots of the log-likelihood surfaces for all populations and all loci.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
msatfinder
identification and characterization of microsatellites in a comparative genomic context
License: GPL

Msatfinder is a Perl script designed to allow the identification and characterization of microsatellites in a comparative genomic context. There is also an online manual, a discussion forum and an online interface where users can do searches in any number of DNA or protein sequences (as long as the maximum size of all sequences does not exceed 10MB). Nucleotide and amino acid sequences in GenBank, FASTA, EMBL and Swissprot formats are supported.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
oligoarrayaux
Prediction of Melting Profiles for Nucleic Acids
License: non-free (fre academical use)

OligoArrayAux is a subset of the UNAFold package for use with OligoArray (http://berry.engin.umich.edu/oligoarray2_1/). OligoArray is a free software that computes gene specific oligonucleotides for genome-scale oligonucleotide microarray construction. (It is not really specified what they mean with "free software". You can download the source code after registration: "registration is the only way for me to keep trace of OligoArray users and be able to send you a bug fix or a new release".)

The original UNAFold server is available at http://dinamelt.bioinfo.rpi.edu/download.php and you should probably read http://dinamelt.bioinfo.rpi.edu/ if you want to know more about "Prediction of Melting Profiles for Nucleic Acids".

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html

Finally it is hard to find some documentation what OligoArrayAux is really doing because it is only specified into relation to OligoArray (as precondition) and UNAFold (as subset of this) but BioLinux distribution http://envgen.nox.ac.uk/biolinux.html decided to package this and so it might make soem sense to list it here - further investigation is needed.

partigene
generating partial gemomes
License: GPL

PartiGene is part of the Edinburgh-EGTDC developed EST-software pipeline at the moment consisting of trace2dbEST, PartiGene, wwwPartiGene, port4EST and annot8r. PartiGene is a menu-driven, multi-step software tool which takes sequences (usually ESTs) and creates a dataabase of a non-redundant set of sequence objects (putative genes) which we term a partial genome.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
pfaat
Protein Family Alignment Annotation Tool
Responsible: BioLinux - Dan Swan
License: GPL

Pfaat is a Java application that allows one to edit, analyze, and annotate multiple sequence alignments. The annotation features are a key component as they provide a framework to for further sequence, structure and statistical analysis.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
prot4est
EST protein translation suite
License: GPL

prot4EST is a perl script that takes expressed sequence tags (ESTs) and translates them optimally to produce putative peptides. prot4EST intergrates a number of programs to overcome problems inherent with translating ESTs.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
python3-orange
Data mining framework
Responsible: Mitar
License: GPLv3

Orange is a component-based data mining software. It includes a range of data visualization, exploration, preprocessing and modeling techniques. It can be used through a nice and intuitive user interface or, for more advanced users, as a module for Python programming language.

qtlcart
map quantitative traits using a map of molecular markers
Responsible: BioLinux - Dan Swan
License: GPL

QTL Cartographer is a suite of programs to map quantitative traits using a map of molecular markers. It contains a set of programs that will aid in locating the genes that control quantitative traits using a molecular map of markers. It includes some programs to allow simulation studies of experiments.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
rbs-finder
find ribosome binding sites(RBS)
License: not specified

The program implements an algorithm to find ribosome binding sites(RBS) in the upstream regions of the genes annotated by Glimmer2, GeneMark, or other prokaryotic gene finders. If there is no RBS-like patterns in this region, program searches for a start codon having a RBS-like pattern ,in the same reading frame upstream or downstream and relocates start codon accordingly.

You can find more detailed information at http://nbc11.biologie.uni-kl.de/docbook/doc_userguide_bioinformatics_server/chunk/ch01s06.html

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
roche454ace2caf
convert GS20 or FLX assemblies into CAF format
License: not specified

Some tools to convert GS20 or FLX assemblies (454Contigs.ace) into CAF format so that these are correct viewable/editable/... whithin the staden package (gap4). You have then access to "hidden data", exact aligned trace and there positions, base values etc and whith staden-1-7-0 you have graphical access to the associated flowgramm traces (SFF format).

Description, Goals - please take a look at http://genome.imb-jena.de/software/roche454ace2caf/Poster_UserMeeting_GS20_Munich_070328.pdf

Remark of Debian Med team: The BioLinux distribution http://envgen.nox.ac.uk/biolinux.html

maintains a package called bio-linux-assembly-conversion-tools which contains caftools and roche2gap in one package with the following description:

Conversion tools for handling 454 assemblies.

This package contains code from different authors that allow sequence assemblies to be converted into formats such as CAF (Common Assembly Format) or GAP4. This package includes tools to convert assemblies from Newbler's ace format for loading into a gap4 assembly.

splitstree
Analyzing and Visualizing Evolutionary Data
License: to be clarified

Evolutionary data is most often presented as a phylogentic tree, the underlying assumption being that evolution is a branching process. However, real data is never ideal and thus doesn't always support a unique tree, but often supports more than one possible tree. Hence, it makes sense to consider tree reconstruction methods that produce a tree, if the given data heavily favors one tree over all others, but otherwise produces a more general graph that indicates different possible phylogenies. One such method is the Split Decomposition introduced by Hans-Juergen Bandelt and Andreas Dress (1992) and its variations. Another example is Spectral Analysis developed by Hendy, Penny and others.

These and other methods are implemented in the program SplitsTree, that I wrote with contributions from Dave Bryant, Mike Hendy, Holger Paschke, Dave Penny and Udo Toenges. It is based on the Nexus format.

Note: There is a new version 4.0 written from scratch at http://www.splitstree.org/ which requires a license key - so this is probably non-free. Version 3.2 which is linked above has some downloadable source code without any license or copyright statement - so it has to be clarified whether we are able to distribute this code or not.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
taverna
designing and executing myGrid workflows for bioinformatics
License: LGPL

The Taverna workbench is a free software tool for designing and executing workflows, created by the myGrid project, and funded through OMII-UK. Taverna allows users to integrate many different software tools, including web services, such as those provided by the National Center for Biotechnology Information, The European Bioinformatics Institute, the DNA Databank of Japan (DDBJ), SoapLab, BioMOBY and EMBOSS.

The Taverna Workbench provides a desktop authoring environment and enactment engine for scientific workflows expressed in Scufl (Simple Conceptual Unified Flow language). The Taverna enactment engine is also available separately, and other Scufl enactors are available including Moteur. The myExperiment social web site supports finding and sharing of workflows and has special support for Scufl workflows. The Taverna workbench, myExperiment and associated components are developed and maintained by the myGrid team, in collaboration with the open source community.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
taxinspector
browser for entries in the NCBI taxonomy
Responsible: BioLinux - Tim Booth
License: Artistic + other free licenses

TaxInspector is a browser for entries in the NCBI taxonomy. It is designed to run as a plugin to annotation software such as maxdLoad2 and Pedro, but also has a standalone mode.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
tetra
tetranucleotide frequency calculator
License: free academic

The TETRA program can be used to calculate how well tetranucleotide usage patterns in DNA sequences correlate. Such correlations can provide valuable hints on the relatedne ss of DNA sequences, and are particularly useful for metagenomic sequences.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html

No known packages available but some record of interest (WNPP bug)

btk-core - wnpp
biomolecule Toolkit C++ library
Responsible: Morten Kjeldgaard
License: GPL
Debian package not available

The Biomolecule Toolkit is a library for modeling biological macromolecules such as proteins, DNA and RNA. It provides a C++ interface for common tasks in structural biology to facilitate the development of molecular modeling, design and analysis tools.

mirbase - wnpp
The microRNA sequence database
Responsible: Charles Plessy
License: Public Domain
Debian package not available

The miRBase Sequence Database provides a searchable repository for published microRNA sequences and associated annotation, functionality previously provided by the microRNA Registry. miRBase also contains predicted miRNA target genes in miRBase Targets, and provides a gene naming and nomenclature function in the miRBase Registry.

Release 9.1 of the database contains 4449 entries representing hairpin precursor miRNAs, expressing 4274 mature miRNA products, in primates, rodents, birds, fish, worms, flies, plants and viruses.

This package will install the miRBase database for mySQL, EMBOSS, and/or ncbi-blast if you have the corresponding packages installed.

It is possible that mirbase will not be a package from the main archive, but will be autogenerated as part of a larger data packaging effort.

phylowin - wnpp
Graphical interface for molecular phylogenetic inference
License: unknown
Debian package not available

Phylo_win is a graphical colour interface for molecular phylogenetic inference. It performs neighbor-joining, parsimony and maximum likelihood methods and bootstrap with any of them. Many distances can be used including Jukes & Cantor, Kimura, Tajima & Nei, HKY, Galtier & Gouy (1995), LogDet for nucleotidic sequences, Poisson correction for protein sequences, Ka and Ks for codon sequences. Species and sites to include in the analysis are selected by mouse. Reconstructed trees can be drawn, edited, printed, stored and evaluated according to numerous criteria.

This program uses sources files from the Phylip program, which forbids its use for profit. Therfore, Phylo_win will unfortunately have to be distributed in contrib or non-free.

Remark of Debian Med team: Issuer of previous ITP said:

Because I could never figure out the license of Phylo_win, and because the upstream authors released SeaView 4, which provides similar functionalities, I will not package Phylo_win.

Probably it makes sense to remove this project from the prospective packages list.

No known packages available

amoscmp
comparative genome assembly package
License: Artistic
Debian package not available

A comparative assembler is a program that can assemble a set of shotgun reads from an organism by mapping them to the finished sequence of a related organism. Thus, a comparative assembler transforms the traditional overlap-layout-consensus approach to alignment-layout-consensus. The AMOScmp package uses the MUMmer program to perform a mapping of the reads to the reference genome, then processes the alignment results with a sophisticated layout program designed to take into account polymorphisms between the two genomes. For a detailed description of the algorithms involved please refer to the paper listed in the References section.

AMOScmp uses as AMOS messages as both the inputs and the outputs (see documentation). Two utilities are provided to process these files: tarchive2amos - a versatile converter from trace archive .seq, .qual, and .xml information into AMOS formatted data; amos2ace - a converter from AMOS formatted data to the .ACE assembly format. In addition, the AMOS::AmosLib Perl module is provided as a tool for users who prefer to write their own conversion utilities. Please see the documentation included with the distribution for more information.

AMOScmp is part of the AMOS package (see http://amos.sourceforge.net/)- a collaborative effort to develop a modular open-source framework for assembly development.

Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
annovar
annotate genetic variants detected from diverse genomes
License: Open Source for non-profit
Debian package not available

ANNOVAR is an efficient software tool to utilize update-to-date information to functionally annotate genetic variants detected from diverse genomes (including human genome hg18, hg19, as well as mouse, worm, fly, yeast and many others). Given a list of variants with chromosome, start position, end position, reference nucleotide and observed nucleotides, ANNOVAR can perform:

 1. Gene-based annotation: identify whether SNPs or CNVs cause protein coding
    changes and the amino acids that are affected. Users can flexibly use RefSeq
    genes, UCSC genes, ENSEMBL genes, GENCODE genes, or many other gene definition
    systems.
 2. Region-based annotations: identify variants in specific genomic regions,
    for example, conserved regions among 44 species, predicted transcription
    factor binding sites, segmental duplication regions, GWAS hits, database
    of genomic variants, DNAse I hypersensitivity sites, ENCODE
    H3K4Me1/H3K4Me3/H3K27Ac/CTCF sites, ChIP-Seq peaks, RNA-Seq peaks, or many
    other annotations on genomic intervals.
 3. Filter-based annotation: identify variants that are reported in dbSNP,
    or identify the subset of common SNPs (MAF>1%) in the 1000 Genome Project,
    or identify subset of non-synonymous SNPs with SIFT score>0.05, or many
    other annotations on specific mutations.
 4. Other functionalities: Retrieve the nucleotide sequence in any
    user-specific genomic positions in batch, identify a candidate gene list
    for Mendelian diseases from exome data, identify a list of SNPs from
    1000 Genomes that are in strong LD with a GWAS hit, and many other
    creative utilities.

In a modern desktop computer (3GHz Intel Xeon CPU, 8Gb memory), for 4.7 million variants, ANNOVAR requires ~4 minutes to perform gene-based functional annotation, or ~15 minutes to perform stepwise "variants reduction" procedure, making it practical to handle hundreds of human genomes in a day.

arachne
toolkit for Whole Genome Shotgun Assembly
License: free
Debian package not available

Arachne is a toolkit developed for Whole Genome Shotgun Assembly. Arachne consists of a comprehensive set of modules, including a central pipeline (Assemblez) that can be run on almost any genome to produce a draft assembly. Arachne's mandate explicitly includes accommodating difficult genomes with complications such as extreme size, repeats, and high polymorphism rates. In order to construct a reasonably well-connected assembly from such tricky genomes, Arachne provides further tools that can be used after the main module pipeline.

The Arachne code package has been under continuous development since 2000. It began with the classic "overlap-layout-consensus" paradigm and has since developed into a vast collection of tools, implemented in numerous modules, to analyze, visualize and manipulate assemblies. New and improved algorithms are becoming available on a regular basis.

asap
organize the data associated with a genome
Responsible: Andreas Tille
License: GPL
Debian package not available

Developments in genome-wide approaches to biological research have yielded greatly increased quantities of data, necessitating the cooperation of communities of scientists focusing on shared sets of data. ASAP leverages the internet and database technologies to meet these needs. ASAP is designed to organize the data associated with a genome from the early stages of sequence annotation through genetic and biochemical characterization, providing a vehicle for ongoing updates of the annotation and a repository for genome-scale experimental data. Development was motivated by the need to more directly involve a greater community of researchers, with their collective expertise, in keeping the genome annotation current and to provide a synergistic link between up-to-date annotation and functional genomic data. The system is continually under development at the Genome Evolution Lab with the stable, in-use, publicly available University of Wisconsin installation updated regularly.

Software development on ASAP began in early 2002, and ASAP has been continually improved up until the present day. A longstanding goal of the ASAP project was to make the source code of ASAP available so that other installations of ASAP could be implemented. As future ASAP installations come to pass, ASAP will be further extended to be inter-operable between sites.

bambus
hierarchical approach to building contig scaffolds
License: Artistic
Debian package not available

BAMBUS is the first publicly available scaffolding program. It orders and orients contigs into scaffolds based on various types of linking information. Additionally, BAMBUS allows the users to build scaffolds in a hierarchical fashion by prioritizing the order in which links are used. For more information please check out the online documentation.

Note that currently Bambus is undergoing a transition in order to be integrated with the AMOS package (see http://amos.sourceforge.net/)

Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
cactus
License: GPL
Debian package not available

Cactus is an open source problem solving environment designed for scientists and engineers. Its modular structure easily enables parallel computation across different architectures and collaborative code development between different groups.

Cactus provides easy access to many cutting edge software technologies being developed in the academic research community, including the Globus Metacomputing Toolkit, HDF5 parallel file I/O, the PETSc scientific library, adaptive mesh refinement, web interfaces, and advanced visualization tools.

cdna-db
quality-control checking of finished cDNA clone sequences
License: Artistic
Debian package not available

cdna_db is a software system designed for quality-control checking of finished cDNA clone sequences, and their computational analysis. The combination of a relational db (MySQL) schema, and an object-orientated perl API make it easy to implement high-level analyses of these transcript sequences.

The cdna_db can store cDNA clone sequences, and ESTs and consensus/contig sequences also derived from these clones. These are then used by the system to check cDNA clone sequence identity etc (see deneral_doc.txt). For each clone multiple DNA sequence versions can be stored, if for instance, the finished DNA sequence is revised as part of the sequencing process.

A blast pipeline is implemented together with a job control system (with LSF underlying) so that multiple CPUs can be used in parallel to carry out the blasts of large datasets. The searches can be made incremental, so as more cDNA sequences are added to the databank, just the new clones are blasted.

Utility scripts are provided to delete previous search results, and dump cDNA clones sequences (such as those that passed the QC checking) from the cdna_db.

cmap
view comparisons of genetic and physical maps
License: Not specified
Debian package not available

CMap is a web-based tool that allows users to view comparisons of genetic and physical maps. The package also includes tools for curating map data.

contralign
parameter learning framework for protein pairwise sequence alignment
License: Public Domain
Debian package not available

CONTRAlign is an extensible and fully automatic parameter learning framework for protein pairwise sequence alignment based on pair conditional random fields. The CONTRAlign framework enables the development of feature-rich alignment models which generalize well to previously unseen sequences and avoid overfitting by controlling model complexity through regularization.

copycat
fast access to cophylogenetic analyses
License: Use of the program is free for academic purposes at an academic institute. For all other uses, please contact the authors.
Debian package not available

CopyCat provides an easy and fast access to cophylogenetic analyses. It incorporates a wrapper for the program ParaFit, which conducts a statistical test for the presence of congruence between host and parasite phylogenies. CopyCat offers various features, such as the creation of customized host-parasite association data and the computation of phylogenetic host/parasite trees based on the NCBI taxonomy.

e-hive
distributed processing system based on 'autonomous agents'
License: Not specified
Debian package not available

This is a distributed processing system based on 'autonomous agents' and Hive behavioural structure of Honey Bees . It implements all functionality of both data-flow graphs and block-branch diagrams which should allow it to codify any program, algorithm, or parallel processing job control system. It is not bound to any processing 'farm' system and can be adapted to any GRID.

exalt
phylogenetic generalized hidden Markov model for predicting alternatively spliced exons
License: Artistic
Debian package not available

ExAlt is a software program designed to predict alternatively spliced overlapping exons in genomic sequence. The program works in several ways depending on the available input. ExAlt can use information of existing gene structure as well as sequence conservation to improve the precision of it's predictions. ExAlt can also make predictions when only a single genomic sequence is available. ExAlt has been extensively tested on Drosophila melanogaster, but can be adapted to run on other species.

Remark of Debian Med team: Computational Gene Finding (http://www.cbcb.umd.edu/software/)
excavator
gene expression data clustering
License: GPL
Debian package not available
Language: Java

Excavator is a program for gene expression data clustering. It uses a set of unique clustering algorithms developed by the Computational Systems Biology Lab (CSBL) at the University of Georgia. Excavator represents data internally as a minimum spanning tree and outputs results to the user through the use of a micro-array data window, graphs, and a dendrogram viewer.

Features

  • partitioning gene expressions profiles using multiple methods of clustering and definitions of distance between profiles.
  • automatic selection of the most plausible number of clusters in a data set
  • three different ways of viewing data: Micro-array, Gene Expression, and Dendrogram. As well as graphing individual genes from each cluster independently.
  • identification of genes with expression profiles similar to specified seed genes
  • cluster identification from a noisy background
  • numerical comparison between different clustering results of the same data set
  • runnable on command line as well as through a Java GUI
figaro
novel vector trimming software
License: Artistic
Debian package not available

Figaro is a software tool for identifying and removing the vector from raw DNA sequence data without prior knowledge of the vector sequence. By statistically modeling short oligonucleotide frequencies within a set of reads, Figaro is able to determine which DNA words are most likely associated with vector sequence. For a description of Figaro's algorithms please see our paper. Figaro is part of the AMOS suite.

Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
forge
genome assembler for mixed read types
License: Apache 2.0
Debian package not available

Forge Genome Assembler is a parallel, MPI based genome assembler for mixed read types.

Forge is a classic "Overlap layout consensus" genome assembler written by Darren Platt and Dirk Evers. Implemented in C++ and using the parallel MPI library, it runs on one or more machines in a network and can scale to very large numbers of reads provided there is enough collective memory on the machines used. It generates a full consensus alignment of all reads, can handle mixtures of sanger, 454 and illumina reads. There is some support for solid color space and it includes built in tools for vector trimming and contamination screening.

Forge and was originally developed at Exelixis and they have kindly agreed to place the software which underwent much subsequent development outside Exelixis, into the public domain. Forge works with most of the common MPI implementations.

Remark of Debian Med team: Competitor to MIRA2 and wgs-assembler

This package was requested by William Spooner whs@eaglegenomics.com as a competitor to MIRA2 and wgs-assembler.

gbrowse-syn
Generic Synteny Browser
License: Not specified
Debian package not available

GBrowse_syn, or the Generic Synteny Browser, is a GBrowse-based synteny browser designed to display multiple genomes, with a central reference species compared to two or more additional species. It can be used to view multiple sequence alignment data, synteny or co-linearity data from other sources against genome annotations provided by GBrowse. GBrowse_syn is included with the standard GBrowse package (version 1.69 and later). Working examples can be seen at TAIR and WormBase.

genemark
family of gene prediction programs
License: Academic License Agreement
Debian package not available

A family of gene prediction programs developed at Georgia Institute of Technology, Atlanta, Georgia, USA.

genesplicer
computational method for splice site prediction
License: Artistic
Debian package not available

A fast, flexible system for detecting splice sites in the genomic DNA of various eukaryotes. The system has been trained and tested successfully on Plasmodium falciparum (malaria), Arabidopsis thaliana, human, Drosophila, and rice . Training data sets for human and Arabidopsis thaliana are included. Use the GeneSplicer Web Interface to run GeneSplicer directly, or see below for instructions on downloading the complete system including source code.

There is no independent program to train GeneSplicer, but there is a way to obtain the necessary files by using the training procedure of GlimmerHMM.

Remark of Debian Med team: Computational Gene Finding (http://www.cbcb.umd.edu/software/)
genetrack
genomic data storage and visualization framework
Responsible: Charles Plessy
License: MIT
Debian package not available

GeneTrack is a high performance bioinformatics data storage and analysis system designed to store genome wide information. It is currently used to analyze data obtained via high-throughput rapid sequencing platforms such as the 454 and Solexa as well as tiling array data based on various platforms.

genezilla
eukaryotic gene finder
License: Artistic
Debian package not available
Language: C++

GeneZilla is a state-of-the-art program for computational prediction of protein-coding genes in eukaryotic DNA, and is based on the Generalized Hidden Markov Model (GHMM) framework, similar to GENSCAN and GENIE. It is highly reconfigurable and includes software for retraining by the end-user. It is written in highly optimized C++ and runs under most UNIX/Linux platforms. The run time and memory requirements are linear in the sequence length, and are in general much better than those of competing systems, due to GeneZilla's novel decoding algorithm. Graph-theoretic representations of the high scoring open reading frames are provided, allowing for exploration of sub-optimal gene models. It utilizes Interpolated Markov Models (IMMs), Maximal Dependence Decomposition (MDD), and includes states for signal peptides, branch points, TATA boxes, CAP sites, and will soon model CpG islands as well.

GeneZilla is an open-source project hosted at bioinformatics.org and currently consists of ~20,000 lines of code. GeneZilla evolved out of the ab initio eukaryotic gene finder TIGRscan, which was developed at The Institute for Genomic Research over a 3-year period under NIH grants R01-LM06845 and R01-LM007938, and which served as the basis for the comparative gene finder TWAIN.

Remark of Debian Med team: Computational Gene Finding (http://www.cbcb.umd.edu/software/)
genographer
read data and reconstruct them into a gel image
License: GPL
Debian package not available

This program will read in data from an ABI 3700, 3100, 377 or 373, CEQ 2000 or SCF and reconstruct them into a gel image which is straightened and sized. Bins can be defined easily and viewed as thumbnails, which allows for a fairly quick and easy way of scoring a gel.

The program is written in Java and uses the Java 1.3 API. Therefore, it should run on any machine that can run java.

glimmerhmm
Eukaryotic Gene-Finding System
License: Artistic
Debian package not available

GlimmerHMM is a new gene finder based on a Generalized Hidden Markov Model (GHMM). Although the gene finder conforms to the overall mathematical framework of a GHMM, additionally it incorporates splice site models adapted from the GeneSplicer program and a decision tree adapted from GlimmerM. It also utilizes Interpolated Markov Models for the coding and noncoding models . Currently, GlimmerHMM's GHMM structure includes introns of each phase, intergenic regions, and four types of exons (initial, internal, final, and single). A basic user manual can be consulted here.

Remark of Debian Med team: Computational Gene Finding (http://www.cbcb.umd.edu/software/)
gmv
comparative genome browser for Murasaki
License: GPL
Debian package not available

GMV is a comparative genome browser for Murasaki. GMV visualizes anchors from Murasaki, annotation data from GenBank files, and expression / prediction score from GFF files.

jigsaw
gene prediction using multiple sources of evidence
License: Artistic
Debian package not available

JIGSAW is a program designed to use the output from gene finders, splice site prediction programs and sequence alignments to predict gene models. The program provides an automated way to take advantage of the many succsessful methods for computational gene prediction and can provide substantial improvements in accuracy over an individual gene prediction program.

JIGSAW is available for all species. It is tested on Human, Rice (Oryza sativa), Arabidopsis thaliana , Brugia malayi, Cryptococcus neoformans, Entamoeba histolytica, Theileria parva, Aspergillus fumigatus, Plasmodium falciparum and Plasmodium yoelii.

The linear combiner option is now available in the current JIGSAW software distribution. This allows JIGSAW to be run without the use of training data. A weight is assigned to each evidence source, and gene predictions are based on a weighted voting scheme, yielding the best 'consensus' predictions.

Predictions are now available for the ENCODE regions in Human and viewable as custom tracks in the UCSC Human Genome Browser. Predictions available for the Human genome and viewable as custom tracks in the UCSC Human Genome Browser

Remark of Debian Med team: Computational Gene Finding (http://www.cbcb.umd.edu/software/)
maker2
annotate genomes and create genome databases
License: GPL / Artistic
Debian package not available

MAKER is a portable and easily configurable genome annotation pipeline. It's purpose is to allow smaller eukaryotic and prokaryotic genome projects to independently annotate their genomes and to create genome databases. MAKER identifies repeats, aligns ESTs and proteins to a genome, produces ab-initio gene predictions and automatically synthesizes these data into gene annotations having evidence-based quality values. MAKER is also easily trainable: outputs of preliminary runs can be used to automatically retrain its gene prediction algorithm, producing higher quality gene-models on seusequent runs. MAKER's inputs are minimal and its ouputs can be directly loaded into a GMOD database. They can also be viewed in the Apollo genome browser; this feature of MAKER provides an easy means to annotate, view and edit individual contigs and BACs without the overhead of a database. MAKER should prove especially useful for emerging model organism projects with minimal bioinformatics expertise and computer resources

metarep
JCVI Metagenomics Reports
License: MIT
Debian package not available

JCVI Metagenomics Reports (METAREP) is a new open source tool for high-performance comparative metagenomics. It provides a suite of web based tools to help scientists to view, query, browse and compare metagenomics annotation data derived from ORFs called on metagenomics reads.

METAREP supports browsing of functional and taxonomic assignments. Users can either specify fields, or logical combinations of fields to flexibly filter datasets on the fly. Users can compare multiple datasets at various functional and taxonomic levels applying statistical tests as well as hierarchical clustering, multidimensional scaling and heatmaps.

minimus
AMOS lightweight assembler
License: Artistic
Debian package not available

minimus is an assembly pipeline designed specifically for small data-sets, such as the set of reads covering a specific gene. Note that the code will work for larger assemblies (we have used it to assemble bacterial genomes), however, due to its stringency, the resulting assembly will be highly fragmented. For large and/or complex assemblies the execution of Minimus should be followed by additional processing steps, such as scaffolding.

minimus follows the Overlap-Layout-Consensus paradigm and consists of three main modules:

  • overlapper - computes the overlaps between the reads using a modified version of the Smith-Waterman local alignment algorithm
  • tigger - uses the read overlaps to generate the layouts of reads representing individual contigs
  • make-consensus - refines the layouts produced by the tigger to generate accurate multiple alignments within the reads

minimus uses as AMOS messages as both the inputs and the outputs (see documentation). Two utilities are provided to process these files: tarchive2amos - a versatile converter from trace archive .seq, .qual, and .xml information into AMOS formatted data; amos2ace - a converter from AMOS formatted data to the .ACE assembly format. In addition, the AMOS::AmosLib Perl module is provided as a tool for users who prefer to write their own conversion utilities. Please see the documentation included with the distribution for more information.

minimus is part of the AMOS package - a collaborative effort to develop a modular open-source framework for assembly development.

Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
mummergpu
High-throughput sequence alignment using Graphics Processing Units
License: Artistic
Debian package not available

The recent availability of new, less expensive high-throughput DNA sequencing technologies has yielded a dramatic increase in the volume of sequence data that must be analyzed. These data are being generated for several purposes, including genotyping, genome resequencing, metagenomics, and de novo genome assembly projects. Sequence alignment programs such as MUMmer have proven essential for analysis of these data, but researchers will need ever faster, high-throughput alignment tools running on inexpensive hardware to keep up with new sequence technologies.

MUMmerGPU is a low cost, ultra-fast sequence alignment program designed to handle the increasing volume of data produced by new, high-throughput sequencing technologies. MUMmerGPU is a GPGPU drop-in replacement for MUMmer, using the GPUs in common workstations to simultaneously align multiple query sequences against a single reference sequence stored as a suffix tree. By processing the queries in parallel on the highly parallel graphics card, MUMmerGPU achieves more than a 10-fold speedup over a serial CPU version of the sequence alignment kernel, and outperforms MUMmer on a high end CPU by 3.5-fold in total application time when aligning reads from recent sequencing projects using Solexa/Illumina, 454, and Sanger sequencing technologies.

Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
obo-edit
editor for biological ontologies
License: Artistic
Debian package not available

(Open Biological Ontologies) Obo-Edit supports the formal representation of biological entities and the specification of is-a (specialisation) and part-of relations. Amongst the databases cureated by this tool is the GeneOntology.

operondb
detect and analyze conserved gene pairs
License: to be clarified
Debian package not available

Comparison of complete microbial genomes reveals a large number of conserved gene clusters - sets of genes that have the same order in two or more different genomes. Such gene clusters often, but not always represent a co-transcribed unit, or operon. A method was developed to detect and analyze conserved gene pairs - pairs of genes that are located close on the same DNA strand in two or more bacterial genomes. For each conserved gene pair, an estimate of probability is calculated that the genes belong to the same operon. The algorithm takes into account several alternative possibilities. One is that functionally unrelated genes may have the same order due simply because they were adjacent in a common ancestor. Other possibilities are that genes may be adjacent in two genomes by chance alone, or due to horizontal transfer of the gene pair.

The method is modified from the one described in: Maria D. Ermolaeva, Owen White and Steven L. Salzberg. Prediction of Operons in Microbial Genomes. Nucleic Acids Research, 29, 1216-1221, (2001)

OperonDB was supported by the NIH under grant R01-LM007938 and by the NSF under grant DBI-0234704.

Remark of Debian Med team: Other sequence analysis tools (http://www.cbcb.umd.edu/software/);

no info about license or downloadable code found, but tried to contact authors.

phagefinder
heuristic computer program to identify prophage regions within bacterial genomes
License: GPL
Debian package not available
Language: Perl

It uses tab-delimited results from NCBI BLASTALL or WU BLASTP 2.0 searches against a collection of bacteriophage protein sequences and results from HMMSEARCH analysis of 441 phage-specific HMMs to locate prophage regions. By using FASTA33, MUMMER or BLASTN, it can find potential attachment (att) sites of the phage region(s). Data from tRNAscan-SE and Aragorn are used to determine whether a tRNA or tmRNA served as the putative target for integration. Additionally, by looking for the presence or absence of specific proteins using specific HMM models, Phage_Finder can predict whether the region is most likely prophage and which type (Mu, P2, or retron R73), an integrated element, a plasmid, or a degenerate phage region.

The goal of this project is to provide an open-sourced, standardized and automated system to identify and classify prophages within prokaryotic genomes. It is hoped that this package will facilitate future studies on the biology and evolution of these prophages by providing a level of microbial genome annotation that was previously void.

phpphylotree
draw phylogenetic trees
License: GPL
Debian package not available

PhpPhylotree is a web application that is able to draw phylogenetic trees. It produces an SVG (Scalable Vector Graphic) file from phylip/newick tree files.

phylographer
Graph Visualization Tool
License: GPL
Debian package not available
Language: Tcl/Tk

PhyloGrapher is a program designed to visualize and study evolutionary relationships within families of homologous genes or proteins (elements). PhyloGrapher is a drawing tool that generates custom graphs for a given set of elements. In general, it is possible to use PhyloGrapher to visualize any type of relations between elements. Used in conjunction with tcl_blast_parser, PhyloGrapher can represent the results of a BLAST search as a graph.

PhyloGrapher and tcl_blast_parser are useful tools to analyse BLAST biological sequence alignment reports (BLAST is provided by Debian's blast2 package).

Remark of Debian Med team: Outdated upstream, better alternatives available

The former packaging effort of this package was dropped. It seems that http://cytoscape.org/ is a reasonable replacement.

pyrophosphate-tools
for assembling and searching pyrophosphate sequence data
License: not specified
Debian package not available

Simple tools for assembling and searching high-density picolitre pyrophosphate sequence data.

rose
Region-Of-Synteny Extractor
License: Open Source
Debian package not available

ROSE is a program which identifies regions between two genomes which are likely to contain orthologous genes. The two genomes are given as two multi fasta files of DNA sequences. The PROmer program from the MUMmer package needs to be run first between the two genomes, and the resulting delta file is then input to ROSE. If a previous annotation is available for one or both genomes, then the coordinates of the annotated genes from a genome can be optionally given as input in a gff file. The gene coordinates will be used to guide the length of the regions produced by ROSE. By default, when finding a region of consistent alignments, ROSE will add a user-defined margin (1000 bp by default) on either side of that region. When a predicted gene overlaps an alignment we use the gene prediction to extend the boundaries of the output region.

Remark of Debian Med team: Computational Gene Finding (http://www.cbcb.umd.edu/software/)
treebuilder3d
viewer of SAGE and other types of gene expression data
License: GPL
Debian package not available
Language: Java

TreeBuilder3D is an interactive viewer that allows organization of SAGE and other types of gene expression data such as microarrays into hierarchical dendrograms, or phenetic networks (the term 'phenetic' used as the analysis relies on principals, used in phylogenetic analysis by system biology). Might be used as a visual aid when analyzing differences in expression profiles of SAGE libraries, serves as an alternative to Venn diagrams.

tripal
collection of Drupal modules for genomic research
License: GPL ( as Drupal a derivative )
Debian package not available

Tripal is a collection of open-source freely available Drupal modules under development at CUGI and a member of the GMOD family of tools. Tripal serve as a web interface for the GMOD Chado database. Tripal intially started as a web front-end for the Marine Genomics Project (MG.org). Work on the interface is currently ongoing for the MG.org project as well as the Fagaceae Genomics Web, and other CUGI projects. Tripal is currently being implemented for the new Cacao Genome Database, and Citrus Genome Database and will be used for the Genome Database for Rosaceae. These latter three databases are projects of the Main Bioinformatics Laboratory at Washington State University

twain
syntenic genefinder employing a Generalized Pair Hidden Markov Model
License: Open Source
Debian package not available

TWAIN is a new syntenic genefinder which employs a Generalized Pair Hidden Markov Model (GPHMM) to predict genes in two closely related eukaryotic genomes simultaneously. It utilizes the MUMmer package to perform approximate alignment before applying a GPHMM based on an enhanced version of the TigrScan gene finder. TWAIN was written by Bill Majoros and Mihaela Pertea while at The Institute for Genomic Research (TIGR).

TWAIN consists of two components: (1) ROSE, the Region Of Synteny Extractor, which identifies contiguous regions likely to contain one or more syntenic genes, and (2) OASIS, a generalized pair hidden Markov model (GPHMM) for predicting genes in the regions identified by ROSE. The system utilizes approximate alignments constructed by the PROmer and NUCmer programs in the MUMmer package to assess approximate alignment scores efficiently. More detailed information on the architecture of this system will be made available soon. Slides from a talk at Computational Genomics 2004 are now available.

Remark of Debian Med team: Computational Gene Finding (http://www.cbcb.umd.edu/software/)
uniprime
workflow-based platform for universal primer design
Responsible: Charles Plessy
License: GPL-3+
Debian package not available

UniPrime automatically designs large sets of universal primers by simply inputting a GeneID reference. It automatically retrieves and aligns orthologous sequences from GenBank, identifies regions of conservation within the alignment and generates suitable primers that can amplify variable genomic regions. UniPrime differs from previous automatic primer design programs in that all steps of primer design are automated, saved and are phylogenetically limited. We have experimentally verified the efficiency and success of this program. UniPrime is an experimentally validated, fully automated program that generates successful cross-species primers that take into account the biological aspects of the PCR.

x-tandem-pipeline
peptide/protein identification from MS/MS mass spectra
License: GPL
Debian package not available
Language: Java

X!Tandem is an open-source software performing peptide/protein identification from MS/MS mass spectra. X!Tandem is fast and accurate, but the Global Proteome Machine (GPM) is relatively limited regarding the processing of identification results. X!Tandem pipeline is an alternative to the installation of the GPM on local servers. X!Tandem pipeline performs database searching and matching on a list of MS/MS runs in one shot, using a list of easily user selected paramaters and databases. X!Tandem pipeline also performs filtering of data according to statistical values at peptide and protein levels. The results are stored into TSV (Tab Separated Values) files. Moreover, redundancy of protein databases are fully filtered as follows :

  • proteins identified without specific peptides compared to others are eliminated;
  • proteins identified with the same pool of peptides are assembled;
  • proteins are grouped by function (identified with at least one common peptide), and the specific peptides for each sub-group of proteins are indicated.
*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 236867