Debian Med Project
Help us to see Debian used by medical practitioners and biomedical researchers! Join us on the Salsa page.
Summary
Biology
pacchetti di bioinformatica per Debian Med

Questo metapacchetto installa i pacchetti Debian per l'uso in biologia molecolare, biologia strutturale e altre scienze biologiche.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Med to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Med mailing list

Links to other tasks

Debian Med Biology packages

Official Debian packages with high relevance

abacas
chiude vuoti in allineamenti genomici da letture corte
Versions of package abacas
ReleaseVersionArchitectures
bookworm1.3.1-9all
jessie1.3.1-2all
stretch1.3.1-3all
buster1.3.1-5all
sid1.3.1-9all
bullseye1.3.1-9all
trixie1.3.1-9all
Debtags of package abacas:
roleprogram
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ABACAS (Algorithm Based Automatic Contiguation of Assembled Sequences, disposizione automatica in modo contiguo, basata su algoritmi, di sequenze assemblate) è pensato per organizzare in modo contiguo (allineare, ordinare, orientare), visualizzare e progettare primer rapidamente per chiudere vuoti su sequenze contigue assemblate con metodo shotgun basate su una sequenza di riferimento.

ABACAS usa MUMmer per trovare le posizioni di allineamenti e identificare sintenie di sequenze contigue assemblate rispetto al riferimento. L'output è quindi elaborato per generare una pseudomolecola prendendo in considerazione le sequenze contigue sovrapponibili e i vuoti. ABACAS genera un file di confronto che può essere usato per visualizzare sequenze contigue ordinate e orientate in ACT. Le sintenie sono rappresentate con barre rosse la cui densità di colore decresce con valori minori dell'uguaglianza percentuale tra i blocchi confrontabili. Le informazioni sulle sequenze contigue, come l'orientamento, l'uguaglianza percentuale, la copertura e la sovrapposizione con altre sequenze contigue possono anche essere visualizzate caricando il file di output con le caratteristiche in ACT.

The package is enhanced by the following packages: abacas-examples
Please cite: Samuel Assefa, Thomas M. Keane, Thomas D. Otto, Chris Newbold and Matthew Berriman: ABACAS: algorithm-based automatic contiguation of assembled sequences. (PubMed,eprint) Bioinformatics 25(15):1968-1969 (2009)
Topics: Probes and primers
abpoa
adaptive banded Partial Order Alignment
Versions of package abpoa
ReleaseVersionArchitectures
bookworm1.4.1-3amd64,arm64,ppc64el
trixie1.5.3-1amd64,arm64,ppc64el
sid1.5.3-1amd64,arm64,ppc64el
Popcon: 1 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

abPOA is an extended version of Partial Order Alignment (POA) that performs adaptive banded dynamic programming (DP) with an SIMD implementation. abPOA can perform multiple sequence alignment (MSA) on a set of input sequences and generate a consensus sequence by applying the heaviest bundling algorithm to the final alignment graph.

abPOA can generate high-quality consensus sequences from error-prone long reads and offer significant speed improvement over existing tools.

abPOA supports three alignment modes (global, local, extension) and flexible scoring schemes that allow linear, affine and convex gap penalties. It right now supports SSE2/SSE4.1/AVX2 vectorization.

For more information please refer to the paper1 published in Bioinformatics.

Please cite: Yan Gao, Yongzhuang Liu, Yanmei Ma, Bo Liu, Yadong Wang and Yi Xing: abPOA: an SIMD-based C library for fast partial order alignment using adaptive band. Bioinformatics 37(15):2209–2211 (2021)
abyss
assemblatore di sequenze, parallelo, de novo per letture corte
Versions of package abyss
ReleaseVersionArchitectures
buster2.1.5-7amd64,arm64,armhf,i386
bullseye2.2.5+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports2.1.5-7~bpo9+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.3.10-1amd64,arm64,mips64el,ppc64el,riscv64
bookworm2.3.5+dfsg-2amd64,arm64,mips64el,ppc64el,s390x
trixie2.3.9-1amd64,arm64,mips64el,ppc64el,riscv64
stretch2.0.2-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.5.2-1 (non-free)amd64
Debtags of package abyss:
roleprogram
Popcon: 3 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

ABySS è un assemblatore di sequenze, parallelo, de novo che è progettato per letture corte. Può essere usato per assemblare dati di sequenza di trascrittoma o genoma. La parallelizzazione è ottenuta usando MPI, OpenMP e pthread.

Please cite: Shaun D. Jackman, Benjamin P. Vandervalk, Hamid Mohamadi, Justin Chu, Sarah Yeo, S. Austin Hammond, Golnaz Jahesh, Hamza Khan, Lauren Coombe, Rene L. Warren and İnanç Birol: "ABySS 2.0: resource-efficient assembly of large genomes using a Bloom filter". (PubMed,eprint) Genome Research 27(5):768-777 (2017)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence assembly
acedb-other
scarica sequenze di proteine o DNA
Versions of package acedb-other
ReleaseVersionArchitectures
buster4.9.39+dfsg.02-4amd64,arm64,armhf,i386
bullseye4.9.39+dfsg.02-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.9.39+dfsg.02-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie4.9.39+dfsg.01-5amd64,armel,armhf,i386
sid4.9.39+dfsg.02-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch4.9.39+dfsg.02-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package acedb-other:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
scopeutility
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto raccoglie tutte quelle piccole applicazioni riunite da acedb sotto il target "other" del suo Makefile.

efetch: presumibilmente un'abbreviazione per "entry fetch", raccoglie informazioni sulle sequenze di DNA e proteine da database pubblici.

Please cite: L. D. Stein and J. Thierry-Mieg: AceDB: a genome database management system. Computing in Science and Engineering 1(3):44-52 (1999)
Registry entries: Bio.tools 
adapterremoval
identificazione e taglio di adattatore e unione di letture di sequenze geniche veloci
Versions of package adapterremoval
ReleaseVersionArchitectures
buster2.2.3-1amd64,arm64,armhf,i386
trixie2.3.3-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.3.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.3.3-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.3.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.2.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream2.3.4
Popcon: 3 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

Questo programma cerca e rimuove sequenze adattatrici rimanenti da dati di sequenziamento ad alta processività (HTS, High-Throughput Sequencing) e (opzionalmente) taglia basi di bassa qualità dall'estremità 3' delle letture dopo la rimozione dell'adattatore. AdapterRemoval può analizzare sia dati a estremità singole e accoppiate e può essere utilizzato per unire letture a estremità accoppiate sovrapposte in sequenze di consenso (più lunghe). In aggiunta, AdapterRemoval può essere utilizzato per recuperare una sequenza adattatrice di consenso da dati ad estremità accoppiate per i quali questa informazione non è disponibile.

The package is enhanced by the following packages: multiqc
Please cite: Mikkel Schubert, Stinus Lindgreen and Ludovic Orlando: AdapterRemoval v2: rapid adapter trimming, identification, and read merging. (PubMed,eprint) BMC Research Notes 9:88 (2016)
Registry entries: SciCrunch 
adun-core
simulatore molecolare
Versions of package adun-core
ReleaseVersionArchitectures
trixie0.81-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.81-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.81-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.81-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.81-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.81-13amd64,arm64,armhf,i386
Popcon: 11 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

Adun è un simulatore biomolecolare che include anche capacità di gestione e analisi di dati. È stato sviluppato presso il Laboratorio di Biofisica e Biochimica Computazionale, una sezione dell'Unità di Ricerca sull'Informatica Biomedica dell'UPF (Universitat Pompeu Fabra).

Questo pacchetto contiene il programma AdunCore e il server Adun. Se si desidera il frontend con interfaccia utente grafica installare il pacchetto adun.app.

Please cite: Michael A. Johnston, Ignacio Fdez. Galván and Jordi Villà-Freixa: Framework-based design of a new all-purpose molecular simulation application: The Adun simulator. (PubMed) J. Comp. Chem. 26(15):1647-1659 (2005)
aegean
toolkit per analisi integrata del genoma
Versions of package aegean
ReleaseVersionArchitectures
trixie0.16.0+dfsg-4amd64,arm64,armel,armhf,i386,ppc64el,s390x
bookworm0.16.0+dfsg-2amd64,arm64,armel,armhf,i386,mipsel,ppc64el,s390x
stretch0.15.2+dfsg-1amd64,arm64,armel,armhf,i386,mipsel,ppc64el,s390x
buster0.16.0+dfsg-1amd64,arm64,armhf,i386
bullseye0.16.0+dfsg-2amd64,arm64,armel,armhf,i386,mipsel,ppc64el,s390x
sid0.16.0+dfsg-4amd64,arm64,armel,armhf,i386,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

AEGeAn Toolkit è progettato per l'analisi e la valutazione di annotazioni di genomi (Analysis and Evaluation of Genome Annotations). Il toolkit contiene svariati programmi di analisi, ad esempio per confrontare insiemi distinti di annotazioni di strutture di geni (ParsEval), calcolo di loci di geni (LocusPocus) e altro.

Please cite: Daniel S Standage and Volker P Brendel: ParsEval: parallel comparison and analysis of gene structure annotations.. (PubMed,eprint) BMC Bioinformatics 13(1):187 (2012)
Topics: Sequencing
aevol
modello digitale di genetica per condurre esperimenti di evoluzione in silico
Versions of package aevol
ReleaseVersionArchitectures
sid5.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm5.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie4.4-1amd64,armel,armhf,i386
stretch4.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster5.0-2amd64,arm64,armhf,i386
bullseye5.0+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie5.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Aevol è un modello digitale di genetica: popolazioni di organismi digitali sono sottoposti a un processo di selezione e variazione che crea una dinamica darwiniana.

Modificando le caratteristiche della selezione (es. dimensione della popolazione, tipo di ambiente, variazioni ambientali) o della variazione (es. tassi di mutazione, tassi di riarrangiamento cromosomico, tipi di riarrangiamento, trasferimento orizzontale), si può studiare sperimentalmente l'impatto di tali parametri sulla struttura degli organismi che si sono evoluti. In particolare Aevol, dal momento che integra un modello di genoma preciso e realistico, permette di studiare le variazioni strutturali del genoma (es. numero di geni, sintenia, proporzione di sequenze codificanti).

La piattaforma di simulazione è fornita con un insieme di strumenti per analizzare filogenie e misurare molte caratteristiche di organismi e popolazioni lungo l'evoluzione.

Please cite: Dusan Misevic, Antoine Frenoy, David P. Parsons and Francois Taddei: Effects of public good properties on the evolution of cooperation. (eprint) :218-225 (2012)
alien-hunter
Interpolated Variable Order Motif per identificare DNA acquisito orizzontalmente
Versions of package alien-hunter
ReleaseVersionArchitectures
stretch1.7-5all
bullseye1.7-8all
bookworm1.7-10all
buster1.7-7all
jessie1.7-3all
sid1.7-10all
trixie1.7-10all
Debtags of package alien-hunter:
fieldbiology, biology:structural
roleprogram
scopeutility
useanalysing
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Alien_hunter è un'applicazione per predire presunti eventi di trasferimento orizzontale di geni (HGT) tramite l'implementazione di IVOM (Interpolated Variable Order Motifs). L'approccio con IVOM sfrutta deviazioni nella composizione usando distribuzioni di motivi ad ordine variabile e determina in modo più affidabile la composizione locale di una sequenza rispetto ad altri metodi di ordine fissato. Le predizioni possono opzionalmente essere analizzate con un HMM (Hidden Markov Model, modello di Markov nascosto) di secondo ordine a due stati, in una infrastruttura di rilevazione di punto di cambiamento, per ottimizzare la localizzazione dei confini delle regioni predette. Le predizioni (in formato embl) possono essere automaticamente caricate nel visualizzatore di genomi Artemis, disponibile all'indirizzo: http://www.sanger.ac.uk/Software/Artemis/.

Please cite: Georgios S. Vernikos and Julian Parkhill: Interpolated variable order motifs for identification of horizontally acquired DNA: revisiting the Salmonella pathogenicity islands. (PubMed,eprint) Bioinformatics 22(18):2196-2203 (2006)
Registry entries: SciCrunch 
alter-sequence-alignment
ambiente per trasformazione di allineamenti di sequenze genomiche
Versions of package alter-sequence-alignment
ReleaseVersionArchitectures
bullseye1.3.4-4all
bookworm1.3.4-6all
sid1.3.4-8all
trixie1.3.4-8all
stretch1.3.3+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.3.4-2all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ALTER (ALignment Transformation EnviRonment, ambiente per trasformazione di allineamenti) è uno strumento per trasformare tra più formati di allineamento di sequenze. ALTER si concentra sulle specifiche dei più diffusi programmi per allineamento e analisi, piuttosto che sulla conversione tra formati più o meno specifici.

Please cite: Daniel Glez-Peña, Daniel Gómez-Blanco, Miguel Reboiro-Jato, Florentino Fdez-Riverola and David Posada: ALTER: program-oriented conversion of DNA and protein alignments". (PubMed,eprint) Nucl. Acids Res. 38(suppl 2):W14-W18 (2010)
Registry entries: Bio.tools  SciCrunch 
altree
programma per effettuare analisi di associazioni e localizzazioni basate su filogenesi
Versions of package altree
ReleaseVersionArchitectures
stretch1.3.1-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.3.1-7amd64,arm64,armhf,i386
bullseye1.3.1-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.3.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.3.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.3.1-2amd64,armel,armhf,i386
sid1.3.2-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package altree:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram, shared-lib
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

ALTree è stato progettato per rilevare associazioni e localizzare siti di suscettibilità tramite alberi filogenetici di aplotipi: in primo luogo, permette di riconoscere l'associazione tra un gene candidato e una malattia, secondariamente, consente di formulare ipotesi sui loci di suscettibilità.

Please cite: Claire Bardel, Vincent Danjean and Emmanuelle Genin: ALTree: association detection and localization of susceptibility sites using haplotype phylogenetic trees. (PubMed,eprint) Bioinformatics 22(11):1402-1403 (2006)
Registry entries: SciCrunch 
amap-align
allineamenti multipli di proteine con appaiamento di sequenze
Versions of package amap-align
ReleaseVersionArchitectures
bookworm2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.2+git20080214.600fc29+dfsg-1amd64,arm64,armhf,i386
stretch2.2-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.2-4amd64,armel,armhf,i386
sid2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.2+git20080214.600fc29+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package amap-align:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 14 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

AMAP è uno strumento a riga di comando per effettuare allineamenti multipli di sequenze peptidiche. Utilizza il metodo di decodifica a posteriori e allineamenti per appaiamenti di sequenze, invece del tradizionale metodo di allineamento progressivo. È l'unico programma di allineamento che permette di controllare il rapporto sensibilità/specificità. È basato sul codice sorgente di ProbCons, ma usa una precisione per le misurazioni degli allineamenti ed elimina le trasformazioni per coerenza.

Lo strumento di visualizzazione Java di AMAP 2.2 non è ancora disponibile come pacchetto Debian.

Please cite: Ariel S. Schwartz and Lior Pachter: Multiple alignment by sequence annealing. (eprint) Bioinformatics 23(2):e24-e29 (2007)
Registry entries: SciCrunch  Bioconda 
Remark of Debian Med team: Dead upstream

The homepage of this project vanished as well as the Download area. An old unmaintained version remained at code.google.com. Please drop the maintainer a note if you have any news of this project.

ampliconnoise
rimozione di rumore da ampliconi PCR sequenziati con 454
Versions of package ampliconnoise
ReleaseVersionArchitectures
buster1.29-8amd64,arm64,armhf,i386
sid1.29-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.29-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.29-2amd64,armel,armhf,i386
bookworm1.29-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.29-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package ampliconnoise:
roleprogram
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

AmpliconNoise è un pacchetto di applicazioni per ripulire dati di sequenziamento ad alte prestazioni. Consiste di tre parti principali:

 Pyronoise - esegue clustering basato su flowgram per individuare letture
 errate;
 SeqNoise - rimuove mutazioni puntuali PCR;
 Perseus - rimuove chimere PCR senza la necessità di un insieme di sequenze
 di riferimento.

Precedentemente esisteva un "Pyronoise" autonomo degli stessi autori e questo pacchetto include una versione aggiornata. C'è anche un "Denoiser" in Qiime che è collegato, ma distinto.

Please cite: Christopher Quince, Anders Lanzen, Russell J Davenport and Peter J Turnbaugh: Removing Noise From Pyrosequenced Amplicons. (PubMed,eprint) BMC Bioinformatics 12:38 (2011)
Registry entries: Bio.tools  SciCrunch 
Topics: Sequencing
andi
stima efficiente delle distanze evolutive
Versions of package andi
ReleaseVersionArchitectures
bookworm0.14-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.14-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.10-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.12-4amd64,arm64,armhf,i386
bullseye0.13-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.14-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Questo è il programma "andi" per stimare la distanza evolutiva tra genomi strettamente correlati. Tali distanze possono essere usate per dedurre filogenie per grandi insiemi di genomi. Dal momento che andi non calcola allineamenti completi, è così efficiente che scala fino a migliaia di genomi di batteri.

Please cite: Bernhard Haubold, Fabian Klötzl and Peter Pfaffelhuber: andi: Fast and accurate estimation of evolutionary distances between closely related genomes. (PubMed,eprint) Bioinformatics 31(8):1169-1175 (2015)
Registry entries: Bio.tools  Bioconda 
Topics: Phylogenetics
anfo
strumento per allineare/mappare letture corte da MPG
Versions of package anfo
ReleaseVersionArchitectures
sid0.98-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
jessie0.98-4amd64,armel,armhf,i386
stretch0.98-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.98-7amd64,arm64,armhf,i386
bullseye0.98-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Anfo è uno strumento per mappatura nello spirito di Soap/Maq/Bowtie, ma la sua implementazione assomiglia più a BLAST/BLAT. È utile soprattutto per l'allineamento di letture di sequenze in cui la sequenza di DNA è in qualche modo modificata (si pensi a DNA ancestrale o a trattamento con bisolfito) o c'è più divergenza tra il campione e il riferimento di quanta viene gestita bene dai mappatori veloci (ad esempio il genoma di riferimento è mancante e viene usata invece una specie correlata).

Registry entries: SciCrunch 
Topics: Sequencing
any2fasta
converte vari formati per sequenze in FASTA
Versions of package any2fasta
ReleaseVersionArchitectures
bookworm0.4.2-2all
sid0.4.2-2all
trixie0.4.2-2all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Strumenti consolidati come readseq e seqret da EMBOSS creano entrambi ID storpiati contenenti caratteri "|" o "." e non c'è modo di correggere questo comportamento. Ciò porta a incongruenze tra le versioni .gbk e .fna dei file nelle catene di elaborazione.

Questo script usa solo moduli principali di Perl, non ha altre dipendenze come Bioperl o Biopython e viene eseguito molto velocemente.

Gestisce i seguenti formati di input:

 1. file semplici di Genbank, tipicamente .gb, .gbk, .gbff (iniziano con
    LOCUS)
 2. file semplici di EMBL, tipicamente .embl, (iniziano con ID)
 3. GFF con sequenze, tipicamente .gff, .gff3 (iniziano con ##gff)
 4. FASTA DNA, tipicamente .fasta, .fa, .fna, .ffn (iniziano con >)
 5. FASTQ DNA, tipicamente .fastq, .fq (iniziano con @)
 6. allineamenti CLUSTAL, tipicamente .clw, .clu (iniziano con CLUSTAL o
    MUSCLE)
 7. allineamenti STOCKHOLM, tipicamente .sth (iniziano con # STOCKHOLM)
 8. grafi di assemblaggi GFA, tipicamente .gfa (iniziano con ^[A-Z]\t)

I file possono essere compressi con:

 1. gzip, tipicamente .gz
 2. bzip2, tipicamente .bz2
 3. zip, tipicamente .zip
Registry entries: Bioconda 
aragorn
rilevamento di tRNA e tmRNA in sequenze nucleotidiche
Versions of package aragorn
ReleaseVersionArchitectures
jessie1.2.36-4amd64,armel,armhf,i386
stretch1.2.38-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.2.38-2amd64,arm64,armhf,i386
trixie1.2.41-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.2.41-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.2.38-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.38-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Il programma utilizza algoritmi euristici per predire la struttura secondaria di tRNA sulla base dell'omologia con le sequenze di consenso tRNA riconosciute e la capacità di formare una struttura a trifoglio con coppie di basi. I geni tmRNA vengono identificati usando una versione modificata del programma BRUCE.

Please cite: Dean Laslett and Bjorn Canback: ARAGORN, a program to detect tRNA genes and tmRNA genes in nucleotide sequences. (PubMed,eprint) Nucleic Acids Research 32(1):11-16 (2004)
Registry entries: SciCrunch  Bioconda 
Topics: Functional, regulatory and non-coding RNA
arden
controllo di specificità per allineamento di letture che usa un riferimento artificiale
Versions of package arden
ReleaseVersionArchitectures
trixie1.0-6all
jessie1.0-1amd64,armel,armhf,i386
stretch1.0-3all
sid1.0-6all
buster1.0-4all
bullseye1.0-5all
bookworm1.0-5all
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

ARDEN (Artificial Reference Driven Estimation of false positives in NGS data) è un innovativo test che stima i tassi di errore basati su letture sperimentali e su un genoma di riferimento artificiale generato aggiuntivamente. Permette il calcolo di tassi di errore per un insieme specifico di dati e la costruzione di una curva ROC. Perciò può essere usato per ottimizzare i parametri per i mappatori di letture, per scegliere i mappatori di letture per uno specifico problema o anche per filtrare gli allineamenti sulla base della stima della qualità.

Please cite: Sven H. Giese, Franziska Zickmann and Bernhard Y. Renard: Specificity control for read alignments using an artificial reference genome-guided false discovery rate. (PubMed,eprint) Bioinformatics 30(1):9-16 (2013)
Registry entries: SciCrunch 
Topics: Sequencing
ariba
identificazione della resistenza agli antibiotici tramite assemblati
Versions of package ariba
ReleaseVersionArchitectures
bookworm2.14.6+ds-5amd64,arm64,mips64el,ppc64el
stretch-backports2.13.3+ds-1~bpo9+1amd64
buster2.13.3+ds-1amd64
stretch2.6.1+ds-1amd64
bullseye2.14.6+ds-1amd64,arm64,mips64el,ppc64el
sid2.14.7+ds-4amd64,arm64,mips64el,ppc64el,riscv64
trixie2.14.7+ds-4amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 3 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

ARIBA (Antibiotic Resistance Identification By Assembly) è uno strumento che identifica i geni della resistenza agli antibiotici eseguendo assemblati locali. L'input è un file FASTA di geni di riferimento e letture di sequenziamento accoppiate. ARIBA riferisce quali dei geni di riferimento sono stati trovati, più informazioni dettagliate sulla qualità degli assemblati e qualsiasi variante tra le letture di sequenziamento e i geni di riferimento.

Please cite: Martin Hunt, Alison E. Mather, Leonor Sanchez-Buso, Andrew J. Page, Julian Parkhill, Jacqueline A. Keane and Simon R. Harris: ARIBA: rapid antimicrobial resistance genotyping directly from sequencing reads. (PubMed,eprint) Microbial Genomics 3 (2017)
Registry entries: SciCrunch  Bioconda 
art-nextgen-simulation-tools
strumenti di simulazione per generare letture sintetiche di sequenziamento di prossima generazione
Versions of package art-nextgen-simulation-tools
ReleaseVersionArchitectures
bullseye20160605+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch20160605+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster20160605+dfsg-3amd64,arm64,armhf,i386
bookworm20160605+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie20160605+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid20160605+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ART è un insieme di strumenti di simulazione per generare letture sintetiche di sequenziamento di prossima generazione. ART simula letture di sequenziamento imitando il procedimento reale di sequenziamento con modelli empirici di errore o profili di qualità riassunti da grandi dati di sequenziamento ricalibrati. ART può anche simulare letture usando modelli di errore o profili di qualità dell'utente. ART gestisce la simulazione di letture a estremità singole, estremità accoppiate/mate-pair delle tre principali piattaforme commerciali di sequenziamento di prossima generazione: Solexa di Illumina, 454 di Roche e SOLiD di Applied Biosystems. ART può essere usato per test o benchmark di svariati metodi o strumenti per analisi di dati di sequenziamento di prossima generazione, inclusi allineamento di letture, assemblaggio de novo, SNP e scoperta di variazioni di struttura. ART è stato usato come strumento principale per lo studio di simulazione del 1000 Genomes Project. ART è implementato in C++ con algoritmi ottimizzati ed è molto efficiente nella simulazione delle letture. ART fa l'output delle letture nel formato FASTQ e degli allineamenti nel formato ALN. ART può anche generare allineamenti nel formato di file SAM per allineamenti o UCSC BED. ART può esser usato insieme ai simulatori di varianti del genoma (es. VarSim) per valutare strumenti o metodi di identificazione di varianti.

Please cite: Weichun Huang, Leping Li, Jason R. Myers and Gabor T. Marth: ART: a next-generation sequencing read simulator. (PubMed,eprint) Bioinformatics 28(4):593-594 (2012)
Registry entries: SciCrunch  Bioconda 
artemis
navigatore di genomi e strumento per annotazioni
Versions of package artemis
ReleaseVersionArchitectures
trixie18.2.0+dfsg-4all
bookworm18.2.0+dfsg-3all
sid18.2.0+dfsg-4all
buster17.0.1+dfsg-2amd64
stretch16.0.17+dfsg-1all
bullseye18.1.0+dfsg-3amd64
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Artemis è un navigatore di genomi e uno strumento per annotazioni che permette la visualizzazione di caratteristiche delle sequenze, di dati di prossima generazione e dei risultati delle analisi all'interno del contesto della sequenza e anche dei suoi sei moduli di traduzione.

Questo pacchetto include il navigatore di genomi Artemis, lo strumento ACT (Artemis Comparison Tool) e le utilità DNAplotter e BamView.

Please cite: Tim Carver, Simon R. Harris, Matthew Berriman, Julian Parkhill and Jacqueline A. McQuillan: Artemis: an integrated platform for visualization and analysis of high-throughput sequence-based experimental data. (PubMed,eprint) Bioinformatics 28(4):464-469 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
Screenshots of package artemis
artfastqgenerator
produce in output file FASTQ artificiali derivati da un genoma di riferimento
Versions of package artfastqgenerator
ReleaseVersionArchitectures
trixie0.0.20150519-5all
sid0.0.20150519-5all
stretch0.0.20150519-2all
buster0.0.20150519-3all
bullseye0.0.20150519-4all
bookworm0.0.20150519-4all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ArtificialFastqGenerator prende come input un genoma di riferimento (in formato FASTA) e produce in output file FASTQ artificiali nel formato Sanger. Può accettare punteggi di qualità delle basi Phred da file FASTQ esistenti e usarli per simulare errori di sequenza. Dato che i file FASTQ artificiali sono derivati dal genoma di riferimento, quest'ultimo fornisce un gold standard per l'identificazione delle varianti (SNP, polimorfismi a singolo nucleotide, e indel, inserzioni e delezioni). Questo permette la valutazione di una catena di elaborazione dati per l'analisi di NGS (Next Generation Sequencing, sequenziamento di prossima generazione) che allinea letture al genoma di riferimento e poi identifica le varianti.

Please cite: Matthew Frampton and Richard Houlston: Generation of Artificial FASTQ Files to Evaluate the Performance of Next-Generation Sequencing Pipelines. (PubMed,eprint) PLOSone 7(11):e49110 (2012)
assembly-stats
ottiene statistiche sugli assemblaggi da file FASTA e FASTQ
Versions of package assembly-stats
ReleaseVersionArchitectures
sid1.0.1+ds-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.1+ds-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.1+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.1+ds-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Ottiene statistiche da un elenco di file.

La rilevazione del formato FASTA o FASTQ di ciascun file è automatica in base al contenuto dei file, perciò i nomi e le estensioni dei file sono irrilevanti.

Il formato di output predefinito è intellegibile. Si può cambiare il formato di output e ignorare le sequenze più corte di una lunghezza specificata.

Registry entries: Bioconda 
assemblytics
rileva e analizza varianti strutturali dall'assemblato di un genoma
Versions of package assemblytics
ReleaseVersionArchitectures
buster1.0+ds-1all
bookworm1.2.1+dfsg-1all
trixie1.2.1+dfsg-2all
sid1.2.1+dfsg-2all
bullseye1.0+ds-2all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Assemblytics incorpora un peculiare approccio di filtraggio ancorato per aumentare la robustezza agli elementi ripetitivi e identifica sei classi di varianti basate sulle loro firme di allineamento distintive. Assemblytics può essere applicato sia per la comparazione di genomi aberranti, come il cancro umano, sia a un riferimento, oppure per identificare differenze tra specie imparentate.

Please cite: Maria Nattestad and Michael C. Schatz: Assemblytics: a web analytics tool for the detection of variants from an assembly. (PubMed) Bioinformatics 32(19):3021-3023 (2016)
atac
confronto di genomi assemblaggio-verso-assemblaggio
Versions of package atac
ReleaseVersionArchitectures
sid0~20150903+r2013-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0~20150903+r2013-6amd64,arm64,armhf,i386
bullseye0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0~20150903+r2013-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0~20150903+r2013-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

atac calcola un allineamento uno-a-uno per coppie di grandi sequenze di DNA. Prima trova i k-meri unici in ciascuna sequenza, li concatena in blocchi più grandi e riempie gli spazi tra i blocchi. È stato scritto principalmente per trasferire annotazioni tra diversi assemblaggi del genoma umano.

L'output è un insieme di "corrispondenze" senza interruzioni e un insieme di "successioni" con interruzioni formate dalle corrispondenze. Ciascuna corrispondenza o successione associa una sequenza con l'altra sequenza. L'associazione è "unica" nel senso che non ci sono altre associazioni (di dimensioni considerevoli) per l'una o l'altra sequenza. Perciò, grandi ripetizioni e duplicazioni non sono presenti nell'output, appaiono come regioni non mappate.

Sebbene l'output sia sempre a coppie, atac può tenere in cache i risultati intermedi per velocizzare il confronto di sequenze multiple.

Questo pacchetto fa parte della suite Kmer.

The package is enhanced by the following packages: kmer-examples
Please cite: B. Walenz and L. Florea: Sim4db and leaff: Utilities for fast batched spliced alignment and sequence indexing. (PubMed) Bioinformatics 27(13):1869-1870 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
ataqv
QC e visualizzazione di ATAC-seq
Versions of package ataqv
ReleaseVersionArchitectures
bullseye1.2.1+ds-1amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el
trixie1.3.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
sid1.3.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm1.3.0+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Toolkit per misurare e confrontare i risultati di ATAC-seq realizzato dal laboratorio Parker alla University of Michigan. È stato scritto per aiutare a capire quanto bene ha funzionato il saggio ATAC-seq e facilitare l'individuazione di differenze che potrebbero essere causate dalla preparazione della libreria o dal sequenziamento.

Please cite: Peter Orchard, Yasuhiro Kyono, John Hensley, Jacob O. Kitzman and Stephen C.J. Parker: Quantification, Dynamic Visualization, and Validation of Bias in ATAC-Seq Data with ataqv. (eprint) Cell Systems 10(3):2405-4712 (2020)
atropos
strumento per taglio di letture NGS che è specifico, sensibile e veloce
Versions of package atropos
ReleaseVersionArchitectures
bookworm1.1.31+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid1.1.32+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie1.1.32+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye1.1.29+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Atropos è uno strumento per taglio di letture NGS specifico, sensibile e veloce. È un fork del venerando strumento per taglio di letture Cutadapt, con questi principali miglioramenti:

  1. supporto per multi-thread, inclusa una modalità "scrittura parallela"
     estremamente veloce;
  2. implementazione di un nuovo algoritmo di taglio basato su allineamento
     di inserimenti per letture corte che è sostanzialmente più sensibile e
     specifico dell'algoritmo originale di Cutadapt basato su allineamenti
     di adattatori; questo algoritmo può anche correggere le non
     corrispondenze tra le porzioni sovrapposte delle letture;
  3. opzioni per tagliare tipi specifici di dati (miRNA, bisulfite-seq);
  4. un nuovo comando ("detect") che rileverà sequenze di adattatori e
     altri potenziali contaminanti;
  5. un nuovo comando ("error") che stimerà il tasso di errore di
     sequenziamento, che aiuta a selezionare i valori appropriati di taglio
     per adattatori e qualità;
  6. un nuovo comando ("qc") che genera statistiche di lettura simili a
     FastQC; anche il comando trim può calcolare statistiche sia prima, sia
     dopo il taglio (usando l'opzione "--stats");
  7. rapporti riassuntivi migliorati, incluso il supporto per formati di
     serializzazione (JSON, YAML, pickle), il supporto per modelli definiti
     dall'utente (tramite la dipendenza opzionale da Jinja2) e
     l'integrazione con MultiQC;
  8. l'abilità di fondere letture sovrapposte (questo è sperimentale e la
     funzionalità è limitata);
  9. l'abilità di scrivere rapporti riassuntivi e messaggi di registro su
     file separati;
 10. l'abilità di leggere file SAM/BAM e leggere/scrivere file FASTQ
     interlacciati;
 11. taglio diretto di letture da accessioni SRA;
 12. una barra di avanzamento e altri minori miglioramenti di usabilità.
Please cite: John P. Didion, Marcel Martin and Francis S. Collins: Atropos: specific, sensitive, and speedy trimming of sequencing reads. (PubMed,eprint) PeerJ 5:e3720 (2017)
Registry entries: Bio.tools  Bioconda 
augur
componenti della catena di elaborazione di dati per analisi in tempo reale di virus
Versions of package augur
ReleaseVersionArchitectures
sid24.4.0-1all
buster-backports6.4.2-2~bpo10+1all
trixie24.4.0-1all
bullseye11.0.0-1all
bookworm20.0.0-1all
upstream26.1.0
Popcon: 2 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Il progetto nextstrain è un tentativo di creare strumenti di visualizzazione e catene di elaborazione di dati informatici flessibili per tenere traccia dell'evoluzione in corso di patogeni mano a mano che emergono i dati delle sequenze. Il progetto nextstrain deriva da nextflu, che era specifico per l'evoluzione dell'influenza.

nextstrain è composto da tre componenti:

  • fauna: database e script di IO per dati seriologici e di sequenze;
  • augur: catene di elaborazione di dati informatiche per fare inferenza da dati grezzi;
  • auspice: applicazione web per visualizzare le inferenze risultanti.
augustus
predizione di geni in genomi di eucarioti
Versions of package augustus
ReleaseVersionArchitectures
buster3.3.2+dfsg-2amd64,arm64,armhf
stretch3.2.3+dfsg-1amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
bullseye3.4.0+dfsg2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.5.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

AUGUSTUS è un software per la predizione di geni in sequenze genomiche di eucarioti che è basato su un modello di Markov nascosto (HMM) generalizzato, un modello probabilistico di una sequenza e della sua struttura di geni. Dopo aver appreso le strutture dei geni da una annotazione di riferimento, AUGUSTUS usa l'HMM per riconoscere i geni in una nuova sequenza e la annota con le regioni di geni identificati. Suggerimenti esterni, es. dal sequenziamento di RNA, EST o allineamenti di proteine, ecc., possono essere usati per guidare e migliorare il processo di ricerca dei geni. Il risultato è l'insieme delle strutture di geni più probabili che rispettano tutti i vincoli dati dall'utente, se tali strutture di geni esistono. AUGUSTUS include già HMM pronti per molte specie e script per istruire modelli personalizzati usando genomi annotati.

Please cite: Stefanie König, Lars Romoth, Lizzy Gerischer and Mario Stanke: Simultaneous gene finding in multiple genomes. (PubMed,eprint) Bioinformatics 32(22):3388-3395 (2016)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Gene transcripts; Gene and protein families
autodock
analisi dei legami dei ligandi alla struttura di una proteina
Versions of package autodock
ReleaseVersionArchitectures
sid4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch4.2.6-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye4.2.6-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie4.2.6-2amd64,armel,armhf,i386
buster4.2.6-6amd64,arm64,armhf,i386
Debtags of package autodock:
fieldbiology, biology:structural
interfacecommandline
roleprogram
scopeutility
useanalysing
works-with3dmodel
Popcon: 9 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

AutoDock è un rappresentante di spicco dei programmi che si occupano della simulazione dell'aggancio di ligandi chimici piuttosto piccoli a recettori proteici piuttosto grandi. Le versioni precedenti avevano tutta la flessibilità nei ligandi, mentre la proteina era mantenuta piuttosto rigida. Questa ultima versione 4 permette anche la flessibilità di catene laterali selezionate di residui superficiali, cioè tiene in considerazione i rotameri.

Il programma AutoDock esegue l'aggancio del ligando ad una serie di griglie che descrivono la proteina bersaglio. AutoGrid pre-calcola queste griglie.

The package is enhanced by the following packages: autogrid
Screenshots of package autodock
autodock-vina
docking di molecole piccole su proteine
Versions of package autodock-vina
ReleaseVersionArchitectures
sid1.2.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.1.2-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.1.2-5amd64,arm64,armhf,i386
stretch1.1.2-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.1.2-3amd64,armel,armhf,i386
bookworm1.2.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 14 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

AutoDock Vina è un programma per supportare la scoperta di medicinali, il docking molecolare e lo screening virtuale di librerie di composti. Offre funzionalità multi-core, alte prestazioni e accuratezza migliorata e facilità d'uso.

Lo stesso istituto ha sviluppato anche autodock, che è largamente usato.

O. Trott, A. J. Olson, "AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization and multithreading", Journal of Computational Chemistry 31 (2010) 455-461

Please cite: Oleg Trott and Arthur J. Olson: AutoDock Vina: Improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. (eprint) Journal of Computational Chemistry 31(2):455-461 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
autogrid
pre-calcola il legame di legandi ai loro recettori
Versions of package autogrid
ReleaseVersionArchitectures
bookworm4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster4.2.6-6amd64,arm64,armhf,i386
bullseye4.2.6-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.2.6-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch4.2.6-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie4.2.6-2amd64,armel,armhf,i386
Debtags of package autogrid:
fieldbiology, biology:structural
interfacecommandline
roleprogram
scopeutility
useanalysing
works-with3dmodel
Popcon: 6 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

AutoDockSuite affronta l'analisi molecolare dell'attracco di piccoli composti chimici ai loro recettori di struttura tridimensionale nota.

Il programma AutoGrid esegue pre-calcoli per l'attracco di un ligando ad un insieme di griglie che descrive l'effetto che la proteina ha sulle cariche dei punti. L'effetto di queste forze sul ligando viene quindi analizzato dal programma AutoDock.

avogadro
sistema di grafica e modellamento molecolare
Versions of package avogadro
ReleaseVersionArchitectures
bullseye1.93.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.97.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.99.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.0.3-10.1amd64,armel,armhf,i386
stretch1.2.0-1+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.2.0-4amd64,arm64,armhf,i386
sid1.99.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package avogadro:
fieldchemistry
roleprogram
uitoolkitqt
useviewing
Popcon: 47 users (26 upd.)*
Versions and Archs
License: DFSG free
Git

Avogadro è un sistema di grafica e modellamento molecolare pensato per molecole e biomolecole. Può visualizzare proprietà come orbitali molecolari * potenziali elettrostatici e ha uno strumento di uso intuitivo per la creazione di molecole.

Le sue caratteristiche includono:

  • modellatore molecolare con ottimizzazione automatica geometrica basata sui campi di forze;
  • meccanica molecolare comprese ricerche di limiti e conformazioni;
  • visualizzazione di orbitali molecolari e iso-superfici generiche;
  • visualizzazione di vibrazioni e disegno degli spettri vibrazionali;
  • gestione di unità a cella cristallografiche;
  • generazione di input per i pacchetti di chimica quantistica Gaussian, GAMESS e MOLPRO;
  • architettura flessibile a plugin e script Python.

Tra i formati di file che Avogadro può leggere sono inclusi PDB, XYZ, CML, CIF, Molden, oltre all'output di Gaussian, GAMESS e MOLPRO.

Please cite: Marcus D Hanwell, Donald E Curtis, David C Lonie, Tim Vandermeersch, Eva Zurek and Geoffrey R Hutchison: Avogadro: An advanced semantic chemical editor, visualization, and analysis platform. (eprint) J. Cheminf. 4:17 (2012)
Registry entries: Bio.tools  SciCrunch 
axe-demultiplexer
demultiplatore di letture di sequenziamento di DNA basato su trie
Versions of package axe-demultiplexer
ReleaseVersionArchitectures
bullseye0.3.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.3.2+dfsg1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.3.3+dfsg-1amd64,arm64,armhf,i386
bookworm0.3.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.3.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.3.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Axe seleziona molto rapidamente il codice a barre ottimale presente in una sequenza letta, anche in presenza di errori di sequenziamento. L'algoritmo è in grado di gestire codici a barre combinatori, codici a barre di lunghezze diverse e diverse non corrispondenze per codice a barre.

Registry entries: SciCrunch 
baitfisher
software package for designing hybrid enrichment probes
Versions of package baitfisher
ReleaseVersionArchitectures
sid1.2.7+git20211020.de26d5c+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.2.7+git20180107.e92dbf2+dfsg-1amd64,arm64,armhf,i386
trixie1.2.7+git20211020.de26d5c+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.2.7+git20211020.de26d5c+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.2.7+git20190123.241d060+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The BaitFisher package consists of two programs: BaitFisher and BaitFilter.

BaitFisher was been designed to construct hybrid enrichment baits from multiple sequence alignments (MSAs) or annotated features in MSAs. The main goal of BaitFisher is to avoid redundancy in the construction of baits by designing fewer baits in conserved regions of the MSAs and designing more baits in variable regions. This makes use of the fact that hybrid enrichment baits can differ to some extends from the target region, which they should capture in the enrichment procedure. By specifying the allowed distance between baits and the sequences in the MSAs the user can control the allowed bait-to-target distance and the degree of reduction in the number of baits that are designed. See the BaitFisher paper for details.

BaitFilter was designed (i) to determine whether baits bind unspecifically to a reference genome, (ii) to filter baits that only have partial length matches to a reference genome, (iii) to determine the optimal bait region in a MSA and to convert baits to a format that can be uploaded at a bait constructing company. The optimal bait region can be the most conserved region in the MSA or the region with the highest number of sequences without gaps or ambiguous nucleotides.

Please cite: Christoph Mayer, Manuela Sann, Alexander Donath, Martin Meixner, Lars Podsiadlowski, Ralph S. Peters, Malte Petersen, Karen Meusemann, Karsten Liere, Johann-Wolfgang Wägele, Bernhard Misof, Christoph Bleidorn, Michael Ohl and Oliver Niehuis: BaitFisher: A Software Package for Multispecies Target DNA Enrichment Probe Design. (PubMed,eprint) Mol. Biol. Evol. 33(7):1875-1886 (2016)
Registry entries: SciCrunch  Bioconda 
bali-phy
inferenza baiesiana di allineamenti e filogenie
Versions of package bali-phy
ReleaseVersionArchitectures
trixie3.6.1+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3.4+dfsg-1amd64,arm64,armhf,i386
experimental4.0~beta13+dfsg-1amd64,arm64,i386,ppc64el,s390x
experimental4.0~beta2+dfsg-1armhf,mips64el
bullseye3.6.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.6.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.6.1+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

BAli-Phy (Bayesian Inference of Alignment and Phylogeny) stima allineamenti multipli di sequenze e alberi evolutivi da sequenze di codoni, amminoacidi o DNA non allineato. BAli-Phy usa MCMC per stimare alberi evolutivi, selezione positiva e lunghezze dei rami mentre fa la media su allineamenti alternativi. BAli-Phy può visualizzare graficamente l'ambiguità degli allineamenti in un diagramma AU (alignment uncertainty).

BAli-Phy può anche stimare filogenie da un allineamento fisso (come MrBayes e BEAST) usando modelli di sostituzione come GTR+gamma. BAli-Phy stima automaticamente tassi relativi per ciascun gene.

Please cite: Benjamin D. Redelings and Marc A. Suchard: Joint Bayesian Estimation of Alignment and Phylogeny. (PubMed,eprint) Systematic Biology 54(3):401-418 (2005)
Registry entries: Bio.tools 
ballview
strumento libero per modelli e grafici molecolari
Versions of package ballview
ReleaseVersionArchitectures
jessie1.4.2+20140406-1amd64,armel,armhf,i386
stretch1.4.3~beta1-3amd64,arm64,armel,armhf,i386,mips,ppc64el,s390x
sid1.5.0+git20180813.37fc53c-11amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.5.0+git20180813.37fc53c-11amd64,arm64,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.5.0+git20180813.37fc53c-6amd64,arm64,i386,mips64el,mipsel,ppc64el,s390x
buster1.5.0+git20180813.37fc53c-3amd64,arm64,i386
upstream1.5.0+git20220524.d85d2dd
Debtags of package ballview:
interfacex11
roleprogram
uitoolkitqt
x11application
Popcon: 6 users (8 upd.)*
Newer upstream!
License: DFSG free
Git

BALLView fornisce una veloce visualizzazione delle strutture molecolari basata sulle OpenGL, metodi per meccanismi molecolari (minimizzazione, simulazione MD tramite i campi di forze AMBER, CHARMM, e MMFF94), calcolo e visualizzazione delle proprietà elettrostatiche (FDPB) e funzionalità di modifica molecolare.

BALLView può essere considerato un'interfaccia utente grafica basata su BALL (Biochemical Algorithms Library - libreria di algoritmi biochimici), con una particolare attenzione specialmente verso le richieste più comuni dei chimici delle proteine e dei biofisici. È stato sviluppato dal gruppo di Hans-Peter Lenhof (Università del Saarland, Saarbruecken, Germania) e Oliver Kohlbacher (Università di Tubinga, Germania). BALL è un'infrastruttura per applicazioni C++ che è stata progettata specificatamente per lo sviluppo veloce del software nel modellamento molecolare e nella biologia molecolare computazionale. Fornisce un ampio insieme di strutture di dati come anche classi per la meccanica molecolare, metodi di solvatazione avanzati, confronto e analisi delle strutture proteiche, importazione ed esportazione dei file e visualizzazione.

Please cite: Andreas Moll, Andreas Hildebrandt, Hans-Peter Lenhof and Oliver Kohlbacher: BALLView: a tool for research and education in molecular modeling. (PubMed,eprint) Bioinformatics 22(3):365-366 (2006)
Registry entries: SciCrunch 
Screenshots of package ballview
bamclipper
rimuove sequenze primer specifiche di geni da allineamenti SAM/BAM
Versions of package bamclipper
ReleaseVersionArchitectures
bookworm1.0.0-3all
sid1.0.0-3all
trixie1.0.0-3all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Rimuove sequenze primer specifiche di geni da allineamenti SAM/BAM di ampliconi di PCR con soft-clipping.

bamclipper.sh fa il soft-clip di primer specifici di geni da file di allineamenti BAM basati su coordinate genomiche di coppie di primer in formato BEDPE.

Please cite: Chun Hang Au, Dona N Ho, Ava Kwong, Tsun Leung Chan and Edmond S K Ma: BAMClipper: removing primers from alignments to minimize false-negative mutations in amplicon next-generation sequencing. (PubMed,eprint) Scientific Reports 7(1):1567 (2017)
Registry entries: Bioconda 
bamkit
strumenti per comuni manipolazioni di file BAM
Versions of package bamkit
ReleaseVersionArchitectures
bullseye0.0.1+git20170413.ccd079d-2all
trixie0.0.1+git20170413.ccd079d-3all
bookworm0.0.1+git20170413.ccd079d-3all
sid0.0.1+git20170413.ccd079d-3all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto fornisce alcuni strumenti Python 3 per manipolazioni comuni di file BAM.

bamtools
toolkit per manipolare file BAM (allineamento di genoma)
Versions of package bamtools
ReleaseVersionArchitectures
trixie2.5.2+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.5.1+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.5.2+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.4.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.5.1+dfsg-3amd64,arm64,armhf,i386
bookworm2.5.2+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.3.0+dfsg-2amd64,armel,armhf,i386
Popcon: 6 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

BamTools facilita l'analisi in ricerca e la gestione dei dati usando file BAM. Fa fronte all'enorme quantità di dati prodotti dalle tecnologie di sequenziamento attuali che sono tipicamente memorizzati in formati binari compressi che non sono facilmente gestiti dagli analizzatori basati su testo comunemente usati nella ricerca bioinformatica.

BamTools fornisce sia un'API C++ per gestire file BAM, sia un toolkit a riga di comando.

Questo è il toolkit bamtools a riga di comando.

Comandi bamtools disponibili:

 convert  converte tra BAM e numerosi altri formati
 count    stampa il numero di allineamenti in file BAM
 coverage stampa statistiche di copertura dal file BAM in input
 filter   filtra file BAM secondo criteri specificati dall'utente
 header   stampa informazioni dell'intestazione BAM
 index    genera l'indice per un file BAM
 merge    unisce più file BAM in un singolo file
 random   sceglie allineamenti casuali da file BAM esistenti,
          è pensato principalmente come strumento di test
 resolve  risolve letture paired-end (segnando il flag IsProperPair
          quando necessario)
 revert   rimuove marcature duplicate e ripristina le qualità originali
          delle basi
 sort     ordina il file BAM secondo certi criteri
 split    divide un file BAM in base a una proprietà specificata
          dall'utente, creando in output un nuovo file BAM per ogni
          valore trovato
 stats    stampa alcune statistiche di base dai file BAM in input
The package is enhanced by the following packages: multiqc
Please cite: Derek W. Barnett, Erik K. Garrison, Aaron R. Quinlan, Michael P. Stromberg and Gabor T. Marth: BamTools: a C++ API and toolkit for analyzing and managing BAM files. (PubMed,eprint) Bioinformatics 27(12):1691-2 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bandage
applicazione bioinformatica per navigare facilmente grafi di assemblati de novo
Versions of package bandage
ReleaseVersionArchitectures
bookworm0.9.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.8.1-1amd64,arm64,armhf,i386
bullseye0.8.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.9.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.9.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Bandage è un programma con GUI che permette agli utenti di interagire con grafi di assemblati creati da assemblatori de novo come Velvet, SPAdes, MEGAHIT e altri.

I grafi degli assemblati de novo non contengono solo i contig assemblati, ma anche le connessioni tra tali contig, che precedentemente non erano facilmente accessibili. Bandage visualizza grafi di assemblati, con connessioni, usando algoritmi di disposizione di grafi. I nodi nel grafo disegnato, che rappresentano i contig, possono essere automaticamente etichettati con il loro ID, lunghezza o profondità. Gli utenti possono interagire con il grafo spostando, etichettando e colorando i nodi. Le informazioni sulla sequenza possono essere estratte anche direttamente dal visualizzatore del grafo. Visualizzando le connessioni tra contig, Bandage apre nuove possibilità per analizzare e migliorare gli assemblati de novo, che non sono possibili osservando i contig da soli.

Ulteriori informazioni e collegamenti per il download si trovano sul sito web di Bandage: rrwick.github.io/Bandage

Il pacchetto è attinente al campo dell'assemblaggio del genoma.

The package is enhanced by the following packages: bandage-examples
Please cite: Ryan R. Wick, Mark B. Schultz, Justin Zobel and Kathryn E. Holt: Bandage: interactive visualisation of de novo genome assemblies. (PubMed,eprint) Bioinformatics 31(20):3350-3352 (2015)
Registry entries: Bio.tools  Bioconda 
barrnap
predizione veloce di RNA ribosomiale
Versions of package barrnap
ReleaseVersionArchitectures
bullseye0.9+dfsg-2all
sid0.9+dfsg-4all
trixie0.9+dfsg-4all
bookworm0.9+dfsg-3all
stretch0.7+dfsg-2all
buster0.9+dfsg-1all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Barrnap (BAsic Rapid Ribosomal RNA Predictor) predice la posizione nei genomi dei geni del RNA ribosomiale. Gestisce batteri (5S, 23S, 16S), archaea (5S, 5,8S, 23S, 16S), mitocondri (12S, 16S) ed eucarioti (5S, 5,8S, 28S, 18S).

Accetta in input sequenze di DNA FASTA e scrive GFF3 come output. Utilizza lo strumento NHMMER che viene fornito con HMMER 3.1 per la ricerca HMM in stile RNA:DNA. È gestito l'uso di più thread e ci si possono attendere aumenti della velocità approssimativamente lineari con l'aumentare delle CPU.

Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Functional, regulatory and non-coding RNA
bbmap
BBTools genomic aligner and other tools for short sequences
Versions of package bbmap
ReleaseVersionArchitectures
bookworm39.01+dfsg-2all
buster-backports38.63+dfsg-1~bpo10+1all
bullseye38.90+dfsg-1all
sid39.11+dfsg-1all
trixie39.11+dfsg-1all
upstream39.13
Popcon: 0 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

The BBTools are a collection of small programs to solve recurrent tasks for the creative handling of short biological RNA/DNA sequences. This suite may be best known for its mapper, which is also the name of the project on sourceforge, but several tools have been added over time. All tools are multi-threaded, implemented platform-independently in Java:

BBMap: Short read aligner for DNA and RNA-seq data. Capable of handling arbitrarily large genomes with millions of scaffolds. Handles Illumina, PacBio, 454, and other reads; very high sensitivity and tolerant of errors and numerous large indels.

BBNorm: Kmer-based error-correction and normalization tool.

Dedupe: Simplifies assemblies by removing duplicate or contained subsequences that share a target percent identity.

Reformat: Reformats reads between fasta/fastq/scarf/fasta+qual/sam, interleaved/paired, and ASCII-33/64, at over 500 MB/s.

BBDuk: Filters, trims, or masks reads with kmer matches to an artifact/contaminant file.

The package is enhanced by the following packages: multiqc
Please cite: Brian Bushnell, Jonathan Rood and Esther Singer: BBMerge – Accurate paired shotgun read merging via overlap. (PubMed,eprint) PLOS One (2017)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bcalm
compattamento de Bruijn in poca memoria
Versions of package bcalm
ReleaseVersionArchitectures
sid2.2.3-5amd64,arm64,mips64el,ppc64el,riscv64
trixie2.2.3-5amd64,arm64,mips64el,ppc64el,riscv64
bookworm2.2.3-4amd64,arm64,mips64el,ppc64el
bullseye2.2.3-1amd64,arm64,i386,mips64el,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Uno strumento di bioinformatica per costruire il grafo compattato de Bruijn dai dati di sequenziamento.

Questa è la versione parallela del software BCALM che usa la libreria gatb-core.

Please cite: Rayan Chikhi, Antoine Limasset and Paul Medvedev: Compacting de Bruijn graphs from sequencing data quickly and in low memory.. (eprint) Bioinformatics 32(12):208 (2016)
bcftools
identificazione di varianti genomiche e manipolazione di file VCF/BCF
Versions of package bcftools
ReleaseVersionArchitectures
bullseye1.11-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster1.9-1amd64,arm64,armhf
sid1.20-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.3.1-1amd64,arm64,armel,mips64el,mipsel,ppc64el
trixie1.20-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch-backports1.8-1~bpo9+1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
bookworm1.16-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
upstream1.21
Popcon: 22 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

BCFtools è un insieme di utilità che manipolano identificazioni di varianti nel formato Variant Call Format (VCF) e nella sua controparte binaria BCF. Tutti i comandi funzionano in modo trasparente sia con VCF sia con BCF, compressi con BGZF e non.

The package is enhanced by the following packages: multiqc
Please cite: Petr Danecek and Shane A. McCarthy: BCFtools/csq: Haplotype-aware variant consequences. (2016)
Registry entries: Bio.tools  SciCrunch  Bioconda 
beads
identificazione di spot in immagini di gel di elettroforesi 2-DE
Versions of package beads
ReleaseVersionArchitectures
buster1.1.18+dfsg-3amd64,arm64,armhf,i386
bookworm1.1.22-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.20-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.1.22-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Beads è un programma per la rilevazione di spot in immagini di gel 2D. È basato su un'analogia con biglie che si muovono verso l'alto sulla superficie dell'immagine del gel e sull'analisi dei loro percorsi (Langella & Zivy, 2008).

Please cite: Olivier Langella and Michel Zivy: A method based on bead flows for spot detection on 2-D gel images. (PubMed) Proteomics 8(23-24):4914-8 (2008)
beagle
identificazione del genotipo, determinazione della fase di genotipo e imputazione di marcatori non genotipizzati
Versions of package beagle
ReleaseVersionArchitectures
bullseye5.1-200518+dfsg-1all
buster5.0-180928+dfsg-1+deb10u1all
bookworm220722-1all
trixie220722-1all
sid220722-1all
stretch4.1~160727-86a+dfsg-1all
upstream241029
Popcon: 5 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Beagle fa identificazione del genotipo, determinazione della fase di genotipo, imputazione di marcatori non genotipizzati e rilevamento di segmenti di identità per discendenza. L'imputazione genotipica funziona su aplotipi a fase usando il modello di frequenza di aplotipi di Li e Stephens. Beagle implementa anche l'algoritmo Refined IBD per rilevazione di segmenti di omozigosità per discendenza (HBD) e identità per discendenza (IBD).

The package is enhanced by the following packages: beagle-doc
Please cite: Sharon R. Browning and Brian L. Browning: Rapid and Accurate Haplotype Phasing and Missing-Data Inference for Whole-Genome Association Studies By Use of Localized Haplotype Clustering. (eprint) The American Journal of Human Genetics 81(5):1084-1097 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
beast-mcmc
inferenza filogenetica bayesiana MCMC
Versions of package beast-mcmc
ReleaseVersionArchitectures
bookworm1.10.4+dfsg-5all
trixie1.10.4+dfsg-5all
buster1.10.4+dfsg-1all
bullseye1.10.4+dfsg-2all
stretch1.8.4+dfsg.1-1all
sid1.10.4+dfsg-5all
jessie1.8.0-1 (contrib)all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

BEAST è un programma multipiattaforma per l'analisi bayesiana MCMC di sequenze molecolari. È interamente orientato verso filogenie con radici, misurate nel tempo e inferite usando modelli di orologio rigidi o rilassati. Può essere usato come un metodo di ricostruzione di filogenie ma è anche un'infrastruttura per testare ipotesi evolutive senza condizionamento su una singola topologia dell'albero. BEAST usa MCMC per mediare sullo spazio dell'albero, in modo che ogni albero sia pesato proporzionalmente alla sua probabilità a posteriori. È incluso un programma con un'interfaccia utente semplice da usare per impostare analisi standard e una suite di programmi per analizzare i risultati.

The package is enhanced by the following packages: beast-mcmc-doc beast-mcmc-examples
Please cite: Alexei J Drummond and Andrew Rambaut: BEAST: Bayesian evolutionary analysis by sampling trees. (PubMed,eprint) BMC Evol Biol 8(7):214 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
beast2-mcmc
inferenza filogenetica bayesiana MCMC
Versions of package beast2-mcmc
ReleaseVersionArchitectures
trixie2.7.6+dfsg-1all
stretch2.4.4+dfsg-1all
sid2.7.6+dfsg-1all
bookworm2.7.3+dfsg-1all
bullseye2.6.3+dfsg-2all
buster2.5.1+dfsg-2all
upstream2.7.7
Popcon: 2 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

BEAST è un programma multipiattaforma per l'analisi bayesiana MCMC di sequenze molecolari. È interamente orientato verso filogenie con radici, misurate nel tempo e inferite usando modelli di orologio rigidi o rilassati. Può essere usato come un metodo di ricostruzione di filogenie ma è anche un'infrastruttura per testare ipotesi evolutive senza condizionamento su una singola topologia dell'albero. BEAST usa MCMC per mediare sullo spazio dell'albero, in modo che ogni albero sia pesato proporzionalmente alla sua probabilità a posteriori. È incluso un programma con un'interfaccia utente semplice da usare per impostare analisi standard e una suite di programmi per analizzare i risultati.

Questa non è una nuova versione a monte di beast-mcmc (1.x), ma piuttosto una versione riscritta.

The package is enhanced by the following packages: beast2-mcmc-doc beast2-mcmc-examples
Please cite: Remco Bouckaert, Joseph Heled, Denise Kühnert, Tim Vaughan, Chieh-Hsi Wu, Dong Xie, Marc A. Suchard, Andrew Rambaut and Alexei J. Drummond: BEAST 2: A Software Platform for Bayesian Evolutionary Analysis. (PubMed,eprint) PLoS Comput Biol 10(4):e1003537 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bedops
operazioni ad alte prestazioni su tratti genomici
Versions of package bedops
ReleaseVersionArchitectures
stretch-backports2.4.35+dfsg-1~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.4.41+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.4.41+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.4.41+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.4.39+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4.35+dfsg-1amd64,arm64,armhf,i386
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

BEDOPS è una suite di strumenti per rispondere a domande comuni sollevate negli studi genomici, principalmente a riguardo di sovrapposizioni e relazioni di prossimità tra insiemi di dati. Ha l'obiettivo di essere scalabile e flessibile, facilitando l'analisi accurata ed efficiente e la gestione di dati genomici su vasta scala.

Please cite: Shane Neph, M. Scott Kuehn, Alex P. Reynolds, Eric Haugen, Robert E. Thurman, Audra K. Johnson, Eric Rynes, Matthew T. Maurano, Jeff Vierstra, Sean Thomas, Richard Sandstrom, Richard Humbert and John A. Stamatoyannopoulos: BEDOPS: high-performance genomic feature operations. (PubMed,eprint) 28(14):1919-1920 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bedtools
suite di utilità per confrontare tratti genomici
Versions of package bedtools
ReleaseVersionArchitectures
sid2.31.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.26.0+dfsg-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
buster2.27.1+dfsg-4amd64,arm64,armhf
bullseye2.30.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.30.0+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.31.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.21.0-1amd64,armhf,i386
Debtags of package bedtools:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, filtering
works-withbiological-sequence
Popcon: 31 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Le utilità BEDTools permettono di affrontare compiti comuni negli studi genomici, come trovare i tratti che si sovrappongono e calcolare la copertura. Le utilità sono largamente basate su quattro formati di file di largo uso: BED, GFF/GTF, VCF e SAM/BAM. Usando BEDTools si possono sviluppare pipe sofisticate che rispondono a domande di ricerca complesse mediante l'uso di svariati BEDTools in un flusso comune.

L'utilità groupBy è distribuita nel pacchetto filo.

Please cite: Aaron R. Quinlan and Ira M. Hall: BEDTools: a flexible suite of utilities for comparing genomic features. (PubMed,eprint) Bioinformatics 26(6):841-842 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
belvu
visualizzatore di allineamenti multipli di sequenze e strumento filogenetico
Versions of package belvu
ReleaseVersionArchitectures
sid4.44.1+dfsg-7.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster4.44.1+dfsg-3amd64,arm64,armhf,i386
bullseye4.44.1+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.44.1+dfsg-7.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm4.44.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Belvu è un visualizzatore di allineamenti multipli di sequenze e strumento filogenetico con un esteso insieme di modalità configurabili dall'utente per colorare i residui.

  • Visualizza allineamenti multipli di sequenze.
  • I residui possono essere colorati per conservazione, con soglia e colori configurabili dall'utente.
  • I residui possono essere colorati per tipo di residuo (configurabile dall'utente.
  • Gli schemi dei colori possono essere importati o esportati.
  • Le voci Swissprot (o PIR) possono essere recuperate tramite doppio clic.
  • La posizione nell'allineamento può essere facilmente tracciata.
  • Eliminazione manuale di righe e colonne.
  • Modifica automatica di righe e colonne sulla base di criteri personalizzabili:
    • rimozione di colonne con soli gap;
    • rimozione di tutti i gap;
    • rimozione di sequenze ridondanti;
    • rimozione di una colonna in base a una percentuale di gap specificata dall'utente;
    • filtraggio di sequenze in base a una percentuale di identicità;
    • rimozione di sequenze in base a una percentuale di gap specificata dall'utente;
    • rimozione di sequenze parziali (quelle che iniziano o finiscono con gap);
    • rimozione di colonne per conservazione (con soglia superiore e inferiore specificate dall'utente).
  • L'allineamento può essere salvato nei formati Stockholm, Selex, MSF o FASTA.
  • Le matrici di distanza tra sequenze possono essere generate usando svariate metriche di distanza.
  • Le matrici di distanza possono essere importate o esportate.
  • Gli alberi filogenetici possono essere costruiti sulla base di svariati algoritmi di ricostruzione dell'albero basati sulla distanza.
  • Gli alberi possono essere salvati nel formato New Hampshire.
  • Belvu può eseguire la ricostruzione filogenetica bootstrap.
Please cite: Gemma Barson and Ed Griffiths: SeqTools: visual tools for manual analysis of sequence alignments. (PubMed,eprint) BMC Research Notes 9:39 (2016)
Registry entries: Bio.tools  SciCrunch 
berkeley-express
quantificazione in streaming per sequenziamento ad alte prestazioni
Versions of package berkeley-express
ReleaseVersionArchitectures
bullseye1.5.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.5.1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.5.2+dfsg-1amd64,arm64,armhf,i386
bookworm1.5.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.5.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.5.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

eXpress è uno strumento in streaming per quantificare l'abbondanza di un insieme di sequenze obiettivo da sottosequenze campionate. Applicazioni di esempio includono la quantificazione RNA-Seq a livello di trascritto, analisi di espressione allele-specifica/di aplotipi (da RNA-Seq), quantificazione del legame di fattori di trascrizione in ChIP-Seq e analisi di dati metagenomici. È basato su un algoritmo online-EM che ha requisiti di spazio (memoria) proporzionali alla dimensione totale delle sequenze obiettivo e requisiti di tempo che sono proporzionali al numero di frammenti campionati. Perciò, in applicazioni come RNA-Seq, eXpress può quantificare in modo accurato campioni molti più grandi degli altri strumenti attualmente disponibili, riducendo i requisiti per l'infrastruttura di calcolo. eXpress può essere utilizzato per costruire catene pipe leggere per elaborazione di sequenziamenti ad alte prestazioni quando affiancato con un allineatore in streaming (come Bowtie), dato che l'output può essere inviato in pipe direttamente in eXpress, eliminando di fatto la necessità di memorizzare allineamenti di letture in memoria o sul disco.

In un'analisi delle prestazioni di eXpress per dati RNA-Seq è stato osservato che questa efficienza non viene ottenuta a spese dell'accuratezza. eXpress è più accurato di altri strumenti disponibili, anche quando limitato a insiemi di dati più piccoli che non richiedono molta efficienza. Inoltre, come il programma Cufflink, eXpress può essere utilizzato per stimare l'abbondanza dei trascritti in geni multi-isoforma. eXpress è anche in grado di risolvere mappature multiple di lettura tra famiglie di geni e non necessita di un genoma di riferimento, perciò può essere usato insieme con assemblatori de novo come Trinity, Oases o Trans-ABySS. Il modello sottostante è basato su modelli probabilistici precedentemente descritti sviluppati per RNA-Seq, ma è applicabile ad altre configurazioni dove le sequenze obiettivo sono campionate, e include parametri per distribuzioni della lunghezza dei frammenti, errori nelle letture e bias dei frammenti specifici per sequenza.

eXpress può essere utilizzato per risolvere mappature ambigue in altre applicazioni basate su sequenziamento ad alte prestazioni. Gli unici input necessari per eXpress sono un insieme di sequenze obiettivo e un insieme di frammenti sequenziati di cui sono stati fatti gli allineamenti multipli con esse. Sebbene queste sequenze obiettivo spesso sono isoforme di geni, non è necessario che lo siano. Gli aplotipi possono essere usati come il riferimento per analisi di espressione allele-specifica, regioni di legame per ChIP-Seq o genomi target in esperimenti di metagenomica. eXpress è utile in qualsiasi analisi dove le letture possono avere mappature multiple su sequenze che differiscono per l'abbondanza.

Please cite: Adam Roberts and Lior Pachter: Streaming fragment assignment for real-time analysis of sequencing experiments. (PubMed) Nature Methods 10(1):71–73 (2013)
Registry entries: SciCrunch  Bioconda 
bifrost
parallel construction, indexing and querying of de Bruijn graphs
Versions of package bifrost
ReleaseVersionArchitectures
trixie1.3.1-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid1.3.1-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
upstream1.3.5
Popcon: 1 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

Bifrost is a command-line tool for sequencing that features a broad range of functions, such as indexing, editing, and querying the graph, and includes a graph coloring method that maps each k-mer of the graph to the genomes it occurs in.

  • Build, index, color and query the compacted de Bruijn graph
  • No need to build the uncompacted de Bruijn graph
  • Reads or assembled genomes as input
  • Output graph in GFA (can be visualized with Bandage), FASTA or binary
  • Graph cleaning: short tip clipping, etc.
  • Multi-threaded
  • No parameters to estimate with other tools
  • Exact or approximate k-mer search of queries
Please cite: Guillaume Holley and Páll Melsted: Bifrost – Highly parallel construction and indexing of colored and compacted de Bruijn graphs. (PubMed,eprint) bioRxiv 21(1):249 (2020)
Registry entries: Bio.tools  Bioconda 
bio-eagle
fasi di aplotipi con una coorte genotipizzata o usando un panel di riferimento con fase
Versions of package bio-eagle
ReleaseVersionArchitectures
buster2.4.1-1amd64
sid2.4.1-3amd64,i386
stretch2.3-3amd64,i386
trixie2.4.1-3amd64,i386
bookworm2.4.1-3amd64,i386
bullseye2.4.1-3amd64,i386
Popcon: 12 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Eagle stima la fase di aplotipo all'interno di una coorte genotipizzata o utilizzando un panel di riferimento con fase. L'idea di base dell'algoritmo Eagle1 è di imbrigliare l'identità per discendenza tra parenti distanti, che è pervasiva per campioni di dimensioni molto grandi ma rara tra campioni più piccoli, per identificare velocemente la fase usando un approccio per punteggio veloce. Al contrario l'algoritmo Eagle2 analizza un modello completamente probabilistico simile al modello diploide di Li-Stephens utilizzata dai precedenti metodi basati su HMM.

Notare: l'eseguibile è stato rinominato in bio-eagle a causa di un conflitto di nome. Leggere di più a riguardo in /usr/share/doc/bio-eagle/README.Debian.

The package is enhanced by the following packages: bio-eagle-examples
Please cite: Po-Ru Loh, Pier Francesco Palamara and Alkes L Price: Fast and accurate long-range phasing in a UK Biobank cohort. Nature Genetics (2016)
bio-rainbow
raggruppamento in cluster e assemblaggio di letture corte per bioinformatica
Versions of package bio-rainbow
ReleaseVersionArchitectures
trixie2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.0.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.0.4+dfsg-1amd64,arm64,armhf,i386
bullseye2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.0.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Strumento efficiente per raggruppamento in cluster e assemblaggio di letture corte, specialmente per RAD.

Rainbow è sviluppato per fornire una soluzione ultra-veloce e che usa efficientemente la memoria per clustering e assemblaggio di letture corte prodotte da RAD-seq. Per prima cosa, Rainbow crea cluster di letture usando un metodo spaced seed. Poi, Rainbow implementa una strategia in stile identificazione eterozigota per dividere gruppi potenziali in aplotipi in maniera top-down. Lungo un albero guidato, fonde iterativamente le foglie sorelle in maniera bottom-up se sono sufficientemente simili. Qui, la similarità è definita confrontando le seconde letture di un segmento RAD. Questo approccio tenta di collassare l'eterozigota mentre discrimina sequenze ripetitive. Infine, Rainbow usa un algoritmo greedy per assemblare localmente le letture fuse in contig. Rainbow non fa solo l'output dei risultati ottimali dell'assemblaggio, ma anche di quelli subottimali. Sulla base di simulazioni e di dati RAD-seq reali della Poecilia reticulata, è dimostrato che Rainbow è più competente di altri strumenti nel trattare dati RAD-seq.

Please cite: Zechen Chong, Jue Ruan and Chung-I. Wu: Rainbow: an integrated tool for efficient clustering and assembling RAD-seq reads.. (PubMed) Bioinformatics 28(21):2732-2737 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bio-tradis
analizza l'output da analisi TraDIS di sequenze genomiche
Versions of package bio-tradis
ReleaseVersionArchitectures
stretch-backports1.3.3+dfsg-3~bpo9+1all
sid1.4.5+dfsg2-2all
trixie1.4.5+dfsg2-2all
bookworm1.4.5+dfsg2-1all
bullseye1.4.5+dfsg2-1all
buster1.4.1+dfsg-1all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Bio-Tradis contiene un insieme di strumenti per analizzare l'output da analisi TraDIS.

La catena di pipe Bio-Tradis è implementata sotto forma di libreria Perl estensibile che può essere usata tale e quale o come base per lo sviluppo di strumenti di analisi più avanzati.

Notare che è necessario installare manualmente BioConductor Edger che non può essere distribuito da Debian nella versione recente perché usa il codice non distribuibile locfit.

Please cite: Lars Barquist, Matthew Mayho, Carla Cummins, Amy K. Cain, Christine J. Boinett, Andrew J. Page, Gemma C. Langridge, Michael A. Quail, Jacqueline A. Keane and Julian Parkhill: The TraDIS toolkit: sequencing and analysis for dense transposon mutant libraries. (PubMed,eprint) Bioinformatics 32(7):1109-1111 (2016)
Registry entries: Bio.tools  SciCrunch  Bioconda 
bio-vcf
linguaggio specifico per dominio (DSL) per elaborare il formato VCF
Versions of package bio-vcf
ReleaseVersionArchitectures
bullseye0.9.5-2all
bookworm0.9.5-3all
sid0.9.5-3all
trixie0.9.5-3all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Bio-vcf fornisce un linguaggio specifico per dominio (DSL) per elaborare il formato VCF. I campi con i nomi dei record possono essere interrogati con espressioni regolari, es.:

 sample.dp>20 and rec.filter !~ /LowQD/ and rec.tumor.bcount[rec.alt]>4

Bio-vcf è un parsificatore di nuova generazione per VCF, un filtro e un convertitore. Bio-vcf non solo è molto veloce per dati di interi genomi (WGS), ha anche un linguaggio molto bello per filtrare, valutare e riscrivere e può anche emettere in output qualsiasi tipo di dato testuale, incluse intestazioni VCF e contenuti in RDF e JSON.

bioawk
estensione di awk per analisi di sequenze biologiche
Versions of package bioawk
ReleaseVersionArchitectures
trixie1.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0-4+deb12u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Bioawk è un'estensione di awk di Brian Kernighan che aggiunge la gestione di diversi formati di dati biologici comuni, inclusi BED, GFF, SAM, VCF, FASTA/Q e formati delimitati da tabulazione, opzionalmente compressi con gzip. Aggiunge anche alcune funzioni incorporate e un'opzione per la riga di comando per usare TAB come delimitatore nell'input/output. Quando non viene usata la nuova funzionalità, bioawk è pensato per comportarsi esattamente come l'originale BWK awk.

Registry entries: Bioconda 
biobambam2
strumenti per elaborare file di allineamento a livello iniziale
Versions of package biobambam2
ReleaseVersionArchitectures
bullseye2.0.179+ds-1amd64,arm64,i386,ppc64el
trixie2.0.185+ds-2amd64,i386,mips64el,ppc64el,riscv64
bookworm2.0.185+ds-1amd64,arm64,i386,ppc64el
sid2.0.185+ds-2amd64,i386,mips64el,ppc64el,riscv64
upstream2.0.185-release-20221211202123
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Questo pacchetto contiene alcuni strumenti per elaborare file BAM e include:

  bamsormadup:       ordinamento parallelo e marcatura di duplicati;
  bamcollate2:       legge BAM e scrive BAM riordinati in modo che siano
                     allineati o accorpati in base al nome
                     dell'interrogazione;
  bammarkduplicates: legge BAM e scrive BAM con allineamenti duplicati
                     segnati usando il campo dei flag di BAM;
  bammaskflags:      legge BAM e scrive BAM mascherando (rimuovendo) bit
                     dalla colonna dei flag;
  bamrecompress:     legge BAM e scrive BAM con un'impostazione di
                     compressione definita; questo strumento è in grado di
                     usare il multi-threading;
  bamsort:           legge BAM e scrive BAM riordinati per coordinate o per
                     nome dell'interrogazione;
  bamtofastq:        legge BAM e scrive FastQ; l'output può essere confrontato
                     * meno con il nome dell'interrogazione.
The package is enhanced by the following packages: multiqc
Please cite: German Tischler and Steven Leonard: biobambam: tools for read pair collation based algorithms on BAM files. (eprint) Source Code Biol Med. 9:13 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
biosyntax
evidenziazione della sintassi per biologia computazionale (metapacchetto)
Versions of package biosyntax
ReleaseVersionArchitectures
trixie1.0.0b-6all
buster1.0.0b-1all
bullseye1.0.0b-2all
bookworm1.0.0b-4all
sid1.0.0b-6all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Evidenziazione della sintassi per biologia computazionale per portare in maniera intuitiva l'utente vicino ai propri dati. bioSyntax gestisce file .sam, .flagstat, .vcf, .fasta, .fastq, .faidx, .clustal, .pdb, .gtf, .bed e altri.

Questo è un metapacchetto che dipende da tutti i plugin di bioSyntax.

Please cite: Artem Babaian, Anicet Ebou, Alyssa Fegen, Ho Yin Jeffrey Kam, German E Novakovsky, Jasper Wong, Dylan Aïssi and Li Yao: bioSyntax: syntax highlighting for computational biology. BMC Bioinformatics 19(303) (2018)
Registry entries: Bio.tools  SciCrunch 
bitseq
inferenza bayesiana di trascritti da dati di sequenziamento
Versions of package bitseq
ReleaseVersionArchitectures
buster0.7.5+dfsg-4amd64,arm64,armhf,i386
bullseye0.7.5+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.7.5+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.7.5+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.7.5+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

BitSeq è un'applicazione per inferire livelli di espressione di trascritti individuali da dati di sequenziamento (RNA-Seq) e stimare l'espressione differenziale (DE) tra condizioni. Un vantaggio di questo approccio è la capacità di tenere conto sia dell'incertezza tecnica, sia dell'intrinseca varianza biologica al fine di evitare false identificazioni DE. Il contributo tecnico all'incertezza viene sia dalla profondità di lettura finita, sia dall'eventuale mappatura ambigua delle letture verso più trascritti.

Please cite: James Hensman, Panagiotis Papastamoulis, Peter Glaus, Antti Honkela and Magnus Rattray: Fast and accurate approximate inference of transcript expression from RNA-seq data. (PubMed,eprint) Bioinformatics 31(24):3881-9 (2015)
Registry entries: Bio.tools  SciCrunch 
blasr
mappatura di letture di sequenziamento di singole molecole
Versions of package blasr
ReleaseVersionArchitectures
bullseye5.3.3+dfsg-5amd64,arm64,mips64el,ppc64el
sid5.3.5+dfsg-6amd64,arm64,mips64el,ppc64el,riscv64
stretch5.3+0-1amd64,arm64,mips64el,ppc64el
buster5.3.2+dfsg-1.1amd64,arm64
bookworm5.3.5+dfsg-6amd64,arm64,mips64el,ppc64el
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Basic Local Alignment with Successive Refinement (BLASR) è un metodo per mappare letture di sequenziamento di singole molecole contro un genoma di riferimento. Tali letture sono lunghe migliaia di basi con divergenze tra esse e il genoma dominate da errori di inserzione e delezione.

Registry entries: Bio.tools  SciCrunch  Bioconda 
blixem
navigatore interattivo di allineamenti di sequenze
Versions of package blixem
ReleaseVersionArchitectures
bookworm4.44.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster4.44.1+dfsg-3amd64,arm64,armhf,i386
bullseye4.44.1+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.44.1+dfsg-7.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.44.1+dfsg-7.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Blixem è un navigatore interattivo di allineamenti di sequenze che sono state impilate in un allineamento multiplo "master-slave"; non è un "vero" allineamento multiplo, ma un allineamento "uno-a-molti".

  • sezione panoramica che mostra le posizioni di geni e allineamenti intorno alla finestra di allineamento;
  • sezione dettagliata che mostra l'allineamento effettivo di sequenze di proteine o nucleotidi alla sequenza di DNA genomico;
  • visualizzazione di allineamenti rispetto ad entrambi i filamenti della sequenza di riferimento;
  • visualizzazione di sequenze in modalità nucleotidi o proteina: in modalità proteina, Blixem mostrerà la traduzione a 3 frame della sequenza di riferimento;
  • i residui sono evidenziati in colori differenti se sono una corrispondenza esatta, una sostituzione conservativa o una mancata corrispondenza;
  • sono gestiti allineamenti con gap, con inserzioni e delezioni evidenziate nella sequenza corrispondente;
  • le corrispondenze possono essere ordinate e filtrate;
  • SNP e altre variazioni possono essere evidenziate nella sequenza di riferimento;
  • le code poli(A) possono essere visualizzate e i segnali poli(A) evidenziati nella sequenza di riferimento.
Please cite: Gemma Barson and Ed Griffiths: SeqTools: visual tools for manual analysis of sequence alignments. (PubMed,eprint) BMC Research Notes 9:39 (2016)
Registry entries: Bio.tools  SciCrunch 
bolt-lmm
Efficient large cohorts genome-wide Bayesian mixed-model association testing
Versions of package bolt-lmm
ReleaseVersionArchitectures
sid2.4.1+dfsg-2amd64,i386,ppc64el
buster2.3.2+dfsg-3amd64
bookworm2.4.0+dfsg-1amd64,i386,ppc64el
bullseye2.3.4+dfsg-3amd64,i386,ppc64el
trixie2.4.1+dfsg-2amd64,i386,ppc64el
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The BOLT-LMM software package currently consists of two main algorithms, the BOLT-LMM algorithm for mixed model association testing, and the BOLT-REML algorithm for variance components analysis (i.e., partitioning of SNP-heritability and estimation of genetic correlations).

The BOLT-LMM algorithm computes statistics for testing association between phenotype and genotypes using a linear mixed model. By default, BOLT-LMM assumes a Bayesian mixture-of-normals prior for the random effect attributed to SNPs other than the one being tested. This model generalizes the standard infinitesimal mixed model used by previous mixed model association methods, providing an opportunity for increased power to detect associations while controlling false positives. Additionally, BOLT-LMM applies algorithmic advances to compute mixed model association statistics much faster than eigendecomposition-based methods, both when using the Bayesian mixture model and when specialized to standard mixed model association.

The BOLT-REML algorithm estimates heritability explained by genotyped SNPs and genetic correlations among multiple traits measured on the same set of individuals. BOLT-REML applies variance components analysis to perform these tasks, supporting both multi-component modeling to partition SNP-heritability and multi-trait modeling to estimate correlations. BOLT-REML applies a Monte Carlo algorithm that is much faster than eigendecomposition-based methods for variance components analysis at large sample sizes.

The package is enhanced by the following packages: bolt-lmm-example
Please cite: Po-Ru Loh, George Tucker, Brendan K Bulik-Sullivan, Bjarni J Vilhjálmsson, Hilary K Finucane, Rany M Salem, Daniel I Chasman, Paul M Ridker, Benjamin M Neale, Bonnie Berger, Nick Patterson and Alkes L Price: Efficient Bayesian mixed-model analysis increases association power in large cohorts. Nature Genetics (2015)
bowtie
allineatore di letture brevi ultraveloce ed efficiente in termini di memoria
Versions of package bowtie
ReleaseVersionArchitectures
sid1.3.1-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.3.1-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye1.3.0+dfsg1-1amd64,arm64,mips64el,ppc64el,s390x
bookworm1.3.1-1amd64,arm64,mips64el,ppc64el,s390x
stretch1.1.2-6amd64,arm64,mips64el,ppc64el,s390x
buster1.2.2+dfsg-4amd64,arm64
jessie1.1.1-2amd64
Debtags of package bowtie:
biologynuceleic-acids
fieldbiology:bioinformatics
interfacecommandline
roleprogram
sciencecalculation
scopeutility
useanalysing, comparing
works-withbiological-sequence
Popcon: 21 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto affronta il problema di interpretare i risultati delle più recenti (2010) tecnologie di sequenziamento del DNA. Esse restituiscono pezzi piuttosto corti che non possono essere interpretate direttamente. La sfida per gli strumenti come Bowtie è quella di fornire una posizione nei cromosomi per i brevi frammenti di DNA sequenziati in ogni corsa.

Bowtie allinea sequenze (letture) brevi di DNA al genoma umano a una velocità di oltre 25 milioni di 35 bp all'ora. Bowtie indicizza il genoma con un indice Burrows-Wheeler per mantenere piccola la propria impronta di memoria: tipicamente circa 2,2 GB per il genoma umano (2,9 GB per le estremità accoppiate).

The package is enhanced by the following packages: bowtie-examples multiqc
Please cite: Ben Langmead, Cole Trapnell, Mihai Pop and Steven L Salzberg: Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. (eprint) Genome Biology 10:R25 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
bowtie2
allineatore di letture brevi ultraveloce ed efficiente
Versions of package bowtie2
ReleaseVersionArchitectures
bookworm2.5.0-3amd64,arm64,mips64el,ppc64el
trixie2.5.4-1amd64,arm64,mips64el,ppc64el,riscv64
sid2.5.4-1amd64,arm64,mips64el,ppc64el,riscv64
bullseye2.4.2-2amd64,arm64,mips64el,ppc64el
buster2.3.4.3-1amd64
jessie2.2.4-1amd64
stretch2.3.0-2amd64
Popcon: 16 users (21 upd.)*
Versions and Archs
License: DFSG free
Git

Uno strumento ultraveloce che usa la memoria in maniera efficiente per allineare letture di sequenziamento a sequenze lunghe di riferimento. È particolarmente adatto per allineare letture da circa 50 fino a centinaia o migliaia di caratteri e particolarmente adatto per allineare a genomi relativamente lunghi (es. mammiferi).

Bowtie 2 indicizza il genoma con un indice FM per mantenere bassa l'impronta di memoria: per il genoma umano, la sua impronta di memoria è tipicamente intorno a 3,2 GB. Bowtie 2 gestisce le modalità di allineamento con gap, locali e a estremità accoppiate.

The package is enhanced by the following packages: bowtie2-examples multiqc
Please cite: Ben Langmead and Steven L Salzberg: Fast gapped-read alignment with Bowtie 2. (PubMed) Nature Methods 9:357–359 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
boxshade
belle stampe di allineamenti multisequenza
Versions of package boxshade
ReleaseVersionArchitectures
buster3.3.1-12amd64,arm64,armhf,i386
sid3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.3.1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch3.3.1-10amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.3.1-8amd64,armel,armhf,i386
Debtags of package boxshade:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usetypesetting
works-with-formathtml, plaintext, postscript, tex
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Boxshade è un programma per creare stampe di bell'aspetto a partire da sequenze proteiche o di DNA multi-allineate. Il programma non fa il reale allineamento e necessita di un file input creato da un programma per allineamenti multipli o creato a mano con strumenti adatti.

Boxshade legge sequenze multiallineate da file PILEUP-MSF, CLUSTAL-ALN, MALIGNED-data e ESEE-save, (limitatamente ad un massimo di 150 sequenze con fino a 10.000 elementi ciascuna). Vari tipi di ombreggiatura possono essere applicati a residui identici/simili. L'output è scritto a schermo o in un file nei seguenti formati: ANSI/VT100, PS/EPS, RTF, HPGL, ReGIS, LJ250-printer, ASCII, xFIG, PICT, HTML.

Registry entries: Bio.tools  SciCrunch 
bppphyview
visualizzatore filogenetico Bio++
Versions of package bppphyview
ReleaseVersionArchitectures
trixie0.6.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.3.0-1amd64,armel,armhf,i386
stretch0.3.0-1.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.6.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.6.1-1amd64,arm64,armhf,i386
bullseye0.6.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.6.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package bppphyview:
roleprogram
uitoolkitqt
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Un editor di alberi filogenetici sviluppato usando Bio++ e Qt. Phyview permette di visualizzare, modificare, stampare e produrre in output alberi filogenetici e i dati associati.

bppsuite
suite di programmi Bio++
Versions of package bppsuite
ReleaseVersionArchitectures
sid2.4.1-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.2.0-0.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.4.1-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.4.1-1amd64,arm64,armhf,i386
bookworm2.4.1-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.4.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package bppsuite:
roleprogram
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

La suite di programmi Bio++ è un pacchetto di programmi che usano le librerie Bio++ e che sono dedicati alla filogenetica e all'evoluzione molecolare. Tutti i programmi sono indipendenti, ma possono essere combinati per eseguire analisi piuttosto complesse. Questi programmi usano gli strumenti ausiliari di interfaccia delle librerie e perciò condividono la stessa sintassi. Hanno anche svariate opzioni in comune che possono essere condivise da software di terze parti.

Include i programmi:

  • BppML per analisi di massima verosimiglianza,
  • BppSeqGen per simulazione di sequenze,
  • BppAncestor per ricostruzione di stati ancestrali,
  • BppDist per metodi di distanza,
  • BppPars per analisi di parsimonia,
  • BppSeqMan per conversioni di file e manipolazione di sequenze,
  • BppConsense per costruire alberi di consenso e calcolare valori di bootstrap,
  • BppReRoot per cambiamento degli elementi radice dell'albero,
  • BppTreeDraw per disegnare alberi,
  • BppAlnScore per confrontare allineamenti e calcolare punteggi di allineamento,
  • BppMixedLikelihoods per calcolare verosimiglianze sito per sito di componenti di modelli mistura,
  • BppPopGen per analisi di genetica di popolazione.
The package is enhanced by the following packages: bppsuite-examples
brig
BLAST Ring Image Generator
Versions of package brig
ReleaseVersionArchitectures
sid0.95+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.95+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.95+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.95+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.95+dfsg-2amd64,arm64,armhf,i386
stretch0.95+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

BRIG può visualizzare confronti circolari tra grandi quantità di genomi, con un accento sulla gestione dei dati di assemblaggio dei genomi.

  • Le immagini mostrano sotto forma di cerchi concentrici le similarità tra una sequenza centrale di riferimento e altre sequenze.
  • BRIG esegue automaticamente tutti i confronti BLAST e l'analisi dei file tramite una semplice GUI.
  • I confini dei contig e la copertura delle letture possono essere visualizzati per le bozze di genoma; possono essere visualizzati grafici personalizzati e annotazioni.
  • Usando come input un insieme di geni definito dall'utente, BRIG può visualizzare la presenza, l'assenza, il troncamento o la variazione della sequenza di un gene in un insieme di genomi completi, bozze di genoma e perfino dati di sequenza non assemblati, grezzi.
  • BRIG accetta anche file di mappa di letture in formato SAM permettendo di confrontare simultaneamente regioni genomiche presenti in sequenze non assemblate da campioni multipli.
Please cite: Nabil-Fareed Alikhan, Nicola K Petty, Nouri L Ben Zakour and Scott A Beatson: BLAST Ring Image Generator (BRIG): simple prokaryote genome comparisons. (PubMed,eprint) BMC Genomics 12:402 (2011)
Registry entries: Bio.tools  SciCrunch 
btllib-tools
strumenti della libreria di codice comune di Bioinformatics Technology Lab
Versions of package btllib-tools
ReleaseVersionArchitectures
sid1.4.10+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64
bookworm1.4.10+dfsg-1amd64,arm64,mips64el,ppc64el
trixie1.4.10+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64
upstream1.7.3
Popcon: 2 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Libreria di codice comune di Bioinformatics Technology Lab in C++ con wrapper per Python.

Questo pacchetto contiene lo strumento indexlr.

Registry entries: Bioconda 
busco
insiemi per benchmark di ortologhi universali a singola copia
Versions of package busco
ReleaseVersionArchitectures
bullseye5.0.0-1all
trixie5.5.0-2amd64,arm64,i386
bookworm5.4.4-1amd64,i386
sid5.5.0-2amd64,arm64,i386
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Valutazione della completezza dell'assemblaggio di genomi e delle annotazioni con BUSCO (Benchmarking Universal Single-Copy Orthologs).

  • Selezione automatica di linee ottenute da https://www.orthodb.org/
  • Scaricamento automatico di tutti gli insiemi di dati e i file necessari per effettuare una elaborazione
  • Uso di prodigal per genomi non eucariotici.
The package is enhanced by the following packages: multiqc
Please cite: Mathieu Seppey, Mosè Manni and Evgeny M. Zdobnov: BUSCO: Assessing Genome Assembly and Annotation Completeness. (PubMed) Methods Mol Biol. 1962:227-245 (2019)
Registry entries: Bio.tools  Bioconda 
bustools
programma per manipolare file BUS per insiemi di dati RNA-Seq di cellule singole
Versions of package bustools
ReleaseVersionArchitectures
trixie0.43.2+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm0.42.0+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
bullseye0.40.0-4amd64,arm64,mips64el,ppc64el,s390x
sid0.43.2+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
upstream0.44.1
Popcon: 2 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Questo pacchetto contiene il programma BUStools; può essere usato per correggere gli errori nei codici a barre, collassare UMI, produrre conteggi di geni o matrici di conteggio di compatibilità di trascritti.

Please cite: Páll Melsted, A. Sina Booeshaghi, Fan Gao, Eduardo Beltrame, Lambda Lu, Kristján Eldjárn Hjorleifsson, Jase Gehring and Lior Pachter: Modular and efficient pre-processing of single-cell RNA-seq.. BioRxiv :673285 (2019)
Registry entries: Bio.tools  Bioconda 
bwa
Burrows-Wheeler Aligner
Versions of package bwa
ReleaseVersionArchitectures
sid0.7.18-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch-backports0.7.17-1~bpo9+1amd64
stretch0.7.15-2+deb9u1amd64
buster0.7.17-3amd64
bullseye0.7.17-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.7.18-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.7.17-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.7.10-1amd64
Debtags of package bwa:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
useanalysing, comparing
Popcon: 18 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

BWA è un pacchetto software per mappare sequenze con bassa divergenza rispetto a vasti genomi di riferimento, come il genoma umano. Consiste di tre algoritmi: BWA-backtrack, BWA-SW e BWA-MEM. Il primo è progettato per sequenze Illumina fino a 100pb, mentre gli altri due per sequenze più lunghe da 70pb a 1Mpb. BWA-MEM e BWA-SH condividono funzionalità simili, come gestione per lunghe sequenze e allineamenti spezzati, ma BWA-MEM, che è il più recente, è generalmente quello raccomandato per interrogazioni di alta qualità perché più veloce e più accurato. BWA-MEM ha prestazioni migliori anche rispetto a BWA-backtrack per sequenze Illumina 70-100pb.

Please cite: Heng Li and Richard Durbin: Fast and accurate short read alignment with Burrows-Wheeler transform. (PubMed,eprint) Bioinformatics 25(14):1754-1760 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
canu
assemblatore di sequenze di molecole singole per genomi
Versions of package canu
ReleaseVersionArchitectures
sid2.2+dfsg-5amd64,arm64,mips64el,ppc64el,riscv64,s390x
stretch-backports1.7.1+dfsg-1~bpo9+1amd64
bookworm2.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.8+dfsg-2amd64
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Canu è un fork di Celera Assembler, progettato per sequenziamento con alto rumore di molecole singole (come PacBio RS II o Oxford Nanopore MinION).

Canu è una catena pipe di assemblaggio gerarchico che viene eseguita in quattro passi:

  • rilevamento di sovrapposizioni in sequenze con alto rumore usando MHAP;
  • generazione del consenso delle sequenze corrette;
  • taglio delle sequenze corrette;
  • assemblaggio delle sequenze corrette dopo il taglio.
Please cite: Sergey Koren, Brian P. Walenz, Konstantin Berlin, Jason R. Miller and Adam M. Phillippy: Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation.. Genome Res. (2017)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
cassiopee
strumento per indici e ricerche in sequenze genomiche
Versions of package cassiopee
ReleaseVersionArchitectures
bookworm1.0.9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.9-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0.5-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.0.9-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0.9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.9-2amd64,arm64,armhf,i386
jessie1.0.1+dfsg-3amd64,armel,armhf,i386
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Implementazione in C della libreria per indicizzazione e ricerca Cassiopee. È una riscrittura completa della gemma Ruby Cassiopee. Analizza una sequenza genomica (DNA/RNA/proteina) di input e cerca una sottosequenza con corrispondenza esatta o permettendo sostituzioni (distanza di Hamming) o inserzioni/delezioni.

Questo pacchetto contiene gli strumenti cassiopee e cassiopeeknife.

Registry entries: SciCrunch  Bioconda 
cat-bat
taxonomic classification of contigs and metagenome-assembled genomes (MAGs)
Versions of package cat-bat
ReleaseVersionArchitectures
bookworm5.2.3-2amd64,arm64,ppc64el,s390x
trixie5.3-2amd64,arm64,ppc64el,riscv64,s390x
sid5.3-2amd64,arm64,ppc64el,riscv64,s390x
bullseye5.2.2-1amd64,arm64,ppc64el,s390x
upstream6.0.1
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Contig Annotation Tool (CAT) and Bin Annotation Tool (BAT) are pipelines for the taxonomic classification of long DNA sequences and metagenome assembled genomes (MAGs/bins) of both known and (highly) unknown microorganisms, as generated by contemporary metagenomics studies. The core algorithm of both programs involves gene calling, mapping of predicted ORFs against the nr protein database, and voting-based classification of the entire contig / MAG based on classification of the individual ORFs. CAT and BAT can be run from intermediate steps if files are formatted appropriately.

Please cite: F. A. Bastiaan von Meijenfeldt, Ksenia Arkhipova, Diego D. Cambuy, Felipe H. Coutinho and Bas E. Dutilh: Robust taxonomic classification of uncharted microbial sequences and bins with CAT and BAT. (PubMed,eprint) Genome Biology 20(1):217 (2019)
Registry entries: Bioconda 
cct
confronta visivamente sequenze di batteri, plasmidi, cloroplasti o mitocondri
Versions of package cct
ReleaseVersionArchitectures
buster20170919+dfsg-1all
bullseye1.0.0-1all
trixie1.0.3-1all
stretch-backports20170919+dfsg-1~bpo9+1all
sid1.0.3-1all
bookworm1.0.3-1all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

CGView Comparison Tool (CCT) è un pacchetto per confrontare visivamente sequenze di interesse di batteri, plasmidi, cloroplasti o mitocondri con genomi esistenti o raccolte di sequenze. I confronti sono effettuati usando BLAST e i risultati di BLAST sono presentati sotto forma di mappe grafiche che possono anche mostrare caratteristiche delle sequenze, nomi di geni e proteine, assegnazioni di categorie COG e caratteristiche della composizione delle sequenze. CCT può generare mappe in una varietà di dimensioni, incluse mappe da 400 Megapixel adatte per poster. I confronti possono essere effettuati all'interno di una particolare specie o genere, o possono essere usati tutti i genomi disponibili. L'intero procedimento di creazione della mappa, dallo scaricamento delle sequenze al ridisegno delle mappe ingrandite, può essere completato facilmente usando gli script inclusi con CCT. Funzionalità definite dall'utente o i risultati dell'analisi possono essere inclusi nelle mappe, e le mappe possono essere ampiamente personalizzate. Per semplificare la configurazione del programma, è disponibile una macchina virtuale CCT che include tutte le dipendenze preinstallate. Nella documentazione di CCT sono inclusi dei tutorial dettagliati che illustrano l'uso di CCT.

Please cite: Jason R Grant, Adriano S Arantes and Paul Stothard: Comparing thousands of circular genomes using the CGView Comparison Tool. (PubMed,eprint) BMC Genomics 13:202 (2012)
cd-hit
suite di programmi progettati per raggruppare velocemente sequenze
Versions of package cd-hit
ReleaseVersionArchitectures
bookworm4.8.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster4.6.8-2amd64,arm64,armhf,i386
sid4.8.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie4.6.1-2012-08-27-2amd64,armel,armhf,i386
stretch4.6.6-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye4.8.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.8.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 9 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

cd-hit contiene svariati programmi progettati per raggruppare velocemente sequenze. cd-hit raggruppa in cluster le proteine che soddisfano una soglia di similarità definita dall'utente. cd-hit-est è simile a cd-hit, ma progettato per raggruppare sequenze di nucleotidi (senza introni). cd-hit-est-2d è simile a cd-hit-2d, ma progettato per confrontare due insiemi di dati di nucleotidi. In questo pacchetto sono contenuti anche diversi altri programmi correlati. Per maggiori informazione vedere il manuale utente di cd-hit, anch'esso parte di questo pacchetto.

Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Genomics
cdbfasta
strumenti Constant DataBase per indicizzazione e recupero per file multi-FASTA
Versions of package cdbfasta
ReleaseVersionArchitectures
buster0.99-20100722-5amd64,arm64,armhf,i386
bullseye1.00+git20181005.014498c+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.99-20100722-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.99-20100722-1amd64,armel,armhf,i386
sid1.00+git20230710.da8f5ba+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.00+git20230710.da8f5ba+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.00+git20181005.014498c+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

CDB (Constant DataBase) può essere usato per creare indici per un recupero veloce di qualsiasi sequenza particolare da grandi file multi-FASTA. Ha l'opzione di comprimere i record dei dati per salvare spazio.

Registry entries: SciCrunch 
centrifuge
sistema rapido ed efficiente nell'uso della memoria per classificare sequenze di DNA
Versions of package centrifuge
ReleaseVersionArchitectures
bookworm1.0.3-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bullseye1.0.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el
buster1.0.3-2amd64
trixie1.0.4.2-1amd64,arm64,mips64el,ppc64el,riscv64
sid1.0.4.2-1amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 1 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Centrifuge è un sistema molto rapido e che usa la memoria in maniera efficiente per la classificazione di sequenze di DNA da campioni microbici, con migliore sensibilità e accuratezza paragonabile rispetto ad altri sistemi all'avanguardia. Il sistema usa un innovativo schema di indicizzazione basato sulla trasformata di Burrows-Wheeler (BWT) e l'indice Ferragina-Manzini (FM), ottimizzati specificamente per il problema della classificazione metagenomica. Centrifuge richiede un indice relativamente piccolo (es. 4,3 GB per ~4100 genomi batterici) ma fornisce una velocità di classificazione molto alta, permettendogli di elaborare una tipica esecuzione di sequenziamento di DNA entro un'ora. Insieme, questi progressi permettono analisi tempestive e accurate di vasti insiemi di dati metagenomici su normali computer da tavolo.

Please cite: Daehwan Kim, Li Song, Florian P. Breitwieser and Steven L. Salzberg: Centrifuge: rapid and sensitive classification of metagenomic sequences. (PubMed,eprint) Genome Research 26(12):1721-1729 (2016)
Registry entries: Bio.tools  Bioconda 
cgview
visualizzatore di genoma circolare
Versions of package cgview
ReleaseVersionArchitectures
bookworm0.0.20100111-7all
buster0.0.20100111-4amd64,arm64,armhf,i386
stretch0.0.20100111-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.0.20100111-7all
sid0.0.20100111-7all
trixie0.0.20100111-7all
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

CGView è un pacchetto Java per generare mappe di alta qualità e zoomabili di genomi circolari. Il suo scopo primario è di servire come componente di catene per annotazione di sequenze, come mezzo per generare output visibile adatto per il web. Informazioni sulle caratteristiche e opzioni per il rendering sono fornite al programma usando un file XML, un file delimitato da tabulazioni o un file ptt NCBI. CGView converte l'input in una mappa grafica (in formato PNG, JPG o Scalable Vector Graphics), completa di etichette, un titolo, legende e note a piè di pagina. In aggiunta alla mappa predefinita della vista totale, il programma può generare una serie di mappe con collegamenti ipertestuali che mostrano viste espanse. Le mappe collegate possono essere esplorate usando qualsiasi browser web, permettendo una esplorazione rapida del genoma e facilitando la condivisione dei dati. Le etichette delle caratteristiche nelle mappe possono avere collegamenti ipertestuali a risorse esterne, permettendo alle mappe di CGView di essere integrate con il contenuto di database o siti web esistenti.

In aggiunta all'applicazione CGView, è disponibile un'API per generare mappe dall'interno di altre applicazioni Java usando il pacchetto cgview.

CGView può essere usato per le seguenti cose:

  • visualizzazione ed esplorazione del genoma dei batteri: CGView può essere incorporato in catene di annotazione del genoma dei batteri, come mezzo per generare contenuto web per visualizzazione e navigazione dei dati; il contenuto PNG e la mappa di immagine non richiedono applet Java o plugin speciali per il browser;
  • generazione di poster di genoma: CGView può generare immagini di genomi circolari grandi come un poster in formati di immagine raster
  • Scalable Vector Graphics;
  • visualizzazione di analisi di sequenze: CGView può essere usato per mostrare l'output di programmi di analisi di sequenze in un contesto circolare.

Funzionalità di CGView:

  • possono essere generate immagini nei formati PNG, JPG o SVG; vedere la galleria di CGView;
  • possono essere generate mappe statiche o interattive; le mappe interattive fanno uso di immagini PNG standard e di mappe di immagine HTML; l'output Scalable Vector Graphics è incluso nelle mappe interattive (vedere l'esempio);
  • l'input XML permette il controllo completo sull'aspetto della mappa;
  • possono essere usati file di input delimitati da tabulazioni e file ptt NCBI in alternativa al formato XML;
  • l'API di CGView può essere usata per incorporare CGView in applicazioni Java;
  • l'applet di CGView può essere usata per incorporare mappe zoomabili in pagine web (vedere l'esempio);
  • il server di CGView può essere usato per generare mappe in linea.
Please cite: Paul Stothard and David S. Wishart: Circular genome visualization and exploration using CGView. (PubMed,eprint) Bioinformatics 21(4):537-539 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
changeo
toolkit per assegnazione di repertori clonali (Python 3)
Versions of package changeo
ReleaseVersionArchitectures
buster0.4.5-1all
bullseye1.0.2-1all
sid1.3.0-2all
trixie1.3.0-2all
bookworm1.3.0-1all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Change-O è una raccolta di strumenti per elaborare l'output di strumenti di allineamento V(D)J, assegnando cluster clonali a sequenze di immunoglobuline (Ig) e ricostruendo sequenze di linee germinali.

Grandi miglioramenti nelle tecnologie di sequenziamento ad alte prestazioni permettono oggi la caratterizzazione su vasta scala di repertori di Ig, definiti come raccolte di proteine antigene-recettore trans-membrana situate sulla superficie delle cellule B e T. Change-O è una suite di utilità per facilitare l'analisi avanzata di sequenze di Ig e di TCR seguendo l'assegnazione di segmenti a linee germinali. Change-O gestisce l'output di IMGT/HighV-QUEST e IgBLAST, e fornisce un'ampia varietà di metodi di clustering per assegnare gruppi clonali a sequenze di Ig. Sono inclusi anche ordinamento dei record, raggruppamento e varie operazioni di manipolazione su database.

Questo pacchetto installa la libreria per Python 3.

Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Link to publication (PubMed,eprint) Bioinformatics 31(20):3356-3358 (2015)
Registry entries: Bioconda 
chimeraslayer
rileva probabili chimere in DNA amplificato con PCR
Versions of package chimeraslayer
ReleaseVersionArchitectures
bookworm20101212+dfsg1-5all
stretch20101212+dfsg1-1all
buster20101212+dfsg1-2all
bullseye20101212+dfsg1-4all
jessie20101212+dfsg-1all
trixie20101212+dfsg1-6all
sid20101212+dfsg1-6all
Debtags of package chimeraslayer:
biologyformat:aln, nuceleic-acids
fieldbiology, biology:molecular
roleprogram
scopeutility
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

ChimeraSlayer è un'utilità per la rilevazione di sequenze chimeriche, compatibile con sequenze di lunghezza quasi completa Sanger e sequenze 454-FLX più corte (~500bp).

ChimeraSlayer comporta la seguente serie di passi che operano per contrassegnare sequenze di rRNA 16S chimeriche.

 1. I terminali di una sequenza di interrogazione vengono cercati in un
    database accluso di sequenze 16S di riferimento libere da chimere per
    identificare potenziali genitori di una chimera.
 2. Vengono selezionati i candidati ad essere genitori di una chimera per
    il fatto che formano un allineamento con rami con il punteggio
    migliore con la sequenza di interrogazione formattata NAST.
 3. L'allineamento NAST della sequenza di interrogazione viene migliorato
    in un riallineamento NAST con "considerazione delle chimere" basato su
    profili con le sequenze genitrici di riferimento selezionate.
 4. Viene utilizzata un'infrastruttura evolutiva per contrassegnare le
    sequenze di interrogazione trovate che hanno dimostrato una maggiore
    omologia di sequenza con una chimera in silico formata tra due
    qualsiasi delle sequenze genitrici di riferimento selezionate.

Per eseguire ChimeraSlayer sono necessarie sequenze in formato NAST generate dall'utilità nast-ier.

ChimeraSlayer fa parte della suite microbiomeutil.

The package is enhanced by the following packages: microbiomeutil-data
Please cite: Brian J. Haas, Dirk Gevers, Ashlee M. Earl, Mike Feldgarden, Doyle V. Ward, Georgia Giannoukos, Dawn Ciulla, Diana Tabbaa, Sarah K. Highlander, Erica Sodergren, Barbara Methé, Todd Z. DeSantis, The Human Microbiome Consortium, Joseph F. Petrosino, Rob Knight and Bruce W. Birren: Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. (PubMed,eprint) Genome Research 21(3):494-504 (2011)
Registry entries: SciCrunch 
chromhmm
scoperta e caratterizzazione dello stato della cromatina
Versions of package chromhmm
ReleaseVersionArchitectures
sid1.25+dfsg-1all
buster1.18+dfsg-1all
trixie1.25+dfsg-1all
bookworm1.24+dfsg-1all
bullseye1.21+dfsg-1all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ChromHMM è un software per imparare e caratterizzare gli stati della cromatina. ChromHMM può integrare insiemi multipli di dati sulla cromatina, come dati ChIP-seq di varie modificazioni degli istoni, per scoprire de novo i principali ricorrenti modelli combinatori e spaziali dei mark. ChromHMM è basato su un modello nascosto di Markov multivariato che modella esplicitamente la presenza o l'assenza di ciascun mark della cromatina. Il modello risultante può poi essere usato per annotare sistematicamente un genoma in uno o più tipi di cellula. Calcolando automaticamente gli arricchimenti dello stato per insiemi di annotazioni e funzionali su grande scala, ChromHMM facilita la caratterizzazione biologica di ciascun stato. ChromHMM produce anche file con mappe di annotazioni di stato della cromatina per tutto il genoma che possono essere visualizzate direttamente in un browser di genoma.

The package is enhanced by the following packages: chromhmm-example
Please cite: Jason Ernst and Manolis Kellis: ChromHMM: automating chromatin-state discovery and characterization. (eprint) Nature Methods 9(3):215-216 (2012)
Registry entries: Bio.tools  Bioconda 
chromimpute
Large-scale systematic epigenome imputation
Versions of package chromimpute
ReleaseVersionArchitectures
trixie1.0.3+dfsg-5all
bookworm1.0.3+dfsg-4all
buster1.0.3+dfsg-1all
bullseye1.0.3+dfsg-2all
sid1.0.3+dfsg-5all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ChromImpute takes an existing compendium of epigenomic data and uses it to predict signal tracks for mark-sample combinations not experimentally mapped or to generate a potentially more robust version of data sets that have been mapped experimentally. ChromImpute bases its predictions on features from signal tracks of other marks that have been mapped in the target sample and the target mark in other samples with these features combined using an ensemble of regression trees.

Please cite: Jason Ernst and Manolis Kellis: Large-scale imputation of epigenomic datasets for systematic annotation of diverse human tissues. (eprint) Nature Biotechnology 33(4):364-376 (2015)
cif-tools
suite di strumenti per manipolare, validare e interrogare file mmCIF
Versions of package cif-tools
ReleaseVersionArchitectures
bookworm1.0.7-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.12-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.12-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto contiene una suite di strumenti per manipolare file mmCIF.

La struttura delle macromolecole al giorno d'oggi è registrata in file mmCIF. Tuttavia, fino a poco tempo fa il vecchio formato di file PDB era usato da molti programmi, ma tale formato è deprecato da molto tempo.

Questo pacchetto fornisce due strumenti, pdb2cif e cif2pdb, che possono convertire file da un formato all'altro, posto che i dati siano adatti, naturalmente.

Altri strumenti sono cif-validate, cif-grep, cif-diff, cif-merge e mmCQL. Quest'ultimo può essere usato per manipolare un file mmCIF come se fosse un database in stile SQL usando i comandi SELECT, UPDATE, INSERT e DELETE.

Questo pacchetto dipende da libcifpp.

circlator
circolarizza assemblati genomici
Versions of package circlator
ReleaseVersionArchitectures
sid1.5.6-11all
bookworm1.5.6-7amd64
bullseye1.5.6-5amd64
stretch1.4.1-1all
buster1.5.5-3amd64
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Circlator è uno strumento per automatizzare la circolarizzazione di assemblati per genomi batterici e piccoli genomi eucariotici, e produce rappresentazioni lineari accurate di sequenze circolari.

Please cite: Martin Hunt, Nishadi De Silva, Thomas D. Otto, Julian Parkhill, Jacqueline A. Keane and Simon R. Harris: Circlator: automated circularization of genome assemblies using long sequencing reads. (PubMed) Genome Biology 29(16):294 (2015)
Registry entries: SciCrunch  Bioconda 
circos
disegnatore per visualizzare i dati
Versions of package circos
ReleaseVersionArchitectures
trixie0.69.9+dfsg-2all
jessie0.66-1all
stretch0.69.4+dfsg-1all
buster0.69.6+dfsg-2all
bullseye0.69.9+dfsg-2all
bookworm0.69.9+dfsg-2all
sid0.69.9+dfsg-2all
Debtags of package circos:
fieldbiology:bioinformatics
roleprogram
useviewing
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Circos visualizza i dati in una disposizione circolare: è ideale per esplorare le relazioni tra oggetti o posizioni e per creare, con una qualità tipografica, grafici altamente informativi.

Questo pacchetto fornisce il motore di disegno di Circos, che è guidato dalla riga di comando (come gnuplot) ed è completamente utilizzabile negli script.

Please cite: Martin I Krzywinski, Jacqueline E Schein, Inanc Birol, Joseph Connors, Randy Gascoyne, Doug Horsman, Steven J Jones and Marco A Marra: Circos: An information aesthetic for comparative genomics. (PubMed,eprint) Genome Research 19(9):1639-45 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
clearcut
ricostruzione estremamente efficiente di alberi filogenetici
Versions of package clearcut
ReleaseVersionArchitectures
sid1.0.9+git20211013.b799afe-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.9+git20211013.b799afe-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.9+git20211013.b799afe-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.9-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.9-3amd64,arm64,armhf,i386
stretch1.0.9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.0.9-1amd64,armel,armhf,i386
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Clearcut è l'implementazione di riferimento per l'algoritmo RNJ (Relaxed Neighbor Joining (RNJ) di J. Evans, L. Sheneman e J. Foster dell'IBEST (Initiative for Bioinformatics and Evolutionary Studies) dell'Università dell'Idaho.

Please cite: Jason Evans, Luke Sheneman and James A. Foster: Relaxed Neighbor-Joining: A Fast Distance-Based Phylogenetic Tree Construction Method. (PubMed) J. Mol. Evol. 62(6):785-792 (2006)
Registry entries: SciCrunch  Bioconda 
clonalframe
inferenza della microevoluzione batterica usando dati di sequenze multi-loci
Versions of package clonalframe
ReleaseVersionArchitectures
bookworm1.2-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2-9amd64,arm64,armhf,i386
stretch1.2-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.2-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.2-3amd64,armel,armhf,i386
trixie1.2-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package clonalframe:
roleprogram
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ClonalFrame identifica le relazioni clonali tra i membri di un campione, stimando al contempo la posizione nei cromosomi di eventi di ricombinazione omologa che hanno perturbato l'eredità clonale.

ClonalFrame può essere applicato a qualsiasi tipo di dati di sequenza, da un singolo frammento di DNA a genomi interi. È ben adatto per l'analisi di dati MLST, in cui sono stati sequenziati 7 frammenti genetici, ma diventa progressivamente più potente mano a mano che le regioni sequenziate aumentano di lunghezza fino a diventare interi genomi. Tuttavia, richiede che le sequenze siano allineate. Se si hanno dati genomici non allineati, è raccomandato l'uso di Mauve che produce allineamenti di interi genomi batterici nell'esatto formato richiesto per le analisi con ClonalFrame.

Please cite: Xavier Didelot and Daniel Falush: Inference of Bacterial Microevolution Using Multilocus Sequence Data. (PubMed,eprint) Genetics Advance 175:1251-1266 (2006)
Registry entries: SciCrunch 
clonalframeml
efficiente inferenza di ricombinazione in genomi interi di batteri
Versions of package clonalframeml
ReleaseVersionArchitectures
bullseye1.12-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.11-3amd64,arm64,armhf,i386
sid1.13-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.13-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.12-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ClonalFrameML è un pacchetto software che esegue un'efficiente inferenza di ricombinazione in genomi di batteri. ClonalFrameML è stato creato da Xavier Didelot e Daniel Wilson. ClonalFrameML può essere applicato a qualsiasi tipo di dati di sequenze allineate, ma è specialmente orientato all'analisi di sequenze di genomi interi. È in grado di confrontare centinaia di genomi interi nell'arco di ore su un normale computer da ufficio. Ci sono tre output principali da un'esecuzione di ClonalFrameML: una filogenia con lunghezze dei rami corrette per tenere conto della ricombinazione, una stima dei parametri chiave del processo di ricombinazione e una mappa genomica di dove la ricombinazione è avvenuta per ogni ramo della filogenia.

ClonalFrameML è un'implementazione di massima verosimiglianza del software bayesiano ClonalFrame che è stato precedentemente descritto da Didelot e Falush (2007). Il modello di ricombinazione alla base di ClonalFrameML è esattamente lo stesso di ClonalFrame, ma questa nuova implementazione è molto più veloce, è in grado di affrontare insiemi di dati genomici molto più grandi e non soffre dei problemi di convergenza di MCMC.

Please cite: Xavier Didelot and Daniel J. Wilson: ClonalFrameML: Efficient Inference of Recombination in Whole Bacterial Genomes. (PubMed,eprint) PLoS Comput Biology 11(2):e1004041 (2015)
Registry entries: Bioconda 
clonalorigin
inferenza di ricombinazione omologa in batteri usando sequenze di genomi interi
Versions of package clonalorigin
ReleaseVersionArchitectures
buster1.0-3amd64,arm64,armhf,i386
bookworm1.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

I batteri, diversamente da noi, si possono riprodurre da soli. Hanno però meccanismi che trasferiscono il DNA tra organismi, un processo più formalmente noto come ricombinazione. I meccanismi con i quali la ricombinazione ha luogo sono stati studiati ampiamente in laboratorio, ma molto rimane da essere compreso a riguardo come, quando e dove la ricombinazione ha luogo all'interno di popolazioni naturali di batteri e come li aiuta ad adattarsi a nuovi ambienti. ClonalOrigin esegue un'analisi comparativa delle sequenze di un campione di genomi di batteri al fine di ricostruire gli eventi di ricombinazione che hanno avuto luogo nella loro ascendenza.

Please cite: Xavier Didelot, Daniel Lawson, Aaron Darling and Daniel Falush: Inference of Homologous Recombination in Bacteria Using Whole-Genome Sequences. (PubMed,eprint) Genetics 186(4):1435-1449 (2010)
Registry entries: Bio.tools  SciCrunch 
clustalo
programma generico di allineamento di sequenze multiple per proteine
Versions of package clustalo
ReleaseVersionArchitectures
bullseye1.2.4-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2.4-2amd64,arm64,armhf,i386
jessie1.2.1-1amd64,armel,armhf,i386
stretch1.2.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.2.4-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.2.4-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.4-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 17 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Clustal Omega è un programma generico per allineamento di sequenze multiple (MSA), principalmente per sequenze di aminoacidi. Produce MSA di alta qualità ed è in grado di gestire in un tempo ragionevole insiemi di dati di centinaia di migliaia di sequenze usando, dove disponibili, più processori.

Please cite: Fabian Sievers, Andreas Wilm, David Dineen, Toby J Gibson, Kevin Karplus, Weizhong Li, Rodrigo Lopez, Hamish McWilliam, Michael Remmert, Johannes Söding, Julie D Thompson and Desmond G Higgins: Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. (PubMed,eprint) Molecular Systems Biology 7:539 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
clustalw
allineamento globale per sequenze multiple di nucleotidi o peptidi
Versions of package clustalw
ReleaseVersionArchitectures
trixie2.1+lgpl-7amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye2.1+lgpl-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.1+lgpl-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.1+lgpl-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.1+lgpl-4amd64,armel,armhf,i386
sid2.1+lgpl-7amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster2.1+lgpl-6amd64,arm64,armhf,i386
Debtags of package clustalw:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 16 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Questo programma effettua un allineamento di sequenze multiple di nucleotidi o di amminoacidi. Riconosce il formato di input delle sequenze e se le sequenze sono acidi nucleici (DNA/RNA) o amminoacidi (proteine). Il formato di output può essere selezionato da diversi formati per allineamenti multipli come Phylip o FASTA. Clustal W è molto ben accettato.

L'output di Clustal W può essere modificato manualmente, ma è preferibile farlo con un editor di allineamenti come SeaView o all'interno del suo compagno Clustal X. Quando si costruisce un modello da un allineamento, questo può essere applicato per ricerche migliorate in database. Il pacchetto Debian hmmer crea modelli simili nella forma di un HMM.

The package is enhanced by the following packages: clustalw-mpi
Please cite: M. A. Larkin, G. Blackshields, N. P. Brown, R. Chenna, P. A. McGettigan, H. McWilliam, F. Valentin, I.M. Wallace, A. Wilm, R. Lopez, J. D. Thompson, T. J. Gibson and D. G. Higgins: Clustal W and Clustal X version 2.0. (PubMed,eprint) Bioinformatics 23(21):2947-2948 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
clustalx
allineamento multiplo di sequenze di acidi nucleici e di proteine (interfaccia grafica)
Versions of package clustalx
ReleaseVersionArchitectures
stretch2.1+lgpl-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1+lgpl-8amd64,arm64,armhf,i386
bullseye2.1+lgpl-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.1+lgpl-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.1+lgpl-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.1+lgpl-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.1+lgpl-3amd64,armel,armhf,i386
Debtags of package clustalx:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacex11
roleprogram
scopeutility
uitoolkitmotif
useanalysing, comparing, viewing
works-with-formatplaintext
x11application
Popcon: 8 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto offre un'interfaccia grafica per il programma di allineamento di sequenze multiple Clustal. Fornisce un ambiente integrato per effettuare allineamenti di sequenze e profili multipli per analizzare i risultati. L'allineamento delle sequenze è visualizzato in una finestra sullo schermo. Uno schema di colorazione versatile è stato incorporato per evidenziare le caratteristiche conservate nell'allineamento. Per le presentazioni professionali occorre usare il pacchetto LaTeX texshade o boxshade.

Il menù a tendina in alto nella finestra permette di selezionare tutte le opzioni richieste per l'allineamento tradizionale di sequenze e profili multipli. Possono essere copiate ed incollate le sequenze per modificare l'ordine dell'allineamento; si può selezionare un sottoinsieme di sequenze che devono essere allineate; si può selezionare un sottointervallo dell'allineamento per essere riallineato e reinserito in quello originale.

Può essere fatta un'analisi qualitativa dell'allineamento e possono essere evidenziati i segmenti con basso punteggio o i residui eccezionali.

Please cite: M.A. Larkin, G. Blackshields, N.P. Brown, R. Chenna, P.A. McGettigan, H. McWilliam, F. Valentin, I.M. Wallace, A. Wilm, R. Lopez, J.D. Thompson, T.J. Gibson and D.G. Higgins: Clustal W and Clustal X version 2.0. (PubMed,eprint) Bioinformatics 23(21):2947-2948 (2007)
Registry entries: Bio.tools  SciCrunch 
Topics: Sequence analysis
cnvkit
rilevamento della variabilità del numero di copie da sequenziamento mirato di DNA
Versions of package cnvkit
ReleaseVersionArchitectures
buster0.9.5-3amd64
bookworm0.9.9-2amd64,arm64,ppc64el
trixie0.9.10-2all
sid0.9.10-2all
experimental0.9.10-3~0exp0all
bullseye0.9.8-1amd64,arm64,ppc64el
upstream0.9.12
Popcon: 3 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

Un toolkit a riga di comando e una libreria Python per rilevare la variabilità del numero di copie e le alterazioni a livello di tutto il genoma da sequenziamento mirato di DNA. È progettato per l'uso con catture ibride, inclusi sia l'esoma intero, sia pannelli obiettivo personalizzati, e piattaforme di sequenziamento con letture corte come Illumina e Ion Torrent.

Please cite: Eric Talevich, A. Hunter Shain, Thomas Botton and Boris C. Bastian: CNVkit: Genome-Wide Copy Number Detection and Visualization from Targeted DNA Sequencing. (PubMed,eprint) PLOS 12(4):e1004873 (2016)
Registry entries: Bio.tools  Bioconda 
codonw
analisi di corrispondenza dell'uso di codoni
Versions of package codonw
ReleaseVersionArchitectures
trixie1.4.4-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.4.4-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.4.4-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.4.4-4amd64,arm64,armhf,i386
bookworm1.4.4-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.4.4-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

CodonW è un pacchetto per l'analisi dell'uso di codoni. È stata progettata per semplificare l'analisi multivariata (MVA) dell'uso dei codoni. Il metodo MVA utilizzato in CodonW è l'analisi di corrispondenza (COA), il metodo MVA più comunemente usato per l'analisi dell'uso di codoni. CodonW può generare un COA per l'uso dei codoni, uso relativo di codoni sinonimi e uso di aminoacidi. Analisi aggiuntive sull'uso dei codoni includono lo studio dei codoni ottimali, uso preferenziale di codoni e dinucleotidi e/o composizione in basi. CodonW analizza le sequenze codificate da codici genetici diversi dal codice universale.

Please cite: Paul M. Sharp, Elizabeth Bailes, Russell J. Grocock, John F. Peden and R. Elizabeth Sockett: Variation in the strength of selected codon usage bias among bacteria.. (PubMed,eprint) Nucleic Acids Research 33(4):1141-1153 (2005)
Registry entries: Bioconda 
Topics: Sequence composition, complexity and repeats
comet-ms
motore di ricerca per spettrometria di massa tandem (MS/MS)
Versions of package comet-ms
ReleaseVersionArchitectures
bookworm2019015+cleaned1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2019015+cleaned1-4.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2019015+cleaned1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2018012-1amd64,arm64,armhf,i386
sid2019015+cleaned1-4.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2014022-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream2021010
Popcon: 2 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Comet è un motore di ricerca open source per database di sequenze di spettrometria di massa tandem (MS/MS). Identifica i peptidi cercando gli spettri MS/MS nelle sequenze presenti nei database di sequenze proteiche.

Questo pacchetto fornisce un binario che esegue le ricerche in database di MS/MS. I formati di input gestiti sono: file mzXML, mzML e ms2. I formati di output gestiti sono: .out, SQT e pepXML.

Please cite: Jimmy K. Eng, Tahmina A. Jahan and Michael R. Hoopmann: Comet: an open source tandem mass spectrometry sequence database search tool. (PubMed) Proteomics 13(1) (2012)
concavity
predizione dei siti di legame di proteine con ligandi da struttura e conservazione
Versions of package concavity
ReleaseVersionArchitectures
trixie0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.1-2amd64,armel,armhf,i386
stretch0.1+dfsg.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.1+dfsg.1-4amd64,arm64,armhf,i386
bullseye0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.1+dfsg.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ConCavity predice i siti di legame delle proteine con ligandi combinando conservazione evolutiva della sequenza e struttura 3D.

ConCavity accetta come input la struttura di una proteina in formato PDB e opzionalmente file che caratterizzano la conservazione evolutiva della sequenza delle catene nel file di struttura.

I seguenti file di risultato sono prodotti in maniera predefinita:

  • predizioni dei residui di legame con ligandi per ciascuna catena (*.scores);
  • predizioni dei residui di legame con ligandi in un file in formato PDB (punteggi dei residui inseriti nel campo del fattore temp., *_residue.pdb);
  • predizioni delle posizioni delle tasche in un file in formato DX (*.dx);
  • script PyMOL per visualizzare le predizioni (*.pml).
The package is enhanced by the following packages: conservation-code
Please cite: John A. Capra, Roman A. Laskowski, Janet M. Thornton, Mona Singh and Thomas A. Funkhouser: Predicting Protein Ligand Binding Sites by Combining Evolutionary Sequence Conservation and 3D Structure. (PubMed) PLoS Computational Biology 5(12):e1000585 (2009)
Registry entries: SciCrunch 
conservation-code
strumento per punteggio di conservazione per le sequenze di proteine
Versions of package conservation-code
ReleaseVersionArchitectures
sid20110309.0-8all
bookworm20110309.0-8all
trixie20110309.0-8all
bullseye20110309.0-8all
jessie20110309.0-3all
stretch20110309.0-5all
buster20110309.0-7all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto fornisce score_conservation(1), uno strumento per assegnare punteggi alla conservazione di sequenze di proteine.

Sono implementati i seguenti metodi di assegnazione di punteggi di conservazione:

  • somma di coppie;
  • somma di coppie pesata;
  • entropia di Shannon;
  • entropia di Shannon con raggruppamenti di proprietà (Mirny e Shakhnovich 1995, Valdar e Thornton 2001);
  • entropia relativa con raggruppamenti di proprietà (Williamson 1995);
  • entropia di von Neumann (Caffrey et al 2004);
  • entropia relativa (Samudrala e Wang 2006);
  • divergenza di Jensen-Shannon (Capra e Singh 2007).

È anche fornita un'estensione basata su finestra, che incorpora la conservazione stimata di residui adiacenti sulla sequenza nel punteggio per ogni colonna. Questo approccio con finestra verrà applicato a qualsiasi metodo di punteggio della conservazione.

Il programma accetta allineamenti nei formati CLUSTAL e FASTA.

L'output specifico per sequenza può essere utilizzato come input di conservazione per concavity.

La conservazione è altamente predittiva nell'identificare siti catalitici e residui vicini a ligandi legati.

Please cite: John A. Capra and Mona Singh: Predicting functionally important residues from sequence conservation. (PubMed) Bioinformatics 23(15):1875-82 (2007)
coot
model building program for macromolecular crystallography
Versions of package coot
ReleaseVersionArchitectures
sid1.1.09+dfsg-2amd64,arm64,armhf,ppc64el
upstream1.1.10
Popcon: 2 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

This is a program for constructing atomic models of macromolecules from x-ray diffraction data. Coot displays electron density maps and molecular models and allows model manipulations such as idealization, refinement, manual rotation/translation, rigid-body fitting, ligand search, solvation, mutations, rotamers. Validation tools such as Ramachandran and geometry plots are available to the user. This package provides a Coot build with embedded Python support.

Please cite: P. Emsley, B. Lohkamp, W. G. Scott and K. Cowtan: Features and development of Coot. (eprint) Acta Crystallographica Section D 66(4):486-501 (2010)
Other screenshots of package coot
VersionURL
1.1.07.705.gb7e2c16a2+dfsghttps://screenshots.debian.net/shrine/screenshot/24994/simage/large-ba16ac981faeabd10afc34f99b9abcde.jpg
Screenshots of package coot
covtobed
converte la traccia di copertura da un file BAM in un file BED
Versions of package covtobed
ReleaseVersionArchitectures
bookworm1.3.5+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.3.5+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.3.5+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.2.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Legge uno o più file di allineamento (BAM ordinati) e stampa un BED con la copertura. Unirà basi consecutive con la stessa copertura e può essere usato per stampare un file BED solamente con le regioni che hanno uno specifico intervallo di copertura.

Please cite: Giovanni Birolo and Andrea Telatin: covtobed: a simple and fast tool to extract coverage tracks from BAM files. Journal of Open Source Software 5(47):2119 (2020)
Registry entries: Bioconda 
crac
analisi integrata di letture RNA-Seq
Versions of package crac
ReleaseVersionArchitectures
sid2.5.2+dfsg-6amd64,arm64,mips64el,ppc64el,riscv64
stretch2.5.0+dfsg-1amd64
buster2.5.0+dfsg-3amd64,arm64
bullseye2.5.2+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm2.5.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el
trixie2.5.2+dfsg-6amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

CRAC è uno strumento per analizzare dati da HTS (High Throughput Sequencing) in confronto a un genoma di riferimento. È pensato per letture di sequenziamento genomico e trascrittomico. Più precisamente, con letture trascrittomiche come input, predice mutazioni puntuali, indel, giunzioni di splice e RNA chimerici (cioè giunzioni di splice non collineari). CRAC può anche emettere in output posizioni e natura di errori di sequenze che rileva nelle letture. CRAC usa un indice del genoma. Questo indice deve essere calcolato prima di eseguire l'analisi della lettura. Per questo scopo, usare il comando "crac-index" sui file del genoma. Si può poi elaborare le letture usando il comando crac. Consultare la pagina man di CRAC (file della guida) scrivendo "man crac". CRAC richiede grandi quantità di memoria principale nel computer. Per elaborazioni del genoma umano, circa 50 milioni di letture di 100 nucleotidi ciascuna, CRAC richiede circa 40 gigabyte di memoria principale. Verificare che il sistema del server di calcolo in uso sia equipaggiato con sufficiente quantità di memoria prima di lanciare un'analisi.

Please cite: Eliseos J. Mucaki, Natasha G. Caminsky, Ami M. Perri, Ruipeng Lu, Alain Laederach, Matthew Halvorsen, Joan H. M. Knoll and Peter K. Rogan: A unified analytic framework for prioritization of non-coding variants of uncertain significance in heritable breast and ovarian cancer. (PubMed) BMS Medical Genomics 9:19 (2016)
Registry entries: Bio.tools  SciCrunch 
csb
insieme di strumenti CSB (Computational Structural Biology)
Versions of package csb
ReleaseVersionArchitectures
sid1.2.5+dfsg-10all
trixie1.2.5+dfsg-10all
buster1.2.5+dfsg-3all
bookworm1.2.5+dfsg-8all
bullseye1.2.5+dfsg-5all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

L'insieme di strumenti CSB (Computational Structural Biology, biologia strutturale computazionale) è una libreria di classi Python per leggere, archiviare e analizzare strutture biomolecolari in una varietà di formati, con un ricco supporto per le analisi statistiche.

CSB è progettato per la riusabilità e l'estensibilità e viene fornito con un'API pulita e ben documentata che segue le buone prassi di progettazione orientata agli oggetti.

Questo pacchetto contiene alcuni strumenti utente eseguibili.

Registry entries: SciCrunch  Bioconda 
ctffind
fast and accurate defocus estimation from electron micrographs
Versions of package ctffind
ReleaseVersionArchitectures
sid4.1.14-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.1.14-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream5.0.2
Popcon: 0 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

This is a widely-used program for the estimation of objective lens defocus parameters from transmission electron micrographs. Defocus parameters are estimated by fitting a model of the microscope's contrast transfer function (CTF) to an image's amplitude spectrum.

Please cite: Alexis Rohou and Nikolaus Grigorieff: CTFFIND4: Fast and accurate defocus estimation from electron micrographs. (PubMed) Journal of Structural Biology 192(2):216-221 (2015)
Registry entries: SciCrunch 
cutadapt
pulisce sequenze biologiche provenienti da letture di sequenziamento ad alte prestazioni
Versions of package cutadapt
ReleaseVersionArchitectures
trixie4.7-2all
bullseye3.2-2all
bookworm4.2-1all
buster1.18-1all
stretch1.12-2all
sid4.7-2all
upstream4.9
Popcon: 8 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Cutadapt aiuta nei compiti di pulitura di sequenze biologiche trovando le sequenze adattatore o primer in maniera tollerante agli errori. Può anche modificare e filtrare in vari modi le letture. Le sequenze adattatore possono contenere metacaratteri IUPAC. Inoltre sono gestite letture con estremità accoppiate e anche dati sullo spazio dei colori. Se lo si desidera, si può anche solamente fare il demultiplex dei dati in input, senza rimuovere alcuna sequenza adattatore.

Questo pacchetto contiene l'interfaccia utente.

The package is enhanced by the following packages: multiqc
Please cite: Marcel Martin: Cutadapt removes adapter sequences from high-throughput sequencing reads. (eprint) EMBnet.journal 17(1):10-12 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
cutesv
comprehensive discovery of structural variations of genomic sequences
Versions of package cutesv
ReleaseVersionArchitectures
sid2.1.1-1all
bookworm2.0.2-1all
trixie2.1.1-1all
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Long-read sequencing enables the comprehensive discovery of structural variations (SVs). However, it is still non-trivial to achieve high sensitivity and performance simultaneously due to the complex SV characteristics implied by noisy long reads.

cuteSV is a sensitive, fast and scalable long-read-based SV detection approach. cuteSV uses tailored methods to collect the signatures of various types of SVs and employs a clustering-and-refinement method to analyze the signatures to implement sensitive SV detection. Benchmarks on real Pacific Biosciences (PacBio) and Oxford Nanopore Technology (ONT) datasets demonstrate that cuteSV has better yields and scalability than state-of-the-art tools.

Please cite: Tao Jiang, Yongzhuang Liu, Yue Jiang, Junyi Li, Yan Gao, Zhe Cui, Yadong Liu, Bo Liu and Yadong Wang: Long-read-based human genomic structural variation detection with cuteSV. (PubMed,eprint) Genome Biology 21(1):189 (2020)
Registry entries: Bio.tools  Bioconda 
daligner
rilevazione di allineamenti locali tra letture lunghe di sequenze nucleotidiche
Versions of package daligner
ReleaseVersionArchitectures
trixie1.0+git20240119.335105d-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0+git20240119.335105d-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0+20161119-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0+git20180524.fd21879-1amd64,arm64,armhf,i386
bullseye1.0+git20200727.ed40ce5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0+git20221215.bd26967-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Questi strumenti permettono di trovare tutti gli allineamenti locali significativi tra letture codificate in un database Dazzler. Si assume che le letture provengano da un sequenziatore di letture lunghe Pacific Biosciences RS II, cioè che le letture siano lunghe e con rumore, fino in media al 15%.

Please cite: Gene Myers: Efficient Local Alignment Discovery amongst Noisy Long Reads. 8701:52-67 (2014)
Registry entries: SciCrunch  Bioconda 
damapper
long read to reference genome mapping tool
Versions of package damapper
ReleaseVersionArchitectures
sid0.0+git20240314.b025cf9-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.0+git20210330.ab45103-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.0+git20240314.b025cf9-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.0+git20200322.b2c9d7f-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Recognised as the Damapper Library, this is a long read to reference genome mapping command line tool.

For a given reference database 'X' and read block 'Y', damapper produces the single file 'Y.X.las'. Each output file is sorted in order of the A-reads, and if a match is a chain of local alignments, then the LA's in the chain occur in increasing order of A-coordinates.

HPC.damapper writes a UNIX shell script to the standard output that maps every read in blocks to of database to a reference sequence . If is missing then only the single block is mapped, and if is also missing then all blocks of the database are mapped.

This package contains the damapper and HPC.damapper binaries.

datamash
strumento per statistiche con interfaccia a riga di comando
Versions of package datamash
ReleaseVersionArchitectures
bullseye1.7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.4-1amd64,arm64,armhf,i386
stretch1.0.7-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.0.6-2amd64,armel,armhf,i386
bookworm1.7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.8-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.8-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 44 users (15 upd.)*
Versions and Archs
License: DFSG free
Git

GNU Datamash è un programma a riga di comando che effettua operazioni di base numeriche, testuali e statistiche sui file di dati testuali in input. È progettato per essere portabile e affidabile e aiutare i ricercatori a automatizzare facilmente catene di analisi senza scrivere codice e nemmeno script corti.

Registry entries: SciCrunch 
dawg
simula l'evoluzione di sequenze di DNA ricombinante
Versions of package dawg
ReleaseVersionArchitectures
bookworm1.2-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2-2amd64,arm64,armhf,i386
bullseye1.2-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.2-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

DNA Assembly with Gaps (Dawg) è un'applicazione progettata per simulare l'evoluzione di sequenze di DNA ricombinante nel tempo continuo sulla base del robusto modello generico reversibile nel tempo con eterogeneità a tasso invariante e gamma e un innovativo modello dipendente dalla lunghezza per la formazione di gap. L'applicazione accetta filogenie in formato Newick e può restituire la sequenza di qualsiasi nodo, permettendo di registrare l'intera esatta storia evolutiva a discrezione dell'utente. Dawg registra la storia dei gap di ciascuna linea per produrre il vero allineamento in output. Sono disponibili molte opzioni per permettere agli utenti di personalizzare le proprie simulazioni e i risultati.

Please cite: Reed A. Cartwright: DNA assembly with gaps (Dawg): simulating sequence evolution. (PubMed,eprint) Bioinformatics 21(Suppl 3):iii31-iii38 (2005)
Registry entries: Bioconda 
dazzdb
gestione dei dati di letture di sequenziamento di nucleotidi
Versions of package dazzdb
ReleaseVersionArchitectures
trixie1.0+git20240115.be65e59-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0+git20221215.aad3a46-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0+git20201103.8d98c37-1+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0+git20180908.0bd5e07-1amd64,arm64,armhf,i386
stretch1.0+20161112-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0+git20240115.be65e59-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Per facilitare le fasi multiple dell'assemblatore dazzler, tutti i dati delle letture sono organizzati in ciò che a tutti gli effetti è un database delle letture e delle loro meta-informazioni. Gli obiettivi del progetto di questo database sono i seguenti:

  • il database memorizza le informazioni sulle letture Pacbio sorgenti in maniera tale che possa ricreare i dati di input originali, permettendo perciò a un utente di rimuovere i file sorgenti (effettivamente ridondanti); ciò permette di evitare di duplicare gli stessi dati, una volta nel file sorgente e una volta nel database;
  • il database può essere costruito in maniera incrementale, cioè nuovi dati sulle sequenze possono essere aggiunti al database nel tempo;
  • il database permette in maniera flessibile di memorizzare qualsiasi metadato desiderato per le letture; ciò è realizzato con il concetto delle tracce che gli implementatori possono aggiungere quando ne hanno bisogno;
  • i dati sono tenuti in una forma compressa equivalente ai file .dexta e .dexqv del modulo di estrazione dati; sia le informazioni .fasta sia .quiva per ogni lettura sono tenute nel database e possono essere ricreate a partire da esso; le informazioni .quiva possono essere aggiunte separatamente e successivamente se lo si desidera;
  • per facilitare lavori paralleli e operazioni su cluster delle fasi dell'assemblatore, il database ha un concetto di partizionamento corrente in cui tutte le letture che sono sopra una data lunghezza e opzionalmente uniche per un pozzetto, sono divise in blocchi contenenti approssimativamente un dato numero di basi, eccetto eventualmente l'ultimo blocco che può avere un conteggio ridotto; spesso i programmi possono essere eseguiti su blocchi o coppie di blocchi e ognuno di tali lavori è ragionevolmente ben bilanciato dal momento che i blocchi sono tutti della stessa dimensione; è necessario essere cauti nel cambiare la partizione durante un assemblaggio perché ciò potrebbe annullare la validità strutturale di qualsiasi risultato parziale basato sui blocchi.
Registry entries: Bioconda 
deblur
deconvolution for Illumina amplicon sequencing
Versions of package deblur
ReleaseVersionArchitectures
sid1.1.1-2all
trixie1.1.1-2all
Popcon: users ( upd.)*
Versions and Archs
License: DFSG free
Git

Deblur is a greedy deconvolution algorithm for amplicon sequencing based on Illumina Miseq/Hiseq error profiles. The authors recommend using Deblur via the QIIME2 plugin q2-deblur. Examples of its use can be found within the plugin itself. However, Deblur itself does not depend on QIIME2.

The input to Deblur workflow is a directory of FASTA or FASTQ files (1 per sample) or a single demultiplexed FASTA or FASTQ file. These files can be gzip'd. The output directory will contain three BIOM tables in which the observation IDs are the Deblurred sequences. The outputs are contingent on the reference databases used and a more focused discussion on them is in the subsequent README section titled "Positive and Negative Filtering." The output files are as follows:

  • reference-hit.biom : contains only Deblurred reads matching the positive filtering database. By default, a reference composed of 16S sequences is used, and this resulting table will contain only those reads which recruit at a coarse level to it will be retained. Reads are also filtered against the negative reference, which by default will remove any read which appears to be PhiX or adapter.

  • reference-hit.seqs.fa : a fasta file containing all the sequences in reference-hit.biom

  • reference-non-hit.biom : contains only Deblurred reads that did not align to the positive filtering database. Negative filtering is also appied to this table, so by default, PhiX and adapter are removed.

  • reference-non-hit.seqs.fa : a fasta file containing all the sequences in reference-non-hit.biom

  • all.biom : contains all Deblurred reads. This file represents the union of the "reference-hit.biom" and "reference-non-hit.biom" tables.

  • all.seqs.fa : a fasta file containing all the sequences in all.biom

Deblur uses two types of filtering on the sequences:

  • Negative mode - removes known artifact sequences (i.e. sequences aligning to PhiX or Adapter with >=95% identity and coverage).

  • Positive mode - keeps only sequences similar to a reference database (by default known 16S sequences). SortMeRNA is used, and any sequence with an e-value <= 10 is retained. Deblur also outputs a BIOM table without this positive filtering step (named all.biom).

The FASTA files for both of these filtering steps can be supplied via the --neg-ref-fp and --pos-ref-fp options. By default, the negative database is composed of PhiX and adapter sequence and the positive database of known 16S sequences.

Deblur uses negative mode filtering to remove known artifact (i.e. PhiX and Adapter sequences) prior to denoising. The output of Deblur contains three files: all.biom, which includes all sOTUs, reference-hit.biom, which contains the output of positive filtering of the sOTUs (default only sOTUs similar to 16S sequences), and reference-non-hit.biom, which contains only sOTUs failing the positive filtering (default only non-16S sOTUs).

deepnano
strumento di identificazione basi alternativo per letture MinION di sequenze genomiche
Versions of package deepnano
ReleaseVersionArchitectures
buster0.0+git20170813.e8a621e-3amd64,arm64,i386
bullseye0.0+git20170813.e8a621e-3.1amd64,arm64,armhf,i386,ppc64el,s390x
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

DeepNano è uno strumento di identificazione delle basi alternativo per letture Oxford Nanopore MinION basato su reti neurali ricorrenti profonde.

Attualmente funziona con chimica SQK-MAP-006 e SQK-MAP-005 e come post-elaboratore per Metrichor.

Please cite: Vladimír Boža, Broňa Brejová and Tomáš Vinař: DeepNano: Deep recurrent neural networks for base calling in MinION nanopore reads. PLOS one (2017)
Remark of Debian Med team: There is no intend to keep continue the existing packaging since

the program nanocall seems to serve the intended purpose better

delly
Structural variant discovery by read analysis
Versions of package delly
ReleaseVersionArchitectures
bookworm1.1.6-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.8-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.1.8-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.8.1-2amd64,arm64,armhf
bullseye0.8.7-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.3.1
Popcon: 1 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Delly performs Structural variant discovery by integrated paired-end and split-read analysis. It discovers, genotypes and visualizes deletions, tandem duplications, inversions and translocations at single-nucleotide resolution in short-read massively parallel sequencing data. It uses paired-ends, split-reads and read-depth to sensitively and accurately delineate genomic rearrangements throughout the genome.

Please cite: Tobias Rausch, Thomas Zichner, Andreas Schlattl, Adrian M. Stuetz, Vladimir Benes and Jan O. Korbel: DELLY: structural variant discovery by integrated paired-end and split-read analysis.. Bioinformatics 28:i333-i339 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
density-fitness
Calculates per-residue electron density scores
Versions of package density-fitness
ReleaseVersionArchitectures
trixie1.0.12-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.12-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.8-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The program density-fitness calculates electron density metrics, for main- (includes Cβ atom) and side-chain atoms of individual residues.

For this calculation, the program uses the structure model in either PDB or mmCIF format and the electron density from the 2mFo-DFc and mFo-DFc maps. If these maps are not readily available, the MTZ file and model can be used to calculate maps clipper. Density-fitness support both X-ray and electron diffraction data.

This program is essentially a reimplementation of edstats, a program available from the CCP4 suite. However, the output now contains only the RSR, SRSR and RSCC fields as in edstats with the addition of EDIAm and OPIA and no longer requires pre-calculated map coefficients.

Please cite: I. J. Tickle: Statistical quality indicators for electron-density maps. Acta Cryst. (D68):454-467 (2012)
dextractor
libreria dextractor di comandi di estrazione e compressione
Versions of package dextractor
ReleaseVersionArchitectures
bullseye1.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

I comandi di dextractor permettono di recuperare esattamente e solamente le informazioni necessarie per assemblato e ricostruzione dai file sorgenti HDF5 prodotti dal sequenziatore PacBio RS II, o dai file sorgenti BAM prodotti dal sequenziatore PacBio Sequel.

Per ciascuno dei tre tipi di file estratti (fasta, quiva e arrow) la libreria contiene comandi per comprimere il tipo di file dato e per decomprimerlo, che è un processo reversibile che restituisce il file originale non compresso. I file .fasta compressi, con l'estensione .dexta, consumano 1/4 di byte per base. I file .quiva compressi, con l'estensione .dexqv, consumano 1,5 byte per base in media, e i file .arrow compressi, con l'estensione .dexar, consumano 1/4 di byte per base.

Per ulteriori informazioni, consultare la documentazione disponibile all'indirizzo https://github.com/thegenemyers/DEXTRACTOR.

Registry entries: Bioconda 
dialign
allineamenti multipli di sequenze basati su segmenti
Versions of package dialign
ReleaseVersionArchitectures
bullseye2.2.1-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2.1-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.2.1-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.2.1-7amd64,armel,armhf,i386
buster2.2.1-10amd64,arm64,armhf,i386
trixie2.2.1-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.2.1-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package dialign:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 12 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

DIALIGN2 è uno strumento a riga di comando per fare allineamenti multipli di sequenze proteiche o di DNA. Costruisce gli allineamenti a partire da coppie di segmenti simili senza gap delle sequenze. Questo schema di punteggio per gli allineamenti è la differenza principale tra DIALIGN e altri metodi di allineamento locale o globale. Si noti che DIALIGN non usa alcun tipo di penalità per i gap.

Please cite: Burkhard Morgenstern: DIALIGN 2: improvement of the segment-to-segment approach to multiple sequence alignment. (PubMed,eprint) Bioinformatics 15(3):211-218 (1999)
Registry entries: Bio.tools  SciCrunch  Bioconda 
dialign-tx
allineamenti multipli di sequenze basati su segmenti
Versions of package dialign-tx
ReleaseVersionArchitectures
bookworm1.0.2-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.2-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.0.2-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0.2-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.0.2-12amd64,arm64,armhf,i386
bullseye1.0.2-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.2-7amd64,armel,armhf,i386
Debtags of package dialign-tx:
fieldbiology, biology:bioinformatics
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 10 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

DIALIGN-TX è uno strumento a riga di comando per fare allineamenti multipli di sequenze proteiche o di DNA. È una completa reimplementazione dell'approccio basato su segmenti che include diverse nuove migliorie e modelli euristici che migliorano significativamente la qualità degli allineamenti in output rispetto a DIALIGN 2.2 e DIALIGN-T. Per l'allineamento di coppie, DIALIGN-TX usa un algoritmo di concatenazione dei frammenti che favorisce catene di allineamenti locali a basso punteggio rispetto a frammenti isolati ad alto punteggio. Per gli allineamenti multipli, DIALIGN-TX usa una procedura migliorata che è meno sensibile a somiglianze spurie tra sequenze locali.

The package is enhanced by the following packages: dialign-tx-data
Please cite: Amarendran R. Subramanian, Michael Kaufmann and Burkhard Morgenstern: DIALIGN-TX: greedy and progressive approaches for segment-based multiple sequence alignment. (PubMed) Algorithms for Molecular Biology 3(1):6 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
diamond-aligner
allineatore di sequenze locali accelerato compatibile con BLAST
Versions of package diamond-aligner
ReleaseVersionArchitectures
sid2.1.9-1amd64,arm64,ppc64el,riscv64,s390x
buster0.9.24+dfsg-1amd64
stretch-backports0.9.22+dfsg-2~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.1.9-1amd64,arm64,ppc64el,riscv64,s390x
bookworm2.1.3-1amd64,arm64,ppc64el,s390x
bullseye2.0.7-1amd64,arm64,ppc64el,s390x
upstream2.1.10
Popcon: 2 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

DIAMOND è un allineatore di sequenze per ricerche su proteine e DNA tradotto e funziona come sostituto perfetto per gli strumenti software NCBI BLAST. È adatto per ricerche proteina-proteina e per ricerche DNA-proteina su letture corte e sequenze più lunghe inclusi contig e assemblaggi, fornendo una velocizzazione di BLAST fino a 20.000 volte.

Please cite: Benjamin Buchfink, Chao Xie and Daniel H Huson: Fast and sensitive protein alignment using DIAMOND. (PubMed) Nature methods 12(1):59-60 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
discosnp
scopre Single Nucleotide Polymorphism da uno o più insiemi di letture grezze
Versions of package discosnp
ReleaseVersionArchitectures
sid2.6.2-3amd64,arm64,mips64el,ppc64el,riscv64
jessie1.2.5-1amd64,armel,armhf,i386
buster2.3.0-2amd64,arm64,i386
bullseye4.4.4-1amd64,arm64,i386,mips64el,ppc64el,s390x
stretch1.2.6-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.6.2-2amd64,arm64,mips64el,ppc64el
trixie2.6.2-3amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Il software discoSnp è progettato per scoprire SNP (Single Nucleotide Polymorphism - polimorfismo di nucleotide singolo) da uno o più insiemi di letture grezze ottenute tramite NGS (Next Generation Sequencers - sequenziatori di prossima generazione).

Notare che il numero di insiemi di letture in input non è vincolato, può essere uno, due o più. Notare anche che non sono necessari ulteriori dati come annotazioni o genoma di riferimento.

Il software è composto da due moduli. Il primo modulo, kissnp2, rileva gli SNP dagli insiemi di letture. Un secondo modulo, kissreads, potenzia i risultati di kissnp2 calcolando, per ogni insieme di letture e per ogni SNP trovato:

 1) la sua copertura di letture media,
 2) la qualità (phred) di letture che generano il polimorfismo.

Questo pacchetto è stato sorpassato da DiscoSnp++.

Registry entries: Bio.tools  SciCrunch  Bioconda 
disulfinder
predittore della connettività e stato di legame del ponte disulfuro di cisteine
Versions of package disulfinder
ReleaseVersionArchitectures
buster1.2.11-8amd64,arm64,armhf,i386
stretch1.2.11-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.2.11-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.11-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.2.11-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.2.11-4amd64,armel,armhf,i386
bullseye1.2.11-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package disulfinder:
roleprogram
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

"disulfinder" serve a predire, a partire dalla sola sequenza, lo stato di legame con ponti disolfuro di cisteine e la loro connettività con ponte disolfuro. I ponti disolfuro hanno un ruolo importante nella stabilizzazione del processo di ripiegamento per molte proteine. La predizione di ponti disolfuro dalla sola sequenza è perciò utile per lo studio delle proprietà strutturali e funzionali di specifiche proteine. In aggiunta, la conoscenza dello stato di legame dei ponti disolfuro delle cisteine può aiutare il processo di determinazione sperimentale della struttura e può essere utile in altre attività di annotazione genomica.

"disulfinder" predice i modelli di ponti disolfuro in due passi di calcolo: (1) viene predetto lo stato di legame con ponte disolfuro di ciascuna cisteina usando un classificatore binario BRNN-SVM; (2) le cisteine di cui si sa che partecipano a formare ponti vengono accoppiate da una rete neurale ricorsiva per ottenere un modello di connettività.

Please cite: Alessio Ceroni, Andrea Passerini, Alessandro Vullo and Paolo Frasconi: DISULFIND: a disulfide bonding state and cysteine connectivity prediction server. (PubMed) Nucleic Acids Res 34(Web Server issue):W177-181 (2006)
Registry entries: Bio.tools  SciCrunch 
dnaclust
strumento per raggruppare in cluster milioni di corte sequenze di DNA
Versions of package dnaclust
ReleaseVersionArchitectures
bullseye3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie3-2amd64,armel,armhf,i386
bookworm3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3-6amd64,arm64,armhf,i386
stretch3-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

dnaclust è uno strumento per raggruppare in cluster un vasto numero di corte sequenze di DNA. I cluster vengono creati in un modo tale che il "raggio" di ogni cluster è più piccolo di una soglia specificata.

Le sequenze di input da raggruppare in cluster devono essere in formato Fasta. L'ID di ogni sequenza è basato sulla prima parola della sequenza nel formato Fasta. La prima parola è il prefisso dell'intestazione fino alla prima occorrenza di caratteri vuoti di spazio nell'intestazione.

Please cite: Mohammadreza Ghodsi, Bo Liu and Mihai Pop: DNACLUST: accurate and efficient clustering of phylogenetic marker genes. (PubMed,eprint) BMC Bioinformatics 12:271 (2011)
Registry entries: Bio.tools  SciCrunch 
dnarrange
metodo per trovare riarrangiamenti in letture lunghe di DNA rispetto ad una sequenza genomica
Versions of package dnarrange
ReleaseVersionArchitectures
trixie1.5.3-1all
bookworm1.5.3-1all
sid1.5.3-1all
upstream1.6.2
Popcon: 2 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Questo pacchetto fornisce utilità per allineare le letture al genoma, trovare riarrangiamenti e disegnare immagini dei gruppi riarrangiati.

dotter
confronto dettagliato tra due sequenze genomiche
Versions of package dotter
ReleaseVersionArchitectures
buster4.44.1+dfsg-3amd64,arm64,armhf,i386
bookworm4.44.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.44.1+dfsg-7.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye4.44.1+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.44.1+dfsg-7.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Dotter è un programma a matrice di punti grafico per confronto dettagliato di due sequenze.

  • Ciascun residuo in una sequenza è confrontato con ciascun residuo nell'altra e viene calcolata una matrice di punteggi.
  • Una sequenza è disegnata sull'asse x e l'altra sull'asse y.
  • Il rumore viene filtrato in modo che gli allineamenti appaiano come linee diagonali.
  • I punteggi delle coppie sono mediati con una finestra mobile per rendere la matrice dei punteggi più intelligibile.
  • La matrice dei punteggi mediati forma un paesaggio tridimensionale, con le due sequenze in due dimensioni e l'altezza dei picchi sulla terza. Questo paesaggio è proiettato in due dimensioni usando un'immagine a scala di grigi, più scuro è un picco, più alto è il punteggio.
  • Il contrasto e la soglia dell'immagine a scala di grigi possono essere regolati interattivamente, senza dover ricalcolare la matrice dei punteggi.
  • È fornito uno strumento di allineamento per esaminare l'allineamento delle sequenze che l'immagine a scala di grigi rappresenta.
  • Le coppie conosciute con punteggi alti possono essere caricate da un file GFF e sovrapposte al grafico.
  • I modelli dei geni possono essere caricati da GFF e visualizzati accanto all'asse relativo.
  • Confrontare una sequenza con sé stessa per trovare ripetizioni interne.
  • Trovare sovrapposizioni tra sequenze multiple facendo un grafico a punti di tutte le sequenze verso loro stesse.
  • Eseguire Dotter in modalità non interattiva come processo sullo sfondo per creare grafici a punti grandi, che richiedono molto tempo.
Please cite: Gemma Barson and Ed Griffiths: SeqTools: visual tools for manual analysis of sequence alignments. (PubMed,eprint) BMC Research Notes 9:39 (2016)
Registry entries: Bio.tools  SciCrunch 
drop-seq-tools
analisi di dati Drop-seq
Versions of package drop-seq-tools
ReleaseVersionArchitectures
bookworm2.5.2+dfsg-1all
trixie3.0.2+dfsg-1all
sid3.0.2+dfsg-1all
bullseye2.4.0+dfsg-6all
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Questo software fornisce l'analisi computazionale di base per dati Drop-seq, che mostra come trasformare dati di sequenze grezze in una misura di espressione per ciascun gene in ciascuna cellula individuale.

Registry entries: Bioconda 
dssp
assegnazione della struttura secondaria di una proteina in base alla struttura 3D
Versions of package dssp
ReleaseVersionArchitectures
jessie2.2.1-2amd64,armel,armhf,i386
trixie4.4.10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.2.1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid4.4.10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm4.2.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.0.0-3amd64,arm64,armhf,i386
bullseye4.0.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

DSSP è un'applicazione per assegnare la struttura secondaria di una proteina in base alla sua struttura tridimensionale (3D) definita.

Questa versione (4.2) di DSSP è una riscrittura che scrive in modo predefinito file mmCIF annotati, ma può ancora produrre il vecchio formato ddsp. È nuova anche la gestione delle eliche PP.

Registry entries: Bio.tools  SciCrunch 
dwgsim
simulatore di letture corte di sequenziamento
Versions of package dwgsim
ReleaseVersionArchitectures
bullseye0.1.12-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.14-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.1.12-2amd64,arm64,armhf
stretch0.1.11-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.1.14-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.1.14-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

DWGSIM simula letture corte di sequenziamento da piattaforme moderne di sequenziamento. DWGSIM genera tassi di errore di base usando un modello parametrico, permettendo un profilo di errore più realistico. È stato originariamente sviluppato per l'uso nella valutazione di allineatori di letture corte.

Registry entries: SciCrunch  Bioconda 
e-mem
calcolo efficiente di Maximal Exact Match per genomi molto grandi
Versions of package e-mem
ReleaseVersionArchitectures
bullseye1.0.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.1-2amd64,arm64,armhf,i386
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

E-MEM permette il calcolo efficiente di Maximal Exact Match (MEM) che non usa indici a tutto testo. L'algoritmo usa molto meno spazio ed è estremamente adatto alla parallelizzazione. Può calcolare tutti i MEM di lunghezza minima 100 tra i genomi completi dell'uomo e del topo su una macchina con 12 core in 10 minuti e 2 GB di memoria; la memoria richiesta può essere appena di 600 MB. Può funzionare in maniera efficiente su genomi di qualunque dimensione. Sono forniti ampi test e confronti con i migliori algoritmi di oggi.

Mummer ha molti script differenti nei quali uno dei programmi chiave è il calcolo dei MEM. In tutti gli script, il programma per il calcolo dei MEM può essere sostituito facilmente con e-mem per migliori prestazioni.

Please cite: Nilesh Khiste and Lucian Ilie: E-MEM: efficient computation of maximal exact matches for very large genomes. (PubMed,eprint) Bioinformatics 31(4):509-514 (2015)
ea-utils
strumenti a riga di comando per elaborare dati di sequenziamento biologici
Versions of package ea-utils
ReleaseVersionArchitectures
bookworm1.1.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.2+dfsg-6amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.1.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.1.2+dfsg-4amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.1.2+dfsg-5amd64,arm64,armhf,i386
trixie1.1.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 12 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Ea-utils fornisce un insieme di strumenti a riga di comando per l'elaborazione di dati di sequenziamento biologici, demultiplexing di codici a barre, trimming di adattatori, ecc.

Scritto principalmente per gestire una catena di elaborazione dati basata su Illumina, ma dovrebbe funzionare con qualsiasi FASTQ.

Gli strumenti principali sono:

  • fastq-mcf Cerca adattatori in un file di sequenza e, basandosi su una soglia a scala logaritmica, determina un insieme di parametri di ritaglio ed esegue il taglio. Esegue anche la rilevazione di sbilanciamenti e il filtraggio di qualità.

  • fastq-multx Demultiplexa un fastq. È capace di determinare automaticamente gli id dei codici a barre in base a un insieme di campi master. Mantiene sincronizzate le letture multiple durante il demultiplexing. Può verificare che anche le letture siano sincronizzate e fallisce se non lo sono.

  • fastq-join Simile al programma stitch di audy, ma in C, più efficiente e gestisce alcuni benchmark e tarature automatiche. Usa la stessa "distanza al quadrato per gli allineamenti ancorati" come altri strumenti.

  • varcall Prende un pileup e calcola le varianti in una maniera parametrizzata in modo più facile rispetto ad altri strumenti.

Please cite: Erik Aronesty: Comparison of Sequencing Utility Programs. (eprint) The Open Bioinformatics Journal 7:1-8 (2013)
Registry entries: Bio.tools  SciCrunch 
ecopcr
stima della qualità dei primer dei codici a barre PCR
Versions of package ecopcr
ReleaseVersionArchitectures
sid1.0.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.1+dfsg-1amd64,arm64,armhf,i386
stretch0.5.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Il DNA barcoding è uno strumento per caratterizzare l'origine delle specie usando una sequenza corta da una posizione standard e concordata del genoma. Per essere usato come codice a barre del DNA, un locus del genoma dovrebbe variare tra gli individui della stessa specie solo in modo contenuto e dovrebbe variare tra specie molto rapidamente. Da un punto di vista pratico, un locus per codice a barre dovrebbe essere affiancato da due regioni conservate per designare primer per PCR. Diversi loci di codici a barre scoperti manualmente come COI, rbcL, rRNA 23S, 18S e 16S, o trnH-ps oggi sono usati abitualmente, ma nessuna funzione obiettiva è stata descritta per misurare la loro qualità in termini di universalità (copertura del codice a barre, barcode coverage o Bc) o in termini di capacità di discriminazione tassonomica (specificità del codice a barre, barcode specificity o Bs).

ecoPCR è un software per PCR elettronico sviluppato da LECA e Helix-Project. Aiuta a stimare la qualità dei primer per barcoding. Insieme a OBITools si può post-elaborare l'output di ecoPCR per calcolare la copertura e la specificità del codice a barre. Nuovi primer per barcoding possono essere sviluppati usando il software ecoPrimers.

Registry entries: Bioconda 
edtsurf
mesh triangolari di superfici per strutture di proteine
Versions of package edtsurf
ReleaseVersionArchitectures
trixie0.2009-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.2009-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.2009-3amd64,armel,armhf,i386
buster0.2009-6amd64,arm64,armhf,i386
stretch0.2009-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.2009-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.2009-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

EDTSurf è un programma open source per costruire superfici a triangoli per macromolecole. Genera le tre principali superfici macromolecolari: superficie di van der Waals, superficie accessibile al solvente e superficie molecolare (superficie esclusa al solvente). EDTsurf identifica anche le cavità che si trovano dentro alle macromolecole.

Please cite: Dong Xu and Yang Zhang: Generating Triangulated Macromolecular Surfaces by Euclidean Distance Transform.. (PubMed,eprint) PLoS ONE 4(12):e8140 (2009)
eigensoft
riduzione del bias della popolazione per analisi genetiche
Versions of package eigensoft
ReleaseVersionArchitectures
buster7.2.1+dfsg-1amd64,arm64,armhf,i386
stretch6.1.4+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye7.2.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm8.0.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie8.0.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid8.0.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Il pacchetto EIGENSOFT combina funzionalità dai metodi della genetica di popolazione di gruppo (Patterson et al. 2006) e il loro metodo di stratificazione EIGENSTRAT (Price et al. 2006). Il metodo EIGENSTRAT usa l'analisi delle componenti principali per modellare esplicitamente le differenze nell'ascendenza tra casi e controlli lungo assi continui di variazione; la correzione risultante è specifica della variazione in frequenza di un marker candidato nelle popolazioni ancestrali, minimizzando associazioni spurie mentre massimizza il potere di rilevare vere associazioni. Il pacchetto EIGENSOFT incorpora uno script di disegno e gestisce formati multipli di file e fenotipi quantitativi.

Please cite: Alkes L. Price, Nick J. Patterson, Robert M. Plenge, Michael E. Weinblatt, Nancy A. Shadick and David Reich: Principal components analysis corrects for stratification in genome-wide association studies. Nature Genetics 38:904 - 909 (2006)
Registry entries: Bio.tools  SciCrunch  Bioconda 
elph
strumento per trovare motivi in sequenze di DNA/proteine
Versions of package elph
ReleaseVersionArchitectures
buster1.0.1-2amd64,arm64,armhf,i386
trixie1.0.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ELPH (Estimated Locations of Pattern Hits) è un campionatore Gibbs di uso generale per trovare motivi in un insieme di sequenze di DNA o proteine. Il programma prende come input un insieme che contiene da poche decine a migliaia di sequenze e cerca in esse il motivo più comune, presupponendo che ciascuna sequenza contenga una copia del motivo. ELPH è stato usato per trovare modelli come RBS (Ribosome Binding Site) e ESE (Exon Splicing Enhancers).

embassy-domainatrix
comandi EMBOSS extra per gestire file di classificazione di domini
Versions of package embassy-domainatrix
ReleaseVersionArchitectures
jessie0.1.650-1amd64,armel,armhf,i386
trixie0.1.660-5amd64,arm64,mips64el,ppc64el,riscv64
bookworm0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.660-3amd64,arm64,armhf,i386
stretch0.1.660-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.1.660-5amd64,arm64,mips64el,ppc64el,riscv64
Debtags of package embassy-domainatrix:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, converting, editing, searching
works-with-formatplaintext
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

I programmi DOMAINATRIX sono stati sviluppati da Jon Ison e dai suoi colleghi al MRC HGMP per la ricerca relativa ai domini delle proteine. Sono inclusi come pacchetto EMBASSY in qualità di lavoro in fase di sviluppo.

Le applicazioni nella distribuzione attuale di domainatrix sono cathparse (genera file DCF da file grezzi CATH), domainnr (rimuove domini ridondanti da un file DCF), domainreso (rimuove domini a bassa risoluzione da un file DCF), domainseqs (aggiunge voci di sequenza ad un file DCF), scopparse (genera un file DCF da file grezzi SCOP) e ssematch (cerca corrispondenze con strutture secondarie in un file DCF).

embassy-domalign
comandi EMBOSS extra per allineamento di domini di proteine
Versions of package embassy-domalign
ReleaseVersionArchitectures
bullseye0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.1.660-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.1.650-1amd64,armel,armhf,i386
buster0.1.660-3amd64,arm64,armhf,i386
stretch0.1.660-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.1.660-5amd64,arm64,mips64el,ppc64el,riscv64
trixie0.1.660-5amd64,arm64,mips64el,ppc64el,riscv64
Debtags of package embassy-domalign:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, editing
works-with-formatplaintext
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

I programmi DOMALIGN sono stati sviluppati da Jon Ison e colleghi al MRC HGMP per le loro ricerche nel campo dei domini proteici. Sono inclusi nel pacchetto EMBASSY come lavoro in corso.

Le applicazioni nell'attuale rilascio di domalign sono allversusall (dati sulla somiglianza di sequenza da una comparazione tutti verso tutti), domainalign (genera allineamenti (file DAF) per i nodi in un file DCF), domainrep (riordina i file DCF per identificare strutture rappresentative) e sequalign (allineamenti estesi (file DAF) con sequenze (file DHF)).

embassy-domsearch
comandi EMBOSS extra per cercare domini proteici
Versions of package embassy-domsearch
ReleaseVersionArchitectures
sid0.1.660-4amd64,arm64,mips64el,ppc64el,riscv64
trixie0.1.660-4amd64,arm64,mips64el,ppc64el,riscv64
bookworm0.1.660-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.1.660-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.660-3amd64,arm64,armhf,i386
stretch0.1.660-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.1.650-1amd64,armel,armhf,i386
Debtags of package embassy-domsearch:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

I programmi DOMSEARCH sono stati sviluppati da Jon Ison e i suoi colleghi del MRC HGMP per le loro ricerche su domini proteici. Sono inclusi nel pacchetto EMBASSY come lavoro in via di sviluppo.

Le applicazioni in questo rilascio di DOMSEARCH sono seqfraggle (rimuove sequenze di frammenti da file DHF), seqnr (rimuove ridondanze da file DHF), seqsearch (genera corrispondenze PSI-BLAST (file DHF) da un file DAF), seqsort (rimuove sequenze classificate ambigue da file DHF) e seqwords (genera file DHF per ricerche con parole chiave di UniProt).

emboss
suite software open source europea per la biologia molecolare
Versions of package emboss
ReleaseVersionArchitectures
jessie6.6.0+dfsg-1amd64,armel,armhf,i386
sid6.6.0+dfsg-15amd64,arm64,mips64el,ppc64el,riscv64
trixie6.6.0+dfsg-15amd64,arm64,mips64el,ppc64el,riscv64
bullseye6.6.0+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm6.6.0+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster6.6.0+dfsg-7amd64,arm64,armhf,i386
stretch6.6.0+dfsg-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package emboss:
fieldbiology, biology:bioinformatics, biology:molecular
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, editing, organizing, searching, text-formatting, typesetting, viewing
works-withdb
works-with-formatplaintext
Popcon: 20 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

EMBOSS (European Molecular Biology Open Software Suite) è una raccolta di software libero e open source di analisi sviluppato in base alle necessità della comunità di utenti di biologia molecolare (come EMBnet). È in grado di gestire dati in diversi formati e consente perfino di recuperare dati di sequenze dal web in modo trasparente. Inoltre, dato che il pacchetto fornisce librerie complete, è una piattaforma che consente ad altri scienziati di sviluppare e rilasciare software conforme alla vera filosofia open source. EMBOSS è dotata anche di strumenti e pacchetti integrati per l'analisi di sequenze. EMBOSS rappresenta un'inversione della tendenza storica a preferire prodotti commerciali.

The package is enhanced by the following packages: clustalw primer3
Please cite: Peter Rice, Ian Longden and Alan Bleasby: EMBOSS: The European Molecular Biology Open Software Suite. (PubMed) Trends in Genetics 16(6):276 - 277 (2000)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package emboss
emmax
genetic mapping considering population structure
Versions of package emmax
ReleaseVersionArchitectures
bookworm0~beta.20100307-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0~beta.20100307-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0~beta.20100307-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0~beta.20100307-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

EMMAX is a statistical test for large scale human or model organism association mapping accounting for the sample structure. In addition to the computational efficiency obtained by EMMA algorithm, EMMAX takes advantage of the fact that each locus explains only a small fraction of complex traits, which allows one to avoid repetitive variance component estimation procedure, resulting in a significant amount of increase in computational time of association mapping using mixed model.

Please cite: Hyun Min Kang, Jae Hoon Sul, Susan K Service, Noah A Zaitlen, Sit-yee Kong, Nelson B Freimer, Chiara Sabatti and Eleazar Eskin: Variance component model to account for sample structure in genome-wide association studies. (PubMed) Nature Genetics 42(4):348-54 (2010)
Registry entries: Bio.tools 
estscan
strumento per rilevare sequenze di DNA codificante indipendente da ORF
Versions of package estscan
ReleaseVersionArchitectures
buster3.0.3-3amd64,arm64,armhf,i386
bookworm3.0.3-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.0.3-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.0.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.0.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ESTScan è un programma che può identificare le regioni codificanti in sequenze di DNA, anche se sono di bassa qualità. ESTScan inoltre identifica e corregge errori di sequenziamento che non portano a scostamento di frame. ESTScan non è un programma per predizione di geni, né è un rilevatore di finestre di lettura. Di fatti la sua forza è nel fatto che non richiede una finestra di lettura per rilevare una regione codificante. Come risultato, il programma può mancare alcuni aminoacidi tradotti al terminale N o C, ma rileva le regioni codificanti con alta selettività e sensibilità.

ESTScan sfrutta l'uso non uniforme di esanucleotidi trovato nelle regioni codificanti rispetto alle non codificanti. Questa differenza è formalizzata in un modello di Markov nascosto (HMM) non omogeneo di quinto ordine e periodo 3. In aggiunta, l'HMM di ESTScan è stato esteso per permettere inserzioni e delezioni quando queste migliorano le statistiche della regione codificante.

Please cite: C. Lottaz, C. Iseli, CV. Jongeneel and Philipp Bucher: Modeling sequencing errors by combining Hidden Markov models Bioinformatics 19:103-112 (2003)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
examl
Exascale Maximum Likelihood (ExaML) code for phylogenetic inference
Versions of package examl
ReleaseVersionArchitectures
buster3.0.21-2amd64,i386
bookworm3.0.22-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.0.22-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid3.0.22-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.0.22-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Exascale Maximum Likelihood (ExaML) is a code for phylogenetic inference using MPI. This code implements the popular RAxML search algorithm for maximum likelihood based inference of phylogenetic trees.

ExaML is a strapped-down light-weight version of RAxML for phylogenetic inference on huge datasets. It can only execute some very basic functions and is intended for computer-savvy users that can write little perl-scripts and have experience using queue submission scripts for clusters. ExaML only implements the CAT and GAMMA models of rate heterogeneity for binary, DNA, and protein data.

ExaML uses a radically new MPI parallelization approach that yields improved parallel efficiency, in particular on partitioned multi-gene or whole-genome datasets. It also implements a new load balancing algorithm that yields better parallel efficiency.

It is up to 4 times faster than its predecessor RAxML-Light and scales to a larger number of processors.

Please cite: Alexey M. Kozlov, Andre J. Aberer and Alexandros Stamatakis: ExaML version 3: a tool for phylogenomic analyses on supercomputers. (PubMed,eprint) Bioinformatics 31(15):2577-2579 (2015)
exonerate
strumento generico per il confronto di sequenze di coppie
Versions of package exonerate
ReleaseVersionArchitectures
buster2.4.0-4amd64,arm64,armhf,i386
trixie2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.2.0-6amd64,armel,armhf,i386
bookworm2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.4.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.4.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package exonerate:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usesearching
works-with-formatplaintext
Popcon: 61 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Exonerate permette l'allineamento di sequenze tramite molti modelli di allineamento, usando una programmazione dinamica esaustiva o una varietà di euristiche. Molte delle funzionalità della suite di programmazione dinamica Wise sono state reimplementate in C per una migliore efficienza. Exonerate è un componente intrinseco della struttura dei database genomici Ensembl, che fornisce punteggi di somiglianza tra sequenze di RNA e di DNA e così determinando varianti di splicing e sequenze di codifica generali.

Un sistema di simulazione per esperimenti PCR In-silico (vedere la pagina man di ipcress) è fornito con exonerate.

Questo pacchetto contiene una selezione di utilità per effettuare velocemente semplici manipolazioni su file fasta oltre i 2 Gb.

Please cite: Guy C. Slater and Ewan Birney: Automated generation of heuristics for biological sequence comparison. (PubMed,eprint) BMC Bioinformatics 6(1):31 (2005)
Registry entries: Bio.tools  SciCrunch  Bioconda 
fasta3
tools for searching collections of biological sequences
Versions of package fasta3
ReleaseVersionArchitectures
buster36.3.8g-1 (non-free)amd64
bullseye36.3.8h.2020-02-11-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm36.3.8i.14-Nov-2020-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie36.3.8i.14-Nov-2020-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid36.3.8i.14-Nov-2020-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

The FASTA programs find regions of local or global similarity between Protein or DNA sequences, either by searching Protein or DNA databases, or by identifying local duplications within a sequence. Other programs provide information on the statistical significance of an alignment. Like BLAST, FASTA can be used to infer functional and evolutionary relationships between sequences as well as help identify members of gene families.

  • Protein
  • Protein-protein FASTA
  • Protein-protein Smith-Waterman (ssearch)
  • Global Protein-protein (Needleman-Wunsch) (ggsearch)
  • Global/Local protein-protein (glsearch)
  • Protein-protein with unordered peptides (fasts)
  • Protein-protein with mixed peptide sequences (fastf)

  • Nucleotide

  • Nucleotide-Nucleotide (DNA/RNA fasta)
  • Ordered Nucleotides vs Nucleotide (fastm)
  • Un-ordered Nucleotides vs Nucleotide (fasts)

  • Translated

  • Translated DNA (with frameshifts, e.g. ESTs) vs Proteins (fastx/fasty)
  • Protein vs Translated DNA (with frameshifts) (tfastx/tfasty)
  • Peptides vs Translated DNA (tfasts)

  • Statistical Significance

  • Protein vs Protein shuffle (prss)
  • DNA vs DNA shuffle (prss)
  • Translated DNA vs Protein shuffle (prfx)

  • Local Duplications

  • Local Protein alignments (lalign)
  • Plot Protein alignment "dot-plot" (plalign)
  • Local DNA alignments (lalign)
  • Plot DNA alignment "dot-plot" (plalign)

This software is often used via a web service at the EBI with readily indexed reference databases at http://www.ebi.ac.uk/Tools/fasta/.

Please cite: William R. Pearson and D. J. Lipman: Improved tools for biological sequence comparison. (PubMed,eprint) Proc Natl Acad Sci U S A 85(8):2444-8 (1988)
Registry entries: Bioconda 
fastahack
utilità per indicizzare ed estrarre sequenze da file FASTA
Versions of package fastahack
ReleaseVersionArchitectures
sid1.0.0+dfsg-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0.0+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.0+20160702-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el
trixie1.0.0+dfsg-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.0+git20160702.bbc645f+dfsg-6amd64,arm64,armhf,i386
bookworm1.0.0+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

fastahack è una piccola applicazione per indicizzare ed estrarre sequenze e sottosequenze da file FASTA. La libreria inclusa Fasta.cpp fornisce un lettore e indicizzatore FASTA che può essere incorporato in applicazioni che beneficerebbero dalla lettura diretta di sottosequenze da file FASTA. La libreria gestisce automaticamente la generazione e l'uso di file indice.

Funzionalità:

  • generazione di indici FASTA (.fai) per file FASTA;
  • estrazione di sequenze;
  • estrazione di sottosequenze;
  • statistiche sulle sequenze (attualmente viene fornita solo l'entropia).

L'estrazione di sequenze e sottosequenze usa fseek64 per fornire l'estrazione più veloce possibile senza operazioni di caricamento di file che fanno un uso intensivo della RAM. Ciò rende fastahack un utile strumento per bioinformatici che hanno bisogno di estrarre velocemente molte sottosequenze da una sequenza FASTA di riferimento.

Registry entries: Bioconda 
fastani
calcolo veloce senza allineamento dell'identità nucleotidica media di interi genomi
Versions of package fastani
ReleaseVersionArchitectures
bookworm1.33-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.33-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.33-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

La ANI (Average Nucleotide Identity) è definita come l'identità nucleotidica media di coppie di geni ortologhi condivisi tra due genomi microbici. FastANI gestisce il confronto a coppie di assemblati genomici completi oppure in bozza.

fastaq
strumenti per manipolare file FASTA e FASTQ
Versions of package fastaq
ReleaseVersionArchitectures
sid3.17.0-8all
jessie1.5.0-1all
trixie3.17.0-8all
stretch3.14.0-1all
bullseye3.17.0-3all
buster3.17.0-2all
bookworm3.17.0-5all
Popcon: 3 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Fastaq rappresenta una raccolta eterogenea di script che effettuano compiti di manipolazione FASTA/FASTQ utili e comuni, come filtraggio, unione, suddivisione, ordinamento, taglio, ricerca/sostituzione, ecc. I file di input e output possono essere compressi con gzip (il formato viene determinato automaticamente) e i singoli comandi Fastaq possono essere concatenati insieme in pipe.

Topics: Bioinformatics
fastdnaml
strumento di costruzione di alberi filogenetici di sequenze di DNA
Versions of package fastdnaml
ReleaseVersionArchitectures
bookworm1.2.2-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.2.2-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.2.2-10amd64,armel,armhf,i386
sid1.2.2-17amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.2-17amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.2.2-14amd64,arm64,armhf,i386
bullseye1.2.2-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package fastdnaml:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

fastDNAml è un programma derivato dalla versione 3.3 di DNAML di Joseph Felsenstein (parte del suo pacchetto PHYLIP). Sarebbe meglio leggere la documentazione di DNAML prima di usare questo programma.

fastDNAml è un tentativo di risolvere gli stessi problemi di DNAML, ma facendolo più in fretta e usando meno memoria, per rendere trattabili alberi più grandi e più ricampionamenti con reimmissione. Gran parte di fastDNAml è una mera riscrittura del programma DNAML di PHYLIP 3.3 dal PASCAL al C.

Si noti che la pagina web di questo programma non è più disponibile, quindi probabilmente questo programma non avrà ulteriori aggiornamenti.

Please cite: Gary J. Olsen, Hideo Matsuda, Ray Hagstrom and Ross Overbeek: fastDNAml: a tool for construction of phylogenetic trees of DNA sequences using maximum likelihood. (PubMed,eprint) Comput Appl Biosci 10(1):41-48 (1994)
fastlink
versione più veloce dei programmi di Linkage per pedigree
Versions of package fastlink
ReleaseVersionArchitectures
stretch4.1P-fix100+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye4.1P-fix100+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.1P-fix100+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster4.1P-fix100+dfsg-2amd64,arm64,armhf,i386
sid4.1P-fix100+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie4.1P-fix95-3amd64,armel,armhf,i386
bookworm4.1P-fix100+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package fastlink:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

L'analisi di linkage è una tecnica statistica usata per mappare geni e trovare la posizione approssimata di geni responsabili di malattie. Per le analisi di linkage esisteva un pacchetto software standard chiamato LINKAGE. FASTLINK è una versione fortemente modificata e migliorata del programma principale di LINKAGE che gira molto più velocemente in modo sequenziale, può essere eseguita in parallelo, permette all'utente di ripartire facilmente se il computer va in crash e fornisce abbondante documentazione nuova. FASTLINK è stato usato in più di 1000 studi genetici di linkage pubblicati.

Questo pacchetto contiene i seguenti programmi:

 ilink:    procedura di ottimizzazione GEMINI per trovare un valore locale
           ottimale per il vettore theta delle frazioni di ricombinazione;
 linkmap:  calcola i punteggi delle posizioni di un locus rispetto a una
           mappa fissata di altri loci;
 lodscore: compara la verosimiglianza corrispondente al theta locale
           ottimale;
 mlink:    calcola i punteggi LOD e il rischio con due o più loci;
 unknown:  identifica possibili genotipi per sconosciuti.
Please cite: R. W. Cottingham Jr., R. M. Idury and A. A. Schaffer: Faster Sequential Genetic Linkage Computations. (PubMed,eprint) American Journal of Human Genetics 53(1):252-263 (1993)
Registry entries: SciCrunch 
fastml
ricostruzione di sequenze di amminoacidi ancestrali con massima verosimiglianza
Versions of package fastml
ReleaseVersionArchitectures
bookworm3.11-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.11-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3.1-4amd64,arm64,armhf,i386
stretch3.1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.11-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.11-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

FastML è uno strumento bioinformatico per la ricostruzione di sequenze ancestrali sulla base delle relazioni filogenetiche tra sequenze omologhe. FastML esegue svariati algoritmi che ricostruiscono le sequenze ancestrali con enfasi sulla ricostruzione accurata sia degli indel, sia dei caratteri. Per la ricostruzione dei caratteri, gli algoritmi di FastML descritti precedentemente sono usati per dedurre in maniera efficiente le sequenze ancestrali più probabili per ciascun nodo interno dell'albero. Sono fornite sia le ricostruzioni congiunte, sia quelle marginali. Per la ricostruzione degli indel, le sequenze sono prima codificate secondo gli eventi degli indel rilevati all'interno del Multiple Sequence Alignment (MSA) e poi un modello di verosimiglianza all'avanguardia è usato per ricostruire gli stati degli indel ancestrali. I risultati sono le sequenze più probabili, insieme alle probabilità a posteriori per ciascun carattere e indel a ciascuna posizione della sequenza per ciascun nodo interno dell'albero. FastML è generico ed è applicabile a qualunque tipo di sequenza molecolare (sequenze di nucleotidi, proteine o codoni).

Please cite: Haim Ashkenazy, Osnat Penn, Adi Doron-Faigenboim, Ofir Cohen, Gina Cannarozzi, Oren Zomer and Tal Pupko: FastML: a web server for probabilistic reconstruction of ancestral sequences. (PubMed,eprint) Nucleic Acids Research 40(Web Server issue):W580-W584 (2012)
Registry entries: Bio.tools 
fastp
preprocessore di FASTQ ultraveloce tutto in uno
Versions of package fastp
ReleaseVersionArchitectures
buster0.19.6+dfsg-1amd64,arm64,armhf,i386
bookworm0.23.2+dfsg-2amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
bullseye0.20.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.23.4+dfsg-1amd64,arm64,armel,armhf,mips64el,ppc64el,riscv64,s390x
trixie0.23.4+dfsg-1amd64,arm64,armel,armhf,mips64el,ppc64el,riscv64,s390x
upstream0.24.0
Popcon: 2 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Preprocessore FASTQ tutto in uno, fastp fornisce funzioni che includono profilazione della qualità, taglio di adattatore, filtraggio delle letture e correzione delle basi. Gestisce letture brevi a estremità singole e accoppiate e fornisce anche il supporto di base per dati di letture lunghe.

The package is enhanced by the following packages: multiqc
Please cite: Shifu Chen, Yanqing Zhou, Yaru Chen and Jia Gu: fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics 34(17):i884-i890 (2018)
Registry entries: Bioconda 
fastq-pair
Rewrites paired end fastq so all reads have a mate to separate out singletons
Versions of package fastq-pair
ReleaseVersionArchitectures
bookworm1.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

This package rewrites the fastq files with the sequences in order, with matching files for the two files provided on the command line, and then any single reads that are not matched are place in two separate files, one for each original file.

This code is designed to be fast and memory efficient, and works with large fastq files. It does not store the whole file in memory, but rather just stores the locations of each of the indices in the first file provided in memory.

fastqc
controllo di qualità per elevati flussi di dati di sequenze
Versions of package fastqc
ReleaseVersionArchitectures
bullseye0.11.9+dfsg-4all
trixie0.12.1+dfsg-4all
sid0.12.1+dfsg-4all
jessie0.11.2+dfsg-3all
stretch0.11.5+dfsg-6all
buster0.11.8+dfsg-2all
bookworm0.11.9+dfsg-6all
Popcon: 13 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

FastQC mira a fornire un metodo rapido per effettuare alcuni controlli di qualità su elevati flussi attraverso pipe di dati di sequenze grezzi. Fornisce un insieme modulare di analisi che consentono di avere una veloce panoramica sui dati per individuare eventuali presenze di errori o problemi che bisogna tenere in considerazione prima di utilizzarli in analisi successive.

Le funzioni principali di FastQC sono:

  • importazione di dati da file BAM, SAM o FastQ (qualsiasi variante);
  • rapida panoramica per identificare in quali aree potrebbero esserci problemi;
  • grafici e tabelle riepilogative per una valutazione rapida dei dati;
  • esportazione dei risultati in un report permanente in formato HTML;
  • modalità offline che consente la generazione di report automatici senza eseguire l'applicazione interattiva.
The package is enhanced by the following packages: multiqc
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing
fastqtl
mappatore Quantitative Trait Loci (QTL) in cis per fenotipi molecolari
Versions of package fastqtl
ReleaseVersionArchitectures
stretch2.184+dfsg-5amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
buster2.184+dfsg-6amd64,arm64,armhf
trixie2.184+v7+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.184+v7+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.184+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.184+v7+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

L'obiettivo di FastQTL è di identificare polimorfismi a nucleotide singolo (SNP) che sono associati in maniera significativa a vari fenotipi molecolari (cioè espressioni di geni conosciuti, livelli di metilazione della citosina, ecc.). Esegue scansioni per tutte le possibili coppie fenotipo-variante in cis (cioè varianti localizzate all'interno di una finestra specifica intorno a un fenotipo). FastQTL implementa un nuovo schema di permutazione (approssimazione Beta) per correggere accuratamente e velocemente test multipli sia a livello di genotipo sia di fenotipo.

The package is enhanced by the following packages: fastqtl-doc
Please cite: Halit Ongen, Alfonso Buil, Andrew Anand Brown, Emmanouil T. Dermitzakis and and Olivier Delaneau: Fast and efficient QTL mapper for thousands of molecular phenotypes. (eprint) Bioinformatics (2015)
fasttree
phylogenetic trees from alignments of nucleotide or protein sequences
Versions of package fasttree
ReleaseVersionArchitectures
bookworm2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.1.7-2amd64,armel,armhf,i386
stretch2.1.9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1.10-2amd64,arm64,armhf,i386
sid2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.1.11-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 7 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

FastTree infers approximately-maximum-likelihood phylogenetic trees from alignments of nucleotide or protein sequences. It handles alignments with up to a million of sequences in a reasonable amount of time and memory. For large alignments, FastTree is 100-1,000 times faster than PhyML 3.0 or RAxML 7.

FastTree is more accurate than PhyML 3 with default settings, and much more accurate than the distance-matrix methods that are traditionally used for large alignments. FastTree uses the Jukes-Cantor or generalized time-reversible (GTR) models of nucleotide evolution and the JTT (Jones-Taylor-Thornton 1992) model of amino acid evolution. To account for the varying rates of evolution across sites, FastTree uses a single rate for each site (the "CAT" approximation). To quickly estimate the reliability of each split in the tree, FastTree computes local support values with the Shimodaira-Hasegawa test (these are the same as PhyML 3's "SH-like local supports").

This package contains a single threaded version (fasttree) and a parallel version which uses OpenMP (fasttreMP).

Please cite: Morgan N. Price, Paramvir S. Dehal and Adam P. Arkin: FastTree 2 -- Approximately Maximum-Likelihood Trees for Large Alignments.. (PubMed,eprint) PLoS ONE 5(3):e9490 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
ffindex
semplice indice/database per grandi quantità di piccoli file
Versions of package ffindex
ReleaseVersionArchitectures
buster0.9.9.9-2amd64,arm64,armhf,i386
jessie0.9.9.3-2amd64,armel,armhf,i386
stretch0.9.9.7-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.9.9.9-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.9.9.9-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.9.9.9-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.9.9.9-6.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

FFindex è un indice/database molto semplice per grandi quantità di piccoli file. I file vengono memorizzati concatenati in un grande file di dati, separati da "\0". Un secondo file contiene un indice in testo semplice che fornisce nome, scostamento e lunghezza dei piccoli file. La ricerca viene attualmente eseguita con una ricerca binaria su un vettore composto dal file indice.

Questo pacchetto fornisce gli eseguibili.

figtree
visualizzatore grafico di alberi filogenetici
Versions of package figtree
ReleaseVersionArchitectures
trixie1.4.4-6all
bookworm1.4.4-5all
buster1.4.4-3all
stretch1.4.2+dfsg-2all
jessie1.4-2all
bullseye1.4.4-5all
sid1.4.4-6all
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

FigTree è progettato come visualizzatore grafico di alberi filogenetici e come programma per produrre immagini pronte per la pubblicazione. In particolare, è pensato per visualizzare gli alberi riassuntivi e annotati prodotti da BEAST.

Registry entries: Bio.tools  SciCrunch  Bioconda 
filtlong
strumento per filtrare la qualità di letture lunghe di sequenze di genoma
Versions of package filtlong
ReleaseVersionArchitectures
sid0.2.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.2.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.2.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.2.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Filtlong è uno strumento per filtrare letture lunghe in base alla qualità. Può prendere un insieme di letture lunghe e produrre un sottoinsieme più piccolo e migliore. Usa la lunghezza della lettura (più lunga è migliore) e l'identità della lettura (più alta è migliore) quando sceglie quali letture passano il filtro.

Registry entries: Bio.tools  Bioconda 
fitgcp
fit di distribuzioni di copertura del genoma con modelli di mistura
Versions of package fitgcp
ReleaseVersionArchitectures
trixie0.0.20150429-5all
bookworm0.0.20150429-5all
buster0.0.20150429-2amd64,arm64
jessie0.0.20130418-2amd64,i386
bullseye0.0.20150429-4all
stretch0.0.20150429-1amd64,arm64,mips64el,ppc64el
sid0.0.20150429-5all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

La copertura del genoma, il numero di letture di sequenziamento mappate in una posizione del genoma, è un indicatore importante delle irregolarità in esperimenti di sequenziamento. Sebbene la copertura media del genoma sia spesso usata all'interno di algoritmi in genomica computazionale, le informazioni complete disponibili nei profili di copertura (cioè istogrammi per tutte le coperture) non sono attualmente sfruttate a pieno. Perciò errori come genomi frammentati o con riferimenti sbagliati spesso rimangono non considerati. Rendere queste informazioni accessibili può migliorare la qualità degli esperimenti di sequenziamento e le analisi quantitative.

fitGCP è un'infrastruttura per fare il fit di misture di distribuzioni di probabilità su profili di copertura del genoma. Oltre alle distribuzioni di uso comune, fitGCP usa distribuzioni fatte apposta per tener conto di artefatti comuni. Il fit dei modelli di mistura viene fatto in modo iterativo sulla base dell'algoritmo Expectation-Maximization.

Please cite: Martin S. Lindner, Maximilian Kollock, Franziska Zickmann and Bernhard Y. Renard: Analyzing genome coverage profiles with applications to quality control in metagenomics. (PubMed,eprint) Bioinformatics 29(10):1260-1267 (2013)
Registry entries: SciCrunch 
flash
Fast Length Adjustment of SHort reads
Versions of package flash
ReleaseVersionArchitectures
bookworm1.2.11-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.11-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.2.11-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.2.11-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

FLASH (Fast Length Adjustment of SHort reads) is a very fast and accurate software tool to merge paired-end reads from next-generation sequencing experiments. FLASH is designed to merge pairs of reads when the original DNA fragments are shorter than twice the length of reads. The resulting longer reads can significantly improve genome assemblies. They can also improve transcriptome assembly when FLASH is used to merge RNA-seq data.

The package is enhanced by the following packages: multiqc
Please cite: Tanja Magoč and Steven L Salzberg: FLASH: Fast Length Adjustment of Short Reads to Improve Genome Assemblies. (PubMed,eprint) Bioinformatics 27(21):2957-2963 (2011)
Registry entries: Bio.tools  Bioconda 
flexbar
rimozione flessibile di codice a barre e adattatore per piattaforme di sequenziamento
Versions of package flexbar
ReleaseVersionArchitectures
stretch2.50-2amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el
sid3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.5.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.5.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.4.0-2amd64,arm64,armhf,i386
jessie2.50-1amd64,armhf,i386
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Flexbar pre-elabora in modo efficiente grosse moli di dati di sequenziamento. Fa il demultiplexing di corse con codici a barre e rimuove sequenze adattatore. Inoltre sono fornite funzionalità di taglio e filtraggio. Flexbar aumenta i tassi di mappatura e migliora gli assemblati di genomi e trascrittomi. Gestisce dati di sequenziamento di nuova generazione in formato fasta/q e csfasta/q dalla piattaforma SOLiD, Illumina e Roche 454.

I nomi dei parametri in Flexbar sono cambiati. Rivedere i propri script. Negli ultimi mesi, le impostazioni predefinite sono state ottimizzate, sono stati risolti diversi bug e sono stati fatti vari miglioramenti, ad esempio un'interfaccia a riga di comando rimessa a nuovo, nuove modalità di taglio così come una quantità richiesta minore di tempo e memoria.

The package is enhanced by the following packages: multiqc
Please cite: Matthias Dodt, Johannes T. Roehr, Rina Ahmed and Christoph Dieterich: FLEXBAR — Flexible Barcode and Adapter Processing for Next-Generation Sequencing Platforms. (eprint) Biology 1(3):895-905 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
flye
de novo assembler for single molecule sequencing reads using repeat graphs
Versions of package flye
ReleaseVersionArchitectures
trixie2.9.5+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm2.9.1+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
sid2.9.5+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Flye is a de novo assembler for single molecule sequencing reads, such as those produced by PacBio and Oxford Nanopore Technologies. It is designed for a wide range of datasets, from small bacterial projects to large mammalian-scale assemblies. The package represents a complete pipeline: it takes raw PacBio / ONT reads as input and outputs polished contigs. Flye also has a special mode for metagenome assembly.

Please cite: Mikhail Kolmogorov, Jeffrey Yuan, Yu Lin and Pavel A. Pevzner: Assembly of long, error-prone reads using repeat graphs. (PubMed) Nature Biotechnology 37(5):540–546 (2019)
Registry entries: Bio.tools  Bioconda 
fml-asm
strumento per assemblare letture corte Illumina in piccole regioni
Versions of package fml-asm
ReleaseVersionArchitectures
sid0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.1-2amd64
stretch-backports0.1-4~bpo9+1amd64
bookworm0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1-5amd64
bullseye0.1+git20190320.b499514-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
experimental0.1+git20190320.b499514-2~0expamd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream0.1+git20221215.85f159e
Popcon: 1 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Fml-asm è uno strumento a riga di comando per assemblare letture corte Illumina in regioni con dimensioni da 100 pb a 10 milioni pb, sulla base della libreria fermi-lite. È in gran parte una versione leggera in memoria di fermikit senza la generazione di alcun file intermedio. Eredita le prestazioni, l'impronta di memoria relativamente piccola e le funzionalità di fermikit. In particolare, fermi-lite è capace di mantenere eventi di eterozigosi e perciò può essere usato per assemblare regioni diploidi con lo scopo dell'identificazione di varianti.

Registry entries: Bio.tools  SciCrunch  Bioconda 
freebayes
scoperta e genotipizzazione bayesiana di polimorfismo basati su aplotipi
Versions of package freebayes
ReleaseVersionArchitectures
sid1.3.7-1amd64,arm64,mips64el,ppc64el,riscv64
stretch-backports1.2.0-1~bpo9+1amd64
buster1.2.0-2amd64
bullseye1.3.5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.3.6-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
experimental1.3.7-1~expamd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
upstream1.3.8-pre3
Popcon: 1 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

FreeBayes è un rilevatore bayesiano di varianti genetiche progettato per trovare piccoli polimorfismi, specificamente SNP (single-nucleotide polymorphism), indel (inserzioni e delezioni), MNP (multi-nucleotide polymorphism) ed eventi complessi (eventi di sostituzione e inserzione compositi) più piccoli della lunghezza di un allineamento di sequenziamento di letture corte.

Please cite: Erik Garrison and Gabor Marth: Haplotype-based variant detection from short-read sequencing. (eprint) arXiv (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
freecontact
fast protein contact predictor
Versions of package freecontact
ReleaseVersionArchitectures
bullseye1.0.21-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.21-7amd64,arm64,armhf,i386
trixie1.0.21-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0.21-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0.21-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0.21-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.21-3amd64,armel,armhf,i386
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

FreeContact is a protein residue contact predictor optimized for speed. Its input is a multiple sequence alignment. FreeContact can function as an accelerated drop-in for the published contact predictors EVfold-mfDCA of DS. Marks (2011) and PSICOV of D. Jones (2011).

FreeContact is accelerated by a combination of vector instructions, multiple threads, and faster implementation of key parts. Depending on the alignment, 8-fold or higher speedups are possible.

A sufficiently large alignment is required for meaningful results. As a minimum, an alignment with an effective (after-weighting) sequence count bigger than the length of the query sequence should be used. Alignments with tens of thousands of (effective) sequences are considered good input.

jackhmmer(1) from the hmmer package, or hhblits(1) from hhsuite can be used to generate the alignments, for example.

This package contains the command line tool freecontact(1).

Please cite: László Kaján, Thomas A. Hopf, Matúš Kalaš, Debora S. Marks and Burkhard Rost: FreeContact: fast and free software for protein contact prediction from residue co-evolution. BMC Bioinformatics (2014)
Topics: Structure prediction; Sequence analysis
fsa
allineamento statistico veloce di proteine, sequenze di DNA e RNA
Versions of package fsa
ReleaseVersionArchitectures
stretch1.15.9+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.15.9+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.15.9+dfsg-4amd64,arm64,armhf,i386
sid1.15.9+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.15.9+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.15.9+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 58 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

FSA (Fast Statistical Alignment) è un algoritmo probabilistico per l'allineamento di sequenze multiple che usa un approccio "basato sulla distanza" per allineare sequenze di proteine, DNA o RNA omologhe. Come i metodi di ricostruzione filogenetica basati sulla distanza, come il Neighbor-Joining, costruiscono una filogenia usando solo stime di divergenza a coppie, FSA costruisce un allineamento multiplo usando solo stime di omologia a coppie. Ciò è reso possibile dalla tecnica di annealing delle sequenze per costruire un allineamento multiplo da confronti a coppie sviluppata da Ariel Schwartz.

FSA porta l'elevata accuratezza, precedentemente disponibile solo per l'analisi su piccola scala di proteine o RNA, a problemi ad ampia scala come l'allineamento di migliaia di sequenze o sequenze con milioni di basi. FSA introduce diversi metodi innovativi per costruire allineamenti migliori:

  • FSA usa tecniche di apprendimento automatico per stimare al volo parametri di sostituzione e gap per ciascun insieme di sequenze in input; questo metodo di allineamento con "apprendimento specifico per la richiesta" rende FSA molto robusto: può produrre allineamenti superiori di insiemi di sequenze omologhe che sono soggetti a vincoli evolutivi molto differenti;
  • FSA è in grado di allineare centinaia o anche migliaia di sequenze usando un algoritmo di inferenza randomizzata per ridurre il costo computazionale degli allineamenti multipli; questa inferenza randomizzata può essere fino a 10 volte più veloce di un approccio diretto con poca perdita di accuratezza;
  • FSA può allineare velocemente sequenze molto lunghe usando la tecnica "anchor annealing" per risolvere i punti di ancoraggio e proiettarli con l'ancoraggio transitivo, poi ricuce l'allineamento tra i punti di ancoraggio usando i metodi descritti sopra;
  • la GUI inclusa, MAD (Multiple Alignment Display), può visualizzare gli allineamenti intermedi prodotti da FSA, in cui ciascun carattere è colorato a seconda della probabilità che sia allineato correttamente.
Please cite: Robert K. Bradley, Adam Roberts, Michael Smoot, Sudeep Juvekar, Jaeyoung Do, Colin Dewey, Ian Holmes and Lior Pachter: Fast Statistical Alignment. (PubMed,eprint) PLoS Comput Biol. 5(5):e1000392 (2009)
Registry entries: Bioconda 
Remark of Debian Med team: Precondition for T-Coffee

see http://wiki.debian.org/DebianMed/TCoffee

Upstream address bounced when contacting about segfaults so it seems to be dead upstream and no good code quality.

fsm-lite
ricerca di stringhe basata sulla frequenza (lite)
Versions of package fsm-lite
ReleaseVersionArchitectures
buster1.0-3amd64,arm64
stretch1.0-2amd64,arm64,mips64el,ppc64el,s390x
bookworm1.0-8amd64,arm64,mips64el,ppc64el,s390x
trixie1.0-8amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid1.0-8amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye1.0-5amd64,arm64,mips64el,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Un'implementazione per core singolo della ricerca di sottostringhe basata sulla frequenza usata in bioinformatica per estrarre sottostringhe che discriminano due (o più) insiemi di dati all'interno di dati di sequenziamento ad alte prestazioni.

Registry entries: SciCrunch  Bioconda 
gamgi
GAMGI (General Atomistic Modelling Graphic Interface)
Versions of package gamgi
ReleaseVersionArchitectures
sid0.17.5-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.17.5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.17.3-2amd64,arm64,armhf,i386
bullseye0.17.3-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.17.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.17.1-1amd64,armel,armhf,i386
Debtags of package gamgi:
roleprogram
uitoolkitgtk
Popcon: 12 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

GAMGI (General Atomistic Modelling Graphic Interface) fornisce un'interfaccia grafica per costruire, visualizzare e analizzare strutture atomiche. Il programma è pensato per la comunità scientifica e fornisce un'interfaccia grafica per studiare le strutture atomiche, per preparare immagini per presentazioni e per insegnare le strutture atomiche della materia.

The package is enhanced by the following packages: gamgi-data gamgi-doc
Registry entries: SciCrunch 
Screenshots of package gamgi
garli
analisi filogenetica di dati di sequenze molecolari usando la massima verosimiglianza
Versions of package garli
ReleaseVersionArchitectures
buster2.1-3amd64,arm64,armhf,i386
stretch2.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.1-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

GARLI, Genetic Algorithm for Rapid Likelihood Inference, è un programma per inferire alberi filogenetici. Usando un approccio simile a un algoritmo genetico classico, cerca rapidamente nello spazio degli alberi evoluzionistici e dei parametri dei modelli per trovare la soluzione che massimizza il punteggio di verosimiglianza. Implementa modelli di evoluzione di sequenze basati su codoni, amminoacidi e nucleotidi e funziona su tutte le piattaforme. L'ultima versione aggiunge la gestione di modelli partizionati e tipi di dati tipo morfologia.

garlic
programma per visualizzazione di biomolecole
Versions of package garlic
ReleaseVersionArchitectures
bookworm1.6-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.6-1.1amd64,armel,armhf,i386
stretch1.6-1.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.6-3amd64,arm64,armhf,i386
bullseye1.6-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.6-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.6-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package garlic:
fieldbiology, chemistry
interfacex11
roleprogram
scopeutility
uitoolkitxlib
useviewing
x11application
Popcon: 13 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

Garlic è stato scritto per lo studio di proteine della membrana. Può essere usato per visualizzare altre proteine ed anche altri oggetti geometrici. Questa versione di garlic riconosce il formato PDB versione 2.1. Garlic può anche essere usato per analizzare sequenze proteiche.

Dipende solamente dalle librerie X, non sono necessarie altre librerie.

Le sue caratteristiche includono:

  • la posizione e lo spessore del piano di sezione sono visibili in una piccola finestra;
  • i legami atomici, così come gli atomi, sono trattati come oggetti disegnabili indipendentemente;
  • i colori degli atomi e dei legami dipendono dalla posizione: sono disponibili cinque modalità di mappatura (come per i piani);
  • possibilità di visualizzare immagini stereo;
  • possibilità di visualizzare altri oggetti geometrici, come la membrana;
  • le informazioni sugli atomi sono disponibili per l'atomo su cui è posizionato il puntatore del mouse: non è necessario fare clic, semplicemente muovere il mouse sopra la struttura!;
  • capacità di caricare più di una struttura;
  • capacità di disegnare grafici di Ramachandran, strutture delle alfa-eliche, diagrammi di Venn, grafici di idrofobicità media e di momento idrofobico;
  • il prompt dei comandi è disponibile alla base della finestra principale e può visualizzare un messaggio di errore e una stringa di comando.
Please cite: Damir Zucic and Davor Juretic: Precise Annotation of Transmembrane Segments with Garlic - a Free Molecular Visualization Program (eprint) Croatica Chemica Acta 77(1-2):397-401 (2004)
Registry entries: Bio.tools 
gasic
correzione della similarità dell'abbondanza del genoma
Versions of package gasic
ReleaseVersionArchitectures
jessie0.0.r18-2amd64
sid0.0.r19-8all
trixie0.0.r19-8all
bookworm0.0.r19-8all
stretch0.0.r19-1amd64
bullseye0.0.r19-7all
buster0.0.r19-4amd64
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Un obiettivo dell'analisi metagenomica basata sul sequenziamento è la valutazione tassonomica quantitativa delle composizioni delle comunità microbiche. Tuttavia, la maggioranza degli approcci o quantifica a bassa risoluzione (es. a livello di phylum) o ha gravi problemi nel distinguere specie estremamente simili. Ciononostante, un'accurata quantificazione a livello di specie è desiderabile in applicazioni come diagnostica metagenomica o confronto di comunità. GASiC è un metodo per correggere i risultati dell'allineamento delle letture per le ambiguità imposte dalle similarità dei genomi. Ha prestazioni superiori rispetto ai metodi esistenti.

The package is enhanced by the following packages: gasic-examples
Please cite: Martin S. Lindner and Bernhard Y. Renard: Metagenomic abundance estimation and diagnostic testing on species level. (PubMed,eprint) Nucleic Acids Research 41(1):e10 (2013)
Registry entries: SciCrunch 
gatb-core
toolbox di analisi genomica con grafi di de Bruijn
Versions of package gatb-core
ReleaseVersionArchitectures
bullseye1.4.2+dfsg-6amd64,arm64,i386,mips64el,ppc64el,s390x
bookworm1.4.2+dfsg-11amd64,arm64,mips64el,ppc64el
trixie1.4.2+dfsg-13amd64,arm64,mips64el,ppc64el,riscv64
sid1.4.2+dfsg-13amd64,arm64,mips64el,ppc64el,riscv64
buster1.4.1+git20181225.44d5a44+dfsg-3amd64,arm64,i386
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Il progetto GATB-CORE fornisce un insieme di algoritmi estremamente efficienti per l'analisi di insiemi di dati NGS. Questi metodi consentono l'analisi di insiemi di dati di qualunque dimensione su computer desktop multicore, inclusa un'enorme quantità di dati di letture che provengono da qualunque tipo di organismo come batteri, piante, animali e anche campioni complessi (ad esempio metagenomi). Maggiori dettagli su GATB possono essere letti all'indirizzo https://gatb.inria.fr/. GATB-CORE da solo non è uno strumento per l'analisi di dati NGS. Tuttavia può essere usato per creare tali strumenti. Esiste già un insieme di strumenti pronti da usare che si basano sulla libreria GATB-CORE, si veda https://gatb.inria.fr/software/

Please cite: Erwan Drezen, Guillaume Rizk, Rayan Chikhi, Charles Deltel, Claire Lemaitre, Pierre Peterlongo and Dominique Lavenier: GATB: Genome Assembly & Analysis Tool Box. Bioinformatics 30(20):2959-2961 (2014)
Registry entries: Bioconda 
gbrowse
browser generico per genoma di GMOD
Versions of package gbrowse
ReleaseVersionArchitectures
trixie2.56+dfsg-12all
bullseye2.56+dfsg-8all
buster2.56+dfsg-4all
stretch2.56+dfsg-2all
jessie2.54+dfsg-3all
sid2.56+dfsg-12all
bookworm2.56+dfsg-11all
Debtags of package gbrowse:
fieldbiology, biology:bioinformatics
interfaceweb
roleprogram
useanalysing, viewing
webapplication, cgi
Popcon: 33 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Generic Genome Browser è un browser per genoma, basato sul web, semplice ma altamente configurabile. È un componente del progetto GMOD (Generic Model Organism Systems Database). Alcune delle sue caratteristiche sono:

  • viste simultanee a volo d'uccello e dettagliata del genoma;
  • scorrimento, ingrandimento e centratura;
  • inclusione di URL arbitrari a qualsiasi annotazione;
  • l'ordine e l'aspetto delle tracce sono personalizzabili dall'amministratore e dall'utente finale;
  • ricerca in base a ID, nome o commenti;
  • gestione di annotazioni di terze parti usando i formati GFF;
  • impostazioni persistenti tra le sessioni;
  • dump di DNA e GFF;
  • connettività con database diversi, inclusi BioSQL e Chado;
  • supporto per più lingue;
  • caricamento di funzionalità di terze parti;
  • architettura a plugin personalizzabile (ad esempio, esecuzione di BLAST, dump & importazione di molti formati, ricerca di oligonucleotidi, progettazione di primer, creazione di mappe di restrizione, modifica delle caratteristiche).
The package is enhanced by the following packages: libbio-samtools-perl
Please cite: Maureen J. Donlin: Using the Generic Genome Browser (GBrowse). (eprint) Department of Biochemistry and Molecular Biology and Department of Molecular Microbiology and Immunology, Saint Louis University School of Medicine (2009)
Registry entries: Bio.tools  SciCrunch 
gdpc
visualizzatore di simulazioni di dinamiche molecolari
Versions of package gdpc
ReleaseVersionArchitectures
bookworm2.2.5-15amd64,arm64,mips64el,ppc64el
jessie2.2.5-3amd64,armel,armhf,i386
sid2.2.5-16amd64,arm64,mips64el,ppc64el,riscv64
trixie2.2.5-16amd64,arm64,mips64el,ppc64el,riscv64
stretch2.2.5-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.2.5-9amd64,arm64,armhf,i386
bullseye2.2.5-14amd64,arm64,mips64el,ppc64el
Debtags of package gdpc:
fieldbiology, biology:structural, chemistry, physics
interfacex11
roleprogram
scopeapplication
uitoolkitgtk
useviewing
works-with3dmodel, image, video
works-with-formatjpg, png
x11application
Popcon: 13 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

gdpc è un programma grafico per la visualizzazione dei dati risultanti da simulazioni di dinamiche molecolari. Legge i dati nel formato standard xyz, come anche in altri formati ad hoc, e può produrre immagini di ogni fotogramma nei formati JPG o PNG.

gemma
efficiente modello misto di associazione genome-wide
Versions of package gemma
ReleaseVersionArchitectures
trixie0.98.5+dfsg-2amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.98.5+dfsg-2amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.98.5+dfsg-2amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
bullseye0.98.4+dfsg-4amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
buster0.98.1+dfsg-1amd64,arm64,armhf,i386
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

GEMMA è un software che implementa l'algoritmo Genome-wide Efficient Mixed Model Association per un modello misto lineare standard e alcuni dei suoi parenti stretti per studi di associazione genome-wide (Genome-Wide Association Studies, GWAS):

  • fa il fit di un modello misto lineare univariato (Linear Mixed Model, LMM) per test di associazione di marker con un singolo fenotipo per tenere conto della stratificazione della popolazione e della struttura del campione, e per stimare la proporzione di varianza in fenotipi spiegata (PVE) da genotipi tipizzati (cioè "chip heritability");
  • fa il fit di un modello misto lineare multivariato (multivariate Linear Mixed Model, mvLMM) per testare associazioni di marker con fenotipi multipli simultaneamente mentre controlla la stratificazione della popolazione, e per stimare correlazioni genetiche tra fenotipi complessi;
  • fa il fit di un modello misto lineare sparso bayesiano (Bayesian Sparse Linear Mixed Model, BSLMM) usando Markov Chain Monte Carlo (MCMC) per stimare il PVE da genotipi tipizzati, predire fenotipi e identificare marker associati modellando congiuntamente tutti i marker mentre controlla la struttura della popolazione;
  • stima la componente varianza/chip heritability e la partiziona in base alle differenti categorie funzionali SNP; in particolare, usa la regressione HE o l'algoritmo REML AI per stimare i componenti della varianza quando sono disponibili dati a livello individuale; usa MOS per stimare i componenti della varianza quando sono disponibili solo statistiche di riepilogo.

GEMMA è computazionalmente efficiente per GWAS su larga scala e usa librerie numeriche open source liberamente disponibili.

Please cite: Xiang Zhou and Matthew Stephens: Genome-wide efficient mixed-model analysis for association studies Nature Genetics 44:821-824 (2012)
Registry entries: Bioconda 
genometester
toolkit per eseguire operazioni di insiemistica su liste di k-meri
Versions of package genometester
ReleaseVersionArchitectures
bullseye4.0+git20200511.91cecb5+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster4.0+git20180508.a9c14a6+dfsg-1amd64,arm64,armhf,i386
sid4.0+git20200511.91cecb5+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.0+git20200511.91cecb5+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm4.0+git20200511.91cecb5+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream4.0+git20221122.71e6625
Popcon: 1 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Toolkit per eseguire operazioni di insiemistica, unione, intersezione e complemento, su liste di k-meri.

Il toolkit GenomeTester4, che contiene un innovativo strumento GListCompare per eseguire operazioni di insiemistica, unione, intersezione e complemento (differenza), su liste di k-meri. Contiene esempi di come tali operazioni generiche possano essere combinate per risolvere varie attività di analisi biologiche.

Please cite: Lauris Kaplinski, Maarja Lepamets and Maido Remm: GenomeTester4: a toolkit for performing basic set operations - union, intersection and complement on k-mer lists. (PubMed,eprint) GigaScience 4(1):58 (2015)
Registry entries: Bio.tools  Bioconda 
genomethreader
software tool to compute gene structure predictions
Versions of package genomethreader
ReleaseVersionArchitectures
bookworm1.7.3+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.7.3+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.7.3+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.7.3+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

GenomeThreader is a software tool to compute gene structure predictions. The gene structure predictions are calculated using a similarity-based approach where additional cDNA/EST and/or protein sequences are used to predict gene structures via spliced alignments. GenomeThreader was motivated by disabling limitations in GeneSeqer, a popular gene prediction program which is widely used for plant genome annotation.

Please cite: G. Gremme, V. Brendel, M.E. Sparks and S. Kurtz: Engineering a software tool for gene structure prediction in higher organisms. Information and Software Technology 47(15):965-978 (2005)
Registry entries: Bio.tools  Bioconda 
genometools
toolkit versatile per analisi genomiche
Versions of package genometools
ReleaseVersionArchitectures
sid1.6.5+ds-2.2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.6.5+ds-2.2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye-backports-sloppy1.6.5+ds-2~bpo11+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm-backports1.6.5+ds-2~bpo12+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.6.1+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster-backports1.6.1+ds-3~bpo10+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.5.9+ds-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.5.3-2amd64,armel,armhf,i386
buster1.5.10+ds-3amd64,arm64,armhf,i386
bookworm1.6.2+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package genometools:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
uitoolkitncurses
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

GenomeTools contiene una raccolta di strumenti utili per analisi e presentazione di sequenze biologiche combinati in un unico binario.

Il toolkit contiene binari per gestione di sequenze e annotazioni, compressione di sequenze, generazione e accesso a strutture indice, visualizzazione di annotazioni e molto altro.

Please cite: Gordon Gremme, Sascha Steinbiss and Stefan Kurtz: GenomeTools: a comprehensive software library for efficient processing of structured genome annotations.. (PubMed) IEEE/ACM Transactions on Computational Biology and Bioinformatics 10(3):645-656 (2013)
Registry entries: Bio.tools 
genomicsdb-tools
sparse array storage library for genomics (tools)
Versions of package genomicsdb-tools
ReleaseVersionArchitectures
sid1.5.4-1amd64,mips64el
bookworm1.4.4-3amd64,mips64el
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

GenomicsDB is built on top of a htslib fork and an internal array storage system for importing, querying and transforming variant data. Variant data is sparse by nature (sparse relative to the whole genome) and using sparse array data stores is a perfect fit for storing such data.

The GenomicsDB stores variant data in a 2D array where:

  • Each column corresponds to a genomic position (chromosome + position);
  • Each row corresponds to a sample in a VCF (or CallSet in the GA4GH terminology);
  • Each cell contains data for a given sample/CallSet at a given position; data is stored in the form of cell attributes;
  • Cells are stored in column major order - this makes accessing cells with the same column index (i.e. data for a given genomic position over all samples) fast.
  • Variant interval/gVCF interval data is stored in a cell at the start of the interval. The END is stored as a cell attribute. For variant intervals (such as deletions and gVCF REF blocks), an additional cell is stored at the END value of the variant interval. When queried for a given genomic position, the query library performs an efficient sweep to determine all intervals that intersect with the queried position.

This package contains some tools to be run as executable files.

gentle
??? missing short description for package gentle :-(
Versions of package gentle
ReleaseVersionArchitectures
jessie1.9+cvs20100605+dfsg1-3amd64,armel,armhf,i386
bullseye1.9+cvs20100605+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.9.5~alpha2+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.9.5~alpha2+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.9+cvs20100605+dfsg1-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.9+cvs20100605+dfsg1-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.9+cvs20100605+dfsg1-7amd64,arm64,armhf,i386
Debtags of package gentle:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacex11
roleprogram
uitoolkitwxwidgets
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git
Please cite: Magnus Manske: GENtle, a free multi-purpose molecular biology tool. (eprint) (2006)
Registry entries: Bio.tools  SciCrunch 
gff2aplot
grafici di allineamento di coppie per sequenze genomiche in PostScript
Versions of package gff2aplot
ReleaseVersionArchitectures
stretch2.0-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.0-7amd64,armel,armhf,i386
buster2.0-11amd64,arm64,armhf,i386
bullseye2.0-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.0-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.0-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.0-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package gff2aplot:
fieldbiology, biology:bioinformatics
interfacecommandline, shell
roleprogram
scopeutility
useconverting, viewing
works-withimage:vector
works-with-formatplaintext, postscript
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Un programma per visualizzare l'allineamento di due sequenze genomiche insieme con le loro annotazioni. A partire da file di input in formato GFF produce immagini PostScript per tali allineamenti. La seguente lista elenca molte delle funzionalità di gff2aplot.

  • Grafici di allineamento esaurienti per qualsiasi funzionalità di GFF. Gli attributi sono definiti separatamente in modo da poter modificare qualsiasi attributo per un dato file o condividere la stessa configurazione tra diversi insiemi di dati.
  • Tutti i parametri sono impostati in modo predefinito all'interno del programma, ma può anche essere completamente configurato attraverso file di personalizzazione flessibili in stile gff2ps. Il programma può gestire diversi di questi file, riassumendo tutte le impostazioni prima di produrre l'immagine corrispondente. In più tutti i parametri di configurazione possono essere impostati attraverso opzioni da riga di comando; ciò permette agli utenti di provare i parametri prima di aggiungerli ad un file di personalizzazione.
  • L'ordine dei sorgenti è preso dai file in input; se si inverte l'ordine dei file si può visualizzare l'allineamento con le sue annotazioni per la nuova disposizione in input.
  • Tutti i punteggi di allineamento possono essere visualizzati in un riquadro PiP sotto all'area gff2aplot, in gradazione di grigi, in toni di un colore definito dall'utente o in gradienti dipendenti dal punteggio.
  • Può usare caratteri scalabili, che possono anche essere scelti tra i caratteri di base predefiniti di PostScript. Le etichette di elementi e gruppi possono essere ruotate per migliorare le leggibilità su entrambi gli assi.
  • Il programma è ancora definito come filtro Unix perciò può gestire dati da file, ridirezioni e pipe, può scrivere l'output sullo standard output e avvertimenti sullo standard error.
  • gff2aplot può gestire molti formati fisici di pagina (da A0 a A10 e altri ancora: vedere il manuale per le dimensioni di pagina disponibili), inclusi quelli definiti dall'utente. Ciò permette, ad esempio, la creazione di mappe genomiche su poster o l'uso di un dispositivo di disegno che supporta carta in modulo continuo, sia in formato orizzontale sia verticale.
  • Si possono tracciare allineamenti diversi sullo stesso grafico di allineamento e distinguerli usando un colore differente per ognuno.
  • Il dizionario delle forme è stato espanso perciò ulteriori forme degli elementi sono ora disponibili (vedere il manuale).
  • Le proiezioni delle annotazioni nei grafici di allineamento (i "nastri") emulano la trasparenza usando colori di riempimento complementari. Questa funzione permette di mostrare pseudo-sfumature dei colori quando nastri orizzontali e verticali si sovrappongono.
Please cite: J. F. Abril, R. Guigó and T. Wiehe: gff2aplot: Plotting sequence comparisons. (PubMed,eprint) Bioinformatics 19(18):2477-2479 (2003)
Registry entries: Bio.tools 
gff2ps
produce PostScript grafico da file GFF
Versions of package gff2ps
ReleaseVersionArchitectures
buster0.98l-2all
stretch0.98d-5all
jessie0.98d-4all
bullseye0.98l-4all
bookworm0.98l-6all
trixie0.98l-6all
sid0.98l-6all
Debtags of package gff2ps:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useconverting, viewing
works-withimage:vector
works-with-formatpostscript
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

gff2ps è un programma script sviluppato con l'obiettivo di convertire da record in formato gff a grafici mono-dimensionali in PostScript di alta qualità. Questi grafici possono essere utili per confrontare strutture genomiche e visualizzare il prodotto di programmi di annotazione genomica. Può essere usato in modo molto semplice, perché assume che il file GFF contenga esso stesso abbastanza informazioni di formato, ma permette anche, grazie a parecchie opzioni o al file di configurazione, un elevato grado di personalizzazione.

Please cite: J. F. Abril and R. Guigó: gff2ps: visualizing genomic annotations.. (PubMed,eprint) Bioinformatics 16(8):743-744 (2000)
Registry entries: Bio.tools  SciCrunch 
gffread
conversioni di formati GFF/GTF, filtraggio di regioni, estrazione di sequenze FASTA
Versions of package gffread
ReleaseVersionArchitectures
trixie0.12.7-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.12.7-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.12.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.12.7-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Gffread è una utilità per analizzare GFF/GTF che fornisce conversioni di formato, filtraggio di regioni, estrazione di sequenze FASTA e altro.

Registry entries: Bio.tools  Bioconda 
ggd-utils
programmi per l'uso in ggd
Versions of package ggd-utils
ReleaseVersionArchitectures
bullseye0.0.7+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Accetta un file di genoma e (attualmente) un .vcf.gz o un .bed.gz e verifica che:

* sia presente un .tbi;
* il VCF abbia ""##fileformat=VCF" come prima riga;
* il VCF abbia un'intestazione #CHROM;
* i cromosomi siano nell'ordine specificato dal file del genoma (e
  presenti);
* le posizioni siano ordinate;
* le posizioni siano <= delle lunghezze dei cromosomi definiti nel file
  del genoma.

Come risultato, ogni nuovo genoma passato a GGD ha un file .genome che detta l'ordine di ordinamento e la presenza o assenza del prefisso "chr" per i cromosomi.

ghemical
ambiente di modellazione molecolare per GNOME
Versions of package ghemical
ReleaseVersionArchitectures
buster3.0.0-4amd64,arm64,armhf,i386
sid3.0.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm3.0.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.0.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch3.0.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package ghemical:
fieldchemistry
interface3d, x11
roleprogram
suitegnome
uitoolkitgtk
useediting, learning, viewing
works-with3dmodel
x11application
Popcon: 13 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Ghemical è un pacchetto software per la chimica computazionale scritto in C++. Ha un'interfaccia utente grafica e supporta sia modelli di meccanica quantistica (semi-empirici), sia modelli di meccanica molecolare. Sono attualmente disponibili l'ottimizzazione geometrica, dinamiche molecolari e un vasto insieme di strumenti di visualizzazione che usano OpenGL.

Ghemical si basa su codice esterno per fornire i calcoli di meccanica quantistica. I metodi semi-empirici MNDO, MINDO/3, AM1 e PM3, che sono inclusi nel pacchetto, provengono dal pacchetto MOPAC7 (di pubblico dominio). Per i metodi ab initio è usato il pacchetto MPQC: i metodi basati sulla teoria Hartree-Fock sono attualmente supportati con i set di base da STO-3G a 6-31G**.

Registry entries: Bio.tools  SciCrunch 
Screenshots of package ghemical
ghmm
libreria generica per modelli di Markov nascosti - strumenti
Versions of package ghmm
ReleaseVersionArchitectures
buster0.9~rc3-2amd64,arm64,armhf,i386
bookworm0.9~rc3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.9~rc3-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.9~rc3-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.9~rc3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

GHMM (General Hidden Markov Model Library) è una libreria C con collegamenti Python 3 aggiuntivi che implementa un'ampia gamma di tipi di modelli di Markov nascosti ed algoritmi: discreti, emissioni continue, addestramento di base, clustering HMM, misture HMM.

Questo pacchetto contiene alcuni strumenti che usano la libreria.

Registry entries: Bioconda 
glam2
motivi proteici con interruzioni da sequenze non allineate
Versions of package glam2
ReleaseVersionArchitectures
sid1064-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1064-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1064-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1064-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1064-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1064-5amd64,arm64,armhf,i386
jessie1064-3amd64,armel,armhf,i386
Debtags of package glam2:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

GLAM2 è un pacchetto software per trovare motivi all'interno di sequenze, tipicamente sequenze amminoacidiche o nucleotidiche. Un motivo è un modello di sequenze che si ripete: esempi tipici sono i TATA box o il motivo di prenilazione CAAX. La maggiore innovazione portata da GLAM2 è che permette di avere inserzioni e delezioni all'interno dei motivi.

Questo pacchetto include programmi per scoprire motivi condivisi da un insieme di sequenze e trovare le corrispondenze a questi motivi in un database di sequenze, così come utilità per convertire motivi glam2 in formati standard per allineamenti, fare maschere di motivi glam2 in sequenze in modo da poter trovare motivi più deboli e rimuovere membri altamente simili da un insieme di sequenze.

Questo pacchetto include i seguenti programmi:

 glam2:       scopre motivi condivisi da un insieme di sequenze;
 glam2scan:   trova corrispondenze, all'interno di un database di
              sequenze, con un motivo scoperto da glam2;
 glam2format: converte motivi glam2 in formati di allineamento standard;
 glam2mask:   maschera motivi glam2 dalle sequenze, così che possano
              essere trovati motivi più deboli;
 glam2-purge: rimuove elementi altamente simili da un insieme di sequenze.

In questo pacchetto binario è stato abilitato l'algoritmo FFT (Fast Fourier Transform) per glam2.

Please cite: Martin C. Frith, Neil F. W. Saunders, Bostjan Kobe and Timothy L. Bailey: Discovering Sequence Motifs with Arbitrary Insertions and Deletions. (PubMed) PLoS Computational Biology 4(5):e1000071 (2008)
Screenshots of package glam2
gmap
allineamento tollerante agli SNP e con splicing per mRNA e letture corte
Versions of package gmap
ReleaseVersionArchitectures
bullseye2021-02-22+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
jessie2014-10-22-1 (non-free)amd64
bookworm2021-12-17+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie2024-10-20+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
stretch2017-01-14-1 (non-free)amd64
sid2024-10-20+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
buster2019-01-24-1 (non-free)amd64
Debtags of package gmap:
fieldbiology, biology:bioinformatics, biology:structural
roleprogram
useanalysing
Popcon: 2 users (19 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto contiene i programmi GMAP e GSNAP, oltre ad utilità per gestire database di genomi in formato GMAP/GSNAP. GMAP (Genomic Mapping and Alignment Program) è uno strumento per allineare sequenze di EST, mRNA e cDNA. GSNAP (Genomic Short-read Nucleotide Alignment Program) è uno strumento per allineare letture di trascrittoma a terminali singoli e appaiati. Entrambi gli strumenti possono usare un database di:

  • siti di splicing noti e identificare nuovi siti di splice;
  • polimorfismi a singolo nucleotide (SNP) noti. GSNAP può allineare DNA trattato con bisolfito.
Please cite: Thomas D. Wu and Serban Nacu: Fast and SNP-tolerant detection of complex variants and splicing in short reads. (PubMed,eprint) Bioinformatics 26(7):873-81 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
grabix
piccolo strumento per accesso casuale a file BGZF
Versions of package grabix
ReleaseVersionArchitectures
sid0.1.7-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.1.7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bookworm0.1.7-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.7-1amd64,arm64,armhf
trixie0.1.7-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Nella ricerca biomedica, è in aumento la pratica di studiare la base genetica della malattia. Ciò attualmente include di frequente il sequenziamento di sequenze umane. Tuttavia, l'output della macchina è ridondante e la vera sequenza è la migliore sequenza che spiega la ridondanza. Lo scambio di dati avviene solo con file compressi, troppo enormi e ridondanti per fare diversamente. Si dovrebbe evitare la decompressione quando possibile.

grabix sfrutta la fantastica libreria BGZF del pacchetto samtools per fornire accesso casuale ai file di testo che sono stati compressi con bgzip. grabix crea il proprio indice (.gbi) del file compresso con bgzip. Una volta indicizzato, si possono estrarre righe arbitrarie dal file con il comando grab. O scegliere righe casuali con il comando random.

Registry entries: Bioconda 
graphlan
rappresentazioni circolari di alberi tassonomici e filogenetici
Versions of package graphlan
ReleaseVersionArchitectures
buster1.1.3-1all
sid1.1.3-6all
trixie1.1.3-6all
bookworm1.1.3-4all
stretch1.1-2all
bullseye1.1.3-2all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

GraPhlAn è uno strumento software per produrre rappresentazioni circolari di alta qualità di alberi tassonomici e filogenetici. Si concentra su rappresentazioni concise, integrate, informative e pronte per la pubblicazione di ricerche indirizzate a studi filogenetici e tassonomici.

Registry entries: Bioconda 
grinder
versatile simulatore di letture di sequenziamento "omiche" shotgun e di ampliconi
Versions of package grinder
ReleaseVersionArchitectures
bookworm0.5.4-6all
trixie0.5.4-6all
sid0.5.4-6all
bullseye0.5.4-6all
buster0.5.4-5all
stretch0.5.4-1all
jessie0.5.3-3all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Grinder è un versatile programma per creare librerie di sequenze casuali shotgun e di ampliconi basate su sequenze di riferimento proteiche, di RNA * di DNA, fornite in un file FASTA.

Grinder può produrre insiemi di dati shotgun e di ampliconi genomici, metagenomici, trascrittomici, metatrascrittomici, proteomici, metaproteomici da tecnologie di sequenziamento attuali come Sanger, 454 e Illumina. Questi insiemi di dati simulati possono essere usati per testare l'accuratezza di strumenti bioinformatici sotto ipotesi specifiche, ad esempio con o senza errori di sequenziamento o con bassa o alta diversità della comunità. Grinder può anche essere usato per aiutare a decidere tra metodi alternativi di sequenziamento per un progetto basato su sequenze, ad esempio se la libreria debba essere o meno con terminali accoppiati, quante letture debbano essere sequenziate.

Please cite: Florent E. Angly, Dana Willner, Forest Rohwer, Philip Hugenholtz and Gene W. Tyson: Grinder: a versatile amplicon and shotgun sequence simulator. (PubMed,eprint) Nucleic Acids Research Epub ahead of print (2012)
Registry entries: SciCrunch 
gromacs
simulatore di dinamica molecolare, con strumenti di costruzione e di analisi
Versions of package gromacs
ReleaseVersionArchitectures
bullseye2020.6-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2019.1-1amd64,arm64,armhf,i386
trixie2024.3-2amd64,arm64,mips64el,ppc64el,riscv64,s390x
stretch2016.1-2amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie5.0.2-1amd64,armel,armhf,i386
bookworm2022.5-2amd64,arm64,mips64el,ppc64el,s390x
sid2024.4-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
Debtags of package gromacs:
fieldbiology, biology:structural, chemistry
interfacecommandline, x11
roleprogram
uitoolkitxlib
x11application
Popcon: 17 users (18 upd.)*
Versions and Archs
License: DFSG free
Git

GROMACS è un pacchetto versatile per l'esecuzione di dinamiche molecolari, ovvero simulazioni delle equazioni newtoniane del moto per sistemi con un numero di particelle tra le centinaia e i milioni.

Progettato principalmente per biomolecole come proteine e lipidi con molte complesse interazioni di legame, GROMACS, essendo estremamente veloce nei calcoli per le interazioni di non-legame (che solitamente dominano le simulazioni) è anche utilizzato da molti gruppi per ricerche su sistemi non biologici, come ad esempio polimeri.

Il pacchetto contiene varianti sia per l'esecuzione su una macchina singola sia per l'uso dell'interfaccia MPI su più macchine.

Please cite: Berk Hess, Carsten Kutzner, David van der Spoel and Erik Lindahl: GROMACS 4: Algorithms for Highly Efficient, Load-Balanced, and Scalable Molecular Simulation. (eprint) J. Chem. Theory Comput. 4(3):435-447 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
gsort
sort genomic data
Versions of package gsort
ReleaseVersionArchitectures
bookworm0.1.4-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.1.4-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.1.4-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.1.4-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

gsort is a tool to sort genomic files according to a genomefile. For example, to sort VCF to have order: X, Y, 2, 1, 3, ... and the header needs to be kept at the top.

As a more likely example, if a file nneds to be sorted to match GATK order (1 ... X, Y, MT) which is not possible with any other sorting tool. With gsort one can simply place MT as the last chrom in the ".genome" file.

It will also be useful for getting files ready for use in bedtools.

Registry entries: Bioconda 
gubbins
analisi filogenetica di sequenze di genoma
Versions of package gubbins
ReleaseVersionArchitectures
trixie3.3.5-1amd64,i386
stretch2.2.0-1amd64,i386
bookworm2.4.1-5amd64,i386
buster2.3.4-1amd64,i386
sid3.3.5-1amd64,i386
bullseye2.4.1-4amd64,i386
upstream3.4
Popcon: 3 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Gubbins gestisce l'analisi filogenetica rapida di grandi campioni di sequenze di genomi completi di batteri ricombinanti.

Gubbins (Genealogies Unbiased By recomBinations In Nucleotide Sequences) è un algoritmo che iterativamente identifica i loci contenenti elevate densità di sostituzioni di base mentre contemporaneamente costruisce una filogenia basata sulle presunte mutazioni puntuali al di fuori di tali regioni. Le simulazioni dimostrano che l'algoritmo genera ricostruzioni altamente accurate in modelli realistici di evoluzione batterica nel breve periodo e può essere eseguito in poche ore su allineamenti di centinaia di sequenze di genoma batterico.

Please cite: Nicholas J. Croucher, Andrew J. Page, Thomas R. Connor, Aidan J. Delaney, Jacqueline A. Keane, Stephen D. Bentley, Julian Parkhill and Simon R. Harris: Rapid phylogenetic analysis of large samples of recombinant bacterial whole genome sequences using Gubbins. (PubMed,eprint) Nucleic Acids Research 43(3):e15 (2014)
Registry entries: Bioconda 
gwama
meta-analisi di associazioni a livello di intero genoma
Versions of package gwama
ReleaseVersionArchitectures
sid2.2.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.2.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.2.2+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.2.2+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.2.2+dfsg-2amd64,arm64,armhf,i386
stretch2.2.2+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Il software GWAMA (Genome-Wide Association Meta Analysis) esegue meta-analisi dei risultati di studi GWA su fenotipi binari o quantitativi. Meta-analisi di effetti fissi e casuali sono effettuate per SNP, sia genotipizzati direttamente sia imputati, usando stime della probabilità allelica e un intervallo di confidenza del 95% per tratti binari, e stime della dimensione dell'effetto allelico ed errore standard per fenotipi quantitativi. GWAMA può essere usato per analizzare i risultati di tutti i differenti modelli genetici (moltiplicativo, additivo, dominante, recessivo). Il software incorpora funzionalità di intercettazione degli errori per identificare errori di allineamento dei filamenti e flipping degli alleli ed esegue test di eterogeneità degli effetti tra gli studi.

Please cite: Reedik Mägi and Andrew P. Morris: GWAMA: software for genome-wide association meta-analysis. (eprint) BMC Bioinformatics 11(May):288 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
harvest-tools
archiviazione e post-elaborazione per allineamenti multipli genomici con riferimenti compressi
Versions of package harvest-tools
ReleaseVersionArchitectures
buster1.3-4amd64,arm64,armhf,i386
trixie1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.3-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

HarvestTools è un'utilità per creare e interfacciarsi con file Gingr che sono archivi efficienti che la suite Harvest usa per memorizzare allineamenti multipli con riferimenti compressi, alberi filogenetici, annotazioni e varianti filtrate. Sebbene progettato per l'uso con Parsnp e Gingr, HarvestTools può anche essere usata per conversioni generiche tra formati di file bioinformatici standard.

Please cite: Todd J. Treangen, Brian D. Ondov, Sergey Koren and Adam M. Phillippy: Rapid Core-Genome Alignment and Visualization for Thousands of Intraspecific Microbial Genomes. (PubMed,eprint) bioRxiv 15(11):524 (2014)
Registry entries: Bioconda 
hhsuite
sensitive protein sequence searching based on HMM-HMM alignment
Versions of package hhsuite
ReleaseVersionArchitectures
trixie3.3.0+ds-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
sid3.3.0+ds-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm3.3.0+ds-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye3.3.0+ds-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
jessie2.0.16-5amd64
buster3.0~beta3+dfsg-3amd64
stretch3.0~beta2+dfsg-3amd64
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

HH-suite is an open-source software package for sensitive protein sequence searching based on the pairwise alignment of hidden Markov models (HMMs).

This package contains HHsearch and HHblits among other programs and utilities.

HHsearch takes as input a multiple sequence alignment (MSA) or profile HMM and searches a database of HMMs (e.g. PDB, Pfam, or InterPro) for homologous proteins. HHsearch is often used for protein structure prediction to detect homologous templates and to build highly accurate query-template pairwise alignments for homology modeling.

HHblits can build high-quality MSAs starting from single sequences or from MSAs. It transforms these into a query HMM and, using an iterative search strategy, adds significantly similar sequences from the previous search to the updated query HMM for the next search iteration. Compared to PSI-BLAST, HHblits is faster, up to twice as sensitive and produces more accurate alignments.

Please cite: Michael Remmert, Andreas Biegert, Andreas Hauser and Johannes Söding: HHblits: Lightning-fast iterative protein sequence searching by HMM-HMM alignment.. (PubMed) Nat. Methods 9(2):173-175 (2011)
Registry entries: SciCrunch  Bioconda 
hilive
allineamento in tempo reale di letture Illumina
Versions of package hilive
ReleaseVersionArchitectures
sid2.0a-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.0a-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.0a-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1-2amd64,arm64,armhf
stretch0.3-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

HiLive è uno strumento per mappare letture che mappa letture HiSeq Illumina (o simili) verso un genoma di riferimento esattamente nel momento in cui sono prodotte. Ciò significa che la mappatura delle letture è terminata non appena il sequenziatore ha terminato di generare i dati.

Please cite: Martin S. Lindner, Benjamin Strauch, Jakob M. Schulze, Simon H. Tausch, Piotr W. Dabrowski, Andreas Nitsche and Bernhard Y. Renard: HiLive: real-time mapping of illumina reads while sequencing. (PubMed) Bioinformatics 33(6):917-919 (2017)
hisat2
allineamento basato su grafi di letture corte di nucleotidi verso molti genomi
Versions of package hisat2
ReleaseVersionArchitectures
stretch2.0.5-1amd64
buster2.1.0-2amd64
bullseye2.2.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.2.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.2.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.2.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 7 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

HISAT2 è un programma di allineamento veloce e sensibile per mappare le letture di sequenziamento della prossima generazione (sia DNA che RNA) su una popolazione di genomi umani (e anche su un singolo genoma di riferimento). Sulla base di un'estensione di BWT per i grafi, è stato progettato e implementato un indice GFM (graph FM). Oltre a usare un indice GFM globale che rappresenta una popolazione di genomi umani, HISAT2 usa un grande insieme di piccoli indici GFM che collettivamente coprono l'intero genoma (ciascun indice rappresenta una regione genomica di 56 kbp, con 55000 indici necessari per coprire la popolazione umana). Questi piccoli indici (chiamati indici locali), combinati con diverse strategie di allineamento, permettono un allineamento rapido e accurato delle letture di sequenziamento. Questo nuovo schema di indicizzazione è chiamato indice HGFM (Hierarchical Graph FM).

The package is enhanced by the following packages: multiqc
Please cite: Daehwan Kim, Joseph M. Paggi, Chanhee Park, Christopher Bennett and Steven L. Salzberg: Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology 37(8):907-915 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
hmmer
profilamento di modelli di Markov nascosti per analisi di sequenze proteiche
Versions of package hmmer
ReleaseVersionArchitectures
buster3.2.1+dfsg-1amd64,i386
jessie3.1b1-3amd64,armel,armhf,i386
stretch3.1b2+dfsg-5amd64,i386
bullseye3.3.2+dfsg-1amd64,i386
bookworm3.3.2+dfsg-1amd64,i386
sid3.4+dfsg-2amd64,arm64,i386
trixie3.4+dfsg-2amd64,arm64,i386
Debtags of package hmmer:
biologyformat:aln, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usesearching
works-withdb
works-with-formatplaintext
Popcon: 19 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

HMMER è un'implementazione di metodi per creazione di profili di modelli di Markov nascosti per effettuare ricerche accurate in database di sequenze biologiche, usando allineamenti multipli di sequenza come base per le interrogazioni.

Dato in input un allineamento multiplo di sequenza, HMMER crea un modello statistico chiamato "modello di Markov nascosto" che può essere usato come criterio per l'interrogazione di un database di sequenze allo scopo di trovare (o allineare) omologhi addizionali della famiglia di sequenze.

Please cite: S. R. Eddy: Profile hidden Markov models. (PubMed,eprint) Bioinformatics 14(9):755-763 (1998)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package hmmer
hmmer2
profilamento di modelli di Markov nascosti per analisi di sequenze proteiche
Versions of package hmmer2
ReleaseVersionArchitectures
sid2.3.2+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.3.2+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.3.2+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.3.2+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.3.2+dfsg-6amd64,arm64,armhf,i386
stretch-backports2.3.2+dfsg-6~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.3.2-8amd64,armel,armhf,i386
stretch2.3.2-13amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

HMMER è un'implementazione di metodi per creazione di profili di modelli di Markov nascosti per effettuare ricerche accurate in database di sequenze biologiche, usando allineamenti multipli di sequenza come base per le interrogazioni.

Dato in input un allineamento multiplo di sequenza, HMMER crea un modello statistico chiamato "modello di Markov nascosto" che può essere usato come criterio per l'interrogazione di un database di sequenze allo scopo di trovare (o allineare) omologhi addizionali della famiglia di sequenze.

Please cite: Eddy, Sean R.: Profile hidden Markov models. (PubMed) Bioinformatics 14(9):755-763 (1998)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Remark of Debian Med team: This older version of HMMER is used in some applications

While Debian has HMMER 3 since some time there are users of HMMER 2 interested in having this old version available and thus the package is reintroduced.

hyphy-mpi
test di ipotesi usando filogenesi (versione MPI)
Versions of package hyphy-mpi
ReleaseVersionArchitectures
buster2.3.14+dfsg-1amd64,arm64,armhf,i386
bookworm2.5.47+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.5.62+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.2.7+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.5.28+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.5.63+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

HyPhy è un pacchetto software open source per l'analisi di sequenze genetiche usando tecniche di filogenetica, evoluzione molecolare e apprendimento macchina. Ha un'interfaccia utente grafica (GUI) completa e un ricco linguaggio per script per una illimitata personalizzazione delle analisi. In aggiunta HyPhy gestisce ambienti di calcolo parallelo (attraverso interfaccia di passaggio di messaggi) e può essere compilato come libreria condivisa e richiamato da altri ambienti di programmazione, come Python o R. Il proseguimento dello sviluppo di HyPhy è attualmente supportato in parte da un premio NIGMS R01 1R01GM093939.

Questo pacchetto fornisce un eseguibile che utilizza MPI per fare la multielaborazione.

Please cite: Sergei L. Kosakovsky Pond, Simon D. W. Frost and Spencer V. Muse: HyPhy: hypothesis testing using phylogenies. (PubMed,eprint) Bioinformatics 21(5):676-679 (2005)
Registry entries: Bioconda 
hyphy-pt
test di ipotesi usando filogenesi (versione Pthreads)
Versions of package hyphy-pt
ReleaseVersionArchitectures
bullseye2.5.28+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.3.14+dfsg-1amd64,arm64,armhf,i386
trixie2.5.62+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.2.7+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.5.63+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.5.47+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 8 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

HyPhy è un pacchetto software open source per l'analisi di sequenze genetiche usando tecniche di filogenetica, evoluzione molecolare e apprendimento macchina. Ha un'interfaccia utente grafica (GUI) completa e un ricco linguaggio per script per una illimitata personalizzazione delle analisi. In aggiunta HyPhy gestisce ambienti di calcolo parallelo (attraverso interfaccia di passaggio di messaggi) e può essere compilato come libreria condivisa e richiamato da altri ambienti di programmazione, come Python o R. Il proseguimento dello sviluppo di HyPhy è attualmente supportato in parte da un premio NIGMS R01 1R01GM093939.

Questo pacchetto fornisce un eseguibile che utilizza Pthreads per fare la multielaborazione.

Please cite: Sergei L. Kosakovsky Pond, Simon D. W. Frost and Spencer V. Muse: HyPhy: hypothesis testing using phylogenies. (PubMed,eprint) Bioinformatics 21(5):676-679 (2005)
Registry entries: Bioconda 
idba
assemblatore iterativo con grafo di de Bruijn di letture corte
Versions of package idba
ReleaseVersionArchitectures
bullseye1.1.3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.1.2-1amd64,armel,armhf,i386
buster1.1.3-3amd64,arm64,armhf,i386
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

IDBA sta per "Iterative De Bruijn graph Assembler" (assemblatore iterativo con grafo di de Bruijn). Nella biologia computazionale di sequenze, un assemblatore risolve il puzzle proveniente da macchine per grandi sequenziamenti che hanno molti gigabyte di letture corte da un grande genoma.

Questo pacchetto fornisce diverse versioni dell'assemblatore IDBA, dato che tutte condividono lo stesso albero sorgente ma assolvono scopi diversi e si sono evolute nel tempo.

IDBA è l'assemblatore iterativo con grafo di de Bruijn di base per letture di sequenze di seconda generazione. IDBA-UD, un'estensione di IDBA, è progettato per utilizzare letture ad estremità accoppiate per assemblare regioni a bassa profondità e usare profondità progressiva nei contig per ridurre gli errori nelle regioni ad alta profondità. È un assemblatore di uso generico ed è specialmente adatto per dati di sequenziamento di cellule singole e di metagenomica. IDBA-Hybrid è un'altra versione aggiornata di IDBA-UD che può utilizzare un genoma simile di riferimento per migliorare i risultati dell'assemblaggio. IDBA-Tran è un assemblatore iterativo con grafo di de Bruijn per dati RNA-Seq.

Please cite: Yu Peng, Henry C. M. Leung, S. M. Yiu and Francis Y. L. Chin: IDBA-UD: a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth. (PubMed,eprint) Bioinformatics 28(11):1420-1428 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
igblast
Immunoglobulin and T cell receptor variable domain sequence analysis
Versions of package igblast
ReleaseVersionArchitectures
bookworm1.19.0-1amd64,arm64,mips64el,ppc64el,s390x
sid1.19.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.19.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
upstream1.22.0
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

IgBLAST allows users to view the matches to the germline V, D, and J genes, details at rearrangement junctions, the delineation of IG V domain framework regions, and complementarity determining regions. IgBLAST has the capability to analyse nucleotide and protein sequences, and can process sequences in batches. Furthermore, IgBLAST allows searches against the germline gene databases and other sequence databases simultaneously to minimize the chance of missing possibly the best matching germline V gene.

Please cite: Jian Ye, Ning Ma, Thomas L Madden and James M Ostell: IgBLAST: an immunoglobulin variable domain sequence analysis tool. (PubMed,eprint) Nucleic Acids Res. 41:W34-W40 (2013)
Registry entries: Bio.tools  SciCrunch 
igdiscover
analizza repertori di anticorpi per trovare nuovi geni V
Versions of package igdiscover
ReleaseVersionArchitectures
sid0.11-4all
bullseye0.11-3all
upstream0.15.1
Popcon: 1 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

IgDiscover analizza repertori di anticorpi e scopre nuovi geni V da letture di sequenziamento ad alte prestazioni. Sono gestite catene pesanti e catene leggere kappa e lambda (per scoprire geni VH, VK e VL).

Please cite: Martin M. Corcoran, Ganesh E. Phad, Néstor Vázquez Bernat, Christiane Stahl-Hennig, Noriyuki Sumida, Mats A.A. Persson, Marcel Martin and Gunilla B. Karlsson Hedestam: Production of individualized V gene databases reveals high levels of immunoglobulin genetic diversity.. (eprint) Nature Communications 7:13642 (2016)
Registry entries: Bio.tools  Bioconda 
igor
inferisce processi di ricombinazione V(D)J da dati di sequenziamento
Versions of package igor
ReleaseVersionArchitectures
bullseye1.4.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.3.0+dfsg-1amd64,arm64,armhf,i386
bookworm1.4.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.4.0+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.4.0+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

IGoR (Inference and Generation of Repertoires) è un versatile software per analizzare e modellare generazione, selezione, mutazione e tutti gli altri processi relativi agli immunorecettori.

Please cite: Quentin Marcou, Thierry Mora and Aleksandra M. Walczak: High-throughput immune repertoire analysis with IGoR. (PubMed,eprint) Nature Communications 9(1):561 (2018)
Registry entries: Bioconda 
igv
Integrative Genomics Viewer
Versions of package igv
ReleaseVersionArchitectures
trixie2.18.5+dfsg-1all
bookworm2.16.0+dfsg-1all
bullseye2.6.3+dfsg-3 (non-free)all
jessie2.3.38+dfsg-1 (non-free)all
stretch2.3.90+dfsg-1 (non-free)all
sid2.18.5+dfsg-1all
Debtags of package igv:
fieldbiology
interfacex11
networkclient
roleprogram
scopeutility
useviewing
works-withbiological-sequence
Popcon: 8 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Integrative Genomics Viewer (IGV) è un visualizzatore ad alte prestazioni che gestisce in modo efficiente vasti insiemi di dati eterogenei, fornendo al contempo un'esperienza utente lineare e intuitiva a tutti i livelli di risoluzione del genoma. Una caratteristica chiave di IGV è la sua attenzione alla natura integrata degli studi genomici, con gestione dei dati sia basati su array sia su sequenziamento di prossima generazione, e l'integrazione di dati clinici e fenotipici. Sebbene IGV sia spesso utilizzato per visualizzare dati genomici da fonti pubbliche, è principalmente focalizzato a supportare i ricercatori che desiderano visualizzare i propri insiemi di dati o quelli di colleghi. A tale scopo IGV supporta il caricamento flessibile di insiemi di dati locali e remoti ed è ottimizzato per fornire visualizzazione ed esplorazione ad alte prestazioni su sistemi desktop standard.

Please cite: James T Robinson, Helga Thorvaldsdóttir, Wendy Winckler, Mitchell Guttman, Eric S Lander, Gad Getz and Jill P Mesirov: Integrative genomics viewer. (PubMed,eprint) Nature Biotechnology 29(1):24–26 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
indelible
powerful and flexible simulator of biological evolution
Versions of package indelible
ReleaseVersionArchitectures
buster1.03-4amd64,arm64,armhf,i386
stretch1.03-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.03-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.03-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.03-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.03-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

INDELible is a new, portable, and flexible application for biological sequence simulation that combines many features in the same place for the first time. Using a length-dependent model of indel formation it can simulate evolution of multi-partitioned nucleotide, amino-acid, or codon data sets through the processes of insertion, deletion, and substitution in continuous time.

Nucleotide simulations may use the general unrestricted model or the general time reversible model and its derivatives, and amino-acid simulations can be conducted using fifteen different empirical rate matrices. Substitution rate heterogeneity can be modeled via the continuous and discrete gamma distributions, with or without a proportion of invariant sites. INDELible can also simulate under non-homogeneous and non-stationary conditions where evolutionary models are permitted to change across a phylogeny.

Unique among indel simulation programs, INDELible offers the ability to simulate using codon models that exhibit nonsynonymous/synonymous rate ratio heterogeneity among sites and/or lineages.

Please cite: William Fletcher and Ziheng Yang: INDELible: A Flexible Simulator of Biological Sequence Evolution. (eprint) Molecular Biology and Evolution 26(8):1879-1888 (2009)
Topics: Sequencing
infernal
inferenza degli allineamenti strutturali secondari dell'RNA
Versions of package infernal
ReleaseVersionArchitectures
sid1.1.5-2amd64,arm64,i386
trixie1.1.5-2amd64,arm64,i386
buster1.1.2-2amd64,i386
jessie1.1.1-2amd64,i386
stretch1.1.2-1amd64,i386
bullseye1.1.4-1amd64,i386
bookworm1.1.4-1amd64,i386
Debtags of package infernal:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 12 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Infernal ("INFERence of RNA ALignment", "inferenza per l'allineamento dell'RNA") cerca in un database di sequenze DNA somiglianze tra strutture e sequenze di RNA. Fornisce un'implementazione di un caso speciale delle grammatiche senza contesto con profilo stocastico chiamate modelli covarianti (CM). Un CM è come un profilo di sequenza, ma dà una valutazione combinando il consenso della sequenza e il consenso sulla struttura secondaria dell'RNA, così in molti casi è più efficace nell'identificare omologhi RNA che conservano la loro struttura secondaria più che la loro sequenza primaria.

Questo strumento è una parte integrante del database Rfam.

Please cite: Eric P. Nawrocki, Diana L. Kolbe and Sean R. Eddy: Infernal 1.0: inference of RNA alignments. (PubMed,eprint) Bioinformatics 25(10):1335-1337 (2009)
Registry entries: SciCrunch  Bioconda 
insilicoseq
sequencing simulator producing realistic Illumina reads
Versions of package insilicoseq
ReleaseVersionArchitectures
bookworm1.5.4-6all
sid2.0.1-1all
bullseye1.5.2-1all
trixie2.0.1-1all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Primarily intended for simulating metagenomic samples, it can also be used to produce sequencing data from a single genome.

InSilicoSeq is written in Python, and use kernel density estimators to model the read quality of real sequencing data.

InSilicoSeq support substitution, insertion and deletion errors. If you don't have the use for insertion and deletion error a basic error model is provided.

Please cite: Hadrien Gourlé, Oskar Karlsson-Lindsjö, Juliette Hayer and Erik Bongcam-Rudloff: Simulating Illumina data with InSilicoSeq. Bioinformatics 35(3):521–522 (2019)
Registry entries: Bioconda 
ipig
integrazione di PSM con la visualizzazione con browser genomici
Versions of package ipig
ReleaseVersionArchitectures
sid0.0.r5-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.0.r5-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.0.r5-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.0.r5-1amd64,armel,armhf,i386
stretch0.0.r5-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.0.r5-3amd64,arm64,armhf,i386
bullseye0.0.r5-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

iPiG ha come obiettivo l'integrazione di PSM (Peptide Spectrum Match, corrispondenza di spettro di peptide) da identificazione di peptidi con spettrometria di massa (MS) in visualizzazioni genomiche fornite da navigatori di genomi come il navigatore di genomi UCSC (http://genome.ucsc.edu/).

iPiG prende PSM nel formato standard per MS mzIdentML (*.mzid) o in formato testuale e fornisce i risultati nei formati per tracce genomici (file BED e GFF3) che possono essere facilmente importati in navigatori di genomi.

Please cite: Mathias Kuhring and Bernhard Y. Renard: iPiG: Integrating Peptide Spectrum Matches into Genome Browser Visualizations. (PubMed,eprint) PLoS ONE 7(12):e50246 (2012)
Registry entries: Bio.tools  SciCrunch 
iqtree
efficiente software filogenetico per massima verosimiglianza
Versions of package iqtree
ReleaseVersionArchitectures
stretch1.5.3+dfsg-2amd64,i386
sid2.0.7+dfsg-1amd64,i386
trixie2.0.7+dfsg-1amd64,i386
bookworm2.0.7+dfsg-1amd64,i386
buster1.6.9+dfsg-1amd64,i386
bullseye1.6.12+dfsg-1amd64,i386
Popcon: 6 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

IQ-TREE è un software filogenetico molto efficiente per massima verosimiglianza con le seguenti funzionalità chiave, tra le altre:

  • un innovativo algoritmo stocastico veloce ed efficace per stimare alberi di massima verosimiglianza; IQ-TREE supera in prestazioni sia RAxML sia PhyML in termini di verosimiglianza richiedendo al contempo una simile quantità di tempo di calcolo (vedere Nguyen et al., 2015);
  • un'approssimazione bootstrap ultraveloce per determinare i supporti dei rami (vedere Minh et al., 2013).
  • un'ampia gamma di modelli di sostituzione per allineamenti per binari, DNA, proteine, codoni e morfologici;
  • selezione ultraveloce del modello per tutti i tipi di dati, da 10 a 100 volte più veloce di jModelTest e ProtTest;
  • ricerca del miglior schema di partizione come PartitionFinder;
  • modelli partizionati con tipi misti di dati per allineamenti filogenomici (multi-gene), permettendo lunghezze dei rami tra i geni separate, proporzionali o unite;
  • compatibile con PLL (Phylogenetic Likelihod Library) (vedere Flouri et al., 2014).
Please cite: Lam Tung Nguyen, Heiko A. Schmidt, Arndt von Haeseler and Bui Quang Minh: IQ-TREE: A fast and effective stochastic algorithm for estimating maximum likelihood phylogenies. (PubMed,eprint) Mol. Biol. Evol. 32(1):268-274 (2015)
Registry entries: Bio.tools  Bioconda 
iva
assemblatore iterativo di sequenze di virus
Versions of package iva
ReleaseVersionArchitectures
trixie1.0.11+ds-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
sid1.0.11+ds-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm1.0.11+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster1.0.9+ds-6amd64,arm64
bullseye1.0.9+ds-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
stretch1.0.8+ds-1amd64,arm64,mips64el,ppc64el
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

IVA è un assemblatore de novo progettato per assemblare genomi di virus che non hanno sequenze ripetute, usando letture accoppiate Illumina sequenziate da popolazioni miste ad una profondità estremamente alta.

L'algoritmo principale di IVA funziona estendendo in maniera iterativa i contig usando letture accoppiate allineate. Il suo input possono essere semplicemente letture accoppiate o in aggiunta si può fornire un insieme esistente di contig da estendere. Come alternativa, può prendere le letture insieme a una sequenza di riferimento.

Please cite: M. Hunt, A. Gall, S. H. Ong, J. Brener, B. Ferns, P. Goulder, E. Nastouli, J. A. Keane, P. Kellam and T. D. Otto: IVA: accurate de novo assembly of RNA virus genomes. (PubMed) Bioinformatics 31(14):2374-2376 (2015)
Registry entries: Bio.tools  Bioconda 
jaligner
algoritmo Smith-Waterman con miglioramento di Gotoh
Versions of package jaligner
ReleaseVersionArchitectures
bullseye1.0+dfsg-7all
stretch1.0+dfsg-4all
trixie1.0+dfsg-11all
sid1.0+dfsg-11all
buster1.0+dfsg-6all
bookworm1.0+dfsg-10all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

JAligner è un'implementazione open source in Java dell'algoritmo Smith-Waterman con miglioramento di Gotoh per l'allineamento locale di coppie di sequenze biologiche con il modello di penalità affine per i gap.

jalview
editor per allineamenti multipli
Versions of package jalview
ReleaseVersionArchitectures
sid2.11.4.0+dfsg-3all
bullseye2.11.1.3+dfsg2-5all
jessie2.7.dfsg-4all
bookworm2.11.2.5+dfsg-3all
trixie2.11.4.0+dfsg-3all
upstream2.11.4.1
Popcon: 3 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

JalView è un editor Java per allineamenti di DNA, RNA e proteine che può lavorare con allineamenti di sequenze prodotti da programmi che implementano algoritmi di allineamento come clustalw, kalign e t-coffee.

Ha molte funzionalità, è attivamente sviluppato e esce avvantaggiato da un confronto con BioEdit, essendo al contempo libero nel senso di "libertà di parola"!

Please cite: Andrew M. Waterhouse, James B. Procter, David M. A. Martin, Michèle Clamp and Geoffrey J. Barton: Jalview Version 2-a multiple sequence alignment editor and analysis workbench. (PubMed,eprint) Bioinformatics 25:1189-1191 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package jalview
jellyfish
conta i k-meri in sequenze di DNA
Versions of package jellyfish
ReleaseVersionArchitectures
jessie2.1.4-1amd64
bookworm2.3.0-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bullseye2.3.0-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el
trixie2.3.1-3amd64,arm64,mips64el,ppc64el,riscv64
sid2.3.1-3amd64,arm64,mips64el,ppc64el,riscv64
buster2.2.10-2amd64,arm64
stretch2.2.6-1amd64
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

JELLYFISH è uno strumento per contare in modo veloce ed efficiente in termini di memoria i k-meri nel DNA. Un k-mero è una sottostringa di lunghezza k, e contare le occorrenze di tutte queste sottostringhe è un passo fondamentale in molte analisi delle sequenze del DNA. JELLYFISH può contare i k-meri usando una quantità di memoria un ordine di grandezza più piccola e una velocità di un ordine di grandezza più grande di quelle degli altri pacchetti per il conteggio dei k-meri, grazie all'uso di una codifica efficiente di una tabella hash e sfruttando l'istruzione "compare-and-swap" della CPU per aumentare il parallelismo.

JELLYFISH è un programma a riga di comando che legge file FASTA e multi-FASTA contenenti sequenze di DNA. Produce in output il suo conteggio dei k-meri in formato binario, che può essere tradotto in testo intelligibile usando il comando "jellyfish dump".

The package is enhanced by the following packages: multiqc
Please cite: Guillaume Marcais and Carl Kingsford: A fast, lock-free approach for efficient parallel counting of occurrences of k-mers. Bioinformatics 27(6):764-770 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
jellyfish1
conta i k-meri in sequenze di DNA
Versions of package jellyfish1
ReleaseVersionArchitectures
bullseye1.1.11-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm1.1.11-8amd64,arm64,mips64el,ppc64el
trixie1.1.11-9amd64,arm64,mips64el,ppc64el,riscv64
stretch-backports1.1.11-3~bpo9+1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.1.11-4amd64,arm64,armhf,i386
sid1.1.11-9amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

JELLYFISH è uno strumento per contare in modo veloce ed efficiente in termini di memoria i k-meri nel DNA. Un k-mero è una sottostringa di lunghezza k, e contare le occorrenze di tutte queste sottostringhe è un passo fondamentale in molte analisi delle sequenze del DNA. JELLYFISH può contare i k-meri usando una quantità di memoria un ordine di grandezza più piccola e una velocità di un ordine di grandezza più grande di quelle degli altri pacchetti per il conteggio dei k-meri, grazie all'uso di una codifica efficiente di una tabella hash e sfruttando l'istruzione "compare-and-swap" della CPU per aumentare il parallelismo.

JELLYFISH è un programma a riga di comando che legge file FASTA e multi-FASTA contenenti sequenze di DNA. Produce in output il suo conteggio dei k-meri in formato binario, che può essere tradotto in testo intelligibile usando il comando "jellyfish dump".

Questa è la versione più recente della serie 1.x di jellyfish che è utilizzata da alcune altre applicazioni che non sono compatibili con la versione 2.x, che è fornita nel pacchetto jellyfish.

Please cite: Guillaume Marcais and Carl Kingsford: A fast, lock-free approach for efficient parallel counting of occurrences of k-mers. Bioinformatics 27(6):764-770 (2011)
Registry entries: Bio.tools  SciCrunch 
jmodeltest
selezione HPC di modelli di sostituzione di nucleotide
Versions of package jmodeltest
ReleaseVersionArchitectures
bullseye2.1.10+dfsg-10all
trixie2.1.10+dfsg-12all
bookworm2.1.10+dfsg-12all
stretch2.1.10+dfsg-5all
buster2.1.10+dfsg-7all
sid2.1.10+dfsg-12all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

jModelTest è uno strumento per eseguire la selezione statistica di modelli best-fit di sostituzione di nucleotide. Implementa cinque differenti strategie di selezione dei modelli: test di tasso di probabilità dinamica e gerarchica (dLRT e hLRT), criteri di informazione bayesiana e Akaike (BIC e AIC) e un metodo della teoria della decisione (DT). Fornisce anche stima dell'incertezza della selezione del modello, importanze dei parametri e stime dei parametri mediate sul modello, incluse topologie dell'albero mediate sul modello. jModelTest 2 include funzionalità per High Performance Computing (HPC) e funzionalità aggiuntive come nuove strategie per l'ottimizzazione dell'albero, alberi filogenetici mediati sul modello (sia topologia sia lunghezza del ramo), filtraggio euristico e registrazione automatica dell'attività dell'utente.

Please cite: Diego Darriba, Guillermo L Taboada, Ramón Doallo and David Posada: jModelTest 2: more models, new heuristics and parallel computing. (PubMed) Nature Methods 9(8):772 (2012)
Registry entries: SciCrunch 
jmol
visualizzatore molecolare
Versions of package jmol
ReleaseVersionArchitectures
jessie12.2.32+dfsg2-1all
buster14.6.4+2016.11.05+dfsg1-4all
bullseye14.6.4+2016.11.05+dfsg1-4all
trixie16.2.33+dfsg-1all
bookworm14.32.83+dfsg-2all
sid16.2.33+dfsg-1all
stretch14.6.4+2016.11.05+dfsg1-3all
upstream16.2.37
Debtags of package jmol:
fieldchemistry
roleprogram
scopeutility
useviewing
Popcon: 62 users (49 upd.)*
Newer upstream!
License: DFSG free
Git

Jmol è un visualizzatore molecolare in Java per strutture chimiche tridimensionali. Le caratteristiche includono la lettura di una varietà di tipi di file e dell'output di programmi di chimica quantistica, e animazioni di file a più fotogrammi e modalità normali calcolate per programmi quantistici. Comprende funzionalità per prodotti chimici, cristalli, materiali e biomolecole. Jmol potrebbe essere utile a studenti, educatori e ricercatori in chimica e biochimica.

I formati di file letti da Jmol includono PDB, XYZ, CIF, CML, MDL Molfile, Gaussian, GAMESS, MOPAC, ABINIT, ACES-II, Dalton e VASP.

Please cite: A. Herráez: Biomolecules in the computer: Jmol to the rescue. (PubMed,eprint) Biochem Mol Biol Educ. 34(4):255-261 (2006)
Registry entries: SciCrunch 
Screenshots of package jmol
kalign
allineamenti multipli di sequenza globali e progressivi
Versions of package kalign
ReleaseVersionArchitectures
bookworm3.3.5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.03+20110620-5amd64,arm64,armhf,i386
stretch2.03+20110620-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.03+20110620-2amd64,armel,armhf,i386
trixie3.4.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid3.4.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package kalign:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 12 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Kalign è uno strumento a riga di comando per fare allineamenti multipli di sequenze biologiche. Usa l'algoritmo per corrispondenze di stringhe Muth-Manber per migliorare sia l'accuratezza che la velocità dell'allineamento. Usa un approccio globale, progressivo per l'allineamento, arricchito dall'uso di un algoritmo per corrispondenze approssimate di stringhe per calcolare le distanze tra le sequenze e incorporando corrispondenze locali nell'allineamento globale.

Please cite: Lassmann, Timo.: Kalign 3: multiple sequence alignment of large datasets. (eprint) Bioinformatics 36(6):1928-1929 (2020)
Registry entries: Bio.tools  SciCrunch 
kallisto
near-optimal RNA-Seq quantification
Versions of package kallisto
ReleaseVersionArchitectures
trixie0.48.0+dfsg-4amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm0.48.0+dfsg-3amd64,arm64,mips64el,ppc64el,s390x
bullseye0.46.2+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.48.0+dfsg-4amd64,arm64,mips64el,ppc64el,riscv64,s390x
upstream0.51.1
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Kallisto is a program for quantifying abundances of transcripts from RNA-Seq data, or more generally of target sequences using high-throughput sequencing reads. It is based on the novel idea of pseudoalignment for rapidly determining the compatibility of reads with targets, without the need for alignment. On benchmarks with standard RNA-Seq data, kallisto can quantify 30 million human reads in less than 3 minutes on a Mac desktop computer using only the read sequences and a transcriptome index that itself takes less than 10 minutes to build. Pseudoalignment of reads preserves the key information needed for quantification, and kallisto is therefore not only fast, but also as accurate than existing quantification tools. In fact, because the pseudoalignment procedure is robust to errors in the reads, in many benchmarks kallisto significantly outperforms existing tools.

The package is enhanced by the following packages: multiqc
Please cite: Nicolas L Bray, Harold Pimentel, Páll Melsted and Lior Pachter: Near-optimal probabilistic RNA-seq quantification. (PubMed) Nature Biotechnology 34(5):525–527 (2016)
Registry entries: Bio.tools  Bioconda 
kaptive
obtain information about K and O types for Klebsiella genome assemblies
Versions of package kaptive
ReleaseVersionArchitectures
sid2.0.8-1all
stretch-backports-sloppy0.7.0-2~bpo9+1all
buster-backports0.7.0-2~bpo10+1all
bookworm2.0.4-1all
bullseye0.7.3-3all
trixie2.0.8-1all
upstream3.0.0b6
Popcon: 1 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Kaptive reports information about K and O types for Klebsiella genome assemblies.

Given a novel genome and a database of known loci (K or O), Kaptive will help a user to decide whether their sample has a known or novel locus. It carries out the following for each input assembly:

  • BLAST for all known locus nucleotide sequences (using blastn) to identify the best match ('best' defined as having the highest coverage).
  • Extract the region(s) of the assembly which correspond to the BLAST hits (i.e. the locus sequence in the assembly) and save it to a FASTA file.
  • BLAST for all known locus genes (using tblastn) to identify which expected genes (genes in the best matching locus) are present/missing and whether any unexpected genes (genes from other loci) are present.
  • Output a summary to a table file.

In cases where your input assembly closely matches a known locus, Kaptive should make that obvious. When your assembly has a novel type, that too should be clear. However, Kaptive cannot reliably extract or annotate locus sequences for totally novel types - if it indicates a novel locus is present then extracting and annotating the sequence is up to you! Very poor assemblies can confound the results, so be sure to closely examine any case where the locus sequence in your assembly is broken into multiple pieces.

The package is enhanced by the following packages: kaptive-data kaptive-example
Please cite: Kelly L. Wyres, Ryan R. Wick, Claire Gorrie, Adam Jenney, Rainer Follador, Nicholas R. Thomson and Kathryn E. Holt: Identification of Klebsiella capsule synthesis loci from whole genome data. (PubMed) Microbial Genomics 2(12):e000102 (2016)
Registry entries: Bioconda 
khmer
attraversamento grafi, filtri e conteggi in memoria di k-meri in sequenze di DNA
Versions of package khmer
ReleaseVersionArchitectures
experimental3.0.0~a3+dfsg-9~0expamd64
buster2.1.2+dfsg-6amd64,arm64
bullseye2.1.2+dfsg-8amd64,arm64
stretch2.0+dfsg-10amd64,arm64,mips64el,ppc64el
bookworm3.0.0~a3+dfsg-4amd64
sid3.0.0~a3+dfsg-8amd64
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

khmer è una libreria e una suite di strumenti a riga di comando per lavorare con sequenze di DNA. È principalmente mirata ai dati di sequenziamento con letture corte, come quelli prodotti dalla piattaforma Illumina. khmer ha un approccio alla analisi di sequenze centrato sui k-meri, e da questo deriva il suo nome.

Please cite: Michael R. Crusoe, Hussien F. Alameldin, Sherine Awad, Elmar Bucher, Adam Caldwell, Reed Cartwright, Amanda Charbonneau, Bede Constantinides, Greg Edvenson, Scott Fay, Jacob Fenton, Thomas Fenzl, Jordan Fish, Leonor Garcia-Gutierrez, Phillip Garland, Jonathan Gluck, Iván González, Sarah Guermond, Jiarong Guo, Aditi Gupta, Joshua R. Herr, Adina Howe, Alex Hyer, Andreas Härpfer, Luiz Irber, Rhys Kidd, David Lin, Justin Lippi, Tamer Mansour, Pamela McA'Nulty, Eric McDonald, Jessica Mizzi, Kevin D. Murray, Joshua R. Nahum, Kaben Nanlohy, Alexander Johan Nederbragt, Humberto Ortiz-Zuazaga, Jeramia Ory, Jason Pell, Charles Pepe-Ranney, Zachary N Russ, Erich Schwarz, Camille Scott, Josiah Seaman, Scott Sievert, Jared Simpson, Connor T. Skennerton, James Spencer, Ramakrishnan Srinivasan, Daniel Standage, James A. Stapleton, Joe Stein, Susan R Steinman, Benjamin Taylor, Will Trimble, Heather L. Wiencko, Michael Wright, Brian Wyss, Qingpeng Zhang, en zyme and C. Titus Brown: The khmer software package: enabling efficient sequence analysis. (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
kineticstools
rilevazione di modifiche al DNA
Versions of package kineticstools
ReleaseVersionArchitectures
bookworm0.6.1+git20220223.1326a4d+dfsg-2all
stretch0.6.1+20161222-1all
buster0.6.1+git20180425.27a1878-2all
bullseye0.6.1+git20200729.e3723e0+dfsg-1all
trixie0.6.1+git20220223.1326a4d+dfsg-3all
sid0.6.1+git20220223.1326a4d+dfsg-3all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Strumenti per rilevare modifiche al DNA da dati di sequenziamento real-time (SMRT®) su singola molecola. Questo strumento implementa il modulo P_ModificationDetection in SMRT® Portal, utilizzato dal protocollo RS_Modification_Detection e RS_Modifications_and_Motif_Detection. I ricercatori interessati a capire o estendere gli algoritmi di rilevazione delle modifiche possono usare questi strumenti come punto di partenza.

Questo pacchetto fa parte della suite SMRTAnalysis.

king-probe
valuta e visualizza il fattore di impacchettamento interatomico delle proteine
Versions of package king-probe
ReleaseVersionArchitectures
trixie02.21-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.16.160404+git20180613.a09b012-1amd64,arm64,armhf,i386
sid02.21-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.13.110909-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm02.21-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.16.160404+git20200121.9b198c1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream02.26
Popcon: 13 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

king-probe è un programma che permette di valutare il fattore di impacchettamento interatomico, all'interno delle molecole e fra molecole. Genera "punti di contatto" dove gli atomi sono a stretto contatto.

Il programma king-probe genera "punti di contatto" nei punti sulla superficie di van der Waals degli atomi che sono in stretta prossimità di altri atomi; leggendo le coordinate atomiche da file in formato PDB (protein databank) e scrivendo liste di punti con colori codificati (punte dove gli atomi si scontrano) per l'inclusione in una immagine animata.

Please cite: J. Michael Word, Simon C. Lovell, Thomas H. LaBean, Hope C. Taylor, Michael E. Zalis, Brent K. Presley, Jane S. Richardson and David C. Richardson: Visualizing and Quantifying Molecular Goodness-of-Fit: Small-probe Contact Dots with Explicit Hydrogen Atoms. (PubMed,eprint) J. Mol. Biol. 285(4):1709-1731 (1999)
kissplice
rilevamento di vari tipi di polimorfismi in dati RNA-Seq
Versions of package kissplice
ReleaseVersionArchitectures
jessie2.2.1-3amd64
bookworm2.6.2-2amd64,arm64,mips64el,ppc64el
stretch2.4.0-p1-1amd64,arm64,mips64el,ppc64el
trixie2.6.7-1amd64,arm64,mips64el,ppc64el,riscv64
bullseye2.5.3-3amd64,arm64,mips64el,ppc64el
sid2.6.7-1amd64,arm64,mips64el,ppc64el,riscv64
buster2.4.0-p1-4amd64,arm64
Debtags of package kissplice:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
works-withbiological-sequence
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

KisSplice è un software che permette l'analisi di dati RNA-Seq con o senza un genoma di riferimento. È un assemblatore esatto di trascrittoma che permette di identificare SNP, indel e eventi di splicing alternativo. Può lavorare con un numero arbitrario di condizioni biologiche e quantifica ciascuna variante in ogni condizione. È stato provato su insiemi di dati Illumina con fino a 1G di letture. Il suo consumo di memoria è di circa 5Gb per 100M letture.

Please cite: Gustavo AT Sacomoto, Janice Kielbassa, Rayan Chikhi, Raluca Uricaru, Pavlos Antoniou, Marie-France Sagot, Pierre Peterlongo and Vincent Lacroix: KISSPLICE: de-novo calling alternative splicing events from RNA-seq data. (PubMed,eprint) BMC Bioinformatics 13((Suppl 6)):S5 (2012)
Registry entries: SciCrunch  Bioconda 
Topics: RNA-seq; RNA splicing; Gene structure
kleborate
strumento per screening di assemblati di genomi di Klebsiella
Versions of package kleborate
ReleaseVersionArchitectures
bookworm2.3.1-2amd64,arm64,mips64el,ppc64el,s390x
trixie2.4.1-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
stretch-backports-sloppy1.0.0-3~bpo9+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster-backports1.0.0-3~bpo10+1amd64,arm64,mips64el,ppc64el,s390x
bullseye2.0.1-1amd64,arm64,mips64el,ppc64el,s390x
sid2.4.1-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
upstream3.1.2
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Kleborate è uno strumento per fare lo screening di assemblati di genomi di Klebsiella per:

  • tipo di sequenze MLST;
  • specie (es K. pneumoniae, K. quasipneumoniae, K. variicola, ecc.);
  • loci di virulenza associati a ICEKp: yersiniabactina (ybt), colibactina (clb);
  • loci di virulenza associati a plasmidi: salmochelina (iro), aerobactina (iuc), ipermucoidi (rmpA, rmpA2);
  • geni di resistenza agli antimicrobici, inclusi SNP di resistenza ai chinoloni e troncamenti di resistenza alla colistina;
  • predizione dei sierotipi degli antigeni K (capsula) e O (LPS), tramite alleli wzi e Kaptive.
Please cite: Margaret M. C. Lam, Ryan R. Wick, Kelly L. Wyres, Claire L. Gorrie, Louise M. Judd, Adam W. J. Jenney, Sylvain Brisse and Kathryn E. Holt: Genetic diversity, mobilisation and spread of the yersiniabactin-encoding mobile element ICEKp in Klebsiella pneumoniae populations. (PubMed) Microbiology Society 4(9) (2018)
Registry entries: Bioconda 
kma
mapping genomic sequences to raw reads directly against redundant databases
Versions of package kma
ReleaseVersionArchitectures
bookworm1.4.11-1amd64,arm64,mips64el,ppc64el,s390x
bullseye1.3.10-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports-sloppy1.2.21-1~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.4.15-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.4.15-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

KMA is mapping a method designed to map raw reads directly against redundant databases, in an ultra-fast manner using seed and extend. KMA is particularly good at aligning high quality reads against highly redundant databases, where unique matches often does not exist. It works for long low quality reads as well, such as those from Nanopore. Non- unique matches are resolved using the "ConClave" sorting scheme, and a consensus sequence are outputtet in addition to other common attributes.

Please cite: Philip T. L. C. Clausen, Frank M. Aarestrup and Ole Lund: Rapid and precise alignment of raw reads against redundant databases with KMA. (PubMed,eprint) BMC Bioinformatics 19:307 (2018)
Registry entries: Bioconda 
kmc
conta i k-meri in sequenze genomiche
Versions of package kmc
ReleaseVersionArchitectures
buster2.3+dfsg-7amd64,arm64,armhf,i386
bookworm3.2.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.2.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.3+dfsg-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.1.1+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.2.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Il software kmc è progettato per contare k-meri (sequenze di k simboli consecutivi) in un insieme di letture. Il conteggio di k-meri è importante per molte applicazioni bioinformatiche, es. lo sviluppo di assemblatori di grafi di de Bruijn.

Creare grafi di de Bruijn è un approccio comunemente usato per l'assemblaggio di genomi con dati di sequenziamento di seconda generazione. Sfortunatamente errori di sequenziamento (frequenti nella pratica) hanno come risultato altissimi requisiti di memoria per i grafi di de Bruijn, così come tempi di creazione lunghi. Uno degli approcci popolari per gestire questo problema è quello di filtrare le letture in input in modo che i k-meri unici (molto probabilmente ottenuti come risultato di un errore) vengano scartati.

Perciò KMC analizza le letture grezze e produce una rappresentazione compatta di tutte le letture non uniche accompagnate dal numero delle loro occorrenze. L'algoritmo implementato in KMC fa uso soprattutto dello spazio su disco piuttosto che della RAM, il che permette di usare KMC anche sui personal computer comuni. Quando eseguito su server di alta fascia, che sono necessari per i concorrenti di KMC, li supera sia in termini di requisiti di memoria sia di velocità di calcolo. Lo spazio su disco necessario per il calcolo è nell'ordine della dimensione dei dati di input (solitamente è più piccolo).

Please cite: S. Deorowicz, M. Kokot, Sz. Grabowski and A. Debudaj-Grabysz: KMC 2: Fast and resource-frugal k-mer counting. (PubMed) Bioinformatics 31(10):1569-1576 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence composition, complexity and repeats
kmer
insieme di strumenti per l'analisi di sequenze di DNA
Versions of package kmer
ReleaseVersionArchitectures
sid0~20150903+r2013-9all
trixie0~20150903+r2013-9all
bookworm0~20150903+r2013-8all
bullseye0~20150903+r2013-8all
stretch0~20150903+r2013-3all
buster0~20150903+r2013-6all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il pacchetto kmer è un insieme di strumenti per l'analisi di sequenze di DNA. Fornisce strumenti per cercare (EST, mRNA, letture di sequenze), allineare (EST, mRNA, interi genomi) e una varietà di analisi basate su k-meri.

Questo è un metapacchetto che dipende dalle componenti eseguibili della suite kmer.

Please cite: B. Walenz and L. Florea: Sim4db and leaff: Utilities for fast batched spliced alignment and sequence indexing. (PubMed) Bioinformatics 27(13):1869-1870 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
kmerresistance
correla geni mappati con le specie predette di campioni WGS
Versions of package kmerresistance
ReleaseVersionArchitectures
trixie2.2.0-4amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid2.2.0-4amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm2.2.0-4amd64,arm64,mips64el,ppc64el,s390x
bullseye2.2.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

KmerResistance correla geni mappati con le specie predette di campioni WGS dove ciò permette l'identificazione di geni in campioni che sono stati sequenziati male o predizioni con elevata accuratezza per campioni con contaminazione. KmerResistance ha una dipendenza per eseguire la mappatura, cioè KMA, che è anche esso disponibile liberamente.

Please cite: Philip T. L. C. Clausen, Ea Zankari, Frank M. Aarestrup and Ole Lund: Benchmarking of methods for identification of antimicrobial resistance genes in bacterial whole genome data. (PubMed,eprint) Journal of Antimicrobial Chemotherapy 71(9):2484-8 (2016)
kraken
assegnazione di etichette tassonomiche a sequenze corte di DNA
Versions of package kraken
ReleaseVersionArchitectures
sid1.1.1-4amd64,arm64,mips64el,ppc64el,riscv64
bookworm1.1.1-4amd64,arm64,mips64el,ppc64el
trixie1.1.1-4amd64,arm64,mips64el,ppc64el,riscv64
buster1.1-3amd64,arm64,armhf,i386
bullseye1.1.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch0.10.5~beta-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch-backports1.1-2~bpo9+1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Kraken è un sistema per assegnare etichette tassonomiche a sequenze corte di DNA, solitamente ottenute tramite studi metagenomici. Tentativi precedenti da parte di altri software di bioinformatica di compiere questo compito spesso hanno usato tecniche di allineamento delle sequenze o di apprendimento macchina che erano piuttosto lente, portando allo sviluppo di programmi di stima dell'abbondanza meno sensibili, ma molto più veloci. Kraken ha lo scopo di raggiungere alta sensibilità e alta velocità usando allineamenti esatti di k-meri e un nuovo algoritmo di classificazione.

Nella sua modalità operativa più veloce, per un metagenoma simulato di letture di 100 pb, Kraken ha elaborato più di 4 milioni di letture al minuto su un singolo core, oltre 900 volte più veloce di Megablast e oltre 11 volte più veloce del programma di stima dell'abbondanza MetaPhlAn. L'accuratezza di Kraken è confrontabile con Megablast, con una sensibilità leggermente inferiore e una precisione molto alta.

The package is enhanced by the following packages: jellyfish1 multiqc
Please cite: Derrick E Wood and Steven L Salzberg: Kraken: ultrafast metagenomic sequence classification using exact alignments. (PubMed,eprint) Genome Biol. 15(3):R46 (2014)
Registry entries: Bio.tools  Bioconda 
kraken2
taxonomic classification system using exact k-mer matches
Versions of package kraken2
ReleaseVersionArchitectures
sid2.1.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.1.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.1.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.1.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Kraken 2 is the newest version of Kraken, a taxonomic classification system using exact k-mer matches to achieve high accuracy and fast classification speeds. This classifier matches each k-mer within a query sequence to the lowest common ancestor (LCA) of all genomes containing the given k-mer. The k-mer assignments inform the classification algorithm. [see: Kraken 1's Webpage for more details].

Kraken 2 provides significant improvements to Kraken 1, with faster database build times, smaller database sizes, and faster classification speeds. These improvements were achieved by the following updates to the Kraken classification program:

 1. Storage of Minimizers: Instead of storing/querying entire k-mers,
    Kraken 2 stores minimizers (l-mers) of each k-mer. The length of
    each l-mer must be ≤ the k-mer length. Each k-mer is treated by
    Kraken 2 as if its LCA is the same as its minimizer's LCA.
 2. Introduction of Spaced Seeds: Kraken 2 also uses spaced seeds to
    store and query minimizers to improve classification accuracy.
 3. Database Structure: While Kraken 1 saved an indexed and sorted list
    of k-mer/LCA pairs, Kraken 2 uses a compact hash table. This hash
    table is a probabilistic data structure that allows for faster
    queries and lower memory requirements. However, this data structure
    does have a <1% chance of returning the incorrect LCA or returning
    an LCA for a non-inserted minimizer. Users can compensate for this
    possibility by using Kraken's confidence scoring thresholds.
 4. Protein Databases: Kraken 2 allows for databases built from amino
    acid sequences. When queried, Kraken 2 performs a six-frame
    translated search of the query sequences against the database.
 5. 16S Databases: Kraken 2 also provides support for databases not
    based on NCBI's taxonomy. Currently, these include the 16S
    databases: Greengenes, SILVA, and RDP.
Please cite: Derrick E Wood and Steven L Salzberg: Kraken: ultrafast metagenomic sequence classification using exact alignments. (PubMed,eprint) Genome Biol. 15(3):R46 (2014)
Registry entries: Bio.tools  Bioconda 
lagan
strumento estremamente parametrizzabile per allineamento globale di coppia di sequenze genomiche
Versions of package lagan
ReleaseVersionArchitectures
buster2.0-3amd64,arm64,armhf,i386
trixie2.0-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.0-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.0-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch-backports2.0-3~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 9 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Lagan prende come ancore gli allineamenti locali generati da CHAOS e limita l'area di ricerca dell'algoritmo Needleman-Wunsch intorno a tali ancore.

Multi-LAGAN è una generalizzazione dell'algoritmo per allineamenti accoppiati di sequenze multiple. M-LAGAN esegue allineamenti di coppia progressivi guidati da un albero filogenetico specificato dall'utente. Gli allineamenti sono allineati agli altri allineamenti usando la metrica della somma delle coppie.

Please cite: Michael Brudno, Chuong Do, Gregory Cooper, Michael F. Kim, Eugene Davydov, Eric D. Green, Arend Sidow and Serafim Batzoglou: LAGAN and Multi-LAGAN: efficient tools for large-scale multiple alignment of genomic DNA. (PubMed,eprint) Genome Research 13(4):721-31 (2003)
Registry entries: Bio.tools  SciCrunch 
lamarc
analisi di verosimiglianza con algoritmo Metropolis che usa coalescenza casuale
Versions of package lamarc
ReleaseVersionArchitectures
buster2.1.10.1+dfsg-3amd64,arm64,armhf,i386
bullseye2.1.10.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.1.10.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.1.10.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.1.10.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

LAMARC è un programma che stima parametri della genetica di popolazione come dimensione della popolazione, tasso di crescita della popolazione, tasso di ricombinazione e tassi di migrazione. Approssima una sommatoria su tutte le possibili genealogie che potrebbero spiegare il campione osservato, che può essere dati di sequenze, SNP, microsatelliti o elettroforetici. LAMARC e il suo programma imparentato Migrate sono programmi successori dei programmi più vecchi Coalesce, Fluctuate e Recombine, che non sono più supportati. I programmi fanno un uso intenso della memoria, ma possono funzionare in maniera efficiente su una workstation.

Please cite: Mary K. Kuhner: Coalescent genealogy samplers: windows into population history. (PubMed) Trends in Ecology & Evolution 24(2):86-93 (2009)
Registry entries: SciCrunch 
lamassemble
unisce letture "lunghe" di DNA che si sovrappongono in una sequenza di consenso
Versions of package lamassemble
ReleaseVersionArchitectures
sid1.7.2-2all
bookworm1.4.2-5all
trixie1.7.2-2all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

lamassemble unisce letture "lunghe" di DNA che si sovrappongono in una sequenza di consenso (cioè le assembla). Funziona decentemente quando il numero di letture è minore di circa un migliaio. L'unione non è sempre accurata. In particolare, se le letture provengono da enormi ripetizioni tandem, possono essere unite parti sbagliate delle letture.

lambda-align
allineatore locale per molti dati biologici
Versions of package lambda-align
ReleaseVersionArchitectures
sid1.0.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0.1-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.3-5amd64,arm64,armhf,i386
bullseye1.0.3-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.3-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Lambda (Local Aligner for Massive Biological DatA) è un allineatore locale di biosequenze ottimizzato per molte sequenze di interrogazione e ricerche nello spazio delle proteine. È compatibile con lo strumento standard di fatto, BLAST, ma spesso supera in prestazioni le migliori alternative attualmente disponibili nel riprodurre i risultati di BLAST ed è il più veloce in confronto al corrente stato dell'arte a livelli di sensibilità comparabili.

Please cite: Hannes Hauswedell, Jochen Singer and Knut Reinert: Lambda: the local aligner for massive biological data. (PubMed,eprint) Bioinformatics 30(17):i349-i355 (2014)
Registry entries: Bioconda 
lambda-align2
Local Aligner for Massive Biological DatA - v2
Versions of package lambda-align2
ReleaseVersionArchitectures
bookworm2.0.0-9amd64
buster2.0.0-6amd64
sid2.0.1-1amd64
trixie2.0.1-1amd64
bullseye2.0.0-9amd64
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Lambda2 is a local biosequence aligner optimized for many query sequences and searches in protein space. It is compatible to the de facto standard tool BLAST, but often outperforms the best currently available alternatives at reproducing BLAST’s results and is the fastest compared with the current state of the art at comparable levels of sensitivity.

This package is for the Lambda (align) v2.x series which has an incompatible command line interface and on disk format from Lambda (align) v1.x.

Please cite: Hannes Hauswedell, Jochen Singer and Knut Reinert: Lambda: the local aligner for massive biological data. (PubMed,eprint) Bioinformatics 30(17):i349-i355 (2014)
Registry entries: Bioconda 
last-align
confronto di sequenze biologiche su scala genomica
Versions of package last-align
ReleaseVersionArchitectures
bullseye1179-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1542-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster963-2amd64,arm64,armhf,i386
stretch830-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie490-1amd64,armel,armhf,i386
trixie1542-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1447-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package last-align:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

LAST è un software per confrontare ed allineare sequenze, tipicamente DNA o sequenze proteiche. LAST è simile a BLAST, ma gestisce meglio quantità molto grandi di dati di sequenza. Ci sono due cose che LAST fa molto bene:

  • confrontare grandi genomi (ad esempio di mammiferi);
  • mappare molte etichette di sequenza su un genoma.

La principale innovazione tecnica è che LAST trova le corrispondenze iniziali in base alla loro molteplicità, invece di usare una dimensione fissa (BLAST ad esempio usa 10-meri). Ciò permette di mappare etichette su genomi senza fare la mascheratura delle ripetizioni e senza essere sopraffatti dalle corrispondenze ripetitive. Per trovare queste corrispondenze di dimensione variabile usa un array di suffissi (ispirato a Vmatch). Per ottenere un'alta sensibilità usa un array di suffissi non contigui, analogo a seed non consecutivi.

Please cite: Martin C. Frith, Raymond Wan and Paul Horton: Incorporating sequence quality data into alignment improves DNA read mapping. (PubMed,eprint) Nucl. Acids Res. 38(7):e100 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
lastz
allineamento di coppie di sequenze di DNA
Versions of package lastz
ReleaseVersionArchitectures
bullseye1.04.03-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.04.22-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.04.22-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.04.22-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

LASTZ è un sostituto perfetto per BLASTZ ed è compatibile all'indietro con la sintassi della riga di comando di BLASTZ. Cioè supporta tutte le opzioni di BLASTZ, ma ne ha anche di aggiuntive e può produrre risultati di allineamento leggermente differenti.

Registry entries: Bioconda 
leaff
applicazioni e utilità per librerie di sequenze biologiche
Versions of package leaff
ReleaseVersionArchitectures
bookworm0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0~20150903+r2013-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0~20150903+r2013-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0~20150903+r2013-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0~20150903+r2013-6amd64,arm64,armhf,i386
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

LEAFF (Let's Extract Anything From Fasta, estraiamo qualunque cosa da Fasta) è un programma di utilità per lavorare con file multi-fasta. Oltre a fornire l'accesso casuale al livello base, include diverse funzioni di analisi.

Questo pacchetto fa parte della suite Kmer.

Please cite: B. Walenz and L. Florea: Sim4db and leaff: Utilities for fast batched spliced alignment and sequence indexing. (PubMed) Bioinformatics 27(13):1869-1870 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
lefse
determina caratteristiche di organismi, cladi, unità tassonomiche, geni
Versions of package lefse
ReleaseVersionArchitectures
stretch1.0+20160802-1all
bullseye1.0.8-3all
bookworm1.1.2-1all
buster1.0.8-2all
trixie1.1.2-1all
sid1.1.2-1all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

LEfSe (Linear discriminant analysis Effect Size) determina le caratteristiche (organismi, cladi, unità tassonomiche operative, geni o funzioni) che più probabilmente spiegano le differenze tra classi, accoppiando test standard per significatività statistica con test aggiuntivi che codificano coerenza biologica e rilevanza dell'effetto.

Registry entries: SciCrunch  Bioconda 
libpwiz-tools
strumenti a riga di comando di ProteoWizard
Versions of package libpwiz-tools
ReleaseVersionArchitectures
buster3.0.18342-2amd64,arm64,armhf,i386
bullseye3.0.18342-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.0.6585-2amd64,armel,armhf,i386
sid3.0.18342-4.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.0.18342-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch3.0.9393-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

La libreria libpwiz dal progetto ProteoWizard fornisce un insieme modulare ed estensibile di librerie e strumenti open source e multipiattaforma. Gli strumenti effettuano analisi di dati di proteomica; le librerie permettono la creazione veloce di strumenti fornendo un'infrastruttura di sviluppo robusta e a plugin, che semplifica e unifica l'accesso ai file di dati, ed effettua calcoli standard per insiemi di dati LCMS e di chimica.

Lo scopo principale di ProteoWizard è quello di eliminare le barriere esistenti per lo sviluppo di software di proteomica, in modo che i ricercatori possano concentrarsi sullo sviluppo di nuovi approcci analitici, piuttosto che dover dedicare quantità importanti di risorse a compiti banali (anche se importanti), come leggere i file dei dati.

Questo pacchetto fornisce strumenti a riga di comando che includono idconvert (conversione di identificazioni MS) e msconvert (conversione di file di dati grezzi MS da/verso qualsiasi formato gestito).

librg-utils-perl
analizzatori e utilità di conversione del formato usati da (ad esempio) profphd
Versions of package librg-utils-perl
ReleaseVersionArchitectures
sid1.0.43-8all
buster1.0.43-6all
bookworm1.0.43-8all
jessie1.0.43-2all
bullseye1.0.43-7all
stretch1.0.43-4all
trixie1.0.43-8all
Debtags of package librg-utils-perl:
devellang:perl, library
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto contribuisce al server PredictProtein per l'annotazione strutturale automatica delle sequenze proteiche. Ha una serie di strumenti di conversione come:

  • blast2saf.pl,
  • blastpgp_to_saf.pl,
  • conv_hssp2saf.pl,
  • copf.pl,
  • hssp_filter.pl,
  • safFilterRed.pl,

che sono gestite dai moduli:

  • RG:Utils::Conv_hssp2saf,
  • RG:Utils::Copf,
  • RG:Utils::Hssp_filter.
libvcflib-tools
libreria C++ per analizzare e manipolare file VCF (strumenti)
Versions of package libvcflib-tools
ReleaseVersionArchitectures
sid1.0.9+dfsg1-3amd64,arm64,mips64el,ppc64el,riscv64
stretch-backports1.0.0~rc1+dfsg1-6~bpo9+1amd64
bullseye1.0.2+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster-backports1.0.1+dfsg-3~bpo10+1amd64
stretch1.0.0~rc1+dfsg1-3amd64
buster1.0.0~rc2+dfsg-2amd64
trixie1.0.9+dfsg1-3amd64,arm64,mips64el,ppc64el,riscv64
bookworm1.0.3+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.0.10
Popcon: 1 users (7 upd.)*
Newer upstream!
License: DFSG free
Git

Variant Call Format (VCF) è un formato testuale semplice delimitato da tabulazioni pensato per descrivere in modo conciso variazioni tra individui indicizzate rispetto ad un riferimento. VCF fornisce un formato comune di interscambio per la descrizione di variazioni in individui e popolazioni di campioni, ed è diventato il formato standard di fatto per i rapporti per una vasta gamma di rilevatori di varianti genomiche.

vcflib fornisce metodi per manipolare ed interpretare variazioni di sequenza come possono essere descritte da VCF. È:

  • un'API per analizzare e lavorare su record di variazioni genomiche come possono essere descritte dal formato VCF;
  • una raccolta di utilità a riga di comando per eseguire manipolazioni complesse di file VCF.

Questo pacchetto contiene diversi strumenti che usano la libreria.

lighter
fast and memory-efficient sequencing error corrector
Versions of package lighter
ReleaseVersionArchitectures
bullseye1.1.2-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.1.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.1.2-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Lighter is a fast, memory-efficient tool for correcting sequencing errors. Lighter avoids counting k-mers. Instead, it uses a pair of Bloom filters, one holding a sample of the input k-mers and the other holding k-mers likely to be correct. As long as the sampling fraction is adjusted in inverse proportion to the depth of sequencing, Bloom filter size can be held constant while maintaining near-constant accuracy. Lighter is parallelized, uses no secondary storage, and is both faster and more memory-efficient than competing approaches while achieving comparable accuracy.

loki
analisi MCMC di linkage in generici alberi genealogici
Versions of package loki
ReleaseVersionArchitectures
trixie2.4.7.4-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.4.7.4-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.4.7.4-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.4.7.4-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4.7.4-8amd64,arm64,armhf,i386
stretch2.4.7.4-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.4.7.4-5amd64,armel,armhf,i386
Debtags of package loki:
fieldbiology
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 52 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Esegue l'analisi multi-punto di linkage, con il metodo delle catene di Markov Montecarlo, su alberi genealogici grandi e complessi. Il pacchetto attuale permette unicamente l'analisi di caratteri quantitativi, sebbene questa limitazione sarà eliminata nelle versioni successive. La stima congiunta del numero QTL, della posizione e degli effetti usa Reversible Jump MCMC. Si possono anche effettuare analisi di condivisione di IBD di individui affetti.

The package is enhanced by the following packages: loki-doc
ltrsift
post-elaborazione e classificazione di retrotrasposoni LTR
Versions of package ltrsift
ReleaseVersionArchitectures
trixie1.0.2-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0.2-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.2-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.2-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.2-8amd64,arm64,armhf,i386
stretch1.0.2-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.0.2-1amd64,armel,armhf,i386
Debtags of package ltrsift:
uitoolkitgtk
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

LTRsift è uno strumento grafico per desktop che fa post-elaborazione semi-automatica delle annotazioni di retrotrasposoni LTR predetti de novo, come quelle generate da LTRharvest e LTRdigest. La sua interfaccia facile da usare mostra i candidati per i retrotrasposoni LTR, le loro famiglie putative e la loro struttura in modo gerarchico, permettendo all'utente di "vagliare" ("sift") i risultati, a volte numerosi, del software di predizione de novo. Offre anche funzionalità di filtraggio e di classificazione personalizzabili.

Screenshots of package ltrsift
lucy
DNA sequence quality and vector trimming tool
Versions of package lucy
ReleaseVersionArchitectures
sid1.20-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.20-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.20-1amd64,arm64,armhf,i386
bullseye1.20-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.20-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Lucy is a utility that prepares raw DNA sequence fragments for sequence assembly, possibly using the TIGR Assembler. The cleanup process includes quality assessment, confidence reassurance, vector trimming and vector removal. The primary advantage of Lucy over other similar utilities is that it is a fully integrated, stand alone program.

Lucy was designed and written at The Institute for Genomic Research (TIGR, now the J. Craig Venter Institute), and it has been used here for several years to clean sequence data from automated DNA sequencers prior to sequence assembly and other downstream uses. The quality trimming portion of lucy makes use of phred quality scores, such as those produced by many automated sequencers based on the Sanger sequencing method. As such, lucy’s quality trimming may not be appropriate for sequence data produced by some of the new “next-generation” sequencers.

lumpy-sv
infrastruttura probabilistica generica per scoperta di varianti strutturali
Versions of package lumpy-sv
ReleaseVersionArchitectures
bullseye0.3.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid0.3.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie0.3.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm0.3.1+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

LUMPY, un'innovativa infrastruttura per scoperta di SV che integra naturalmente segnali SV multipli unitamente attraverso campioni multipli. LUMPY produce sensibilità migliorata, specialmente quando il segnale SV è ridotto a causa della bassa copertura dei dati o della bassa frequenza di varianti di alleli nei campioni.

The package is enhanced by the following packages: lumpy-sv-examples
macs
analisi basata su modelli di ChIP-Seq su sequenziatori di letture corte
Versions of package macs
ReleaseVersionArchitectures
stretch2.1.1.20160309-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1.2.1-1amd64,arm64,armhf,i386
jessie2.0.9.1-1amd64,armel,armhf,i386
trixie3.0.2-1amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
sid3.0.2-1amd64,arm64,armel,armhf,i386,ppc64el,riscv64,s390x
bookworm2.2.7.1-6amd64,arm64,armel,armhf,i386,ppc64el,s390x
bullseye2.2.7.1-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
Popcon: 6 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

MACS modella in modo empirico la lunghezza dei frammenti ChIP sequenziati, che tende ad essere più corta delle stime di dimensione per sonicazione o costruzione di biblioteche genomiche, e la usa per migliorare la risoluzione spaziale dei siti di legame predetti. MACS usa anche una distribuzione di Poisson dinamica per catturare in modo efficace i bias locali nella sequenza del genoma, permettendo una predizione più sensibile e robusta. MACS si comporta bene al confronto degli algoritmi esistenti ChIP-Seq di ricerca di picchi, è disponibile pubblicamente come open source e può essere usato per ChIP-Seq con o senza campioni di controllo.

Please cite: Yong Zhang, Tao Liu, Clifford A Meyer, Jérôme Eeckhoute, David S. Johnson, Bradley E. Bernstein, Chad Nussbaum, Richard M. Myers, Myles Brown, Wei Li and X Shirley Liu: Model-based Analysis of ChIP-Seq (MACS). (PubMed,eprint) Genome Biol. 9(9):R137 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
macsyfinder
rilevamento di sistemi macromolecolari in insiemi di dati di proteine
Versions of package macsyfinder
ReleaseVersionArchitectures
buster1.0.5-2all
bookworm2.0-2amd64,i386
bullseye2.0~rc1-3amd64,i386
trixie2.1.4-1amd64,arm64,i386
sid2.1.4-1amd64,arm64,i386
stretch1.0.2-3all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

MacSyFinder è un programma per modellare e rilevare sistemi macromolecolari, percorsi genetici, ... in insiemi di dati di proteine. Nei procarioti, questi sistemi hanno spesso proprietà che si conservano nell'evoluzione: sono costituiti da componenti conservati e sono codificati in loci compatti (architettura genetica conservata). L'utente modella questi sistemi con MacSyFinder per rispecchiare queste proprietà conservate, e per permettere la loro rilevazione efficiente.

Questo pacchetto presenta l'API Java open source per i database biologici e una serie di algoritmi, la maggior parte basati su sequenze.

Please cite: Sophie S. Abby, Bertrand Néron, Hervé Ménager, Marie Touchon and Eduardo P. C. Rocha: MacSyFinder: A Program to Mine Genomes for Molecular Systems with an Application to CRISPR-Cas System. (PubMed,eprint) PLOS ONE 9(10):e110726 (2014)
Registry entries: Bio.tools 
maffilter
elabora allineamenti di genoma in Multiple Alignment Format
Versions of package maffilter
ReleaseVersionArchitectures
bullseye1.3.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.3.1+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.3.1+dfsg-1amd64,arm64,armhf,i386
sid1.3.1+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.1.0-1+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.3.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

MafFilter applica una serie di "filtri" a un file MAF per ripulirlo, estrarre dati e calcolare statistiche tenendo traccia dei metadati associati come coordinate del genoma e punteggi di qualità.

  • Può elaborare l'allineamento per rimuovere regioni con bassa qualità / ambigue / mascherate.
  • Può esportare i dati in un file di allineamenti multipli o singoli in formati come Fasta o Clustal.
  • Può leggere i dati delle annotazioni nel formato GFF o GTF ed estrarre l'allineamento corrispondente.
  • Può eseguire calcoli con finestre mobili.
  • Può ricostruire filogenie/genealogie insieme all'allineamento del genoma.
  • Può calcolare statistiche genetiche sulla popolazione come spettro di frequenza dei siti, numero di siti fissi/polimorfici, ecc.
The package is enhanced by the following packages: maffilter-examples
Please cite: Julien Y Dutheil, Sylvain Gaillard and Eva H Stukenbrock: MafFilter: a highly flexible and extensible multiple genome alignment files processor. (PubMed,eprint) BMC Genomics 15:53 (2014)
mafft
programma per allineamenti multipli per sequenze aminoacidiche o nucleotidiche
Versions of package mafft
ReleaseVersionArchitectures
stretch7.307-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie7.505-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster7.407-2amd64,arm64,armhf,i386
bullseye7.475-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid7.505-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm7.505-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie7.205-1amd64,armel,armhf,i386
Debtags of package mafft:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 17 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

MAFFT è un programma per l'allineamento di sequenze multiple che offre tre metodi orientati all'accuratezza:

  • L-INS-i (probabilmente il più accurato; raccomandato per meno di 200 sequenze; metodo di raffinamento con iterazioni che incorpora informazioni sull'allineamento locale di coppie);
  • G-INS-i (adatto per sequenze di lunghezza simile; raccomandato per meno di 200 sequenze; metodo di raffinamento con iterazioni che incorpora informazioni sull'allineamento globale di coppie);
  • E-INS-i (adatto per sequenze contenenti grandi regioni non allineabili; raccomandato per meno di 200 sequenze); e cinque metodi orientati alla velocità:

  • FFT-NS-i (metodo di raffinamento con iterazioni; solo due cicli);

  • FFT-NS-i (metodo di raffinamento con iterazioni; massimo 1000 iterazioni);
  • FFT-NS-2 (veloce; metodo progressivo);
  • FFT-NS-1 (molto veloce; raccomandato per più di 2000 sequenze; metodo progressivo con un albero guida grezzo);
  • NW-NS-PartTree-1 (raccomandato per ~50.000 sequenze; metodo progressivo con l'algoritmo PartTree).
Please cite: Kazutaka Katoh and Hiroyuki Toh: Recent developments in the MAFFT multiple sequence alignment program. (PubMed) Brief Bioinform 9(4):286-298 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
malt
sequence alignment and analysis tool to process sequencing data
Versions of package malt
ReleaseVersionArchitectures
trixie0.5.2-3all
sid0.5.2-3all
bookworm0.5.2-2all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

MALT, an acronym for MEGAN alignment tool, is a sequence alignment and analysis tool designed for processing high-throughput sequencing data, especially in the context of metagenomics. It is an extension of MEGAN6, the MEGenome Analyzer and is designed to provide the input for MEGAN6, but can also be used independently of MEGAN6.

The core of the program is a sequence alignment engine that aligns DNA or protein sequences to a DNA or protein reference database in either BLASTN (DNA queries and DNA references), BLASTX (DNA queries and protein references) or BLASTP (protein queries and protein references) mode. The engine uses a banded-alignment algorithm with ane gap scores and BLOSUM substitution matrices (in the case of protein alignments). The program can compute both local alignments (Smith-Waterman) or semi-global alignments (in which reads are aligned end-to-end into reference sequences), the latter being more appropriate for aligning metagenomic reads to references.

The package is enhanced by the following packages: multiqc
Please cite: Alexander Herbig, Frank Maixner, Kirsten I. Bos, Albert Zink, Johannes Krause and Daniel H. Huson: MALT: Fast alignment and analysis of metagenomic DNA sequence data applied to the Tyrolean Iceman. (eprint) bioRxiv (2016)
mapdamage
tracciamento e quantificazione di modelli di danno in sequenze di DNA antico
Versions of package mapdamage
ReleaseVersionArchitectures
bullseye2.2.1+dfsg-1all
stretch2.0.6+dfsg-2all
sid2.2.2+dfsg-1all
buster2.0.9+dfsg-1all
bookworm2.2.1+dfsg-3all
trixie2.2.2+dfsg-1all
Popcon: 7 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

MapDamage è un'infrastruttura computazionale scritta in Python e R che tiene traccia e quantifica i modelli di danno del DNA tra letture di sequenziamento di DNA antico generate da piattaforme di sequenziamento di prossima generazione.

MapDamage è sviluppato al Centre for GeoGenetics dall'Orlando Group.

Please cite: Hákon Jónsson, Aurélien Ginolhac, Mikkel Schubert and Philip Johnson and Ludovic Orlando: mapDamage2.0: fast approximate Bayesian estimates of ancient DNA damage parameters. (PubMed,eprint) Bioinformatics 29(13):1682-4 (2013)
Registry entries: SciCrunch  Bioconda 
mapsembler2
software per assemblaggio pensato per la bioinformatica
Versions of package mapsembler2
ReleaseVersionArchitectures
stretch2.2.3+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
jessie2.1.6+dfsg-1amd64,armel,armhf,i386
trixie2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
bookworm2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
sid2.2.4+dfsg1-4amd64,arm64,ppc64el,s390x
bullseye2.2.4+dfsg1-3amd64,arm64,ppc64el,s390x
buster2.2.4+dfsg-3amd64,arm64,armhf,i386
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Mapsembler2 è un software di assemblaggio pensato per la bioinformatica. Accetta in input un insieme di letture grezze NGS (fasta o fastQ, compresse con gzip o meno) e un insieme di sequenze di input (starter).

Come prima cosa determina se ogni starter è coerente a livello di letture, ad esempio se le letture confermano la presenza di ciascun starter nella sequenza originale. Poi, per ogni starter coerente con le letture, Mapsembler2 produce in output le sue sequenze vicine come sequenza lineare o come grafo, a seconda della scelta dell'utente.

Mapsempler2 può essere usato per (ma non è limitato a questo):

  • validare una sequenza assemblata (data in input come starter), per esempio da un assemblato con grafo di de Bruijn in cui non è stata imposta la coerenza con le letture;
  • controlla se un gene (dato in input come starter) ha un omologo in un insieme di letture;
  • controlla se un enzima conosciuto è presente in un insieme di letture NGS metagenomico;
  • arricchisce letture non mappabili estendendole, rendendole eventualmente mappabili;
  • controlla cosa accade alle estremità di un contig;
  • rimuove contaminanti o letture simbionti da un insieme di letture.
Please cite: Pierre Peterlongo and Rayan Chikhi: Mapsembler, targeted and micro assembly of large NGS datasets on a desktop computer. (PubMed) BMC Bioinformatics 13:48 (2012)
Registry entries: Bio.tools  Bioconda 
maq
mappatura di corte sequenze di lunghezza fissa di DNA polimorfo su sequenze di riferimento
Versions of package maq
ReleaseVersionArchitectures
buster0.7.1-8amd64,arm64,armhf,i386
sid0.7.1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.7.1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.7.1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.7.1-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.7.1-5amd64,armel,armhf,i386
Debtags of package maq:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 7 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Maq (abbreviazione di Mappatura e Assemblaggio con Qualità) costruisce assemblaggi per mappatura a partire da corte letture generate dalle apparecchiature di sequenziamento di seconda generazione. È pensato principalmente per l'analizzatore Illumina-Solexa 1G Genetic Analyzer ed ha una preliminare capacità di gestire dati ABI SOLiD. Maq si chiamava prima mapass2.

Lo sviluppo di Maq si è fermato nel 2008. I suoi successori sono BWA e SAMtools.

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.tools  SciCrunch 
maqview
visualizzatore grafico di allineamento di letture per brevi sequenze geniche
Versions of package maqview
ReleaseVersionArchitectures
bookworm0.2.5-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.2.5-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.2.5-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.2.5-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.2.5-9amd64,arm64,armhf,i386
stretch0.2.5-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.2.5-6amd64,armel,armhf,i386
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Maqview è un visualizzatore grafico di allineamenti di letture. È specificamente progettato per i file di allineamento Maq e permette di vedere non corrispondenze, qualità delle basi e qualità della mappatura. Maqview non è sofisticato come Consed o GAP, ma è solamente un semplice visualizzatore per vedere ciò che succede in una particolare regione.

In confronto a tgap-maq, il visualizzatore testuale di allineamenti di letture scritto da James Bonfield, Maqview è più veloce e usa molta meno memoria e spazio su disco durante l'indicizzazione. Ciò è possibile perché tgap mira ad essere un visualizzatore universale, mentre Maqview sfrutta a pieno il fatto che un file di allineamento Maq è già stato ordinato. Maqview è efficiente anche nella visualizzazione e fornisce uno strumento a riga di comando per recuperare velocemente qualsiasi regione in un file di allineamento Maq.

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.tools  SciCrunch 
mash
veloce stima di distanze in genoma e metagenoma usando MinHash
Versions of package mash
ReleaseVersionArchitectures
stretch1.1.1-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.3+dfsg-3amd64,arm64,mips64el,ppc64el,s390x
bullseye2.2.2+dfsg-2amd64,arm64,mips64el,ppc64el,s390x
sid2.3+dfsg-6amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie2.3+dfsg-6amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster2.1+dfsg-2amd64,arm64,armhf,i386
Popcon: 1 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Mash usa gli hash MinHash sensibili localmente per ridurre grandi biosequenze in sketch rappresentativi e stimare rapidamente le distanze di coppia tra genomi o metagenomi. I database di sketch di Mash delineano in maniera efficace i confini conosciuti tra le specie, permettono la costruzione di filogenie approssimate e possono essere cercati in secondi usando genomi assemblati o risultati grezzi di sequenziamento da Illumina, Pacific Biosciences e Oxford Nanopore. Per la metagenomica, Mash scala fino a migliaia di campioni e può replicare i risultati dello Human Microbiome Project e del Global Ocean Survey in una frazione del tempo.

Please cite: Brian D. Ondovi, Todd J. Treangen, Páll Melsted, Adam B. Mallonee, Nicholas H. Bergman, Sergey Koren and Adam M. Phillippy: Mash: fast genome and metagenome distance estimation using MinHash. (PubMed,eprint) Genome Biology 17:132 (2016)
Registry entries: Bioconda 
massxpert
pacchetto di transizione per massxpert -> massxpert2
Versions of package massxpert
ReleaseVersionArchitectures
stretch3.6.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid8.5.0-1all
jessie3.4.1-1amd64,armel,armhf,i386
bullseye6.0.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm7.0.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package massxpert:
biologynuceleic-acids, peptidic
fieldbiology, chemistry
interfacex11
roleprogram
uitoolkitqt
useanalysing, simulating
works-withbiological-sequence
works-with-formatxml
x11application
Popcon: 4 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Questo è un pacchetto di transizione; può essere rimosso senza problemi. Pacchetto runtime.

Registry entries: Bio.tools 
mauve-aligner
allineamento multiplo di genomi
Versions of package mauve-aligner
ReleaseVersionArchitectures
bookworm2.4.0+4736-6all
bullseye2.4.0+4736-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.4.0+4736-6all
stretch2.4.0+4734-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.4.0+4736-1amd64,arm64,armhf,i386
trixie2.4.0+4736-6all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Mauve è un sistema per costruire in modo efficiente allineamenti multipli di genomi in presenza di eventi evolutivi su grande scala, come riarrangiamenti ed inversioni. L'allineamento multiplo di genomi fornisce una base per la ricerca nel campo della genomica comparativa e per lo studio della dinamica evolutiva. L'allineamento di interi genomi è un problema sostanzialmente diverso dall'allineamento di sequenze corte.

Mauve è stato sviluppato con l'idea che un allineatore di genomi multipli dovrebbe richiedere risorse di calcolo modeste. Utilizza tecniche algoritmiche che scalano bene con la quantità di sequenze da allineare. Per esempio una coppia di genomi di Y. pestis può essere allineata in meno di un minuto, mentre un gruppo di 9 genomi divergenti di enterobatteri può essere allineato in alcune ore.

Mauve calcola e visualizza in modo interattivo confronti tra sequenze genomiche. Usando dati di sequenze FastA o GenBank, Mauve costruisce allineamenti multipli di genomi che identificano riarrangiamenti su larga scala, acquisizione e perdita di geni, indel e sostituzione di nucleotidi.

Mauve è sviluppato all'University of Wisconsin.

The package is enhanced by the following packages: progressivemauve
Please cite: Aaron C. E. Darling, Bob Mau, Frederick R. Blattner and Nicole T. Perna: Mauve: multiple alignment of conserved genomic sequence with rearrangements. (PubMed,eprint) Genome research 14(7):1394-1403 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mcaller
trova metilazioni in letture nanopore
Versions of package mcaller
ReleaseVersionArchitectures
sid1.0.3+git20210624.b415090-3all
trixie1.0.3+git20210624.b415090-3all
bookworm1.0.3+git20210624.b415090-3all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git
   H
   |
 H-C-aller
   |
   H

Questo programma è progettato per identificare m6A da dati nanopore usando le differenze tra le correnti misurate e attese.

mecat2
ultra-fast and accurate de novo assembly tools for SMRT reads
Versions of package mecat2
ReleaseVersionArchitectures
trixie0.0+git20200428.f54c542+ds-4amd64
sid0.0+git20200428.f54c542+ds-4amd64
bookworm0.0+git20200428.f54c542+ds-3amd64
bullseye0.0+git20200428.f54c542+ds-3amd64
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

An improved version of MECAT. It is an ultra-fast and accurate mapping and error correcting de novo assembly tools for single molecula sequencing (SMRT) reads. MECAT2 consists of the following three modules:

 1. mecat2map: a fast and accurate alignment tool for SMRT reads.
 2. mecat2cns: correct noisy reads based on their pairwise overlaps.
 3. fsa: a string graph based assembly tool.
Please cite: Chuan-Le Xiao, Ying Chen, Shang-Qian Xie, Kai-Ning Chen, Yan Wang, Yue Han, Feng Luo and Zhi Xie: MECAT: fast mapping, error correction, and de novo assembly for single-molecule sequencing reads. Nature Methods 14(11):1078 (2017)
megadepth
calcola la copertura da file di sequenziamento BigWig e BAM
Versions of package megadepth
ReleaseVersionArchitectures
sid1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Una delle principali preoccupazioni nell'interpretazione di sequenziamenti di DNA e RNA (!) è il numero di letture che coprono una particolare area. Questo pacchetto ha statistiche interessanti per la distinzione tra parti codificanti e non codificanti del genoma e sa come interpretare trascritti che si estendono su più esoni.

Questo pacchetto è un successore del programma "bamcount".

Please cite: Christopher Wilks, Omar Ahmed, Daniel N Baker, David Zhang, Leonardo Collado-Torres and Ben Langmead: Megadepth: efficient coverage quantification for BigWigs and BAMs. (PubMed) Bioinformatics 37(18):3014–3016 (2021)
Registry entries: Bio.tools  Bioconda 
megahit
ultra-fast and memory-efficient meta-genome assembler
Versions of package megahit
ReleaseVersionArchitectures
trixie1.2.9-5amd64
bullseye1.2.9-2amd64
bookworm1.2.9-4amd64
sid1.2.9-5amd64
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Megahit is an ultra-fast and memory-efficient NGS assembler. It is optimized for metagenomes, but also works well on generic single genome assembly (small or mammalian size) and single-cell assembly.

The software was praised in a Briefings in Bioinformatics 5/2020 review (DOI: 10.1093/bib/bbaa085).

Please cite: Dinghua Li, Chi-Man Liu, Ruibang Luo, Kunihiko Sadakane and Tak-Wah Lam: MEGAHIT: an ultra-fast single-node solution for large and complex metagenomics assembly via succinct de Bruijn graph. (PubMed) 31:1674-1676 (2015)
Registry entries: Bio.tools  Bioconda 
megan-ce
interactive tool to explore and analyse microbiome sequencing data
Versions of package megan-ce
ReleaseVersionArchitectures
sid6.21.1+dfsg-4all
trixie6.21.1+dfsg-4all
bookworm6.21.1+dfsg-2all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

MEGAN Community Edition is a shotgun sequencer to analyze microbiome samples. It is a rewrite and extension of the widely-used microbiome analysis tool MEGAN so as to facilitate the interactive analysis of the taxonomic and functional content of very large microbiome datasets. Other new features include a functional classifier called InterPro2GO, gene-centric read assembly, principal coordinate analysis of taxonomy and function, and support for metadata. By integrating MEGAN CE with the high-throughput DNA-to-protein alignment tool DIAMOND a powerful and complete pipeline for the analysis of metagenome shotgun sequences can be provided.

Please cite: Daniel H. Huson, Sina Beier, Isabell Flade, Anna Górska, Mohamed El-Hadidi, Suparna Mitra, Hans-Joachim Ruscheweyh and Rewati Tappu: MEGAN Community Edition - Interactive Exploration and Analysis of Large-Scale Microbiome Sequencing Data. (PubMed,eprint) PLoS Comput Biol. 12(6):e1004957 (2016)
Registry entries: Bioconda 
melting
calcola la temperatura di fusione di doppie eliche di acidi nucleici
Versions of package melting
ReleaseVersionArchitectures
buster5.2.0-1all
sid5.2.0-2all
trixie5.2.0-2all
bookworm5.2.0-2all
bullseye5.2.0-2all
stretch4.3.1+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie4.3.1+dfsg-1amd64,armel,armhf,i386
Debtags of package melting:
biologynuceleic-acids
fieldbiology, biology:molecular
interfacecommandline
roleprogram
scopeutility
suitegnu
useanalysing
works-with-formatplaintext
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Questo programma calcola, per una doppia elica di acido nucleico, l'entalpia, l'entropia e la temperatura di fusione della transizione dell'elica. Sono possibili tre tipi di ibridazione: DNA/DNA, DNA/RNA e RNA/RNA. Il programma prima calcola l'entalpia e l'entropia di ibridazione a partire dai parametri elementari di ciascuna coppia di Crick con il metodo del prossimo più vicino. Poi viene calcolata la temperatura di fusione. L'insieme dei parametri termodinamici può essere facilmente modificato, per esempio a seguito di una scoperta sperimentale.

Please cite: Le Novère, Nicolas: MELTING, computing the melting temperature of nucleic acid duplex. (PubMed,eprint) Bioinformatics 17(12):1226-1227 (2001)
Registry entries: Bio.tools 
Screenshots of package melting
meryl
conteggio di k-meri in- e out-of-core e utilità
Versions of package meryl
ReleaseVersionArchitectures
buster0~20150903+r2013-6amd64,arm64,armhf,i386
sid0~20150903+r2013-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0~20150903+r2013-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0~20150903+r2013-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

meryl calcola il contenuto di k-meri di sequenze genomiche. Il contenuto di k-meri è rappresentato come una lista di k-meri e il numero di volte che ognuno di essi appare nelle sequenze di input. Il k-mero può essere ristretto solamente al k-mero forward, solo a quello reverse o al k-mero canonico (lessicograficamente più piccolo del k-mero forward e reverse ad ogni posizione). Meryl può riportare l'istogramma dei conteggi, la lista dei k-meri e il loro conteggio o può effettuare operazioni matematiche o insiemistiche sui file dei dati elaborati.

Questo pacchetto fa parte della suite Kmer.

Please cite: B. Walenz and L. Florea: Sim4db and leaff: Utilities for fast batched spliced alignment and sequence indexing. (PubMed) Bioinformatics 27(13):1869-1870 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
metabat
robust statistical framework for reconstructing genomes from metagenomic data
Versions of package metabat
ReleaseVersionArchitectures
sid2.15-4amd64,i386
bookworm2.15-4amd64,i386
bullseye2.15-3amd64,i386
trixie2.15-4amd64,i386
upstream2.17
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

MetaBAT integrates empirical probabilistic distances of genome abundance and tetranucleotide frequency for accurate metagenome binning. MetaBAT outperforms alternative methods in accuracy and computational efficiency on both synthetic and real metagenome datasets. It automatically forms hundreds of high quality genome bins on a very large assembly consisting millions of contigs in a matter of hours on a single node.

Please cite: Dongwan D. Kang, Jeff Froula, Rob Egan and Zhong Wang: MetaBAT, an efficient tool for accurately reconstructing single genomes from complex microbial communities. (PubMed) PeerJ 3:e1165 (2015)
Registry entries: Bioconda 
metaeuk
rilevamento e annotazione di geni sensibili e ad alte prestazioni per metagenomica
Versions of package metaeuk
ReleaseVersionArchitectures
sid6-a5d39d9+ds-5amd64,arm64,mips64el,ppc64el,riscv64
trixie6-a5d39d9+ds-5amd64,arm64,mips64el,ppc64el,riscv64
upstream7-bba0d80
Popcon: users ( upd.)*
Newer upstream!
License: DFSG free
Git

MetaEuk è un toolkit modulare progettato per rilevamento e annotazione di geni su larga scala in contig metagenomi di eucarioti. MetaEuk combina le capacità di ricerca veloce e sensibile di omologie di MMseqs2 con una procedura di programmazione dinamica per recuperare insiemi di esoni ottimali. Riduce le ridondanze in rilevamenti multipli dello stesso gene e risolve le predizioni in conflitto di geni sullo stesso filamento.

metaphlan
analisi filogenetica metagenomica
Versions of package metaphlan
ReleaseVersionArchitectures
sid4.0.4-1all
bookworm4.0.4-1all
trixie4.0.4-1all
upstream4.1.1
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

MetaPhlAn è uno strumento informatico per profilare la composizione di comunità microbiche (Bacteria, Archaea ed eucarioti) da dati di sequenziamento shotgun metagenomico (cioè non 16S) a livello di specie. Con il modulo StrainPhlAn recentemente aggiunto è ora possibile effettuare una profilazione microbica accurata a livello di ceppo.

MetaPhlAn si basa su ~1.1M geni marcatori univoci specifici per clade (il file più recente con informazioni sui marcatori mpa_v31_CHOCOPhlAn_201901_marker_info.txt.bz2 può essere scaricato) identificati da circa 100,000 genomi di riferimento (~99.500 di batteri e archei, e ~500 eucariotici), permettendo:

  • assegnazioni tassonomiche non ambigue;
  • stime accurate dell'abbondanza relativa degli organismi;
  • risoluzione a livello di specie per batteri, archei, eucarioti e virus;
  • identificazione e tracciatura dei ceppi;
  • incrementi di velocità di ordini di magnitudine in confronto ai metodi esistenti;
  • genomica di popolazione a livello di ceppi metagenomica.
Please cite: Duy Tin Truong, Eric A Franzosa, Timothy L Tickle, Matthias Scholz, George Weingart, Edoardo Pasolli, Adrian Tett, Curtis Huttenhower and Nicola Segata: MetaPhlAn2 for enhanced metagenomic taxonomic profiling. (PubMed) Nature Methods 12(10):902–903 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
metastudent
strumento di predizione di termini Gene Ontology da sequenze proteiche
Versions of package metastudent
ReleaseVersionArchitectures
sid2.0.1-10all
jessie1.0.11-2all
bookworm2.0.1-9all
bullseye2.0.1-8all
stretch2.0.1-4all
buster2.0.1-6all
trixie2.0.1-10all
Popcon: 9 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Spesso è nota solo la sequenza di una proteina, ma non le sue funzioni. Metastudent cercherà di predire le annotazioni funzionali mancanti attraverso ricerche di omologia (BLAST).

Tutte le funzioni predette corrispondono a termini Gene Ontology (GO) da MFO (Molecular Function Ontology), BPO (Biological Process Ontology) e CCO (Cellular Component Ontology) e sono associati ad un punteggio di affidabilità.

Please cite: Tobias Hamp, Rebecca Kassner, Stefan Seemayer, Esmeralda Vicedo, Christian Schaefer, Dominik Achten, Florian Auer, Ariane Boehm, Tatjana Braun, Maximilian Hecht, Mark Heron, Peter Hönigschmid, Thomas A. Hopf, Stefanie Kaufmann, Michael Kiening, Denis Krompass, Cedric Landerer, Yannick Mahlich, Manfred Roos and Burkhard Rost: Homology-based inference sets the bar high for protein function prediction.. (PubMed) BMC Bioinformatics 14(Suppl 3):S7 (2013)
Registry entries: Bio.tools 
mhap
hash con sensibilità locale per rilevare sovrapposizioni di letture lunghe
Versions of package mhap
ReleaseVersionArchitectures
trixie2.1.3+dfsg-3all
sid2.1.3+dfsg-3all
bullseye2.1.3+dfsg-3all
stretch2.1.1+dfsg-1all
buster2.1.3+dfsg-2all
stretch-backports2.1.3+dfsg-1~bpo9+1all
bookworm2.1.3+dfsg-3all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

MinHash Alignment Process (MHAP, pronunciato MAP) è un'implementazione di riferimento di un algoritmo probabilistico per la sovrapposizione di sequenze. È progettato per rilevare in maniera efficiente tutte le sovrapposizioni tra letture lunghe in dati di sequenze con rumore. Stima in maniera efficiente la similarità di Jaccard comprimendo le sequenze nelle loro impronte digitali rappresentative composte su min-meri (minimi k-meri).

Please cite: Konstantin Berlin, Sergey Koren, Chen-Shan Chin, James P Drake, Jane M Landolin and Adam M Phillippy: Assembling large genomes with single-molecule sequencing and locality-sensitive hashing. (PubMed) Nature Biotechnology 33(6):623–630 (2015)
Registry entries: Bioconda 
microbegps
strumento di profilazione tassonomica esplorativa per dati metagenomici
Versions of package microbegps
ReleaseVersionArchitectures
sid1.0.0-6all
stretch1.0.0-2all
buster1.0.0-3all
bullseye1.0.0-5all
bookworm1.0.0-5all
trixie1.0.0-6all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

MicrobeGPS è uno strumento bioinformatico per l'analisi di dati di sequenziamento metagenomico. L'obiettivo è di profilare la composizione di comunità metagenomiche il più accuratamente possibile e di presentare i risultati all'utente in maniera comoda. Un obiettivo principale è l'affidabilità: lo strumento calcola metriche di qualità per i candidati stimati e permette all'utente di identificare facilmente i falsi candidati.

Please cite: Martin S. Lindner and Bernhard Y. Renard: Metagenomic Profiling of Known and Unknown Microbes with MicrobeGPS. (PubMed,eprint) PLoS One 10(2):e0117711 (2015)
Registry entries: Bio.tools 
microbiomeutil
utilità per analisi di microbioma
Versions of package microbiomeutil
ReleaseVersionArchitectures
trixie20101212+dfsg1-6all
stretch20101212+dfsg1-1all
bookworm20101212+dfsg1-5all
sid20101212+dfsg1-6all
bullseye20101212+dfsg1-4all
jessie20101212+dfsg-1all
buster20101212+dfsg1-2all
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Il pacchetto microbiomeutil contiene le seguenti utilità:

  • ChimeraSlayer: ChimeraSlayer per la rilevazione di chimere;
  • NAST-iEr: strumento di allineamento basato su NAST;
  • WigeoN: una reimplementazione dell'utilità Pintail di rilevamento delle anomalie 16S;
  • RESOURCES: sequenze 16S e allineamenti NAST di riferimento utilizzati dagli strumenti precedenti.
Please cite: Brian J. Haas, Dirk Gevers, Ashlee M. Earl, Mike Feldgarden, Doyle V. Ward, Georgia Giannoukos, Dawn Ciulla, Diana Tabbaa, Sarah K. Highlander, Erica Sodergren, Barbara Methé, Todd Z. DeSantis, The Human Microbiome Consortium, Joseph F. Petrosino, Rob Knight and Bruce W. Birren: Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. (PubMed,eprint) Genome Research 21(3):494-504 (2011)
Registry entries: SciCrunch 
mindthegap
performs detection and assembly of DNA insertion variants in NGS read datasets
Versions of package mindthegap
ReleaseVersionArchitectures
bullseye2.2.2-2amd64,arm64,i386,mips64el,ppc64el,s390x
bookworm2.3.0-2amd64,arm64,mips64el,ppc64el
sid2.3.0-4amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Designed to call insertions of any size, whether they are novel or duplicated, homozygous or heterozygous in the donor genome. It takes as input a set of reads and a reference genome. It outputs two sets of FASTA sequences: one is the set of breakpoints of detection insertion sites, the other is the set of assembled insertions for each breakpoint. MindTheGap can also be used as a genome assembly finishing tool. It can fill the gaps between a set of input contigs without any a priori on their relative order and orientation. It outputs the results in gfa file.

Registry entries: Bio.tools  Bioconda 
minexpert2
estrazione e visualizzazione di dati spettrometrici di massa MS^n (runtime)
Versions of package minexpert2
ReleaseVersionArchitectures
bullseye7.4.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm8.6.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid9.6.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie9.6.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

mineXpert2 permette all'utente di eseguire le seguenti attività:

  • aprire file di dati di spettrometria di massa (mzML, mzXML, asc, xy, ...);
  • visualizzare in una tabella l'intero insieme di dati, per un facile filtraggio;
  • calcolare e visualizzare il cromatogramma TIC;
  • calcolare e visualizzare una mappa di colori mz=f(rt);
  • per dati di mobilità, calcolare e visualizzare una mappa di colori mz=f(dt);
  • integrare i dati di spettrometria di massa da qualsiasi tipo di rappresentazione di dati (spettro di massa | drift, cromatogramma TIC | XIC, mappe di colori 2D) a qualsiasi altro tipo di rappresentazione di dati;
  • per qualsiasi caratteristica dei dati di massa (picco di massa, picco TIC | XIC, mappa di colore) integrare in un singolo valore di intensità XIC;
  • calcolare il cluster isotopico in maniera potente partendo da una formula chimica, opzionalmente con tassi di abbondanza isotopica definiti dall'utente;
  • fare il fit gaussiano su qualsiasi cluster isotopico per stimare la massa media di un dato ione;
  • fare la deconvoluzione di dati m/z guidata dal mouse (basata sull'inviluppo di carica o sul cluster isotopico);
  • esportare i dati in file di testo;
  • esportare la rappresentazione grafica dei dati spettrometrici di massa in file grafici in numerosi formati (jpg, png, pdf).

Questo pacchetto installa il programma mineXpert2.

Registry entries: Bio.tools 
minia
assemblatore di sequenze biologiche a letture corte
Versions of package minia
ReleaseVersionArchitectures
bookworm3.2.6-3amd64,arm64,mips64el,ppc64el
bullseye3.2.1+git20200522.4960a99-1amd64,arm64,i386,mips64el,ppc64el,s390x
stretch1.6906-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.6906-2amd64,arm64,armhf,i386
sid3.2.6-4amd64,arm64,mips64el,ppc64el,riscv64
jessie1.6088-1amd64,armel,armhf,i386
trixie3.2.6-4amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Fino all'anno 2020 ciò che veniva chiamato sequenziamento di DNA di prossima generazione ("next-generation") produceva solo letture "corte", fino a ~600 paia basi in lunghezza, che poi dovevano essere unite come un puzzle, mediante sovrapposizioni casuali nella loro sequenza, fino ad un genoma completo. Questo è l'assemblamento di un genoma. Ci sono molti tranelli biologici in lunghi tratti di regioni a bassa complessità e variazioni nel numero di copie e altri tipi di ridondanze che lo rendono difficile.

Questo pacchetto contiene un assemblatore di sequenze di DNA a letture corte basato su un grafo di de Bruijn, capace di assemblare un genoma umano su un computer desktop in un giorno.

L'output di Minia è un insieme di contig, cioè tratti di sovrapposizioni lineari di letture corte privi di gap. Nel migliore caso possibile è un intero cromosoma.

Minia produce risultati con contiguità e accuratezza simili ad altri assemblatori di de Bruijn (es. Velvet).

Please cite: Rayan Chikhi and Guillaume Rizk: Space-Efficient and Exact de Bruijn Graph Representation Based on a Bloom Filter.. (PubMed,eprint) Algorithms for Molecular Biology 8(1):22 (2013)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence assembly
miniasm
assemblatore de novo ultraveloce per letture lunghe di sequenze di DNA con rumore
Versions of package miniasm
ReleaseVersionArchitectures
buster0.3+dfsg-1amd64,arm64,armhf,i386
bullseye0.3+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.2+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Miniasm è un assemblatore de novo sperimentale molto veloce e basato su OLC per letture lunghe con rumore. Prende in input le automappature di letture tutti-contro-tutti (tipicamente da minimap) e produce in output un grafo di assemblaggio in formato GFA. A differenza dagli assemblatori più popolari, miniasm non ha un passaggio di consenso. Semplicemente concatena pezzi di sequenze di letture per generare le sequenze unitig finali. Perciò il tasso di errore per base è simile a quello delle letture grezze di input.

Registry entries: Bioconda 
Topics: Sequence assembly
minimac4
Fast Imputation Based on State Space Reduction HMM
Versions of package minimac4
ReleaseVersionArchitectures
buster1.0.0-2amd64
trixie4.1.6-1amd64
bookworm4.1.2-1amd64
bullseye1.0.2-2amd64
sid4.1.6-1amd64
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Minimac4 is a lower memory and more computationally efficient implementation of "minimac2/3". It is an algorithm for genotypic imputation that works on phased genotypes (say from MaCH).

Minimac4 is designed to handle very large reference panels in a more computationally efficient way with no loss of accuracy. This algorithm analyzes only the unique sets of haplotypes in small genomic segments, thereby saving on time-complexity, computational memory but no loss in degree of accuracy.

Please cite: Sayantan Das, Lukas Forer, Sebastian Schönherr, Carlo Sidore, Adam E Locke, Alan Kwong, Scott I Vrieze, Emily Y Chew, Shawn Levy, Matt McGue, David Schlessinger, Dwight Stambolian, Po-Ru Loh, William G Iacono, Anand Swaroop, Laura J Scott, Francesco Cucca, Florian Kronenberg, Michael Boehnke, Gonçalo R Abecasis and Christian Fuchsberger: Next-generation genotype imputation service and methods. Nature Genetics 48(10):1284-1287 (2016)
Registry entries: Bio.tools  SciCrunch 
minimap
strumento per mappatura approssimata di biosequenze lunghe come letture di DNA
Versions of package minimap
ReleaseVersionArchitectures
bookworm0.2-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.2-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.2-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.2-4amd64,arm64,armhf,i386
bullseye0.2-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.2-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Minimap è uno strumento sperimentale per trovare in modo efficiente posizioni di mappatura approssimate multiple tra due insiemi di lunghe sequenze biologiche, come tra letture di DNA e genomi di riferimento, tra genomi e tra lunghe letture con rumore. Minimap attualmente non genera allineamenti e pertanto è solitamente decine di volte più veloce degli strumenti di allineamento più popolari. Non rimpiazza tali strumenti, ma può essere utile quando si desidera identificare velocemente lunghe corrispondenze approssimate con divergenze moderate in una enorme raccolta di sequenze. Per questo compito è molto più veloce della maggior parte degli strumenti esistenti.

Please cite: Heng Li: Minimap and miniasm: fast mapping and de novo assembly for noisy long sequences. (eprint) Bioinformatics :2103-2110 (2016)
Registry entries: Bioconda 
Topics: Mapping
minimap2
allineatore a coppie versatile per sequenze genomiche e nucleotidiche con splice
Versions of package minimap2
ReleaseVersionArchitectures
sid2.27+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.15+dfsg-1amd64,i386
bullseye2.17+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.24+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.27+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch-backports2.15+dfsg-1~bpo9+1amd64,i386
upstream2.28
Popcon: 7 users (8 upd.)*
Newer upstream!
License: DFSG free
Git

Minimap2 è un versatile programma per l'allineamento di sequenze che allinea sequenze di DNA o mRNA rispetto a un grande database di riferimento. Casi d'uso tipici includono: (1) mappatura di letture genomiche PacBio o Oxford Nanopore con il genoma umano; (2) ricerca di sovrapposizioni tra letture lunghe con tassi di errore fino a ~15%; (3) allineamento, tenendo conto degli splice, di letture PacBio Iso-Seq o Nanopore cDNA o Direct RNA rispetto a un genoma di riferimento; (4) allineamento di letture Illumina singole o accoppiate; (5) allineamento assemblaggio-verso-assemblaggio; (6) allineamento dell'intero genoma tra due specie strettamente imparentate con divergenza sotto a ~15%.

Per sequenze di letture di circa 10kb con rumore, minimap2 è decine di volte più veloce dei mappatori di letture lunghe più comuni, come BLASR, BWA-MEM, NGMLR e GMAP. È più accurato su letture lunghe simulate e produce allineamenti biologicamente significativi pronti per le analisi successive. Per letture corte Illumina >100bp, minimap2 è tre volte più veloce di BWA-MEM e Bowtie2, e altrettanto accurato su dati simulati. Valutazioni dettagliate sono disponibili nell'articolo o il preprint su minimap2.

Please cite: Heng Li: Minimap2: pairwise alignment for nucleotide sequences. (PubMed,eprint) Bioinformatics :2103-2110 (2018)
Registry entries: Bioconda 
mipe
strumenti per archiviare dati derivanti da PCR
Versions of package mipe
ReleaseVersionArchitectures
bullseye1.1-9all
jessie1.1-4all
stretch1.1-5all
buster1.1-7all
bookworm1.1-9all
trixie1.1-9all
sid1.1-9all
Debtags of package mipe:
fieldbiology, biology:bioinformatics, biology:molecular
interfacecommandline
roledocumentation, program
scopeutility
useorganizing
works-with-formatxml
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

MIPE fornisce un formato standard per scambiare o archiviare, usando un file di testo semplice, tutte le informazioni associate ad esperimenti con PCR. Può:

  • permettere lo scambio di dati PCR tra ricercatori e laboratori,
  • rendere possibile la tracciabilità dei dati,
  • prevenire problemi in fase di invio dei dati a dbSTS o dbSNP,
  • rendere possibile la scrittura di script standard per estrarre dati (per esempio un elenco di primer per PCR, posizioni SNP o aplotipi per animali diversi).

Questo strumento, anche se può essere usato per l'archiviazione dei dati, è pensato principalmente per lo scambio dei dati. Per quantità di dati più grandi, i database relazionali sono più adatti alla archiviazione di questi dati. Il formato MIPE dovrebbe quindi essere usato come formato standard per importare dati in questi database o esportare da essi.

Please cite: Jan Aerts and T. Veenendaal: MIPE - a XML-format to facilitate the storage and exchange of PCR-related data. Online Journal of Bioinformatics 6(2):114-120 (2005)
Registry entries: SciCrunch 
mira-assembler
assemblatore di sequenze di genomi interi con metodo shotgun e di EST
Versions of package mira-assembler
ReleaseVersionArchitectures
bullseye4.9.6-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.9.6-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.9.6-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid4.9.6-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch4.9.6-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie4.0.2-1amd64,armel,armhf,i386
buster4.9.6-4amd64,arm64,armhf,i386
Debtags of package mira-assembler:
roleprogram
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

L'assemblatore di frammenti di genoma mira è un assemblatore specializzato per progetti di sequenziamento considerati "difficili" a causa di un alto numero di ripetizioni simili. Per i trascritti di EST (expressed sequence tag, etichette di sequenze espresse), miraEst è specializzato nel ricostruire trascritti originali di mRNA, al contempo rilevando e classificando polimorfismi di singoli nucleotidi (SNP) che vi appaiono in diverse variazioni.

L'assemblatore viene normalmente utilizzato per compiti vari quali la rilevazione di mutazioni in diversi tipi di cellule, analisi di somiglianza di trascritti tra organismi diversi e l'assemblaggio originale di sequenze da varie fonti per la progettazione di oligonucleotidi in esperimenti clinici con microarray.

Il pacchetto fornisce gli eseguibili elencati in seguito. Binari forniti:

  • mira: per assemblare sequenze genomiche;
  • miramem: stima la memoria necessaria per assemblare progetti;
  • mirabait: uno strumento in stile "grep" per selezionare letture con k-meri fino a 256 basi;
  • miraconvert: uno strumento per convertire, estrarre e, a volte, ricalcolare tutte i tipi di dati relativi ai file di assemblaggio di sequenze.
Please cite: Bastien Chevreux, Thomas Pfisterer, Bernd Drescher, Albert J. Driesel, Werner E. G. Müller, Thomas Wetter and Sándor Suhai: Using the miraEST Assembler for Reliable and Automated mRNA Transcript Assembly and SNP Detection in Sequenced ESTs. (PubMed,eprint) Genome Research 14(6):1147-1159 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mirtop
annotate miRNAs with a standard mirna/isomir naming
Versions of package mirtop
ReleaseVersionArchitectures
bookworm0.4.25-2all
sid0.4.28-1all
bullseye0.4.23-2all
trixie0.4.28-1all
Popcon: 0 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The main goal of this project is to create a reflection group on metazoan microRNAs (miRNAs), open to all interested researchers, to identify blockages and develop standards and guidelines to improve miRNA research, resources and communication. This can go through the use of standardized file formats, gene and variants nomenclature guidelines, and advancements in miRNA biology understanding. The group will eventually also aim at expanding its breadth to the development of novel tools, data resources, and best-practices guidelines to benefit the scientific community by providing high confidence validated research and analysis strategies, regardless the expertise in this field. This package provides the command line interface to mirtop.

The package is enhanced by the following packages: multiqc
Please cite: Thomas Desvignes, Karen Eilbeck, Ioannis S. Vlachos, Bastian Fromm, Yin Lu, Marc K. Halushka, Michael Hackenberg, Gianvito Urgese, Elisa Ficarra, Shruthi Bandyadka, Jason Sydes, Peter Batzel, John H. Postlethwait, Phillipe Loher, Eric Londin, Aristeidis G. Telonis, Isidore Rigoutsos and Lorena Pantano Rubino: miRTOP: An open source community project for the development of a unified format file for miRNA data [version 1; not peer reviewed]. (eprint) F1000Research 7(ISCB Comm. J.):953 (Slides) (2018)
Registry entries: Bio.tools  Bioconda 
mlv-smile
trova schemi statisticamente significativi in sequenze
Versions of package mlv-smile
ReleaseVersionArchitectures
buster1.47-6amd64,arm64,armhf,i386
stretch1.47-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.47-3amd64,armel,armhf,i386
sid1.47-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.47-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.47-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Smile determina motivi di sequenze sulla base di un insieme di sequenze di DNA, RNA o proteiche.

  • Nessun limite prefissato sul numero di combinazioni dei motivi per descrivere sottoinsiemi di sequenze.
  • L'alfabeto delle sequenze può essere specificato.
  • È gestito l'uso di caratteri jolly.
  • Migliore determinazione della significatività dei motivi grazie a simulazione.
  • Introduzione di un insieme di sequenze con controlli negativi che dovrebbero non corrispondere automaticamente a determinati motivi.
mmb
modella la struttura e la dinamica di macromolecole
Versions of package mmb
ReleaseVersionArchitectures
bullseye3.2+dfsg-2+deb11u1amd64,arm64,ppc64el
bookworm4.0.0+dfsg-2amd64,arm64
experimental4.0.0+dfsg-3.1~exp1amd64,arm64,armhf
trixie4.0.0+dfsg-4amd64,arm64
sid4.0.0+dfsg-4amd64,arm64
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MacroMoleculeBuilder, precedentemente conosciuto come RNABuilder, può essere usato per trasformazione, modellazione di omologie, ripiegamento (es. usando i contatti delle coppie di basi), ridisegno dei complessi, fit su mappe di densità a bassa risoluzione, predire riarrangiamenti locali in seguito a mutazione e molte altre applicazioni.

mmseqs2
raggruppamento in cluster e ricerca di proteine ultra-veloce e sensibile
Versions of package mmseqs2
ReleaseVersionArchitectures
trixie15-6f452+ds-2amd64,arm64,mips64el,ppc64el,riscv64
bullseye12-113e3+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bookworm14-7e284+ds-1amd64,arm64,mips64el,ppc64el
sid15-6f452+ds-2amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

MMseqs2 (ricerca di sequenze Many-against-Many, molti-contro-molti) è una suite software per cercare e fare cluster di enormi insiemi di sequenze proteiche/nucleotidiche. MMseqs2 è software open source con licenza GPL implementato in C++ per Linux, MacOS e (come versione beta attraverso cygwin) Windows. Il software è progettato per essere eseguito su core e server multipli e dimostra una scalabilità molto buona. L'esecuzione di MMseqs2 può essere 10.000 volte più veloce di BLAST. A 100 volte la sua velocità ottiene quasi la stessa sensibilità. Può effettuare ricerche di profili con la stessa sensibilità di PSI-BLAST a una velocità più di 400 volte superiore.

Please cite: Martin Steinegger and Johannes Söding: Clustering huge protein sequence sets in linear time. Nature Communications 9(1) (2018)
Registry entries: Bio.tools  Bioconda 
mosdepth
calcolo di profondità per BAM/CRAM per sequenziamenti biologici
Versions of package mosdepth
ReleaseVersionArchitectures
bookworm0.3.3+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye0.3.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid0.3.6+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
upstream0.3.9
Popcon: 0 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Le tecnologie di sequenziamento ad alte prestazioni di "prossima generazione" producono molte piccole letture. La sequenza finale deriva da come queste letture si sovrappongono verso un consenso. Più letture coprono/confermano parti di una sequenza nucleotidica, maggiore è la confidenza. Troppe letture indicherebbero, ad esempio, ripetizioni nel genoma.

mosdepth può produrre in output:

  • profondità per base circa 2 volte più velocemente di "samtools depth", circa 25 minuti di tempo di CPU per un genoma 30x;
  • profondità media per finestra data una dimensione di finestra, come utilizzato per l'identificazione di CNV;
  • media per regione dato un file BED con regioni;
  • distribuzione di proporzioni di basi coperte a o sopra un livello soglia per ciascun cromosoma e a livello di intero genoma;
  • output quantificato che unisce basi adiacenti fintanto che cadono nello stesso gruppo di copertura, es. 10-20;
  • output per soglia per indicare quante basi in ciascuna regione sono coperte alle soglie date. Quando appropriato i file di output sono compressi con bgzip e indicizzati per facilitare l'uso.
The package is enhanced by the following packages: multiqc
Please cite: Brent S Pedersen and Aaron R. Quinlan: Mosdepth: quick coverage calculation for genomes and exomes. (PubMed,eprint) Bioinformatics 34(5):867-868 (2018)
Registry entries: Bio.tools  Bioconda 
mothur
suite di analisi di sequenze per ricerche su microrganismi
Versions of package mothur
ReleaseVersionArchitectures
bullseye1.44.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.48.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.48.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.48.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.33.3+dfsg-2amd64,armel,armhf,i386
stretch1.38.1.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.41.21-1amd64,arm64,armhf,i386
upstream1.48.2
Debtags of package mothur:
roleprogram
Popcon: 2 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Mothur cerca di sviluppare un unico software open source, estensibile per soddisfare le necessità dei bioinformatici nel campo dell'ecologia microbica. Ha incorporate le funzionalità di dotur, sons, treeclimber, s-libshuff, unifrac e molto altro. In aggiunta a migliorare la flessibilità di questi algoritmi, sono state aggiunte svariate altre funzionalità inclusi strumenti di calcolo e visualizzazione.

Please cite: Patrick D Schloss, Sarah L Westcott, Thomas Ryabin, Justine R Hall, Martin Hartmann, Emily B Hollister, Ryan A Lesniewski, Brian B Oakley, Donovan H Parks, Courtney J Robinson, Jason W Sahl, Blaz Stres, Gerhard G Thallinger, David J Van Horn and Carolyn F Weber: Introducing mothur: Open-source, platform-independent, community-supported software for describing and comparing microbial communities. (PubMed) Appl Environ Microbiol 75(23):7537-7541 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Microbial ecology
mptp
single-locus species delimitation
Versions of package mptp
ReleaseVersionArchitectures
bullseye0.2.4-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.2.4-1amd64,arm64,armhf,i386
bookworm0.2.4-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.2.5-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.2.5-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Implementation of a fast species delimitation method, based on PTP (Zhang et al. 2013) with a 64-bit multi-threaded design that handles very large datasets.

The tool mPTP can handle very large biodiversity datasets. It implements a fast method to compute the ML delimitation from an inferred phylogenetic tree of the samples. Using MCMC, it also computes the support values for each clade, which can be used to assess the confidence of the ML delimitation.

ML delimitation mPTP implements two flavours of the point-estimate solution. First, it implements the original method from (Zhang et al. 2013) where all within-species processes are modelled with a single exponential distribution. mPTP uses a dynamic programming implementation which estimates the ML delimitation faster and more accurately than the original PTP. The dynamic programming implementation has similar properties as (Gulek et al. 2010). See the wiki for more information. The second method assumes a distinct exponential distribution for the branching events of each of the delimited species allowing it to fit to a wider range of empirical datasets.

MCMC method mPTP generates support values for each clades. They represent the ratio of the number of samples for which a particular node was in the between-species process, to the total number of samples.

Please cite: Paschalia Kapli, Sarah Lutteropp, Jiajie Zhang, Kassian Kobert, Pavlos Pavlidis, Alexandros Stamatakis and Tomas Flouri: Multi-rate Poisson Tree Processes for single-locus species delimitation under Maximum Likelihood and Markov Chain Monte Carlo. (PubMed,eprint) bioRxiv (2016)
mrbayes
inferenza bayesiana per filogenetica
Versions of package mrbayes
ReleaseVersionArchitectures
sid3.2.7a-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.2.7a-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.2.7a-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.2.7a-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.2.6+dfsg-2amd64,arm64,armhf,i386
stretch3.2.6+dfsg-1amd64,arm64,armhf,i386
jessie3.2.3+dfsg-1amd64,armel,armhf,i386
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

L'inferenza bayesiana per filogenetica è basata su una quantità chiamata la distribuzione di probabilità a posteriori degli alberi, che è la probabilità di un albero condizionata dalle osservazioni. Il condizionamento è realizzato usando il teorema di Bayes. Non è possibile calcolare analiticamente la distribuzione della probabilità a posteriori degli alberi; invece, MrBayes utilizza una tecnica di simulazione chiamata MCMC (Markov Chain Monte Carlo) per approssimare le probabilità a posteriori degli alberi.

The package is enhanced by the following packages: mrbayes-doc
Please cite: Fredrik Ronquist, Maxim Teslenko, Paul van der Mark, Daniel L. Ayres, Aaron Darling, Sebastian Höhna, Bret Larget, Liang Liu, Marc A. Suchard and John P. Huelsenbeck: MrBayes 3.2: Efficient Bayesian Phylogenetic Inference and Model Choice across a Large Model Space. (PubMed,eprint) Systematic Biology (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package mrbayes
multiqc
output integration for RNA sequencing across tools and samples
Versions of package multiqc
ReleaseVersionArchitectures
bookworm1.14+dfsg-1all
sid1.21+dfsg-2all
trixie1.21+dfsg-2all
bullseye1.9+dfsg-3all
upstream1.25.1
Popcon: 99 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

The sequencing of DNA or RNA with current high-throughput technologies involves an array of tools and these are applied over a range of samples. It is easy to loose oversight. And gathering the data and forwarding them in a readable manner to the individuals who took the samples is a challenge for a tool in itself. Well. Here it is. MultiQC aggregates the output of multiple tools into a single report.

Reports are generated by scanning given directories for recognised log files. These are parsed and a single HTML report is generated summarising the statistics for all logs found. MultiQC reports can describe multiple analysis steps and large numbers of samples within a single plot, and multiple analysis tools making it ideal for routine fast quality control.

Please cite: Philip Ewels, Måns Magnusson, Sverker Lundin and Max Käller: MultiQC: summarize analysis results for multiple tools and samples in a single report. (PubMed,eprint) Bioinformatics 31(19):3047-8 (2016)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mummer
Allineamento efficiente di sequenze di genomi completi
Versions of package mummer
ReleaseVersionArchitectures
bullseye3.23+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.23+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.23+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.23+dfsg-4amd64,arm64,armhf,i386
stretch3.23+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.23~dfsg-2amd64,armel,armhf,i386
sid3.23+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream4.0.0.~beta5
Debtags of package mummer:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 60 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

MUMmer è un sistema per allineare rapidamente interi genomi, sia in forma completa o in forma di bozza. Per esempio, MUMmer 3.0 può trovare tutte le corrispondenze esatte di 20 o più coppie di basi in un genoma di 5 milioni di basi in 13.7 secondi, usando 78MB di memoria su una macchina Linux desktop a 2.4 GHz. MUMmer può anche allineare genomi incompleti; gestisce con facilità le centinaia o migliaia di tratti contigui di un progetto di sequenziamento shotgun e li allinea con un altro insieme di contigui o con un genoma usando il programma NUCmer incluso nel sistema. Se le specie sono troppo divergenti per trovare una somiglianza nell'allineamento delle sequenze di DNA, allora il programma PROmer può generare allineamenti basati sulla traduzione dei sei moduli di lettura di entrambe le sequenze di input.

The package is enhanced by the following packages: e-mem
Please cite: Stefan Kurtz, Adam Phillippy, Arthur L. Delcher, Michael Smoot, Martin Shumway, Corina Antonescu and Steven L. Salzberg: Versatile and open software for comparing large genomes. (PubMed) Genome Biology 5(2):R12 (2004)
Registry entries: Bio.tools  Bioconda 
Topics: Sequence analysis
Screenshots of package mummer
murasaki
strumento per rilevazione di omologie tra più genomi vasti
Versions of package murasaki
ReleaseVersionArchitectures
buster1.68.6-8amd64,arm64,armhf,i386
stretch1.68.6-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.68.6-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.68.6-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.68.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.68.6-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Murasaki è uno strumento per la rilevazione di omologie in più genomi vasti veloce e basato sulla teoria del linguaggio. Permette allineamenti globali multipli di genomi su scala di intero genoma. Gestisce modelli di lunghezza illimitata con gap e seed e filtraggio unico basato su TF-IDF.

Murasaki è un software per allineamento ad ancore, che è

  • estremamente veloce (17 ore di CPU per l'intero genoma uomo x topo (con 40 nodi: 52 minuti di orologio))
  • scalabile (parallelizzabile a piacimento tra più nodi usando MPI. Anche un singolo nodo con 16 GB di RAM può gestire più di 1 Gpb di sequenza.)
  • con lunghezza illimitata dei modelli
  • tollerante alle ripetizioni
  • con riduzione intelligente del rumore
Please cite: Kris Popendorf, Hachiya Tsuyoshi, Yasunori Osana and Yasubumi Sakakibara: Murasaki: A Fast, Parallelizable Algorithm to Find Anchors from Multiple Genomes. (PubMed,eprint) PLOS one 5(9):e12651 (2010)
murasaki-mpi
strumento per rilevazione di omologie tra più genomi vasti (versione MPI)
Versions of package murasaki-mpi
ReleaseVersionArchitectures
bookworm1.68.6-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.68.6-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.68.6-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.68.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.68.6-8amd64,arm64,armhf,i386
bullseye1.68.6-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Murasaki è uno strumento per la rilevazione di omologie in più genomi vasti veloce e basato sulla teoria del linguaggio. Permette allineamenti globali multipli di genomi su scala di intero genoma. Gestisce modelli di lunghezza illimitata con gap e seed e filtraggio unico basato su TF-IDF.

Murasaki è un software per allineamento ad ancore, che è

  • estremamente veloce (17 ore di CPU per l'intero genoma uomo x topo (con 40 nodi: 52 minuti di orologio))
  • scalabile (parallelizzabile a piacimento tra più nodi usando MPI. Anche un singolo nodo con 16 GB di RAM può gestire più di 1 Gpb di sequenza.)
  • con lunghezza illimitata dei modelli
  • tollerante alle ripetizioni
  • con riduzione intelligente del rumore

Questo pacchetto fornisce il binario con gestione di MPI per murasaki. Mentre questo pacchetto velocizza le operazioni su macchine con più processori, rallenta quelle con un singolo processore.

Please cite: Kris Popendorf, Hachiya Tsuyoshi, Yasunori Osana and Yasubumi Sakakibara: Murasaki: A Fast, Parallelizable Algorithm to Find Anchors from Multiple Genomes. (PubMed,eprint) PLOS one 5(9):e12651 (2010)
muscle
programma per allineamenti multipli di sequenze proteiche
Versions of package muscle
ReleaseVersionArchitectures
trixie5.1.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch3.8.31+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid5.1.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.8.1551-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm5.1.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.8.1551-2amd64,arm64,armhf,i386
jessie3.8.31-1amd64,armel,armhf,i386
upstream5.3
Debtags of package muscle:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 15 users (10 upd.)*
Newer upstream!
License: DFSG free
Git

MUSCLE è un programma di allineamenti multipli di sequenze proteiche; il nome sta per MUltiple Sequence Comparison by Log-Expectation, confronto di sequenze multiple tramite log-expectation. Nei test fatti dagli autori, MUSCLE ha ottenuto i punteggi più alti tra tutti i programmi sottoposti a diversi benchmark per l'accuratezza degli allineamenti ed è anche uno dei programmi più veloci tra quelli disponibili.

Muscle v5 è una riscrittura con grandi modifiche di MUSCLE, basata su nuovi algoritmi.

Gli utenti dovrebbero considerare che gli argomenti della riga di comando sono cambiati rispetto alla versione 3.x di MUSCLE.

Maggiore accuratezza, scalabile a migliaia di sequenze

In confronto alle versioni precedenti, Muscle v5 è più accurato, è spesso più veloce e scalabile a insiemi di dati molto più grandi. Al momento della stesura di questo testo (fine 2021), Muscle v5 ha il più alto punteggio nei benchmark per allineamenti multipli, inclusi Balibase, Bralibase, Prefab e Balifam. Può allineare decine di migliaia di sequenze con alta accuratezza su un computer comune a basso costo (ad esempio una CPU Intel a 8 core con 32 GB di RAM). Su insiemi di dati più grandi, Muscle v5 è più accurato del 20-30% rispetto a MAFFT e Clustal-Omega.

Insiemi di allineamenti

Muscle v5 può generare insiemi di allineamenti alternativi ad alta accuratezza. Tutti i replicati hanno uguale accuratezza media nei test benchmark, incluso l'MSA fatto con i parametri predefiniti. Confrontando i risultati delle analisi successive (alberi, predizione di struttura, ...) su replicati diversi, si possono valutare gli effetti degli errori di allineamento sui propri studi.

Please cite: Robert C. Edgar: MUSCLE: multiple sequence alignment with high accuracy and high throughput. (PubMed,eprint) Nucleic Acids Research 32(5):1792-1797 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
Screenshots of package muscle
muscle3
programma per allineamenti multipli di sequenze proteiche
Versions of package muscle3
ReleaseVersionArchitectures
bookworm3.8.1551-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.8.1551-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid3.8.1551-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

MUSCLE è un programma di allineamenti multipli di sequenze proteiche; il nome sta per MUltiple Sequence Comparison by Log-Expectation, confronto di sequenze multiple tramite log-expectation. Nei test fatti dagli autori, MUSCLE ha ottenuto i punteggi più alti tra tutti i programmi sottoposti a diversi benchmark per l'accuratezza degli allineamenti ed è anche uno dei programmi più veloci tra quelli disponibili.

Questa è la versione 3 del programma MUSCLE. È un programma diverso da MUSCLE versione 5 che è pacchettizzato in Debian come muscle.

Please cite: Robert C. Edgar: MUSCLE: multiple sequence alignment with high accuracy and high throughput. (PubMed,eprint) Nucleic Acids Research 32(5):1792-1797 (2004)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
mustang
allineamento strutturale multiplo di proteine
Versions of package mustang
ReleaseVersionArchitectures
buster3.2.3-3amd64,arm64,armhf,i386
bullseye3.2.3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.2.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.2.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.2.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie3.2.2-1amd64,armel,armhf,i386
stretch3.2.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package mustang:
biologypeptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing, comparing
works-with-formatplaintext
Popcon: 11 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Mustang è un algoritmo per allineare strutture multiple di proteine. Dato un insieme di file PDB, il programma usa le informazioni spaziali negli atomi C-alfa dell'insieme per produrre un allineamento di sequenze. Basandosi su un metodo euristico progressivo basato su coppie, l'algoritmo compie in seguito un numero di passaggi di raffinamento. Mustang riporta l'allineamento di sequenze multiple e la corrispondente sovrapposizione di strutture.

The package is enhanced by the following packages: mustang-testdata
Please cite: Arun S. Konagurthu, James C. Whisstock, Peter J. Stuckey and Arthur M. Lesk: MUSTANG: A multiple structural alignment algorithm. (PubMed) Proteins: Structure, Function, and Bioinformatics 64(3):559-574 (2006)
Registry entries: Bio.tools 
Screenshots of package mustang
nanofilt
filtraggio e ritaglio di dati di sequenziamento con letture lunghe
Versions of package nanofilt
ReleaseVersionArchitectures
bullseye2.6.0-3all
sid2.8.0-1all
trixie2.8.0-1all
bookworm2.8.0-1all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Filtraggio e ritaglio di dati di sequenziamento con letture lunghe. Filtraggio in base a qualità o lunghezza delle letture e ritaglio opzionale dopo aver passato i filtri. Legge dallo stdin e scrive sullo stdout. Opzionalmente legge direttamente da un file non compresso specificato nella riga di comando.

Pensato per essere usato:

 1. direttamente dopo l'estrazione di fastq
 2. prima della mappatura
 3. in un flusso tra l'estrazione e la mappatura
Please cite: Wouter De Coster, Svenn D'Hert, Darrin T. Schultz and Christine Van Broeckhoven: NanoPack: visualizing and processing long-read sequencing data. Bioinformatics 34 (2018)
Registry entries: Bioconda 
nanolyse
rimuove le letture del fago lambda da un file fastq
Versions of package nanolyse
ReleaseVersionArchitectures
bookworm1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.2.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.0-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

NanoLyse è uno strumento per la rimozione rapida di DNA contaminante, che usa l'allineatore Minimap2 attraverso il collegamento Python mappy. Un'applicazione tipica è la rimozione del frammento di DNA di controllo del fago lambda fornito da ONT, per il quale è inclusa in questo pacchetto la sequenza di riferimento. Questo approccio, tuttavia, può portare a perdite non volute di letture da regioni altamente omologhe al genoma del fago lambda.

Please cite: Wouter De Coster, Svenn D’Hert, Darrin T Schultz, Marc Cruts and Christine Van Broeckhoven: NanoPack: visualizing and processing long-read sequencing data. (PubMed,eprint) Bioinformatics 34(15):2666-2669 (2018)
Registry entries: Bioconda 
nanook
analisi pre- e post-allineamento di dati di sequenziamento Nanopore
Versions of package nanook
ReleaseVersionArchitectures
bookworm1.33+dfsg-5all
trixie1.33+dfsg-5all
sid1.33+dfsg-5all
stretch-backports1.33+dfsg-1~bpo9+1all
buster1.33+dfsg-1all
bullseye1.33+dfsg-2.1all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

NanoOK è un software flessibile, multi-riferimento per analisi pre- e post-allineamento di dati di sequenziamento Nanopore, profili di errore e qualità.

NanoOK (pronunciato ne-nuc) è uno strumento per estrazione, allineamento e analisi di letture Nanopore. NanoOK estrae letture come file FASTA o FASTQ, le allinea (con una scelta di strumenti di allineamento), poi genera un esaustivo rapporto multipagina in PDF contenente analisi di resa, accuratezza e qualità. Durante il processo genera file in testo semplice che possono essere utilizzati per ulteriori analisi, oltre a grafi utilizzabili per l'inclusione in presentazioni ed articoli.

The package is enhanced by the following packages: nanook-examples
Please cite: Richard M. Leggett, Darren Heavens, Mario Caccamo, Matthew D. Clark and Robert P. Davey: NanoOK: multi-reference alignment analysis of nanopore sequencing data, quality and error profiles. (PubMed,eprint) Bioinformatics 32(1):142-144 (2016)
Registry entries: Bio.tools 
nanopolish
identificatore di sequenze di consenso per dati di sequenziamento a nanopori
Versions of package nanopolish
ReleaseVersionArchitectures
bullseye0.13.2-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.5.0-1amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
stretch-backports0.10.2-1~bpo9+1amd64
buster0.11.0-2amd64
bookworm0.14.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie0.14.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
sid0.14.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Nanopolish usa un modello di Markov nascosto segnale-livello per l'identificazione di sequenze di consenso di dati di sequenziamento a nanopori di genomi. Può eseguire l'analisi a livello di segnale di dati di sequenziamento Oxford Nanopore. Nanopolish può calcolare una sequenza di consenso migliorata per una bozza di assemblaggio genomico, rilevare modificazioni di basi, identificare SNP e indel in rapporto ad un genoma di riferimento e altro ancora.

Registry entries: Bio.tools  SciCrunch  Bioconda 
nanostat
statistiche su sequenze biologiche lunghe
Versions of package nanostat
ReleaseVersionArchitectures
bullseye1.4.0-3all
sid1.4.0-3all
bookworm1.4.0-3all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

NanoStat calcola varie statistiche da un insieme di dati di sequenziamento di sequenze lunghe nel formato riassuntivo per sequenziamenti albacore, fastq o bam. È pensato per migliorare le catene di elaborazione per l'interpretazione di lunghe sequenze di DNA come generate con Nanopore.

Questo pacchetto fornisce l'eseguibile NanoStat.

nanosv
structural variant caller for nanopore data
Versions of package nanosv
ReleaseVersionArchitectures
bookworm1.2.4+git20190409.c1ae30c-6all
sid1.2.4+git20190409.c1ae30c-6all
bullseye1.2.4+git20190409.c1ae30c-3all
trixie1.2.4+git20190409.c1ae30c-6all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

NanoSV is a software package that can be used to identify structural genomic variations in long-read sequencing data, such as data produced by Oxford Nanopore Technologies’ MinION, GridION or PromethION instruments, or Pacific Biosciences RSII or Sequel sequencers. NanoSV has been extensively tested using Oxford Nanopore MinION sequencing data.

Please cite: Mircea Cretu Stancu, Markus J. van Roosmalen, Ivo Renkens, Marleen M. Nieboer, Sjors Middelkamp, Joep de Ligt, Giulia Pregno, Daniela Giachino, Giorgia Mandrile, Jose Espejo Valle-Inclan, Jerome Korzelius, Ewart de Bruijn, Edwin Cuppen, Michael E. Talkowski, Tobias Marschall, Jeroen de Ridder and Wigard P. Kloosterman: Mapping and phasing of structural variation in patient genomes using nanopore sequencing.. (eprint) Nature Communications 8:1326 (2017)
Registry entries: Bioconda 
nast-ier
strumento per allineamento di DNA basato su NAST
Versions of package nast-ier
ReleaseVersionArchitectures
trixie20101212+dfsg1-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid20101212+dfsg1-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm20101212+dfsg1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye20101212+dfsg1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch20101212+dfsg1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster20101212+dfsg1-2amd64,arm64,armhf,i386
jessie20101212+dfsg-1amd64,armel,armhf,i386
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

L'utilità di allineamento NAST-iEr allinea una singola sequenza nucleotidica grezza con una o più sequenze in formato NAST.

L'algoritmo di allineamento comporta l'allineamento globale di profili mediante programmazione dinamica con sequenze modello fisse (in formato NAST) con allineamenti multipli, senza penalità per le lacune terminali.

NAST-iEr fa parte della suite microbiomeutil.

The package is enhanced by the following packages: microbiomeutil-data
Please cite: Brian J. Haas, Dirk Gevers, Ashlee M. Earl, Mike Feldgarden, Doyle V. Ward, Georgia Giannoukos, Dawn Ciulla, Diana Tabbaa, Sarah K. Highlander, Erica Sodergren, Barbara Methé, Todd Z. DeSantis, The Human Microbiome Consortium, Joseph F. Petrosino, Rob Knight and Bruce W. Birren: Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. (PubMed,eprint) Genome Research 21(3):494-504 (2011)
Registry entries: SciCrunch 
ncbi-acc-download
scarica file di genoma da NCBI per accession
Versions of package ncbi-acc-download
ReleaseVersionArchitectures
bullseye0.2.7-1all
bookworm0.2.8-1all
trixie0.2.8-3all
sid0.2.8-3all
upstream0.2.9
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Questo pacchetto fornisce uno script per scaricare sequenze da GenBank/RefSeq per accession tramite l'API NCBI ENTREZ.

Registry entries: Bioconda 
ncbi-blast+
suite di prossima generazione degli strumenti di ricerca di sequenze BLAST
Versions of package ncbi-blast+
ReleaseVersionArchitectures
buster2.8.1-1+deb10u1amd64,arm64,armhf,i386
stretch2.6.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch-backports-sloppy2.9.0-3~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster-backports2.9.0-4~bpo10+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie2.16.0+ds-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.11.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.12.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.2.29-3amd64,armel,armhf,i386
sid2.16.0+ds-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye-backports2.12.0+ds-3~bpo11+1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package ncbi-blast+:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
works-withbiological-sequence
Popcon: 49 users (24 upd.)*
Versions and Archs
License: DFSG free
Git

BLAST (Basic Local Alignment Search Tool) è lo strumento per similarità di sequenze più largamente usato. Ci sono versioni di BLAST che confrontano interrogazioni su proteine con database di proteine, interrogazioni su nucleotidi con database di nucleotidi, così come versioni che traducono interrogazioni o database di nucleotidi in tutte le sei griglie di lettura e li confrontano con database o interrogazioni su proteine. PSI-BLAST produce una PSSM (position-specific-scoring-matrix, matrice di punteggio posizione-specifica) a partire da un'interrogazione su proteina, e poi usa tale PSSM per effettuare ulteriori ricerche. È anche possibile confrontare un'interrogazione per proteina o nucleotidi in un database di PSSM. NCBI gestisce una pagina web per BLAST su blast.ncbi.nlm.nih.gov così come un servizio in rete.

Registry entries: Bio.tools  SciCrunch  Bioconda 
ncbi-blast+-legacy
script per vecchia chiamata a NCBI Blast
Versions of package ncbi-blast+-legacy
ReleaseVersionArchitectures
trixie2.16.0+ds-6all
jessie2.2.29-3all
bookworm2.12.0+ds-3all
stretch-backports-sloppy2.9.0-3~bpo9+1all
sid2.16.0+ds-6all
buster2.8.1-1+deb10u1all
bullseye-backports2.12.0+ds-3~bpo11+1all
stretch2.6.0-1all
bullseye2.11.0+ds-1all
buster-backports2.9.0-4~bpo10+1all
Debtags of package ncbi-blast+-legacy:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
Popcon: 21 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto aggiunge alcuni script fasulli per chiamare programmi NCBI+ con le righe di comando per NCBI blast. Fa uso dello script legacy_blast nel pacchetto ncbi-blast+.

Registry entries: Bio.tools  SciCrunch  Bioconda 
ncbi-entrez-direct
NCBI Entrez utilities on the command line
Versions of package ncbi-entrez-direct
ReleaseVersionArchitectures
bookworm19.0.20230216+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster10.9.20190219+ds-1amd64,arm64,armhf,i386
stretch6.10.20170123+ds-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid19.2.20230331+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye14.6.20210224+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie19.2.20230331+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream23.0.20241028
Popcon: 6 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

Entrez Direct (EDirect) is an advanced method for accessing NCBI's set of interconnected databases (publication, sequence, structure, gene, variation, expression, etc.) from a terminal window or script. Functions take search terms from command-line arguments. Individual operations are combined to build multi-step queries. Record retrieval and formatting normally complete the process.

EDirect also provides an argument-driven function that simplifies the extraction of data from document summaries or other results that are returned in structured XML format. This can eliminate the need for writing custom software to answer ad hoc questions. Queries can move seamlessly between EDirect commands and UNIX utilities or scripts to perform actions that cannot be accomplished entirely within Entrez.

ncbi-epcr
strumento per testare la presenza di STS in sequenze di DNA
Versions of package ncbi-epcr
ReleaseVersionArchitectures
bookworm2.3.12-1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.3.12-1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.3.12-1-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.3.12-1-7amd64,arm64,armhf,i386
stretch2.3.12-1-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.3.12-1-2amd64,armel,armhf,i386
bullseye2.3.12-1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package ncbi-epcr:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usechecking, searching
works-with-formatplaintext
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

La PCR elettronica (e-PCR) è una procedura computazionale usata per identificare STS (sequence tagged site) all'interno di sequenze di DNA. e-PCR cerca STS potenziali nel DNA ricercando sottosequenze che corrispondano da vicino ai primer PCR e che abbiano ordine, orientamento e spaziatura corretti tali da poter rappresentare i primer PCR usati per generare STS noti.

La nuova versione di e-PCR implementa una strategia di corrispondenza approssimata. Per ridurre la probabilità che una STS esatta possa essere non vista a causa di corrispondenze inesatte, si possono usare parole non contigue invece di una singola parola esatta. Ognuna di queste parole ha gruppi di posizioni significative separate da posizioni "jolly" che non è necessario corrispondano. In aggiunta è anche possibile permettere dei salti negli allineamenti dei primer.

La principale motivazione per implementare la ricerca inversa (chiamata Reverse e-PCR) fu quella di rendere possibile fare ricerche nella sequenza del genoma umano o in altri genomi grandi. La nuova versione di e-PCR fornisce una modalità di ricerca che confronta una sequenza di interrogazione e un database di sequenze.

Questo programma è stato ritirato dall'autore originale e si suggerisce di usare Primer-Blast https://www.ncbi.nlm.nih.gov/tools/primer-blast/ al suo posto.

Please cite: Gregory D. Schuler: Sequence Mapping by Electronic PCR. (PubMed,eprint) Genome Research 7(5):541-550 (1997)
Registry entries: Bioconda 
ncbi-seg
strumento per mascherare segmenti con bassa complessità composizionale in sequenze di amminoacidi
Versions of package ncbi-seg
ReleaseVersionArchitectures
buster0.0.20000620-5amd64,arm64,armhf,i386
jessie0.0.20000620-2amd64,armel,armhf,i386
stretch0.0.20000620-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.0.20000620-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.0.20000620-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.0.20000620-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.0.20000620-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ncbi-seg (alias SEG) è un programma per identificare e mascherare segmenti con bassa complessità composizionale in sequenze di amminoacidi.

ncbi-seg divide le sequenze in segmenti contrastanti con bassa complessità e alta complessità. I segmenti con bassa complessità definiti dall'algoritmo rappresentano "sequenze semplici" o "regioni con bias composizionale".

Questo programma è inappropriato per mascherare sequenze di nucleotidi e, infatti, può rimuovere alcuni codici di ambiguità da sequenze di nucleotidi mentre vengono lette.

Please cite: John C. Wootton and Scott Federhen: Statistics of local complexity in amino acid sequences and sequence databases.. Computers & Chemistry 17:149-163 (1993)
ncbi-tools-bin
librerie NCBI per applicazioni biologiche (utilità testuali)
Versions of package ncbi-tools-bin
ReleaseVersionArchitectures
sid6.1.20170106+dfsg2-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie6.1.20170106+dfsg2-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm6.1.20170106+dfsg1-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye6.1.20170106+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster6.1.20170106+dfsg1-0+deb10u2amd64,arm64,armhf,i386
stretch6.1.20170106+dfsg1-0+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie6.1.20120620-8amd64,armel,armhf,i386
Debtags of package ncbi-tools-bin:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
networkclient
roleprogram
sciencecalculation
scopeutility
useanalysing, calculating, converting, searching
works-withbiological-sequence
works-with-formatplaintext, xml
Popcon: 6 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto include varie utilità distribuite con l'SDK C NCBI, inclusi gli strumenti di sviluppo asntool e errhdr (prima in libncbi6-dev). Nessuno dei programmi in questo pacchetto richiede X, si possono trovare le utilità basate su X nel pacchetto ncbi-tools-x11. BLAST e gli strumenti correlati provengono ora da codice sorgente separato, corrispondente ai pacchetti ncbi-blast+ e ncbi-blast+-legacy.

The package is enhanced by the following packages: mcl
Registry entries: Bio.tools  SciCrunch 
ncbi-tools-x11
librerie NCBI per applicazioni biologiche (utilità basate su X)
Versions of package ncbi-tools-x11
ReleaseVersionArchitectures
jessie6.1.20120620-8amd64,armel,armhf,i386
trixie6.1.20170106+dfsg2-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid6.1.20170106+dfsg2-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm6.1.20170106+dfsg1-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch6.1.20170106+dfsg1-0+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye6.1.20170106+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster6.1.20170106+dfsg1-0+deb10u2amd64,arm64,armhf,i386
Debtags of package ncbi-tools-x11:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics, biology:structural
interface3d, x11
networkclient
roleprogram
sciencevisualisation
scopeutility
uitoolkitmotif
useanalysing, calculating, editing, searching, viewing
x11application
Popcon: 4 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto include alcune utilità basate su X e distribuite con l'SDK C di NCBI: Network Entrez, Sequin, ddv e udv. Questi programmi non sono inclusi in ncbi-tools-bin perché dipendono da svariati pacchetti aggiuntivi di librerie.

Registry entries: Bio.tools  SciCrunch 
Screenshots of package ncbi-tools-x11
ncl-tools
strumenti per lavorare con file NEXUS
Versions of package ncl-tools
ReleaseVersionArchitectures
sid2.1.21+git20210811.b1213a7-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.1.18+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1.21+git20180827.c71b264-2amd64,arm64,armhf,i386
bullseye2.1.21+git20190531.feceb81-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.1.21+git20210811.b1213a7-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.1.21+git20210811.b1213a7-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream2.1.21+git20231019.f845ec2
Popcon: 2 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

NEXUS Class Library è una libreria C++ per analizzare file NEXUS.

Il formato di file NEXUS è ampiamente utilizzato in bioinformatica. Usano questo formato diversi programmi popolari di filogenetica come Paup, MrBayes, Mesquite e MacClade.

Please cite: Paul O. Lewis: NCL: a C++ class library for interpreting data files in NEXUS format. (PubMed,eprint) Bioinformatics 19(17):2330-2331 (2003)
ncoils
predizione della struttura secondaria di una spirale superavvolta
Versions of package ncoils
ReleaseVersionArchitectures
trixie2002-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2002-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2002-4amd64,armel,armhf,i386
sid2002-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2002-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2002-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2002-7amd64,arm64,armhf,i386
Popcon: 9 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Il programma predice la struttura secondaria di una spirale superavvolta da sequenze proteiche. L'algoritmo è stato pubblicato in Lupas, van Dyke & Stock, Predicting coiled coils from protein sequences, Science, 252, 1162-1164, 1991.

Please cite: Andrei Lupas, Marc Van Dyke and Jeff Stock: Predicting coiled coils from protein sequences. (PubMed) Science 252:1162-1164 (1991)
Registry entries: Bio.tools  SciCrunch 
neobio
calcola allineamenti di sequenze di nucleotidi e aminoacidi
Versions of package neobio
ReleaseVersionArchitectures
sid0.0.20030929-6all
jessie0.0.20030929-1.1all
stretch0.0.20030929-2all
buster0.0.20030929-4all
bullseye0.0.20030929-6all
bookworm0.0.20030929-6all
trixie0.0.20030929-6all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Liberia e interfaccia utente grafica per allineamenti di coppie di sequenze. Implementazione dei metodi di programmazione dinamica di Needleman & Wunsch (allineamento globale) e Smith & Waterman (allineamento locale).

Please cite: Maxime Crochemore, Gad M. Landau and Michal Ziv-Ukelson: A sub-quadratic sequence alignment algorithm for unrestricted cost matrices. :679-688 (2002)
Registry entries: Bio.tools 
Screenshots of package neobio
ngmlr
CoNvex Gap-cost alignMents for Long Reads
Versions of package ngmlr
ReleaseVersionArchitectures
experimental0.2.7+git20210816.a2a31fb+dfsg-4~0exp0simdeamd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.2.7+git20210816.a2a31fb+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.2.7+git20210816.a2a31fb+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.2.7+git20210816.a2a31fb+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.2.7+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Ngmlr is a long-read mapper designed to sensitively align PacBilo or Oxford Nanopore to (large) reference genomes. It was designed to quickly and correctly align the reads, including those spanning (complex) structural variations. Ngmlr uses an SV aware k-mer search to find approximate mapping locations for a read and then a banded Smith- Waterman alignment algorithm to compute the final alignment. Ngmlr uses a convex gap cost model that penalizes gap extensions for longer gaps less than for shorter ones to compute precise alignments.

Please cite: Fritz J. Sedlazeck, Philipp Rescheneder, Moritz Smolka, Han Fang, Maria Nattestad, Arndt von Haeseler and Michael C. Schatz: Accurate detection of complex structural variations using single-molecule sequencing. Nature Methods 15:461–468 (2018)
Registry entries: Bio.tools  SciCrunch  Bioconda 
njplot
programma per disegnare alberi filogenetici
Versions of package njplot
ReleaseVersionArchitectures
sid2.4-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.4-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.4-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.4-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4-8amd64,arm64,armhf,i386
bullseye2.4-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.4-2amd64,armel,armhf,i386
Debtags of package njplot:
fieldbiology, biology:bioinformatics
interfacex11
roleprogram
scopeutility
uitoolkitmotif
useanalysing, editing, organizing, printing, viewing
works-withbiological-sequence
works-with-formatplaintext
x11application
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

NJplot è in grado di disegnare qualsiasi dendrogramma espresso nel formato standard dell'albero filogenetico di Newick, ad esempio il formato usato dal pacchetto Phylip. È particolarmente adatto per radicare gli alberi senza radici ottenuti con i metodi basati su parsimonia, distanza o la massima verosimiglianza.

Please cite: G. Perrière and M. Gouy: WWW-query: An on-line retrieval system for biological sequence banks. (PubMed) Biochimie 78(5):364–369 (1996)
Registry entries: Bio.tools 
Screenshots of package njplot
norsnet
tool to identify unstructured loops in proteins
Versions of package norsnet
ReleaseVersionArchitectures
sid1.0.17-7all
stretch1.0.17-2all
jessie1.0.17-1all
trixie1.0.17-7all
bookworm1.0.17-7all
bullseye1.0.17-6all
buster1.0.17-4all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

NORSnet can distinguish between very long contiguous segments with non-regular secondary structure (NORS regions) and well-folded proteins.

NORSnet was trained on predicted information rather than on experimental data. This allows NORSnet to reach into regions in sequence space that are not covered by specialized disorder predictors. One disadvantage of this approach is that it is not optimal for the identification of the "average" disordered region.

NORSnet takes the following input, further described on norsnet(1):

  • a protein sequence in a FASTA file
  • secondary structure and solvent accessibility prediction by prof(1)
  • an HSSP file
  • flexible/rigid residues prediction by profbval(1)
Please cite: Avner Schlessinger, Jinfeng Liu and Burkhard Rost: Natively unstructured loops differ from other loops.. (PubMed,eprint) PLoS Comput Biol. 3:e140 (2007)
Registry entries: Bio.tools 
norsp
predictor of non-regular secondary structure
Versions of package norsp
ReleaseVersionArchitectures
stretch1.0.6-2all
trixie1.0.6-7all
jessie1.0.6-1all
bookworm1.0.6-7all
bullseye1.0.6-6all
sid1.0.6-7all
buster1.0.6-4all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

NORSp is a publicly available predictor for disordered regions in proteins. Specifically, it predicts long regions with no regular secondary structure. Upon submission of a protein sequence, NORSp analyses the protein about its secondary structure, the presence of transmembrane helices and coiled-coils. It then returns the presence and position of disordered regions.

NORSp can be useful for biologists in several ways. For example, crystallographers can check whether their proteins contain NORS regions and make the decision about whether to proceed with the experiments since NORS proteins may be difficult to crystallise, as demonstrated by the their low occurrence in PDB. Biologists interested in protein structure-function relationship may also find it interesting to verify whether the protein-protein interaction sites coincide with NORS regions.

Please cite: Jinfeng Liu and Burkhard Rost: NORSp: Predictions of long regions without regular secondary structure.. (PubMed,eprint) Nucleic Acids Res 31(13):3833-3835 (2003)
Registry entries: Bio.tools 
ntcard
algoritmo in streaming per stimare la cardinalità in insiemi di dati genomici
Versions of package ntcard
ReleaseVersionArchitectures
bookworm1.2.2+dfsg-5amd64,arm64,mips64el,ppc64el
sid1.2.2+dfsg-9amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.2.2+dfsg-9amd64,arm64,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Come input accetta file nei formati FASTA, FASTQ, SAM o BAM e calcola il numero totale di k-meri distinti, F0, e anche l'istogramma della frequenza di copertura dei k-meri, fi, i>=1.

Please cite: Hamid Mohamadi, Hamza Khan and Inanc Birol: ntCard: a streaming algorithm for cardinality estimation in genomics data. (PubMed,eprint) Bioinformatics 33(9):1324-1330 (2017)
Registry entries: Bio.tools  Bioconda 
nxtrim
trimming ottimizzato di letture Illumina Mate Pair
Versions of package nxtrim
ReleaseVersionArchitectures
bookworm0.4.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.4.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.4.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto aiuta a rimuovere adattatori di giunzione di Nextera Mate Pair e a categorizzare le letture secondo l'orientamento derivante dalla posizione dell'adattatore.

Registry entries: Bio.tools  Bioconda 
obitools
programmi per analizzare dati NGS in un contesto di DNA meta-barcoding
Versions of package obitools
ReleaseVersionArchitectures
buster1.2.12+dfsg-2amd64
bullseye1.2.13+dfsg-3amd64
bookworm1.2.13+dfsg-5amd64
trixie1.2.13+dfsg-9amd64
sid1.2.13+dfsg-9amd64
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

I programmi OBITools hanno lo scopo di aiutare a manipolare vari file di dati e sequenze in maniera comoda usando l'interfaccia a riga di comando Unix. Essi seguono l'interfaccia a riga di comando Unix standard, permettendo di concatenare un insieme di comandi usando il meccanismo delle pipe.

Please cite: Frédéric Boyer, Céline Mercier, Aurélie Bonin, Yvan Le Bras, Pierre Taberlet and Eric Coissac: obitools: a unix-inspired software package for DNA metabarcoding.. (PubMed,eprint) Mol. Ecol. Resour. 16(1):176-182 (2016)
Registry entries: Bio.tools  Bioconda 
openms
pacchetto per gestione ed analisi di dati LC/MS
Versions of package openms
ReleaseVersionArchitectures
sid2.6.0+cleaned1-4all
buster2.4.0-real-1all
jessie1.11.1-5all
bookworm2.6.0+cleaned1-3all
bullseye2.6.0+cleaned1-3all
trixie2.6.0+cleaned1-4all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

OpenMS è un pacchetto per gestione ed analisi di dati LC/MS. OpenMS offre un'infrastruttura per lo sviluppo di software relativo alla spettrometria di massa e potenti soluzioni per la visualizzazione 2D e 3D.

TOPP (OpenMS proteomic pipeline) è una catena di strumenti per l'analisi di dati HPLC/MS. Consiste di un insieme di numerose piccole applicazioni che possono essere concatenate insieme per creare catene di analisi su misura per un problema specifico.

Questo è un metapacchetto che dipende sia dal pacchetto delle librerie libopenms (libOpenMS e libOpenMS_GUI), sia dal pacchetto dell'OpenMS Proteomic Pipeline (topp).

Please cite: Marc Sturm, Andreas Bertsch, Clemens Gröpl, Andreas Hildebrandt, Rene Hussong, Eva Lange, Nico Pfeifer, Ole Schulz-Trieglaff, Alexandra Zerck, Knut Reinert and Oliver Kohlbacher: OpenMS – an Open-Source Software Framework for Mass Spectrometry. (PubMed,eprint) BMC Bioinformatics 9(163) (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package openms
optimir
Integrating genetic variations in miRNA alignment
Versions of package optimir
ReleaseVersionArchitectures
bookworm1.2-1all
sid1.2-2all
trixie1.2-2all
bullseye1.0-3all
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

OptimiR is a miRSeq data alignment workflow. It integrates genetic information to assess the impact of variants on miRNA expression.

OptimiR: A bioinformatics pipeline designed to detect and quantify miRNAs, isomiRs and polymiRs from miRSeq data, & study the impact of genetic variations on polymiRs' expression.

Please cite: Florian Thibord, Claire Perret, Maguelonne Roux, Pierre Suchon, Marine Germain, Jean-François Deleuze, Pierre-Emmanuel Morange and David-Alexandre Trégouët: OPTIMIR, a novel algorithm for integrating available genome-wide genotype data into miRNA sequence alignment analysis. RNA (2019)
Registry entries: Bio.tools  Bioconda 
pal2nal
converts proteins to genomic DNA alignment
Versions of package pal2nal
ReleaseVersionArchitectures
buster14.1-2all
bullseye14.1-3all
sid14.1-3all
trixie14.1-3all
bookworm14.1-3all
Popcon: 7 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

PAL2NAL is a program that converts a multiple sequence alignment of proteins and the corresponding DNA (or mRNA) sequences into a codon-based DNA alignment. The program automatically assigns the corresponding codon sequence even if the input DNA sequence has mismatches with the input protein sequence, or contains UTRs, polyA tails. It can also deal with frame shifts in the input alignment, which is suitable for the analysis of pseudogenes. The resulting codon-based DNA alignment can further be subjected to the calculation of synonymous (Ks) and non-synonymous (Ka) substitution rates.

Please cite: Mikita Suyama, David Torrents and Peer Bork: PAL2NAL: robust conversion of protein sequence alignment into the corresponding codon alignments. (PubMed,eprint) Nucleic Acids Research 34:W609-W612 (2006)
Registry entries: Bio.tools  Bioconda 
paleomix
pipelines and tools for the processing of ancient and modern HTS data
Versions of package paleomix
ReleaseVersionArchitectures
trixie1.3.8-2amd64,arm64
bookworm1.3.7-3amd64,arm64
buster1.2.13.3-1amd64
sid1.3.8-2amd64,arm64
bullseye1.3.2-1amd64,arm64,mips64el,ppc64el
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The PALEOMIX pipelines are a set of pipelines and tools designed to aid the rapid processing of High-Throughput Sequencing (HTS) data: The BAM pipeline processes de-multiplexed reads from one or more samples, through sequence processing and alignment, to generate BAM alignment files useful in downstream analyses; the Phylogenetic pipeline carries out genotyping and phylogenetic inference on BAM alignment files, either produced using the BAM pipeline or generated elsewhere; and the Zonkey pipeline carries out a suite of analyses on low coverage equine alignments, in order to detect the presence of F1-hybrids in archaeological assemblages. In addition, PALEOMIX aids in metagenomic analysis of the extracts.

The pipelines have been designed with ancient DNA (aDNA) in mind, and includes several features especially useful for the analyses of ancient samples, but can all be for the processing of modern samples, in order to ensure consistent data processing.

Please cite: Mikkel Schubert, Luca Ermini, Clio Der Sarkissian, Hákon Jónsson, Aurélien Ginolhac, Robert Schaefer, Michael D Martin, Ruth Fernández, Martin Kircher, Molly McCue, Eske Willerslev and Ludovic Orlando: Characterization of ancient and modern genomes by SNP detection and phylogenomic and metagenomic analysis using PALEOMIX. (PubMed) Nature Protocols 9(5):1056-82 (2014)
Registry entries: Bio.tools  SciCrunch 
paml
PAML (Phylogenetic Analysis by Maximum Likelihood)
Versions of package paml
ReleaseVersionArchitectures
sid4.9j+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie4.8+dfsg-1 (non-free)amd64
stretch4.8+dfsg-1 (non-free)amd64
buster4.9h+dfsg-1amd64,arm64,armhf,i386
bullseye4.9j+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.9j+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.9j+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package paml:
roleprogram
Popcon: 10 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

PAML è un pacchetto di programmi per analisi filogenetiche di sequenze di DNA o proteiche usando la massima verosimiglianza. PAML non è adatto per la creazione di alberi. Può essere utile per stimare parametri e testare ipotesi per studiare il processo evolutivo, quando si sono ricostruiti alberi usando altri programmi, come PAUP*, PHYLIP, MOLPHY, PhyML, RaxML, ecc.

Please cite: Ziheng Yang: PAML 4: phylogenetic analysis by maximum likelihood. (PubMed,eprint) Molecular Biology and Evolution 24(8):1586-91 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
paraclu
raggruppamento in cluster parametrico di caratteristiche genomiche e transcrittomiche
Versions of package paraclu
ReleaseVersionArchitectures
trixie10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster9-2amd64,arm64,armhf,i386
bullseye9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm10-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch9-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie9-1amd64,armel,armhf,i386
sid10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

paraclu trova i cluster in dati associati a sequenze. È stato per la prima volta applicato ai conteggi degli inizi di trascrizione in sequenze genomiche, ma può essere applicato anche ad altre cose.

paraclu è pensato per esplorare i dati, imporre assunti a priori minimi e permettere ai dati di parlare da soli.

Una conseguenza di tutto ciò è che paraclu può trovare cluster all'interno di cluster. I dati reali a volte mostrano raggruppamenti in cluster a più livelli: possono esserci grandi cluster poco addensati e all'interno di ognuno di essi possono esserci piccoli cluster molto addensati.

Please cite: Martin C. Frith, Eivind Valen, Anders Krogh, Yoshihide Hayashizaki, Piero Carninci and Albin Sandelin: A code for transcription initiation in mammalian genomes. (eprint) Genome Research 18(1):1-12 (2008)
parasail
allineatore basato su libparasail
Versions of package parasail
ReleaseVersionArchitectures
trixie2.6.2+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.6.2+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.6+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.4.3+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto contiene un allineatore a riga di comando basato su libparasail. Parasail è una libreria C SIMD contenente implementazioni degli algoritmi Smith-Waterman, Needleman-Wunsch e vari algoritmi per allineamento di sequenze a coppie semi-globali.

parsinsert
INSERimenTo PARSimonioso di sequenze non classificate in alberi filogenetici
Versions of package parsinsert
ReleaseVersionArchitectures
jessie1.04-1amd64,armel,armhf,i386
buster1.04-4amd64,arm64,armhf,i386
trixie1.04-15amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
stretch1.04-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.04-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.04-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.04-15amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ParsInsert produce in modo efficiente tanto un albero filogenetico quanto una classificazione tassonomica di sequenze nell'analisi di sequenze di comunità microbiche. È un'implementazione C++ dell'algoritmo "Parsimonious Insertion".

The package is enhanced by the following packages: parsinsert-testdata
parsnp
allineamenti multipli rapidi del genoma fondamentale
Versions of package parsnp
ReleaseVersionArchitectures
trixie2.0.6+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.7.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.0.6+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.2+dfsg-5amd64,arm64,armhf,i386
stretch1.2+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.5.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Parsnp è stato progettato per allineare il genoma fondamentale da centinaia a migliaia di genomi batterici entro pochi minuti o poche ore. L'input può essere sia assemblaggi in bozza, sia genomi finiti, e l'output include identificazione di varianti (SNP), filogenia del genoma fondamentale e allineamenti multipli. Parsnp sfrutta le informazioni contestuali fornite dagli allineamenti multipli intorno ai siti SNP per filtraggio/pulizia, in aggiunta agli strumenti esistenti per rilevamento/filtraggio di ricombinazioni e ricostruzione filogenetica.

Please cite: Todd J. Treangen, Brian D. Ondov, Sergey Koren and Adam M. Phillippy: The Harvest suite for rapid core-genome alignment and visualization of thousands of intraspecific microbial genomes. (PubMed,eprint) Genome Biology 15(11):524 (2014)
Registry entries: Bioconda 
patman
allineamento rapido di sequenze corte con vasti database
Versions of package patman
ReleaseVersionArchitectures
buster1.2.2+dfsg-5amd64,arm64,armhf,i386
bullseye1.2.2+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.2+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.2+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.2.2+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Patman cerca modelli corti in grandi database di DNA, permettendo corrispondenze approssimate. È ottimizzato per cercare molti modelli corti contemporaneamente, per esempio sonde per microarray.

Please cite: Kay Prüfer, Udo Stenzel, Michael Dannemann, Richard E Green, Michael Lachmann and Janet Kelso: PatMaN: rapid alignment of short sequences to large databases. (PubMed,eprint) Bioinformatics 24(13):1530-1 (2008)
Registry entries: Bio.tools  SciCrunch 
pbdagcon
sequence consensus using directed acyclic graphs
Versions of package pbdagcon
ReleaseVersionArchitectures
bookworm0.3+git20180411.c14c422+dfsg-8amd64,arm64,mips64el,ppc64el
bullseye0.3+git20180411.c14c422+dfsg-1amd64,arm64,mips64el,ppc64el
buster0.3+git20161121.0000000+ds-1.1amd64,arm64
sid0.3+git20180411.c14c422+dfsg-9amd64,arm64,mips64el,ppc64el,riscv64
stretch0.3+20161121+ds-1amd64,arm64,mips64el,ppc64el
trixie0.3+git20180411.c14c422+dfsg-9amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

pbdagcon is a tool that implements DAGCon (Directed Acyclic Graph Consensus) which is a sequence consensus algorithm based on using directed acyclic graphs to encode multiple sequence alignment.

It uses the alignment information from blasr to align sequence reads to a "backbone" sequence. Based on the underlying alignment directed acyclic graph (DAG), it will be able to use the new information from the reads to find the discrepancies between the reads and the "backbone" sequences. A dynamic programming process is then applied to the DAG to find the optimum sequence of bases as the consensus. The new consensus can be used as a new backbone sequence to iteratively improve the consensus quality.

While the code is developed for processing PacBio(TM) raw sequence data, the algorithm can be used for general consensus purpose. Currently, it only takes FASTA input. For shorter read sequences, one might need to adjust the blasr alignment parameters to get the alignment string properly.

The code and the underlying graphical data structure have been used for some algorithm development prototyping including phasing reads and pre-assembly.

Registry entries: Bioconda 
pbhoney
genomic structural variation discovery
Versions of package pbhoney
ReleaseVersionArchitectures
stretch15.8.24+dfsg-2all
bullseye15.8.24+dfsg-7all
bookworm15.8.24+dfsg-7all
buster15.8.24+dfsg-3all
sid15.8.24+dfsg-7all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PBHoney is an implementation of two variant-identification approaches designed to exploit the high mappability of long reads (i.e., greater than 10,000 bp). PBHoney considers both intra-read discordance and soft-clipped tails of long reads to identify structural variants.

PBHoney is part of the PBSuite.

pbjelly
strumento per aggiornare assemblati di genoma
Versions of package pbjelly
ReleaseVersionArchitectures
sid15.8.24+dfsg-7all
bookworm15.8.24+dfsg-7all
buster15.8.24+dfsg-3all
bullseye15.8.24+dfsg-7all
stretch15.8.24+dfsg-2all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PBJelly è una catena di elaborazione dati estremamente automatizzata che allinea letture lunghe di sequenziamento (come letture PacBio RS o letture 454 lunghe in formato FASTA) in assemblati bozza con elevata fiducia. PBJelly riempie o riduce quanti più gap catturati possibile per produrre genomi bozza aggiornati.

PBJelly fa parte di PBSuite.

pbsim
simulatore per letture di sequenziamento PacBio
Versions of package pbsim
ReleaseVersionArchitectures
trixie1.0.3+git20180330.e014b1d+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0.3+git20180330.e014b1d+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.3+git20180330.e014b1d+dfsg-1amd64,arm64,armhf,i386
sid1.0.3+git20180330.e014b1d+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0.3-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0.3+git20180330.e014b1d+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

I sequenziatori di DNA PacBio producono due tipi di letture caratteristiche: CCS (corte e con basso tasso d'errore) e CLR (lunghe e con alto tasso d'errore), che possono essere entrambe utili per l'assemblaggio de novo di genomi. PBSIM simula tali letture PacBio da una sequenza di riferimento usando una simulazione basata su modello o su campionamento. Le letture simulate sono utili, ad esempio, quando si sviluppano o valutano assemblatori di sequenza pensati per dati PacBio.

Please cite: Yukiteru Ono, Kiyoshi Asai and Michiaki Hamada: PBSIM: PacBio reads simulator - toward accurate genome assembly. (PubMed,eprint) Bioinformatics 29(1):119-121 (2013)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
pbsuite
software per dati di sequenziamento di Pacific Biosciences
Versions of package pbsuite
ReleaseVersionArchitectures
buster15.8.24+dfsg-3all
bookworm15.8.24+dfsg-7all
sid15.8.24+dfsg-7all
bullseye15.8.24+dfsg-7all
stretch15.8.24+dfsg-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

PBSuite contiene due progetti creati per l'analisi di dati di sequenziamento di letture lunghe di Pacific Biosciences.

  • PBJelly - strumento per upgrade del genoma
  • PBHoney - scoperta di variazioni strutturali
pdb2pqr
preparazione di strutture di proteine per calcoli elettrostatici
Versions of package pdb2pqr
ReleaseVersionArchitectures
bookworm3.5.2+dfsg-3all
jessie1.9.0+dfsg-1amd64,armel,armhf,i386
stretch2.1.1+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1.1+dfsg-5amd64,arm64,armhf,i386
bullseye2.1.1+dfsg-7+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.6.1+dfsg-1all
trixie3.6.1+dfsg-1all
upstream3.6.2
Popcon: 10 users (9 upd.)*
Newer upstream!
License: DFSG free
Git

PDB2PQR è un pacchetto software Python che automatizza molti dei compiti comuni nella preparazione di strutture per calcoli elettrostatici in continuo. Per questo fornisce un'utilità indipendente dalla piattaforma per convertire file di proteine in formato PDB al formato PQR. Questi compiti includono:

  • aggiungere un numero limitato di atomi pesanti mancanti a strutture biomolecolari;
  • determinare i pKa di catene laterali;
  • posizionare idrogeni mancanti;
  • ottimizzare la proteina per legami idrogeno favorevoli;
  • assegnare parametri di carica e raggio da una varietà di campi di forza.
Please cite: Todd J Dolinsky, Paul Czodrowski, Hui Li, Jens E Nielsen, Jan H Jensen, Gerhard Klebe and Nathan A Baker: PDB2PQR: Expanding and upgrading automated preparation of biomolecular structures for molecular simulations. (PubMed,eprint) Nucleic Acids Research 35:W522-5 (2007)
perlprimer
progettazione grafica di primer per PCR
Versions of package perlprimer
ReleaseVersionArchitectures
trixie1.2.4-2all
stretch1.2.3-1all
jessie1.1.21-2all
buster1.2.4-1all
bullseye1.2.4-2all
bookworm1.2.4-2all
sid1.2.4-2all
Debtags of package perlprimer:
biologyformat:aln, nuceleic-acids, peptidic
fieldbiology, biology:molecular
interfacex11
networkclient
roleprogram
scopeutility
uitoolkittk
useanalysing
works-with-formatplaintext
x11application
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PerlPrimer è un'applicazione grafica libera, open source, scritta in Perl che progetta primer per PCR (Polymerase Chain Reaction, reazione a catena della polimerasi), bisolfito-PCR, PCR in tempo reale (QPCR) e sequenziamento. Mira ad automatizzare e semplificare il processo di progettazione di primer.

Se fatto funzionare con collegamento in rete, lo strumento comunica efficacemente con il progetto Ensembl per una comprensione più approfondita della struttura del gene, cioè permette di tenere in considerazione la posizione di esoni e introni durante la progettazione dei primer. Possono anche essere recuperate le sequenze stesse.

Please cite: Owen J. Marshall: PerlPrimer: cross-platform, graphical primer design for standard, bisulphite and real-time PCR. (PubMed,eprint) Bioinformatics 20(15):2471-2472 (2004)
Registry entries: SciCrunch 
perm
mappatura efficiente di letture brevi con semi spaziati periodicamente
Versions of package perm
ReleaseVersionArchitectures
trixie0.4.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.4.0-1amd64,armel,armhf,i386
stretch0.4.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.4.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.4.0-4amd64,arm64,armhf,i386
bullseye0.4.0-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.4.0-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PerM è un pacchetto software che è stato progettato per eseguire allineamenti a livello di genoma estremamente efficienti per centinaia di milioni di letture brevi prodotte da piattaforme di sequenziamento ABI SOLiD e Illumina. Attualmente PerM è in grado di fornire sensibilità totale per allineamenti con fino a 4 non corrispondenze per letture SOLiD di 50 pb e 9 non corrispondenze per letture Illumina di 100 pb.

Please cite: Yangho Chen, Tade Souaiaia and Ting Chen: PerM: efficient mapping of short sequencing reads with periodic full sensitive spaced seeds. (PubMed,eprint) Bioinformatics 25(19):2514-21 (2009)
Registry entries: Bio.tools  SciCrunch 
pftools
build and search protein and DNA generalized profiles
Versions of package pftools
ReleaseVersionArchitectures
stretch-backports3+dfsg-3~bpo9+1amd64
sid3.2.12-1amd64
buster3+dfsg-3amd64
bookworm3.2.12-1amd64
bullseye3.2.6-1amd64
trixie3.2.12-1amd64
Popcon: 11 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

The pftools package contains all the software necessary to build protein and DNA generalized profiles and use them to scan and align sequences, and search databases.

File formats used by the pftools

  • Generalized profiles format and syntax.
  • The multiple sequence alignment format (PSA).
  • The extended header multiple sequence alignment format (XPSA).

Programs to build generalized profiles

 pfmake
   Build a profile from a multiple sequence alignment.
 pfscale
   Fit parameters of an extreme-value distribution to a profile score list.
 pfw
   Weight sequences of a multiple sequence alignment to correct for
   sampling bias.

Programs to search with generalized profiles

 pfsearch / pfsearchV3
   Search a protein or DNA sequence library for sequence segments matching
   a profile (V3 is the new version of this tool).
 pfscan
   Scan a protein or DNA sequence with a profile library

Conversion programs

 psa2msa
   Reformat PSA file to Pearson/Fasta multiple sequence alignment file.
 ptof
   Convert a protein profile into a frame-search profile to search DNA
   sequences. To be used with 2ft.
 2ft
   Converts both strands of DNA into so-called interleaved
   frame-translated DNA sequences to search with protein profiles. To be
   used with ptof.
 6ft
   Translates all six reading frames of a double-stranded DNA sequence
   into individual protein sequences.
 pfgtop
   Convert a profile in GCG format into PROSITE format.
 pfhtop
   Convert a HMMER1 ASCII-formatted HMM into an equivalent PROSITE profile.
 ptoh
   Converts a generalized profile into an approximately equivalent HMM
   profile in HMMER1 format (can be read by the hmmconvert program from
   the HMMER2 package).
Please cite: Christian J. A. Sigrist, Lorenzo Cerutti, Nicolas Hulo, Alexandre Gattiker, Laurent Falquet, Marco Pagni, Amos Bairoch and Philipp Bucher: PROSITE: a documented database using patterns and profiles as motif descriptors. (PubMed,eprint) Briefings in Bioinformatics 3(3):265-74 (2002)
Registry entries: Bio.tools 
phast
phylogenetic analysis with space/time models
Versions of package phast
ReleaseVersionArchitectures
bullseye1.5+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.6+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.6+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.6+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.4+dfsg-1amd64,arm64,armhf,i386
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PHAST is a software package for comparative and evolutionary genomics. It consists of about half a dozen major programs, plus more than a dozen utilities for manipulating sequence alignments, phylogenetic trees, and genomic annotations. For the most part, PHAST focuses on two kinds of applications: the identification of novel functional elements, including protein-coding exons and evolutionarily conserved sequences; and statistical phylogenetic modeling, including estimation of model parameters, detection of signatures of selection, and reconstruction of ancestral sequences.

PHAST does not support phylogeny reconstruction or sequence alignment, and it is designed for use with DNA sequences only (see Comparison).

Please cite: Melissa J. Hubisz, Katherine S. Pollard and Adam Siepel: PHAST and RPHAST: phylogenetic analysis with space/time models. (PubMed,eprint) Bioinformatics 12(1):41-51 (2011)
Registry entries: SciCrunch  Bioconda 
phipack
test PHI e altri test di ricombinazione
Versions of package phipack
ReleaseVersionArchitectures
trixie0.0.20160614-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.0.20160614-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.0.20160614-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.0.20160614-3amd64,arm64,armhf,i386
bullseye0.0.20160614-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.0.20160614-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Il pacchetto software PhiPack implementa diversi test di ricombinazione e può anche produrre matrici di incompatibilità raffinate. Specificamente, PHIPack implementa il "Pairwise Homoplasy Index", il "Maximum Chi2" e il "Neighbour Similarity Score". Il programma Phi può essere eseguito per produrre un p-value di ricombinazione all'interno di un insieme di dati e il programma profile può essere eseguito per determinare le regioni che mostrano le prove più forti di mosaicismo.

Please cite: Trevor C. Bruen, Hervé Philippe and David Bryant: A Simple and Robust Statistical Test for Detecting the Presence of Recombination. (PubMed,eprint) Genetics 172(4):2665-2681 (2006)
Registry entries: Bioconda 
phybin
binning/clustering newick trees by topology
Versions of package phybin
ReleaseVersionArchitectures
stretch0.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye0.3-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.3-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.3-3amd64,arm64,armhf,i386
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PhyBin is a simple command line tool that classifies a set of Newick tree files by their topology. The purpose of it is to take a large set of tree files and browse through the most common tree topologies.

It can do simple binning of identical trees or more complex clustering based on an all-to-all Robinson-Foulds distance matrix.

phybin produces output files that characterize the size and contents of each bin or cluster (including generating GraphViz-based visual representations of the tree topologies).

Please cite: Ryan R. Newton and Irene L.G. Newton: PhyBin: binning trees by topology. (PubMed,eprint) PeerJ 1:e187 (2013)
phylip
pacchetto di programmi per inferire alberi filogenetici
Versions of package phylip
ReleaseVersionArchitectures
jessie3.696+dfsg-1amd64,armel,armhf,i386
stretch3.696+dfsg-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm3.697+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.697+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.697+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.697+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.697+dfsg-1amd64,arm64,armhf,i386
Debtags of package phylip:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 19 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Il PHYLogeny Inference Package è un pacchetto di programmi per inferire alberi filogenetici (alberi evolutivi) da sequenze. I metodi disponibili nel pacchetto includono la parsimonia, la matrice di distanze e metodi di verosimiglianza, inclusi bootstrap e alberi di consenso. I tipi di dati che possono essere gestiti includono sequenze molecolari, frequenze geniche, siti di restrizione, matrici di distanze e caratteri discreti 0/1.

Registry entries: Bio.tools  SciCrunch  Bioconda 
phylonium
stima veloce e accurata delle distanze evolutive
Versions of package phylonium
ReleaseVersionArchitectures
sid1.7-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.6-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.7-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Questo è il programma phylonium per stimare le distanze evolutive tra genomi strettamente correlati. È molto più veloce degli approcci basati sugli allineamenti per la ricostruzione filogenetica e solitamente più accurato dei metodi alternativi senza allineamenti.

Topics: Phylogenetics
phyml
stime filogenetiche usando il metodo della massima verosimiglianza
Versions of package phyml
ReleaseVersionArchitectures
trixie3.3.20220408-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3.3.20180621-2amd64,arm64,armhf,i386
stretch3.2.0+dfsg-7amd64,arm64,armhf,i386
bullseye3.3.20200621-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.3.20220408-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.3.20220408-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie20120412-2amd64,armel,armhf,i386
Debtags of package phyml:
biologypeptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing, comparing
works-withbiological-sequence
Popcon: 11 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

PhyML è un software che stima alberi filogenetici con il metodo della massima verosimiglianza a partire da allineamenti nucleotidici o di sequenze aminoacidiche. Fornisce una vasta gamma di opzioni che sono state progettate per facilitare le analisi filogenetiche standard. Il punto di forza di PhyML è nel gran numero di modelli di sostituzione associati a varie opzioni per cercare nello spazio delle topologie degli alberi filogenetici, a partire da metodi molto veloci ed efficienti, fino ad arrivare ad approcci più lenti ma generalmente più accurati. Implementa anche due metodi per valutare la forza dei rami in una solida infrastruttura statistica (il metodo bootstrap non parametrico e il test di verosimiglianza approssimata).

PhyML è stato progettato per elaborare insiemi di dati di dimensioni medie * grandi. In teoria, possono essere analizzati allineamenti con fino a 4.000 sequenze di 2.000.000 di caratteri. In pratica, tuttavia, la quantità di memoria necessaria per elaborare un insieme di dati è proporzionale al numero delle sequenze moltiplicato per la loro lunghezza. Perciò si possono elaborare un gran numero di sequenze solo se esse sono corte. Inoltre PhyML può gestire lunghe sequenze a patto che non siano numerose. Con la maggior parte dei personal computer standard, si può stare tranquilli con circa da 3 a 500 sequenze più corte di 2.000 caratteri.

Questo pacchetto include anche PhyTime.

Please cite: Stéphane Guindon: Bayesian estimation of divergence times from large sequence alignments. (PubMed,eprint) Molecular Biology and Evolution 27(8):1768-81 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package phyml
physamp
sample sequence alignment corresponding to phylogeny
Versions of package physamp
ReleaseVersionArchitectures
trixie1.1.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.1.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1.0-1amd64,arm64,armhf,i386
sid1.1.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.1.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.2.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The PhySamp package currently contains two programs: bppphysamp, which samples sequences according to their similarity, and bppalnoptim, which samples a sequence alignment by removing sequences in order to maximize the number of sites suitable for a given analysis. The bppalnoptim program has three running modes:

  • Interactive: the user will be iteratively proposed a set of choices for sequence removal, with their corresponding site gains. The procedure stops when the user does not want to remove more sequences, and the resulting filtered alignment is written.
  • Automatic: the user enters an a priori criterion for stopping the filtering procedure (for instance a minimum number of sequences to keep).
  • Diagnostic: this mode allows one to plot the trade-off curve, by showing the site gain as a function of the number of removed sequences.
Please cite: Julien Y. Dutheil and Emeric Figuet: Optimization of sequence alignments according to the number of sequences vs. number of sites trade-off. (PubMed,eprint) BMC Bioinformatics 16:160 (2015)
phyutility
semplici analisi o modifica di alberi filogenetici e matrici di dati
Versions of package phyutility
ReleaseVersionArchitectures
buster2.7.3+dfsg-2amd64,arm64,armhf,i386
sid2.7.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.7.3-1amd64,armel,armhf,i386
stretch2.7.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.7.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.7.3+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.7.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Phyutility (pronuncia faiutiliti) è un programma a riga di comando che effettua semplici analisi o modifiche sia su alberi sia su matrici di dati.

Attualmente effettua le seguenti funzioni (per suggerire un'altra funzionalità segnalare un problema ("Issue") e usare l'etichetta "Type-Enhancement"):

Alberi

  • cambiamento della radice
  • potatura
  • conversione di tipo
  • consenso
  • stabilità delle foglie
  • movimento del lineage
  • gestione di alberi

Matrici di dati

  • allineamenti concatenati
  • analisi di banche genomiche
  • allineamenti di trimming
  • ricerche NCBI
  • recupero di NCBI
Please cite: Stephen A. Smith and Casey W. Dunn: Phyutility: a phyloinformatics utility for trees, alignments, and molecular data. (PubMed,eprint) Bioinformatics 24(5):715-716 (2008)
phyx
UNIX-style phylogenetic analyses on trees and sequences
Versions of package phyx
ReleaseVersionArchitectures
sid1.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.3+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.01+ds-2+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.999+ds-1amd64,arm64,armhf,i386
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

phyx provides a convenient, lightweight and inclusive toolkit consisting of programs spanning the wide breadth of programs utilized by researchers performing phylogenomic analyses. Modeled after Unix/GNU/Linux command line tools, individual programs perform a single task and operate on standard I/O streams. A result of this stream-centric approach is that, for most programs, only a single sequence or tree is in memory at any moment. Thus, large datasets can be processed with minimal memory requirements. phyx’s ever-growing complement of programs consists of over 35 programs focused on exploring, manipulating, analyzing and simulating phylogenetic objects (alignments, trees and MCMC logs). As with standard Unix command line tools, these programs can be piped (together with non-phyx tools), allowing the easy construction of efficient analytical pipelines.

picard-tools
strumenti a riga di comando per manipolare file SAM e BAM
Versions of package picard-tools
ReleaseVersionArchitectures
jessie1.113-1all
stretch2.8.1+dfsg-1all
sid3.1.1+dfsg-1all
bookworm2.27.5+dfsg-2all
trixie3.1.1+dfsg-1all
buster2.18.25+dfsg-2amd64
bullseye2.24.1+dfsg-1all
upstream3.3.0
Popcon: 9 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

Il formato SAM (Sequence Alignment/Map, allineamento/mappa di sequenza) è un formato generico per memorizzare grandi allineamenti di sequenze nucleotidiche. In Picard Tools sono incluse le seguenti utilità per manipolare file SAM e BAM:

 AddCommentsToBam                  FifoBuffer
 AddOrReplaceReadGroups            FilterSamReads
 BaitDesigner                      FilterVcf
 BamIndexStats                     FixMateInformation
                                   GatherBamFiles
 BedToIntervalList                 GatherVcfs
 BuildBamIndex                     GenotypeConcordance
 CalculateHsMetrics                IlluminaBasecallsToFastq
 CalculateReadGroupChecksum        IlluminaBasecallsToSam
 CheckIlluminaDirectory            LiftOverIntervalList
 CheckTerminatorBlock              LiftoverVcf
 CleanSam                          MakeSitesOnlyVcf
 CollectAlignmentSummaryMetrics    MarkDuplicates
 CollectBaseDistributionByCycle    MarkDuplicatesWithMateCigar
 CollectGcBiasMetrics              MarkIlluminaAdapters
 CollectHiSeqXPfFailMetrics        MeanQualityByCycle
 CollectIlluminaBasecallingMetrics MergeBamAlignment
 CollectIlluminaLaneMetrics        MergeSamFiles
 CollectInsertSizeMetrics          MergeVcfs
 CollectJumpingLibraryMetrics      NormalizeFasta
 CollectMultipleMetrics            PositionBasedDownsampleSam
 CollectOxoGMetrics                QualityScoreDistribution
 CollectQualityYieldMetrics        RenameSampleInVcf
 CollectRawWgsMetrics              ReorderSam
 CollectRnaSeqMetrics              ReplaceSamHeader
 CollectRrbsMetrics                RevertOriginalBaseQualitiesAndAddMateCigar
 CollectSequencingArtifactMetrics  RevertSam
 CollectTargetedPcrMetrics         SamFormatConverter
 CollectVariantCallingMetrics      SamToFastq
 CollectWgsMetrics                 ScatterIntervalsByNs
 CompareMetrics                    SortSam
 CompareSAMs                       SortVcf
 ConvertSequencingArtifactToOxoG   SplitSamByLibrary
 CreateSequenceDictionary          SplitVcfs
 DownsampleSam                     UpdateVcfSequenceDictionary
 EstimateLibraryComplexity         ValidateSamFile
 ExtractIlluminaBarcodes           VcfFormatConverter
 ExtractSequences                  VcfToIntervalList
 FastqToSam                        ViewSam
The package is enhanced by the following packages: multiqc
Please cite: Broad Institute: Picard toolkit. Broad Institute, GitHub repository (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing; Document, record and content management
picopore
lossless compression of Nanopore files
Versions of package picopore
ReleaseVersionArchitectures
sid1.2.0-3all
bullseye1.2.0-2all
bookworm1.2.0-2all
trixie1.2.0-3all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The Nanopore is a device to determine the sequences of single moleculres of DNA. No amplification. The output is gigantic and tools like this one help to reduce it.

Over time, other means have substitute the need for this one. Upstream has halted development. Some tutorials and pipelines of the Nanopore still refer to it, though.

Registry entries: Bio.tools  Bioconda 
pigx-rnaseq
pipeline for checkpointed and distributed RNA-seq analyses
Versions of package pigx-rnaseq
ReleaseVersionArchitectures
trixie0.1.1-1all
bullseye0.0.10+ds-2all
bookworm0.1.0-1.1all
sid0.1.1-1all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides a automated workflow for the automated analysis of RNA-seq experiments. A series of well-accecpted tools are connected in Python scripts and controlled via snakemake. This supports the parallel execution of these workflows and provides checkpointing, such that interrupted workflows can take up their work again.

Please cite: Ricardo Wurmus, Bora Uyar, Brendan Osberg, Vedran Franke, Alexander Gosdschan, Katarzyna Wreczycka, Jonathan Ronen and and Altuna Akalin: PiGx: Reproducible Genomics Analysis Pipelines with GNU Guix. (PubMed,eprint) GigaScience 7(12):giy123 (2018)
Registry entries: SciCrunch 
piler
analisi di ripetizioni genomiche
Versions of package piler
ReleaseVersionArchitectures
trixie0~20140707-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0~20140707-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0~20140707-2amd64,arm64,armhf,i386
stretch0~20140707-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0~20140707-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0~20140707-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PILER (Parsimonious Inference of a Library of Elementary Repeats) cerca elementi ripetitivi in una sequenza di genoma. Implementa algoritmi di ricerca che identificano modelli caratteristici di allineamenti locali indotti da certe classi di ripetizioni.

Please cite: Robert C. Edgar and Eugene W. Myers: PILER: identification and classification of genomic repeats. (PubMed,eprint) Bioinformatics 21(suppl 1):i152-i158 (2005)
Registry entries: Bioconda 
pilercr
software per trovare ripetizioni CRISPR
Versions of package pilercr
ReleaseVersionArchitectures
bullseye1.06+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.06+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.06+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.06+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Gli elementi CRISPR sono ripetizioni brevi ed altamente conservate nei genomi procariotici, separate da sequenze uniche di lunghezza simile. PILERCR è progettato per l'identificazione e l'analisi di ripetizioni CRISPR.

Please cite: R. C. Edgar: PILER-CR: fast and accurate identification of CRISPR repeats. (PubMed,eprint) BMC Bioinformatics 8:18 (2007)
pilon
automated genome assembly improvement and variant detection tool
Versions of package pilon
ReleaseVersionArchitectures
stretch-backports1.22+dfsg-2~bpo9+2all
bullseye1.23+dfsg-2all
trixie1.24-3all
buster1.23+dfsg-1all
sid1.24-3all
bookworm1.24-2all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Pilon is a software tool which can be used to:

  • Automatically improve draft assemblies
  • Find variation among strains, including large event detection Pilon requires as input a FASTA file of the genome along with one or more BAM files of reads aligned to the input FASTA file. Pilon uses read alignment analysis to identify inconsistencies between the input genome and the evidence in the reads. It then attempts to make improvements to the input genome, including:

  • Single base differences

  • Small indels
  • Larger indel or block substitution events
  • Gap filling
  • Identification of local misassemblies, including optional opening of new gaps
Please cite: Bruce J. Walker, Thomas Abeel, Terrance Shea, Margaret Priest, Amr Abouelliel, Sharadha Sakthikumar, Christina A. Cuomo, Qiandong Zeng, Jennifer Wortman, Sarah K. Young and Ashlee M. Earl: Pilon: An Integrated Tool for Comprehensive Microbial Variant Detection and Genome Assembly Improvement". (PubMed,eprint) PLOSone 9(11):e11296 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
pinfish
Collection of tools to annotate genomes using long read transcriptomics data
Versions of package pinfish
ReleaseVersionArchitectures
trixie0.1.0+ds-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.1.0+ds-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.1.0+ds-3amd64,arm64,mips64el,ppc64el,s390x
bullseye0.1.0+ds-2amd64,arm64,mips64el,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The toolchain is composed of the following tools: 1. spliced_bam2gff - a tool for converting sorted BAM files containing spliced alignments into GFF2 format. Each read will be represented as a distinct transcript. This tool comes handy when visualizing spliced reads at particular loci and to provide input to the rest of the toolchain.

  1. cluster_gff - this tool takes a sorted GFF2 file as input and clusters together reads having similar exon/intron structure and creates a rough consensus of the clusters by taking the median of exon boundaries from all transcripts in the cluster.

  2. polish_clusters - this tool takes the cluster definitions generated by cluster_gff and for each cluster creates an error corrected read by mapping all reads on the read with the median length and polishing it using racon. The polished reads can be mapped to the genome using minimap2 or GMAP.

  3. collapse_partials - this tool takes GFFs generated by either cluster_gff or polish_clusters and filters out transcripts which are likely to be based on RNA degradation products from the 5' end. The tool clusters the input transcripts into "loci" by the 3' ends and discards transcripts which have a compatible transcripts in the loci with more exons.

pique
software pipeline for performing genome wide association studies
Versions of package pique
ReleaseVersionArchitectures
trixie1.0-7all
sid1.0-7all
bullseye1.0-2all
bookworm1.0-6all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PIQUE is a software pipeline for performing genome wide association studies (GWAS). The main function of PIQUE is to provide ‘convenience’ wrappers that allow users to perform GWAS using the popular program EMMAX (Kang et al., 2010) without the need to be familiar with all of the software tools used to generate the required EMMAX input files. PIQUE will also perform a number of quality control steps prior to running EMMAX, ensuring that the various input data files are in the correct format. PIQUE proceeds in two main stages although there are multiple entry and exit points from which the pipeline can be run. The first stage consists of running the “pique-input” program, which can read genotype and phenotype information in several different formats and generates all the necessary input files required to run EMMAX. The second step in the pipeline uses the “pique-run” program to actually run EMMAX using the files generated by “pique-input” (or pre-existing user-supplied input files) to perform the GWAS and output the analysis summary files.

The package is enhanced by the following packages: pique-doc
pirs
Profile based Illumina pair-end Reads Simulator
Versions of package pirs
ReleaseVersionArchitectures
trixie2.0.2+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.0.2+dfsg-8amd64,arm64,armhf,i386
stretch2.0.2+dfsg-5.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.0.2+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.0.2+dfsg-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.0.2+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The program pIRS can be used for simulating Illumina PE reads, with a series of characters generated by Illumina sequencing platform, such as insert size distribution, sequencing error(substitution, insertion, deletion), quality score and GC content-coverage bias.

The insert size follows a normal distribution, so users should set the mean value and standard deviation. Usually the standard deviation is set as 1/20 of the mean value. The normal distribution by Box-Muller method is simulated.

The program simulates sequencing error, quality score and GC content- coverage bias according to the empirical distribution profile. Some default profiles counted from lots of real sequencing data are provided.

To simulate reads from diploid genome, users should simulate the diploid genome sequence firstly by setting the ratio of heterozygosis SNP, heterozygosis InDel and structure variation.

Please cite: Xuesong Hu, Jianying Yuan, Yujian Shi, Jianliang Lu, Binghang Liu, Zhenyu Li, Yanxiang Chen, Desheng Mu, Hao Zhang, Nan Li, Zhen Yue, Fan Bai, Heng Li and Wei Fan: pIRS: Profile-based Illumina pair-end reads simulator. (PubMed,eprint) Bioinformatics 28(11):1533-5 (2012)
Registry entries: Bioconda 
pizzly
Identifies gene fusions in RNA sequencing data
Versions of package pizzly
ReleaseVersionArchitectures
bookworm0.37.3+ds-9amd64,arm64,mips64el,ppc64el,s390x
bullseye0.37.3+ds-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.37.3+ds-9amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie0.37.3+ds-9amd64,arm64,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

For the interpretation of the transcriptome (the abundance and sequence of RNA) of tomour cells one is particularly interested in transcripts that cannot be mapped to single genes but that are seen to be fused as parts from two genes. Likely eplanations are chromosomal translocations.

Pizzly can identify novel such peculiarities, building on interpretations on variable splicing by the tool kallisto. Both tools are elements of the bcbio workflow.

Registry entries: Bioconda 
placnet
progetto Plasmid Constellation Network
Versions of package placnet
ReleaseVersionArchitectures
buster1.03-3all
bullseye1.03-3all
stretch1.03-2all
trixie1.04-1all
sid1.04-1all
bookworm1.04-1all
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Placnet è un nuovo strumento per l'analisi di plasmidi in progetti NGS. Placnet è ottimizzato per lavorare con sequenze Illumina, ma funziona anche con 454, Iontorrent o qualsiasi tecnologia di sequenziamento esistente.

L'input di Placnet è un insieme di contigui e uno o più file SAM con la mappatura tra le letture e i contigui. Placnet ottiene un insieme di file facilmente aperti nel software Cytoscape o in altri strumenti di rete.

Please cite: Val F. Lanza, María de Toro, M. Pilar Garcillán-Barcia, Azucena Mora, Jorge Blanco, Teresa M. Coque and Fernando de la Cruz: Plasmid Flux in Escherichia coli ST131 Sublineages, Analyzed by Plasmid Constellation Network (PLACNET), a New Method for Plasmid Reconstruction from Whole Genome Sequences. (PubMed,eprint) PLOS 10(12):e1004766 (2014)
plasmidid
mapping-based, assembly-assisted plasmid identification tool
Versions of package plasmidid
ReleaseVersionArchitectures
bookworm1.6.5+dfsg-2amd64
bullseye1.6.3+dfsg-3amd64
trixie1.6.5+dfsg-2amd64,arm64
sid1.6.5+dfsg-2amd64,arm64
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PlasmidID is a mapping-based, assembly-assisted plasmid identification tool that analyzes and gives graphic solution for plasmid identification.

PlasmidID is a computational pipeline that maps Illumina reads over plasmid database sequences. The k-mer filtered, most covered sequences are clustered by identity to avoid redundancy and the longest are used as scaffold for plasmid reconstruction. Reads are assembled and annotated by automatic and specific annotation. All information generated from mapping, assembly, annotation and local alignment analyses is gathered and accurately represented in a circular image which allow user to determine plasmidic composition in any bacterial sample.

Registry entries: Bioconda 
plasmidomics
Disegna mappe di plasmidi e vettori, esporta grafica PostScript
Versions of package plasmidomics
ReleaseVersionArchitectures
stretch0.2.0-5all
bullseye0.2.0-9all
trixie0.2.0-10all
bookworm0.2.0-10all
buster0.2.0-7all
jessie0.2.0-3all
sid0.2.0-10all
Debtags of package plasmidomics:
fieldbiology, biology:molecular
interfacex11
roleprogram
scopeutility
uitoolkittk
works-withimage:vector
works-with-formatpostscript
x11application
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Plasmidomics è scritto per disegnare facilmente mappe di plasmidi e vettori in modo da poterle usare in tesi, presentazioni o altre pubblicazioni. Ha il supporto nativo di PostScript come formato di output.

Screenshots of package plasmidomics
plasmidseeker
identificazione di plasmidi noti da letture di sequenziamento di genomi interi
Versions of package plasmidseeker
ReleaseVersionArchitectures
buster1.0+dfsg-1amd64,arm64,armhf,i386
sid1.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.3+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PlasmidSeeker è un programma basato su k-meri per l'identificazione di plasmidi noti da letture di sequenziamento di interi genomi batterici.

PlasmidSeeker abilita il rilevamento di plasmidi da dati di WGS di batteri senza assemblaggio delle letture. L'algoritmo di PlasmidSeeker è basato sui k-meri e usa l'abbondanza dei k-meri per distinguere tra sequenze dei plasmidi e batteriche. Le prestazioni di PlasmidSeeker sono state testate su un insieme di campioni WGS batterici reali e simulati ottenendo come risultato una sensibilità del 100% e una specificità del 99.98%.

Please cite: Märt Roosaare, Mikk Puustusmaa, Märt Möls, Mihkel Vaher and Maido Remm: PlasmidSeeker: identification of known plasmids from bacterial whole genome sequencing reads. (PubMed,eprint) PeerJ - Life & Environment 6:e4588 (2018)
plast
Parallel Local Sequence Alignment Search Tool
Versions of package plast
ReleaseVersionArchitectures
trixie2.3.2+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.3.2+dfsg-1amd64
bullseye2.3.2+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.3.2+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.3.1+dfsg-4amd64
sid2.3.2+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PLAST è uno strumento veloce, accurato e scalabile a livello NGS di ricerca di similarità tra sequenze da banca a banca, che fornisce una accelerazione significativa di metodi di confronto euristici basati su semi, come la suite Blast di algoritmi.

Affidandosi ad un'architettura software unica, PLAST sfrutta a pieno i computer personali recenti multi-core, senza richiedere alcun dispositivo hardware aggiuntivo.

Please cite: Van Hoa Nguyen and Dominique Lavenier: PLAST: parallel local alignment search tool for database comparison. (PubMed,eprint) BMC Bioinformatics 10:329 (2009)
Registry entries: Bio.tools 
plink
insieme di strumenti di analisi per associazione dell'intero genoma
Versions of package plink
ReleaseVersionArchitectures
trixie1.07+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.07+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.07+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.07-3amd64,armel,armhf,i386
buster1.07+dfsg-2amd64,arm64,armhf,i386
sid1.07+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.07-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package plink:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
Popcon: 36 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

plink si aspetta in input i dati da chip SNP (polimorfismi a singolo nucleotide) di molti individui e la loro descrizione fenotipica di una malattia. Trova associazioni tra una variazione singola o una coppia di variazioni nel DNA con un fenotipo e può recuperare le annotazioni SNP da una fonte in linea.

Gli SNP possono essere analizzati individualmente o a coppie per valutare la loro associazione con fenotipi di malattie. È possibile ricercare congiuntamente variazioni nel numero di copie. Sono stati implementati svariati test statistici.

Notare che l'eseguibile è stato rinominato in plink1 per una collisione di nomi. Ulteriori informazioni su questo possono essere lette in /usr/share/doc/plink/README.Debian .

Please cite: Shaun Purcell, Benjamin Neale, Kathe Todd-Brown, Lori Thomas, Manuel A. R. Ferreira, David Bender, Julian Maller, Pamela Sklar, Paul I. W. de Bakker, Mark J. Daly and Pak C. Sham: PLINK: a toolset for whole-genome association and population-based linkage analysis. (PubMed) American Journal of Human Genetics 81(3):559-75 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
plink1.9
insieme di strumenti di analisi per associazione dell'intero genoma
Versions of package plink1.9
ReleaseVersionArchitectures
trixie1.90~b7.2-231211-1amd64,armel,armhf,i386
bookworm1.90~b6.26-220402-1amd64,armel,armhf,i386,mipsel
bullseye1.90~b6.21-201019-1amd64,armel,armhf,i386,mipsel
buster1.90~b6.6-181012-1amd64,armhf,i386
stretch1.90~b3.45-170113-1amd64,armel,armhf,i386,mipsel
sid1.90~b7.2-231211-1amd64,armel,armhf,i386
Popcon: 92 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

plink si aspetta in input i dati da chip SNP (polimorfismi a singolo nucleotide) di molti individui e la loro descrizione fenotipica di una malattia. Trova associazioni tra una variazione singola o una coppia di variazioni nel DNA con un fenotipo e può recuperare le annotazioni SNP da una fonte in linea.

Gli SNP possono essere analizzati individualmente o a coppie per valutare la loro associazione con fenotipi di malattie. È possibile ricercare congiuntamente variazioni nel numero di copie. Sono stati implementati svariati test statistici.

plink1.9 è un esteso aggiornamento di plink con nuovi algoritmi e nuovi metodi, più veloce e con meno consumo di memoria rispetto al primo plink.

Notare che l'eseguibile è stato rinominato in plink1.9 per una collisione di nomi. Ulteriori informazioni su questo possono essere lette in /usr/share/doc/plink1.9/README.Debian.

Please cite: Christopher C. Chang, Carson C. Chow, Laurent C.A.M. Tellier, Shashaank Vattikuti, Shaun M. Purcell and James J. Lee: Second-generation PLINK: rising to the challenge of larger and richer datasets. (eprint) GigaScience 4(1):7 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
plink2
insieme di strumenti di analisi per associazione dell'intero genoma
Versions of package plink2
ReleaseVersionArchitectures
bookworm2.00~a3.5-220809+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.00~a5.8-231123+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.00~a5.8-231123+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.00~a3-210203+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

plink si aspetta in input i dati da chip SNP (polimorfismi a singolo nucleotide) di molti individui e la loro descrizione fenotipica di una malattia. Trova associazioni tra una variazione singola o una coppia di variazioni nel DNA con un fenotipo e può recuperare le annotazioni SNP da una fonte in linea.

Gli SNP possono essere analizzati individualmente o a coppie per valutare la loro associazione con fenotipi di malattie. È possibile ricercare congiuntamente variazioni nel numero di copie. Sono stati implementati svariati test statistici.

plink2 è un aggiornamento esaustivo di plink e plink1.9 con nuovi algoritmi e nuovi metodi, più veloce e con meno consumo di memoria rispetto al primo plink.

Please cite: Christopher C. Chang, Carson C. Chow, Laurent C.A.M. Tellier, Shashaank Vattikuti, Shaun M. Purcell and James J. Lee: Second-generation PLINK: rising to the challenge of larger and richer datasets. (eprint) GigaScience 4(1):7 (2015)
Registry entries: SciCrunch 
plip
strumento di profilazione dell'interazione proteina-ligando completamente automatizzato
Versions of package plip
ReleaseVersionArchitectures
sid2.3.0+dfsg-2all
bookworm2.2.2+dfsg-1all
stretch1.3.3+dfsg-1all
bullseye2.1.7+dfsg-1all
trixie2.3.0+dfsg-2all
buster1.4.3~b+dfsg-2all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PLIP (Protein-Ligand Interaction Profiler) è uno strumento per analizzare e visualizzare interazioni proteina-ligando in file PDB.

Le sue funzionalità comprendono:

  • rilevamento di otto diversi tipi di interazioni non covalenti;
  • rilevamento automatico dei ligandi rilevanti in un file PDB;
  • scaricamento diretto di strutture PDB da server wwPDB se viene fornito un ID di PDB valido;
  • elaborazione di file PDB personalizzati contenenti complessi proteina- ligando (es. dal docking);
  • nessuna necessità per preparazione speciale di un file PDB, funziona così come è;
  • rapporti su interazioni a livello di atomi nei formati rST e XML per una facile analisi;
  • generazione di file di sessione di PyMOL (.pse) per ogni accoppiamento, che permette una facile preparazione di immagini per pubblicazioni e presentazioni;
  • rendering di immagini di anteprima per ciascun ligando e le sue interazioni con la proteina.
Please cite: Sebastian Salentin, Sven Schreiber, V. Joachim Haupt, Melissa F. Adasme and Michael Schroeder: PLIP: fully automated protein–ligand interaction profiler. (eprint) Nucleic Acids Research (W1) (2015)
Registry entries: Bio.tools 
poa
Partial Order Alignment per allineamenti multipli di sequenza
Versions of package poa
ReleaseVersionArchitectures
jessie2.0+20060928-3amd64,armel,armhf,i386
stretch2.0+20060928-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.0+20060928-7amd64,arm64,armhf,i386
bullseye2.0+20060928-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.0+20060928-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.0+20060928-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.0+20060928-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package poa:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
works-with-formatplaintext
Popcon: 9 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

POA è Partial Order Alignment, un programma veloce per MSA (allineamenti multipli di sequenza) in campo bioinformatico. I suoi vantaggi sono velocità, scalabilità, sensibilità e una capacità superiore di gestire ramificazioni e inserzioni/delezioni nell'allineamento. POA è un approccio a MSA che può essere combinato con metodi esistenti come l'allineamento progressivo. POA allinea in maniera ottimale una coppia di MSA e ciò può essere successivamente applicato direttamente a metodi di allineamento progressivo come CLUSTAL. Per allineamenti grandi, Progressive POA è 10-30 volte più veloce di CLUSTALW.

Registry entries: Bioconda 
Screenshots of package poa
populations
software di genetica delle popolazioni
Versions of package populations
ReleaseVersionArchitectures
sid1.2.33+svn0120106+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.2.33+svn0120106-2.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.2.33+svn0120106+dfsg-2amd64,arm64,armhf,i386
bullseye1.2.33+svn0120106+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.33+svn0120106+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.33+svn0120106+dfsg-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.2.33+svn0120106-2.1amd64,armel,armhf,i386
Debtags of package populations:
roleprogram
uitoolkitqt
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Populations è un software di genetica delle popolazioni. Calcola distanze genetiche tra popolazioni o individui. Crea alberi filogenetici (NJ o UPGMA) con valori bootstrap.

Screenshots of package populations
porechop
adapter trimmer for Oxford Nanopore reads
Versions of package porechop
ReleaseVersionArchitectures
bookworm0.2.4+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.2.4+dfsg-1amd64,arm64,armhf,i386
sid0.2.4+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.2.4+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.2.4+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Porechop is a tool for finding and removing adapters from Oxford Nanopore reads. Adapters on the ends of reads are trimmed off, and when a read has an adapter in its middle, it is treated as chimeric and chopped into separate reads. Porechop performs thorough alignments to effectively find adapters, even at low sequence identity. Porechop also supports demultiplexing of Nanopore reads that were barcoded with the Native Barcoding Kit, PCR Barcoding Kit or Rapid Barcoding Kit.

Registry entries: Bioconda 
poretools
toolkit per dati Nanopore di sequenziamento di nucleotidi
Versions of package poretools
ReleaseVersionArchitectures
bullseye0.6.0+dfsg-5all
buster0.6.0+dfsg-3all
stretch0.6.0+dfsg-2all
trixie0.6.0+dfsg-7all
bookworm0.6.0+dfsg-6all
sid0.6.0+dfsg-7all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

poretools è un toolkit flessibile per esplorare insiemi di dati generati da dispositivi Nanopore di sequenziamento da MinION con gli scopi di controllo di qualità e di analisi a valle. poretools opera direttamente sul formato di file nativo FAST5 (una variante dello standard HDF5) prodotto da ONT e fornisce una vasta gamma di utilità per convertire formati e strumenti per visualizzazione ed esplorazione dei dati.

Please cite: Nicholas Loman and Aaron Quinlan: Poretools: a toolkit for analyzing nanopore sequence data. (PubMed,eprint) Bioinformatics 30(23):3399-3401 (2014)
Registry entries: Bio.tools  Bioconda 
pplacer
phylogenetic placement and downstream analysis
Versions of package pplacer
ReleaseVersionArchitectures
bullseye1.1~alpha19-4amd64,arm64,ppc64el,s390x
sid1.1~alpha19-8amd64,arm64,ppc64el,riscv64,s390x
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Pplacer places reads on a phylogenetic tree. guppy (Grand Unified Phylogenetic Placement Yanalyzer) yanalyzes them. rppr is a helpful tool for working with reference packages.

Pplacer places query sequences on a fixed reference phylogenetic tree to maximize phylogenetic likelihood or posterior probability according to a reference alignment. Pplacer is designed to be fast, to give useful information about uncertainty, and to offer advanced visualization and downstream analysis.

Please cite: Frederick A Matsen, Robin B Kodner and E Virginia Armbrust: pplacer: linear time maximum-likelihood and Bayesian phylogenetic placement of sequences onto a fixed reference tree. (PubMed,eprint) BMC Bioinformatics 11:538 (2010)
Registry entries: Bioconda 
prank
kit per allineamenti probabilistici di sequenze di DNA, codoni e amminoacidi
Versions of package prank
ReleaseVersionArchitectures
sid0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.0.170427+dfsg-2amd64,arm64,armhf,i386
stretch0.0.150803-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.0.140110-1amd64,armel,armhf,i386
trixie0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.0.170427+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 11 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

PRANK è un programma per allineamenti multipli probabilistici per sequenze di DNA, codoni e amminoacidi. È basato su un algoritmo innovativo che tratta le inserzioni correttamente e evita di sovrastimare il numero degli eventi di delezione. In aggiunta PRANK prende a prestito idee dai metodi di massima verosimiglianza usati in filogenetica e prende in considerazione correttamente le distanze evolutive tra le sequenze. Da ultimo, PRANK permette di definire una struttura potenziale per le sequenze da allineare e poi, contemporaneamente all'allineamento, predice le posizioni delle unità strutturali nelle sequenze.

PRANK è un programma a riga di comando per ambienti in stile UNIX, ma lo stesso motore di allineamento delle sequenze è implementato nel programma grafico PRANKSTER. In aggiunta a fornire un'interfaccia facile da usare per coloro che non hanno familiarità con i sistemi Unix, PRANKSTER è un navigatore di allineamenti per gli allineamenti salvati in formato HSAML. Il nuovo formato permette di memorizzare tutte le informazioni generate dallo strumento di allineamento e il navigatore di allineamenti è un modo comodo per analizzare e manipolare i dati.

PRANK mira ad un allineamento di sequenze corretto dal punto di vista evolutivo e spesso il risultato è diverso da quelli generati con altri metodi di allineamento. Ci sono, tuttavia, casi in cui l'aspetto diverso è causato da violazioni degli assunti del metodo. Per capire perché le cose possono andare storto e come evitarlo, leggere la spiegazione delle differenze tra PRANK e i metodi tradizionali di allineamento progressivo.

Please cite: Ari Löztznoja: Phylogeny-aware alignment with PRANK. (PubMed) Methods Mol. Biol. 1079:155-170 (2014)
Registry entries: Bio.tools  Bioconda 
Screenshots of package prank
predictnls
predizione e analisi dei segnali di localizzazione nucleare delle proteine
Versions of package predictnls
ReleaseVersionArchitectures
buster1.0.20-5all
sid1.0.20-8all
trixie1.0.20-8all
jessie1.0.20-1all
bookworm1.0.20-8all
bullseye1.0.20-6all
stretch1.0.20-3all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

predictnls è un metodo per la predizione e l'analisi dei segnali di localizzazione nucleare delle proteine (NLS). In aggiunta a riportare le posizioni degli NLS trovati, predictnls fornisce anche delle brevi statistiche.

Please cite: Murat Cokol, Rajesh Nair and Burkhard Rost: Finding nuclear localization signals.. (PubMed,eprint) EMBO reports 1(5):411-415 (2000)
Registry entries: Bio.tools  SciCrunch 
Screenshots of package predictnls
presto
toolkit per elaborare sequenze di cellule B e T
Versions of package presto
ReleaseVersionArchitectures
bookworm0.7.1-1all
bullseye0.6.2-1all
trixie0.7.2-1all
sid0.7.2-1all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

pRESTO è un toolkit per elaborare letture grezze da sequenziamento ad alte prestazioni di repertori di cellule B e cellule T.

Gli enormi miglioramenti nelle tecnologie di sequenziamento ad alte prestazioni permettono ora la caratterizzazione su larga scala di repertori di linfociti, definiti come raccolte di proteine antigene-recettore trans-membrana posizionate sulla superficie di cellule B e cellule T. pRESTO (REpertoire Sequencing TOolkit) è composto da una suite di utilità per gestire tutti gli stadi dell'elaborazione di sequenze prima dell'assegnazione di segmenti a linee germinali. pRESTO è progettato per gestire letture singole o a terminali accoppiati. Include funzionalità per controllo di qualità, mascheramento dei primer, annotazione delle letture con codici a barre incorporati nelle sequenze, generazione di sequenze di consenso UMI (Unique Molecular Identifier), assemblaggio di letture a terminali accoppiati e identificazione di sequenze duplicate. Sono incluse anche numerose opzioni per operazioni di ordinamento, campionamento e conversione delle sequenze.

Please cite: Jason A. Vander Heiden, Gur Yaari, Mohamed Uduman, Joel N.H. Stern, Kevin C. O’Connor, David A. Hafler, Francois Vigneault and Steven H. Kleinstein: pRESTO: a toolkit for processing high-throughput sequencing raw reads of lymphocyte receptor repertoires. (PubMed,eprint) Bioinformatics 30(13):1930-1932 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
prime-phylo
stima bayesiana di alberi genetici che tiene in considerazione l'albero delle specie
Versions of package prime-phylo
ReleaseVersionArchitectures
stretch1.0.11-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.11-13amd64,arm64,mips64el,ppc64el,riscv64,s390x
jessie1.0.11-2amd64,armel,armhf,i386
trixie1.0.11-12amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster1.0.11-7amd64,arm64,armhf,i386
bookworm1.0.11-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.11-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

PrIME (Probabilistic Integrated Models of Evolution) è un pacchetto che permette l'inferenza di parametri evoluzionistici in un'infrastruttura bayesiana usando simulazioni con catene di Markov Monte Carlo. Una caratteristica distintiva di PrIME è che l'albero delle specie viene tenuto in considerazione quando vengono analizzati gli alberi genetici.

I dati di input di PrIME è un allineamento di sequenze multiple in formato FASTA e i dati di output contengono alberi in formato Newick.

Please cite: Ö. Åkerborg, B. Sennblad, L. Arvestad and J. Lagergren: Simultaneous Bayesian gene tree reconstruction and reconciliation analysis. (PubMed,eprint) Proceedings of the National Academy of Sciences 106(14):5714-5719 (2009)
Registry entries: Bio.tools 
primer3
strumento per progettare oligonucleotidi fiancheggianti per amplificazione di DNA
Versions of package primer3
ReleaseVersionArchitectures
bullseye2.4.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.3.6-1amd64,armel,armhf,i386
stretch2.3.7-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.4.0-2amd64,arm64,armhf,i386
bookworm2.6.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.6.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.6.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package primer3:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
works-with-formatplaintext
Popcon: 14 users (14 upd.)*
Versions and Archs
License: DFSG free
Git

Primer3 sceglie primer per PCR (Polymerase Chain Reaction, reazione a catena della polimerasi), valutando come criteri la temperatura di fusione, la dimensione, il contenuto in GC e le possibilità di formazione di primer-dimer dell'oligonucleotide, la dimensione del prodotto della PCR, limiti posizionali all'interno della sequenza sorgente e vari altri fattori limitanti. Tutti questi criteri sono specificabili dall'utente come limitazioni ed alcuni sono specificabili come termini in una funzione obiettivo che caratterizzi una coppia di primer ottimale.

Please cite: Steve Rozen and Helen J. Skaletsky: Primer3 on the WWW for general users and for biologist programmers. (PubMed,eprint) Methods Mol Biol. 132(3):365-86 (2000)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package primer3
prinseq-lite
dati per PReprocessing and INformation of SEQuence (versione leggera)
Versions of package prinseq-lite
ReleaseVersionArchitectures
sid0.20.4-6all
bookworm0.20.4-6all
bullseye0.20.4-6all
trixie0.20.4-6all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PRINSEQ aiuta a pre-elaborare i dati di sequenze genomiche o metagenomiche in formato FASTA o FASTQ. È uno strumento che genera statistiche riassuntive su sequenze e dati di qualità, e che è utilizzato per filtrare, riformattare e tagliare dati da sequenziamento di prossima generazione. È in particolare pensato per dati 454/Roche, ma può essere usato anche per altri tipi di dati di sequenze. La versione autonoma è principalmente progettata per la pre-elaborazione di dati e non genera statistiche riassuntive in forma grafica.

Please cite: Schmieder R and Edwards R: Quality control and preprocessing of metagenomic datasets. (PubMed,eprint) Bioinformatics 27(6):863-864 (2011)
proalign
programma per allineamenti multipli probabilistici
Versions of package proalign
ReleaseVersionArchitectures
trixie0.603-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.603-4amd64,arm64,armhf,i386
bookworm0.603-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.603-1amd64,armel,armhf,i386
bullseye0.603-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.603-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.603-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ProAlign effettua allineamenti multipli probabilistici usando modelli di Markov nascosti (HMM). Include un'interfaccia grafica (GUI) che permette di: (i) effettuare allineamenti di sequenze di nucleotidi o di aminoacidi, (ii) visualizzare la qualità delle soluzioni, (iii) filtrare le regioni con allineamenti non affidabili e (iv) esportare gli allineamenti per altro software.

ProAlign usa un metodo progressivo, in modo che l'allineamento multiplo viene creato passo a passo, effettuando allineamenti a coppie nei nodi di un albero guida. Le sequenze sono descritte con vettori di probabilità dei caratteri, e ogni allineamento a coppie ricostruisce la sequenza ancestrale (genitrice) calcolando le probabilità di diversi caratteri sulla base di un modello evolutivo.

Please cite: Ari Löytynoja and Michel C Milinkovitch: A hidden Markov model for progressive multiple alignment. (PubMed,eprint) Bioinformatics 19(12):1505-13 (2003)
probabel
insieme di strumenti per analisi di associazione a livello di genoma
Versions of package probabel
ReleaseVersionArchitectures
buster0.5.0+dfsg-3amd64,arm64,armhf,i386
stretch0.4.5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
jessie0.4.3-2amd64,armel,armhf,i386
sid0.5.0+dfsg-6amd64,i386
trixie0.5.0+dfsg-6amd64,i386
bookworm0.5.0+dfsg-6amd64,i386
bullseye0.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Il pacchetto ProbABEL fa parte del progetto GenABEL per l'analisi di dati a livello di genoma. ProbABEL viene usato per eseguire GWAS. Usando file in formato filevector/DatABEL è anche possibile eseguire GWAS su computer con solo pochi GB di RAM.

The package is enhanced by the following packages: probabel-examples
Please cite: Yurii S Aulchenko, Maksim V Struchalin and Cornelia M van Duijn: ProbABEL package for genome-wide association analysis of imputed data.. (PubMed,eprint) BMC Bioinformatics 11:134 (2010)
Registry entries: Bio.tools  SciCrunch 
probalign
allineamento di sequenze multiple usando le probabilità a posteriori della funzione di ripartizione
Versions of package probalign
ReleaseVersionArchitectures
jessie1.4-3amd64,armel,armhf,i386
sid1.4-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.4-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.4-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.4-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.4-8amd64,arm64,armhf,i386
stretch1.4-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 7 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Probalign usa stime della probabilità a posteriori della funzione di ripartizione per calcolare allineamenti di sequenze multiple con la massima accuratezza attesa. Funziona in modo migliore rispetto ai programmi di allineamento più usati Probcons v1.1, MAFFT v5.851 e MUSCLE v3.6 nei test di prestazione BAliBASE 3.0, HOMSTRAD e OXBENCH, e tale miglioramento è statisticamente significativo. I miglioramenti di Probalign sono maggiori negli insiemi di dati che contengono estensioni terminali N/C e in quelli con sequenze di lunghezze elevate ed eterogenee. Negli insiemi di dati con lunghezze eterogenee contenenti ripetizioni, l'accuratezza degli allineamenti di Probalign è del 10% e il 15% maggiore rispetto agli altri tre metodi, quando la deviazione standard della lunghezza è almeno 300 e 400.

Please cite: Usman Roshan and Dennis R. Livesay: Probalign: multiple sequence alignment using partition function posterior probabilities. (PubMed,eprint) Bioinformatics 22(22):2715-21 (2006)
Registry entries: SciCrunch 
probcons
allineamenti multipli di sequenze probabilistici basati sulla coerenza
Versions of package probcons
ReleaseVersionArchitectures
sid1.12-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.12-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.12-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.12-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.12-12amd64,arm64,armhf,i386
stretch1.12-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.12-9amd64,armel,armhf,i386
Debtags of package probcons:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
works-with-formatplaintext
Popcon: 13 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Strumento per generare allineamenti multipli di sequenze proteiche che usa una combinazione di modelli probabilistici e di tecniche di allineamento basate sulla coerenza. PROBCONS ha ottenuto dei livelli di accuratezza più alti di tutti i metodi di allineamento usati fino ad oggi. Nei test con il database degli allineamenti di riferimento BAliBASE, gli allineamenti prodotti con PROBCONS mostrano un significativo miglioramento rispetto ai programmi attuali poiché contengono in media il 7% in più di colonne correttamente allineate rispetto a T-Coffee, l'11% in più rispetto a CLUSTAL W ed il 14% in più rispetto a DIALIGN.

Please cite: Chuong B. Do, Mahathi S.P. Mahabhashyam, Michael Brudno and Serafim Batzoglou: ProbCons: Probabilistic consistency-based multiple sequence alignment. (PubMed,eprint) Genome Research 15(2):330-340 (2005)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package probcons
proda
allineamento multiplo di sequenze proteiche
Versions of package proda
ReleaseVersionArchitectures
jessie1.0-8amd64,armel,armhf,i386
sid1.0-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0-12amd64,arm64,armhf,i386
stretch1.0-10amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package proda:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 11 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

ProDA è un sistema per il rilevamento automatico e l'allineamento di regioni omologhe in insiemi di proteine con architetture di dominio arbitrarie. Dato un insieme di sequenze non allineate, ProDA identifica tutte le regioni omologhe che appaiono in una o più sequenze, e restituisce un insieme di allineamenti multipli locali per queste regioni.

Please cite: Tu Minh Phuong, Chuong B. Do, Robert C. Edgar and Serafim Batzoglou: Multiple alignment of protein sequences with repeats and rearrangements. (PubMed,eprint) Nucl. Acids Res. 34(20):5932-5942 (2006)
Registry entries: Bio.tools  Bioconda 
Screenshots of package proda
prodigal
programma per trovare geni microbici (di batteri e archeobatteri)
Versions of package prodigal
ReleaseVersionArchitectures
sid2.6.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.6.1-1amd64,armel,i386
stretch2.6.3-1amd64,arm64,armel,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.6.3-4amd64,arm64,armhf,i386
bullseye2.6.3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.6.3-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.6.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Prodigal (Prokaryotic Dynamic Programming Genefinding Algorithm) è un programma per trovare geni microbici (di batteri e archeobatteri) sviluppato all'Oak Ridge National Laboratory dell'University of Tennessee. Le funzionalità principali di Prodigal includono:

Velocità: Prodigal è uno strumento estremamente veloce per il riconoscimento di geni (scritto in C molto standard). Può analizzare un intero genoma microbico in 30 secondi o meno.

Accuratezza: Prodigal trova geni in modo altamente accurato. Localizza correttamente il terminale 3' di ogni gene nell'insieme dei dati Ecogene sperimentalmente verificato (tranne quelli che contengono introni). Possiede un sistema molto sofisticato di punteggi per i siti di legame con ribosomi che gli permette di localizzare il sito di inizio della traduzione con grande accuratezza (il 96% dei terminali 5' nell'insieme di dati Ecogene è correttamente localizzato).

Specificità: Il confronto di Prodigal con altri programmi di identificazione di geni è buono per ciò che riguarda il tasso di falsi positivi di Prodigal che di solito è inferiore al 5%.

Insensibile al contenuto di GC: Prodigal dà buoni risultati anche in genomi con alto contenuto di GC, con più del 90% di corrispondenza perfetta (5'+3') rispetto alle annotazioni riviste di Pseudomonas aeruginosa.

Versione metagenomica: Prodigal può essere eseguito in modalità metagenomica e analizzare sequenze anche quando l'organismo è sconosciuto.

Facilità d'uso: Progigal può essere eseguito in un unico passaggio su un'unica sequenza genomica oppure su una bozza di genoma contenente molte sequenze. Non è necessario fornirgli alcuna conoscenza sull'organismo dato che apprende da solo tutte le proprietà di cui ha bisogno.

Please cite: Doug Hyatt, Gwo-Liang Chen, Philip F. Locascio, Miriam L. Land, Frank W. Larimer and Loren J. Hauser: Prodigal: prokaryotic gene recognition and translation initiation site identification. (PubMed,eprint) BMC Bioinformatics 11:119 (2010)
Registry entries: SciCrunch  Bioconda 
profbval
predittore di residui flessibili/rigidi di proteine da sequenze
Versions of package profbval
ReleaseVersionArchitectures
trixie1.0.22-8all
stretch1.0.22-4all
jessie1.0.22-1all
bullseye1.0.22-7all
buster1.0.22-6all
bookworm1.0.22-8all
sid1.0.22-8all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PROFbval può essere utile per la predizione sia delle strutture delle proteine, sia per le loro funzioni. Per esempio, un biologo può individuare determinanti potenzialmente antigenici identificando i residui più flessibili sulla superficie della proteina. Inoltre, un cristallografo può individuare residui che potenzialmente hanno alti fattori B sperimentali.

PROFbval accetta i seguenti input, ulteriormente descritti in profbval(1):

  • una sequenza di proteina in un file FASTA;
  • una predizione di prof(1) su accessibilità al solvente e struttura secondaria;
  • un file HSSP.

Retroscena: la mobilità di un dato residuo sulla superficie della proteina è correlata al suo ruolo funzionale, perciò l'identificazione di residui estremamente rigidi o flessibili sulla superficie della proteina è utile per identificare residui funzionalmente importanti nelle proteine. Una misura comune della mobilità degli atomi nelle proteine è il dato del fattore B da strutture di cristallografia a raggi X. PROFbval è il primo strumento che predice fattori B backbone normalizzati da sequenze di aminoacidi.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: PROFbval: predict flexible and rigid residues in proteins.. (PubMed) Bioinformatics 22(7):891-3 (2006)
profisis
predizione di siti di interazione proteina-proteina dalla sequenza
Versions of package profisis
ReleaseVersionArchitectures
jessie1.0.11-1all
trixie1.0.11-7all
sid1.0.11-7all
bookworm1.0.11-7all
bullseye1.0.11-6all
buster1.0.11-5all
stretch1.0.11-3all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Profisis (ISIS) identifica i residui proteici che interagiscono in interfacce proteina-proteina a partire dalla sola sequenza.

Le predizioni più robuste del metodo hanno raggiunto più del 90% di accuratezza in un esperimento di validazione incrociata.

Please cite: Yanay Ofran and Burkhard Rost: ISIS: interaction sites identified from sequence. (PubMed,eprint) Bioinformatics 23(2):e13-e16 (2007)
Registry entries: Bio.tools 
profnet-bval
architettura di rete neurale per profbval
Versions of package profnet-bval
ReleaseVersionArchitectures
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.22-6amd64,arm64,armhf,i386
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.0.22-2amd64,armel,armhf,i386
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet è un componente dei metodi di predizione che costituiscono il servizio Predict Protein del laboratorio di Burkhard Rost. Fornisce il componente per rete neurale ad una varietà di predittori che effettuano la predizione di caratteristiche delle proteine direttamente da sequenze. Questa implementazione di rete neurale deve essere compilata per ogni architettura di rete diversa.

Questo pacchetto contiene l'architettura di rete neurale per profbval.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profnet-chop
architettura di rete neurale per profchop
Versions of package profnet-chop
ReleaseVersionArchitectures
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.0.22-2amd64,armel,armhf,i386
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.0.22-6amd64,arm64,armhf,i386
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet è un componente dei metodi di predizione che costituiscono il servizio Predict Protein del laboratorio di Burkhard Rost. Fornisce il componente per rete neurale ad una varietà di predittori che effettuano la predizione di caratteristiche delle proteine direttamente da sequenze. Questa implementazione di rete neurale deve essere compilata per ogni architettura di rete diversa.

Questo pacchetto contiene l'architettura di rete neurale per profchop.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profnet-con
architettura di rete neurale per profcon
Versions of package profnet-con
ReleaseVersionArchitectures
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.22-6amd64,arm64,armhf,i386
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.0.22-2amd64,armel,armhf,i386
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet è un componente dei metodi di predizione che costituiscono il servizio Predict Protein del laboratorio di Burkhard Rost. Fornisce il componente per rete neurale ad una varietà di predittori che effettuano la predizione di caratteristiche delle proteine direttamente da sequenze. Questa implementazione di rete neurale deve essere compilata per ogni architettura di rete diversa.

Questo pacchetto contiene l'architettura di rete neurale per profcon.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profnet-isis
architettura di rete neurale per profisis
Versions of package profnet-isis
ReleaseVersionArchitectures
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.22-6amd64,arm64,armhf,i386
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.22-2amd64,armel,armhf,i386
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet è un componente dei metodi di predizione che costituiscono il servizio Predict Protein del laboratorio di Burkhard Rost. Fornisce il componente per rete neurale ad una varietà di predittori che effettuano la predizione di caratteristiche delle proteine direttamente da sequenze. Questa implementazione di rete neurale deve essere compilata per ogni architettura di rete diversa.

Questo pacchetto contiene l'architettura di rete neurale per profisis.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profnet-md
architettura di rete neurale per metadisordine
Versions of package profnet-md
ReleaseVersionArchitectures
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.0.22-2amd64,armel,armhf,i386
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.22-6amd64,arm64,armhf,i386
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet è un componente dei metodi di predizione che costituiscono il servizio Predict Protein del laboratorio di Burkhard Rost. Fornisce il componente per rete neurale ad una varietà di predittori che effettuano la predizione di caratteristiche delle proteine direttamente da sequenze. Questa implementazione di rete neurale deve essere compilata per ogni architettura di rete diversa.

Questo pacchetto contiene l'architettura di rete neurale per metadisordine.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profnet-norsnet
architettura di rete neurale per norsnet
Versions of package profnet-norsnet
ReleaseVersionArchitectures
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.22-6amd64,arm64,armhf,i386
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.22-2amd64,armel,armhf,i386
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet è un componente dei metodi di predizione che costituiscono il servizio Predict Protein del laboratorio di Burkhard Rost. Fornisce il componente per rete neurale ad una varietà di predittori che effettuano la predizione di caratteristiche delle proteine direttamente da sequenze. Questa implementazione di rete neurale deve essere compilata per ogni architettura di rete diversa.

Questo pacchetto contiene l'architettura di rete neurale per norsnet.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profnet-prof
architettura di rete neurale per profacc
Versions of package profnet-prof
ReleaseVersionArchitectures
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.22-6amd64,arm64,armhf,i386
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.22-2amd64,armel,armhf,i386
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet è un componente dei metodi di predizione che costituiscono il servizio Predict Protein del laboratorio di Burkhard Rost. Fornisce il componente per rete neurale ad una varietà di predittori che effettuano la predizione di caratteristiche delle proteine direttamente da sequenze. Questa implementazione di rete neurale deve essere compilata per ogni architettura di rete diversa.

Questo pacchetto contiene l'architettura di rete neurale per profsec e profacc.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profnet-snapfun
architettura di rete neurale per snapfun
Versions of package profnet-snapfun
ReleaseVersionArchitectures
jessie1.0.22-2amd64,armel,armhf,i386
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.22-6amd64,arm64,armhf,i386
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet è un componente dei metodi di predizione che costituiscono il servizio Predict Protein del laboratorio di Burkhard Rost. Fornisce il componente per rete neurale ad una varietà di predittori che effettuano la predizione di caratteristiche delle proteine direttamente da sequenze. Questa implementazione di rete neurale deve essere compilata per ogni architettura di rete diversa.

Questo pacchetto contiene l'architettura di rete neurale per snapfun.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profphd
secondary structure and solvent accessibility predictor
Versions of package profphd
ReleaseVersionArchitectures
buster1.0.42-3all
jessie1.0.40-1all
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides prof(1), the protein secondary structure, accessibility and transmembrane helix predictor from Burkhard Rost. Prediction is either done from protein sequence alone or from an alignment - the latter should be used for optimal performance.

How well does prof(1) perform?

  • Secondary structure is predicted at an expected average accuracy > 72% for the three states helix, strand and loop.

  • Solvent accessibility is predicted at a correlation coefficient (correlation between experimentally observed and predicted relative solvent accessibility) of 0.54

  • Transmembrane helix prediction has an expected per-residue accuracy of about 95%. The number of false positives, i.e., transmembrane helices predicted in globular proteins, is about 2%.

Please cite: Burkhard Rost and Chris Sander: Combining evolutionary information and neural networks to predict protein secondary structure. (PubMed) Proteins 19(1):55-72 (1994)
profphd-net
architettura di rete neurale per profphd
Versions of package profphd-net
ReleaseVersionArchitectures
bullseye1.0.22-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.22-2amd64,armel,armhf,i386
trixie1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.0.22-6amd64,arm64,armhf,i386
sid1.0.22-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.0.22-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Profnet è un componente dei metodi di predizione che costituiscono il servizio Predict Protein del laboratorio di Burkhard Rost. Fornisce il componente per rete neurale ad una varietà di predittori che effettuano la predizione di caratteristiche delle proteine direttamente da sequenze. Questa implementazione di rete neurale deve essere compilata per ogni architettura di rete diversa.

Questo pacchetto contiene l'architettura di rete neurale per profphd.

Please cite: Avner Schlessinger, Guy Yachdav and Burkhard Rost: OPRFbval: predict flexible and rigid residues in proteins. (PubMed,eprint) Bioinformatics 22(7):891-893 (2006 Apr 1)
profphd-utils
utilità ausiliarie convert_seq e filter_hssp per profphd
Versions of package profphd-utils
ReleaseVersionArchitectures
sid1.0.10-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.0.10-5amd64,arm64,armhf,i386
bullseye1.0.10-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.10-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.0.10-1amd64,armel,armhf,i386
stretch1.0.10-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.0.10-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Il pacchetto fornisce le seguenti utilità binarie: convert_seq, filter_hssp. Sono usate da prof del pacchetto profphd: un predittore di struttura secondaria, accessibilità e elica transmembrana da Burkhard Rost.

proftmb
per-residue prediction of bacterial transmembrane beta barrels
Versions of package proftmb
ReleaseVersionArchitectures
bullseye1.1.12-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.1.12-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.1.12-2amd64,armel,armhf,i386
bookworm1.1.12-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1.12-8amd64,arm64,armhf,i386
trixie1.1.12-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.1.12-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

proftmb predicts transmembrane beta-barrel (TMB) proteins in Gram-negative bacteria.

For each query protein, proftmb provides both a Z-value indicating that the protein actually contains a membrane barrel, and a four-state per-residue labeling of upward- and downward-facing strands, periplasmic hairpins and extracellular loops.

The package is enhanced by the following packages: proftmb-dbg
Please cite: H. Bigelow and B. Rost: PROFtmb: a web server for predicting bacterial transmembrane beta barrel proteins.. (PubMed) Nucleic Acids Res 34(Web Server issue):W186-8 (2006)
Registry entries: Bio.tools 
progressivemauve
algoritmi per allineamenti multipli di genomi
Versions of package progressivemauve
ReleaseVersionArchitectures
trixie1.2.0+4713+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.2.0+4713+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.2.0+4713+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.2.0+4713+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2.0+4713+dfsg-4amd64,arm64,armhf,i386
stretch1.2.0+4713-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Gli algoritmi di allineamento mauveAligner e progressiveMauve sono stati implementati come programmi a riga di comando inclusi con il software scaricabile Mauve. Quando eseguiti dalla riga di comando, tali programmi forniscono opzioni non ancora disponibili nell'interfaccia grafica.

Mauve è un sistema per costruire in modo efficiente allineamenti multipli di genomi in presenza di eventi evolutivi su grande scala, come riarrangiamenti ed inversioni. L'allineamento multiplo di genomi fornisce una base per la ricerca nel campo della genomica comparativa e per lo studio della dinamica evolutiva. L'allineamento di interi genomi è un problema sostanzialmente diverso dall'allineamento di sequenze corte.

Mauve è stato sviluppato con l'idea che un allineatore di genomi multipli dovrebbe richiedere risorse di calcolo modeste. Utilizza tecniche algoritmiche che scalano bene con la quantità di sequenze da allineare. Per esempio una coppia di genomi di Y. pestis può essere allineata in meno di un minuto, mentre un gruppo di 9 genomi divergenti di enterobatteri può essere allineato in alcune ore.

Mauve calcola e visualizza in modo interattivo confronti tra sequenze genomiche. Usando dati di sequenze FastA o GenBank, Mauve costruisce allineamenti multipli di genomi che identificano riarrangiamenti su larga scala, acquisizione e perdita di geni, indel e sostituzione di nucleotidi.

Mauve è sviluppato all'University of Wisconsin.

Please cite: Aaron E. Darling, Bob Mau and Nicole T. Perna: progressiveMauve: multiple genome alignment with gene gain, loss and rearrangement. (PubMed,eprint) PloS one 5(6):e11147 (2010)
Registry entries: Bio.tools  SciCrunch 
prokka
annotazione rapida di genomi di procarioti
Versions of package prokka
ReleaseVersionArchitectures
sid1.14.6+dfsg-6all
bookworm1.14.6+dfsg-4amd64
bullseye1.14.6+dfsg-3amd64
trixie1.14.6+dfsg-6all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Un tipico genoma con 4 Mbp può essere completamente annotato in meno di 10 minuti su un computer quad-core e scala bene fino a sistemi SMP con 32 core. Produce file GFF3, GBK e SQN che sono pronti per la modifica in Sequin e infine inviati a Genbank/DDJB/ENA.

The package is enhanced by the following packages: multiqc
Please cite: Torsten Seemann: Prokka: rapid prokaryotic genome annotation. (PubMed,eprint) Bioinformatics 30(14):2068-2069 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
proteinortho
rilevazione di (co-)ortologhi in analisi su vasta scala di proteine
Versions of package proteinortho
ReleaseVersionArchitectures
sid6.3.1+dfsg-1amd64,arm64,ppc64el,riscv64,s390x
trixie6.3.1+dfsg-1amd64,arm64,ppc64el,riscv64,s390x
bookworm6.1.7+dfsg-1amd64,arm64,ppc64el,s390x
stretch5.15+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster5.16.b+dfsg-1amd64,arm64,armhf,i386
bullseye6.0.28+dfsg-1amd64,arm64,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Proteinortho è uno strumento autonomo che è diretto verso grandi insiemi di dati e fa uso di tecniche di calcolo distribuito quando gira su hardware multi-core. Implementa una versione estesa dell'euristica per il miglior allineamento reciproco. Proteinortho è stato applicato per calcolare le proteine ortologhe nell'insieme completo di tutti i 717 genomi eubatterici disponibili su NCBI all'inizio del 2009. Gli autori sono riusciti ad identificare trenta proteine presenti nel 99% di tutti i proteomi batterici.

Please cite: Marcus Lechner, Sven Findeiß, Lydia Steiner, Manja Marz, Peter F Stadler and Sonja J Prohaska: Proteinortho: Detection of (Co-)orthologs in large-scale analysis. (PubMed,eprint) BMC Bioinformatics 12:124 (2011)
prottest
selezione di modelli di best-fit per evoluzione di proteine
Versions of package prottest
ReleaseVersionArchitectures
buster3.4.2+dfsg-3all
trixie3.4.2+dfsg-8all
bookworm3.4.2+dfsg-8all
bullseye3.4.2+dfsg-5all
stretch3.4.2+dfsg-2all
sid3.4.2+dfsg-8all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PROTTEST (parente di ModelTest) è un programma per selezionare il modello di evoluzione di una proteina che meglio si adatta a un dato insieme di sequenze (allineamento). Questo programma in Java è basato sul programma Phyml (per calcoli col metodo della massima verosimiglianza e ottimizzazione dei parametri) e usa anche la libreria PAL. I modelli inclusi sono matrici empiriche di sostituzione (come WAG, LG, mtREV, Dayhoff, DCMut, JTT, VT, Blosum62, CpREV, RtREV, MtMam, MtArt, HIVb e HIVw) che indicano i tassi relativi di sostituzione di aminoacidi e specifici miglioramenti (+I: siti invarianti, +G: tasso di eterogeneità tra siti, +F: frequenze osservate di aminoacidi) per tenere conto di vincoli evolutivi imposti dalla conservazione della struttura e della funzione delle proteine. ProtTest usa l'Akaike Information Criterion (AIC) e altre statistiche (AICc e BIC) per trovare quale dei modelli candidati si adatta meglio ai dati a disposizione.

Please cite: Diego Darriba, Guillermo L. Taboada, Ramón Doallo and David Posada: ProtTest 3: fast selection of best-fit models of protein evolution. (PubMed,eprint) Bioinformatics 27(8):1164-5 (2011)
Registry entries: Bio.tools  SciCrunch 
provean
Protein Variation Effect Analyzer
Versions of package provean
ReleaseVersionArchitectures
bookworm1.1.5+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.1.5+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PROVEAN (Protein Variation Effect Analyzer) is a software tool which predicts whether an amino acid substitution or indel has an impact on the biological function of a protein.

PROVEAN is useful for filtering sequence variants to identify nonsynonymous or indel variants that are predicted to be functionally important.

The performance of PROVEAN is comparable to popular tools such as SIFT or PolyPhen-2.

A fast computation approach to obtain pairwise sequence alignment scores enabled the generation of precomputed PROVEAN predictions for 20 single AA substitutions and a single AA deletion at every amino acid position of all protein sequences in human and mouse.

pscan-chip
ChIP-based identifcation of TF binding sites
Versions of package pscan-chip
ReleaseVersionArchitectures
sid1.1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1-2amd64,arm64,armhf,i386
trixie1.1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Regulation of transcription is one of the main check points of gene expression regulation and plays a key role in fundamental processes like cellular differentiation and dynamic molecular responses to stimuli The transcriptional activity of genes is finely regulated by the interaction of sequence elements on the DNA (transcription factor binding sites or TFBSs) and particular proteins called Transcription Factors (TFs). , TFBSs are usually clustered in specific regulatory genomic regions called promoters and enhancers. TFs usually recognize TFBSs in a loose sequence specific fashion but there is no computational way to determine if any given sequence motif on the DNA is actually bound in-vivo by a TF, even when the motif is an istance of the sequences typically bound by the TF itself.

Tools like Pscan and PscanChIP analyse a set of regulatory sequences to detect motif enrichment. The rationale is that if a given TFBS is present in a "surpisingly high" number of istances then there is a good chance that the TF that recognize that motif is a common regulator of the input sequences, thus they use redundancy as an information source.

While Pscan (of the pscan-tfbs package) is tailored to work on promoters, that is the regulatory regions upstream of transcription start sites, PscanChIP is suited to work on more general regulatory genomic regions like the ones identified through ChIP-Seq experiments.

Registry entries: Bio.tools  SciCrunch 
pscan-tfbs
search for transcription factor binding sites
Versions of package pscan-tfbs
ReleaseVersionArchitectures
sid1.2.2-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.2-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.2.2-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.2.2-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2.2-3amd64,arm64,armhf,i386
Popcon: 11 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Pscan finds Over-represented Transcription Factor Binding Site Motifs in Sequences from Co-Regulated or Co-Expressed Genes.

Pscan is a software tool that scans a set of sequences (e.g. promoters) from co-regulated or co-expressed genes with motifs describing the binding specificity of known transcription factors and assesses which motifs are significantly over- or under-represented, providing thus hints on which transcription factors could be common regulators of the genes studied, together with the location of their candidate binding sites in the sequences. Pscan does not resort to comparisons with orthologous sequences and experimental results show that it compares favorably to other tools for the same task in terms of false positive predictions and computation time. The website is free and open to all users and there is no login requirement.

Please cite: Federico Zambelli, Graziano Pesole and Giulio Pavesi: Pscan: Finding Over-represented Transcription Factor Binding Site Motifs in Sequences from Co-Regulated or Co-Expressed Genes. (PubMed,eprint) Nucleic Acids Research 37(Web Server Issue):W247-W252 (2009)
Registry entries: Bio.tools 
psortb
bacterial localization prediction tool
Versions of package psortb
ReleaseVersionArchitectures
buster3.0.6+dfsg-1amd64
bullseye3.0.6+dfsg-2amd64
sid3.0.6+dfsg-4amd64
stretch-backports3.0.6+dfsg-1~bpo9+1amd64
bookworm3.0.6+dfsg-3amd64
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PSORTb enables prediction of bacterial protein subcellular localization (SCL) and provides a quick and inexpensive means for gaining insight into protein function, verifying experimental results, annotating newly sequenced bacterial genomes, detecting potential cell surface/secreted drug targets, as well as identifying biomarkers for microbes.

Please cite: Nancy Y. Yu, James R. Wagner, Matthew R. Laird, Gabor Melli, Sébastien Rey, Raymond Lo, Phuong Dao, S. Cenk Sahinalp, Martin Ester, Leonard J. Foster and F. S. Brinkman: PSORTb 3.0: improved protein subcellular localization prediction with refined localization subcategories and predictive capabilities for all prokaryotes. (PubMed,eprint) Bioinformatics 26(13):1608-1615 (2010)
pullseq
estrae sequenze da un FASTA o FASTQ
Versions of package pullseq
ReleaseVersionArchitectures
bookworm1.0.2-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.2-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0.2-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Questa è un'utilità per estrarre sequenze da un FASTA o FASTQ. Aiuta anche a filtrare le sequenze in base ad una lunghezza minima o massima. È veloce, scritto in C usando la libreria kseq.h.

pycoqc
computes metrics and generates Interactive QC plots
Versions of package pycoqc
ReleaseVersionArchitectures
bookworm2.5.2+dfsg-3all
bullseye2.5.2+dfsg-1all
trixie2.5.2+dfsg-3all
sid2.5.2+dfsg-3all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PycoQC computes metrics and generates interactive QC plots for Oxford Nanopore technologies sequencing data

PycoQC relies on the sequencing_summary.txt file generated by Albacore and Guppy, but if needed it can also generates a summary file from basecalled fast5 files. The package supports 1D and 1D2 runs generated with Minion, Gridion and Promethion devices and basecalled with Albacore 1.2.1+ or Guppy 2.1.3+

The package is enhanced by the following packages: multiqc
Registry entries: Bioconda 
pycorrfit
strumento per fare il fit di curve di correlazione su un grafico logaritmico
Versions of package pycorrfit
ReleaseVersionArchitectures
bullseye1.1.7+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.1.7+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1.7+nopack-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.1.7+nopack-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.9.9+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.8.3-2all
buster1.1.5+dfsg-1amd64,arm64,armhf,i386
Debtags of package pycorrfit:
fieldbiology, mathematics, physics
interfacex11
roleprogram
sciencemodelling, plotting, visualisation
scopeapplication
uitoolkitwxwidgets
useanalysing, learning, organizing, viewing
x11application
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

PyCorrFit è un software generico per calcoli FCS che gestisce, tra gli altri, il comunissimo formato di file ~.fcs di Zeiss ConfoCor3. PyCorrFit viene fornito con diverse funzioni modello incorporate che coprono una vasta gamma di applicazioni in FCS confocale standard. In aggiunta contiene equazioni per diverse geometrie di eccitazione, come la TIR (riflessione interna totale).

Please cite: Paul Müller, Petra Schwille and Thomas Weidemann: PyCorrFit—generic data evaluation for fluorescence correlation spectroscopy. (PubMed) Bioinformatics 30(17):2532–2533 (2014)
pyensembl
installs data from the Ensembl genome database
Versions of package pyensembl
ReleaseVersionArchitectures
trixie2.3.13-1all
bookworm2.2.4+ds-1all
sid2.3.13-1all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The Ensembl genome database is an established reference for genomic sequences and their automated annotation. To have this data local has advantages for bulk analyses, e.g. for the mapping of reads from RNA-seq against the latest golden path - or a previous one to compare analyses.

This package provides a reproducible way to insatll this data and thus simplify the automation of respective workflows.

Registry entries: Bio.tools  Bioconda 
pyfastx
fast random access to sequences from FASTA/Q file - command
Versions of package pyfastx
ReleaseVersionArchitectures
trixie2.1.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.8.4-2amd64,arm64,i386,mips64el,ppc64el,s390x
sid2.1.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The pyfastx is a lightweight Python C extension that enables users to randomly access to sequences from plain and gzipped FASTA/Q files. This module aims to provide simple APIs for users to extract sequence from FASTA and reads from FASTQ by identifier and index number. The pyfastx will build indexes stored in a sqlite3 database file for random access to avoid consuming excessive amount of memory. In addition, the pyfastx can parse standard (sequence is spread into multiple lines with same length) and nonstandard (sequence is spread into one or more lines with different length) FASTA format.

It features:

  • a single file for the Python extension;
  • lightweight, memory efficient FASTA/Q file parsing;
  • fast random access to sequences from gzipped FASTA/Q file;
  • sequences reading from FASTA file line by line;
  • N50 and L50 calculation of sequences in FASTA file;
  • GC content and nucleotides composition calculation;
  • reverse, complement and antisense sequences extraction;
  • excellent compatibility: support for parsing nonstandard FASTA file;
  • support for FASTQ quality score conversion;
  • a command line interface for splitting FASTA/Q file.

This package provides the command line interface.

Please cite: Lianming Du, Qin Liu, Zhenxin Fan, Jie Tang, Xiuyue Zhang, Megan Price, Bisong Yue and Kelei Zhao: Pyfastx: a robust Python package for fast random access to sequences from plain and gzipped FASTA/Q files. (PubMed) Briefings in Bioinformatics 22(4) (2021)
Registry entries: Bioconda 
pymol
sistema di grafica per molecole
Versions of package pymol
ReleaseVersionArchitectures
bookworm2.5.0+dfsg-1all
buster2.2.0+dfsg-4all
trixie3.0.0+dfsg-1all
stretch1.8.4.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.0.0+dfsg-1all
jessie1.7.2.1-1amd64,armel,armhf,i386
bullseye2.4.0+dfsg-2all
Debtags of package pymol:
fieldbiology:structural, chemistry
interface3d, x11
roleprogram
scopeutility
uitoolkittk
uselearning, viewing
works-withimage
x11application
Popcon: 57 users (26 upd.)*
Versions and Archs
License: DFSG free
Git

PyMOL è un sistema di grafica per molecole pensato per biomolecole medie o grandi, come proteine. Può generare immagini grafiche e animazioni di molecole di alta qualità pronte per la pubblicazione.

Le funzionalità includono:

  • visualizzazione di molecole, traiettorie molecolari e superfici di dati di cristallografia o orbitali;
  • costruttore e scultore molecolare;
  • raytracer e generatore di filmati interno;
  • completamente estensibile e gestibile da script tramite interfaccia Python.

Tra i formati file che PyMOL può leggere sono inclusi PDB, XYZ, CIF, MDL Molfile, ChemDraw, mappe CCP4, mappe XPLOR e mappe gaussiane cubiche.

Registry entries: Bio.tools  SciCrunch 
Topics:
pyscanfcs
strumento scientifico per FCS con scansione a linee perpendicolari
Versions of package pyscanfcs
ReleaseVersionArchitectures
bullseye0.3.6+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.3.2+ds-2amd64,arm64,armhf,i386
jessie0.2.2-2amd64,armel,armhf,i386
stretch0.2.3-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.3.6+ds-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.3.6+ds-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.3.6+ds-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Quando una membrana viene scansionata perpendicolarmente alla sua superficie, il segnale di fluorescenza che origina dalla membrana stessa deve essere separato dal segnale del mezzo circostante per poter fare un'analisi FCS. PyScanFCS estrae interattivamente il segnale fluttuante di fluorescenze da misurazioni di questo tipo e applica un algoritmo multiple-tau. Le curve di correlazione ottenute possono essere valutate usando PyCorrFit.

Il pacchetto fornisce il modulo Python pyscanfcs e la sua interfaccia utente grafica scritta in wxPython.

python3-biomaj3-daemon
libreria per demone di BioMAJ
Versions of package python3-biomaj3-daemon
ReleaseVersionArchitectures
bullseye3.0.22-2all
sid3.0.24-3all
trixie3.0.24-3all
buster3.0.17-1all
bookworm3.0.24-2all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

BioMAJ scarica banche dati remote, controlla il loro stato e applica i flussi di lavoro di trasformazione, con stato coerente, per fornire dati pronti all'uso ai biologi e bioinformatici. Per esempio, può trasformare file FASTA in indici BLAST. È molto flessibile e le sue funzionalità di post-elaborazione possono essere estese molto facilmente.

BioMAJ3 è una riscrittura della versione 1.x di BioMAJ; si veda la documentazione online per la migrazione.

Questo pacchetto contiene la libreria e il microservizio per gestire il demone e la CLI in BioMAJ3.

Registry entries: Bio.tools 
python3-bioxtasraw
process biological small angle scattering data
Versions of package python3-bioxtasraw
ReleaseVersionArchitectures
sid2.3.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm2.1.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 2 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

BioXTAS RAW is a GUI based, Python program for reduction and analysis of small-angle X-ray solution scattering (SAXS) data. The package is designed for biological SAXS data.

BioXTAS RAW provides an alternative to closed source programs such as Primus and Scatter for primary data analysis. Because it can calibrate, mask, and integrate images it also provides an alternative to synchrotron beamline pipelines that scientists can install on their own computers and use both at home and at the beamline.

python3-cogent3
infrastruttura per biologia genomica
Versions of package python3-cogent3
ReleaseVersionArchitectures
sid2024.5.7a1+dfsg-3amd64,arm64,mips64el,ppc64el
sid2023.12.15a1+dfsg-1s390x
bullseye2020.12.21a+dfsg-4+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2023.2.12a1+dfsg-2+deb12u1amd64,arm64,mips64el,ppc64el,s390x
upstream2024.7.19a9
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

PyCogent è una libreria software per la biologia genomica. È un'infrastruttura completamente integrata e accuratamente testata per:

  • controllare applicazioni di terze parti;
  • ideare flussi di lavoro; interrogare database;
  • condurre analisi probabilistiche innovative dell'evoluzione di sequenze biologiche;
  • generare grafici di qualità adatta per la pubblicazione. Si distingue per le molte funzionalità interne uniche (come un vero allineamento dei codoni) e l'aggiunta frequente di metodi completamente nuovi per l'analisi di dati genomici.
Please cite: Rob Knight, Peter Maxwell, Amanda Birmingham, Jason Carnes, J Gregory Caporaso, Brett C Easton, Michael Eaton, Micah Hamady, Helen Lindsay, Zongzhi Liu, Catherine Lozupone, Daniel McDonald, Michael Robeson, Raymond Sammut, Sandra Smit, Matthew J Wakefield, Jeremy Widmann, Shandy Wikman, Stephanie Wilson, Hua Ying and Gavin A Huttley: PyCogent: a toolkit for making sense from sequence. (PubMed,eprint) Genome Biology 8(8):R171 (2007)
Registry entries: Bio.tools  Bioconda 
python3-emperor
visualizzazione di dati di comunità microbiche ad alte prestazioni
Versions of package python3-emperor
ReleaseVersionArchitectures
bookworm1.0.3+ds-7all
trixie1.0.3+ds-9.1all
sid1.0.3+ds-9.1all
upstream1.0.4
Popcon: 43 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Emperor è uno strumento interattivo di prossima generazione per l'analisi, la visualizzazione e la comprensione di insiemi di dati di ecologia microbica ad alte prestazioni.

Grazie alla sua interfaccia utente fatta su misura, immergersi in un nuovo insieme di dati per spiegare modelli nascosti nei dati, non è mai stato così facile. Emperor porta un ricco insieme di personalizzazioni e modifiche che possono essere integrate in qualsiasi insieme di dati conforme a QIIME o scikit-bio; con file di dati leggeri e grafica accelerata tramite l'hardware, si posiziona all'avanguardia nell'arte di analizzare dati N-dimensionali usando l'analisi delle coordinate principali.

Please cite: Yoshiki Vázquez-Baeza, Meg Pirrung, Antonio Gonzalez and Rob Knight: EMPeror: a tool for visualizing high-throughput microbial community data. (PubMed) Gigascience 2(1):16 (2013)
Registry entries: Bioconda 
python3-geneimpacts
wrapper per strumenti a riga di comando per valutare varianti in sequenze geniche
Versions of package python3-geneimpacts
ReleaseVersionArchitectures
bullseye0.3.7-3all
trixie0.3.7-4all
bookworm0.3.7-4all
sid0.3.7-4all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le differenze interpersonali nel DNA sono responsabili delle variazioni nelle risposte agli stimoli esterni, nell'efficienza del metabolismo o possono anche causare ciò che viene chiamato disordine genetico.

È stata creata una gamma di strumenti per predire l'importanza di differenze (polimorfismi) di singoli nucleotidi in sequenze genetiche (SNP). Questa classe Python fa da wrapper e rappresenta i risultati forniti da uno qualsiasi tra gli strumenti snpEff, VEP e BCFT.

Registry entries: Bioconda 
python3-gffutils
lavorare con file GFF e GTF in un'infrastruttura a database flessibile
Versions of package python3-gffutils
ReleaseVersionArchitectures
trixie0.13-1all
bookworm0.11.1-3all
bullseye0.10.1-2all
buster0.9-1all
sid0.13-1all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Un pacchetto Python per lavorare con i file in formato GFF e GTF, comunemente utilizzati per annotazioni genomiche, e per manipolarli. I file vengono caricati in un database sqlite3, permettendo una manipolazione molto più complessa delle caratteristiche gerarchiche (es.: geni, trascritti ed esoni) di quella possibile con i soli metodi in testo semplice.

Registry entries: Bio.tools  Bioconda 
python3-pairtools
infrastruttura per elaborare dati di sequenziamento da un esperimento Hi-C
Versions of package python3-pairtools
ReleaseVersionArchitectures
bookworm1.0.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid1.1.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie1.0.3-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye0.3.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Semplice e veloce infrastruttura a riga di comando per elaborare dati di sequenziamento da un esperimento Hi-C.

Elabora allineamenti di sequenze a terminali appaiati ed effettua le seguenti operazioni:

  • rileva giunzioni di legatura (alias coppie Hi-C) in sequenze allineate, a terminali accoppiati, di molecole di DNA Hi-C;
  • ordina file .pairs per analisi successive;
  • rileva, applica tag e rimuove duplicati di PCR/ottici;
  • genera statistiche esaurienti su insiemi di dati Hi-C;
  • seleziona coppie Hi-C in base a criteri definiti in modo flessibile;
  • ripristina allineamenti .sam da coppie Hi-C.
The package is enhanced by the following packages: python3-pairtools-examples
Registry entries: Bioconda 
python3-pybedtools
wrapper in Python 3 intorno a BEDTools per lavori di bioinformatica
Versions of package python3-pybedtools
ReleaseVersionArchitectures
bookworm0.9.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie0.10.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
sid0.10.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
buster0.8.0-1amd64,arm64
bullseye0.8.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

La suite di programmi BEDTools è ampiamente usata per la manipolazione di intervalli genomici, o "algebra del genoma". pybedtools fa da wrapper per BEDTools e lo estende, e offre manipolazioni a livello di tratti all'interno di Python.

Questa è la versione per Python 3.

Please cite: R. K. Dale, B. S. Pedersen and A. R. Quinlan: Pybedtools: a flexible Python library for manipulating genomic datasets and annotations". Bioinformatics 27(24):3423-3424 (2011)
Registry entries: Bio.tools  Bioconda 
python3-sqt
SeQuencing Tools for biological DNA/RNA high-throughput data
Versions of package python3-sqt
ReleaseVersionArchitectures
trixie0.8.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
sid0.8.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
buster0.8.0-3amd64,arm64
bullseye0.8.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bookworm0.8.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

sqt is a collection of command-line tools for working with high-throughput sequencing data. Conceptionally not fixed to use any particular language, many sqt subcommands are currently implemented in Python. For them, a Python package is available with functions for reading and writing FASTA/FASTQ files, computing alignments, quality trimming, etc.

The following tools are offered:

  • sqt-coverage -- Compute per-reference statistics such as coverage and GC content
  • sqt-fastqmod -- FASTQ modifications: shorten, subset, reverse complement, quality trimming.
  • sqt-fastastats -- Compute N50, min/max length, GC content etc. of a FASTA file
  • sqt-qualityguess -- Guess quality encoding of one or more FASTA files.
  • sqt-globalalign -- Compute a global or semiglobal alignment of two strings.
  • sqt-chars -- Count length of the first word given on the command line.
  • sqt-sam-cscq -- Add the CS and CQ tags to a SAM file with colorspace reads.
  • sqt-fastamutate -- Add substitutions and indels to sequences in a FASTA file.
  • sqt-fastaextract -- Efficiently extract one or more regions from an indexed FASTA file.
  • sqt-translate -- Replace characters in FASTA files (like the 'tr' command).
  • sqt-sam-fixn -- Replace all non-ACGT characters within reads in a SAM file.
  • sqt-sam-insertsize -- Mean and standard deviation of paired-end insert sizes.
  • sqt-sam-set-op -- Set operations (union, intersection, ...) on SAM/BAM files.
  • sqt-bam-eof -- Check for the End-Of-File marker in compressed BAM files.
  • sqt-checkfastqpe -- Check whether two FASTQ files contain correctly paired paired-end data.
Registry entries: Bioconda 
python3-treetime
inference of time stamped phylogenies and ancestral reconstruction (Python 3)
Versions of package python3-treetime
ReleaseVersionArchitectures
buster0.5.3-1all
trixie0.11.4-1all
sid0.11.4-1all
bookworm0.9.4-1all
bullseye0.8.1-1all
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

TreeTime provides routines for ancestral sequence reconstruction and the maximum likelihoo inference of molecular-clock phylogenies, i.e., a tree where all branches are scaled such that the locations of terminal nodes correspond to their sampling times and internal nodes are placed at the most likely time of divergence.

TreeTime aims at striking a compromise between sophisticated probabilistic models of evolution and fast heuristics. It implements GTR models of ancestral inference and branch length optimization, but takes the tree topology as given. To optimize the likelihood of time-scaled phylogenies, treetime uses an iterative approach that first infers ancestral sequences given the branch length of the tree, then optimizes the positions of unconstraine d nodes on the time axis, and then repeats this cycle. The only topology optimization are (optional) resolution of polytomies in a way that is most (approximately) consistent with the sampling time constraints on the tree. The package is designed to be used as a stand-alone tool or as a library used in larger phylogenetic analysis workflows.

Features

  • ancestral sequence reconstruction (marginal and joint maximum likelihood)
  • molecular clock tree inference (marginal and joint maximum likelihood)
  • inference of GTR models
  • rerooting to obtain best root-to-tip regression
  • auto-correlated relaxed molecular clock (with normal prior)

This package provides the Python 3 module.

Registry entries: Bioconda 
pyvcf
script ausiliari per l'analizzatore di Variant Call Format (VCF)
Versions of package pyvcf
ReleaseVersionArchitectures
bookworm0.6.8+git20170215.476169c-9all
bullseye0.6.8+git20170215.476169c-7all
buster0.6.8+git20170215.476169c-1all
sid0.6.8+git20170215.476169c-10all
stretch0.6.8-1all
trixie0.6.8+git20170215.476169c-10all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Variant Call Format (VCF) specifica il formato di un file di testo usato in bioinformatica per memorizzare variazioni di sequenze di geni. Il formato è stato sviluppato con l'avvento di progetti di sequenziamento di DNA e di genotipizzazione su larga scala, come il 1000 Genomes Project.

L'intento di questo modulo è di imitare il modulo "csv" nella stdlib di Python, in contrasto con formati più flessibili di serializzazione come JSON o YAML. "vcf" tenterà di analizzare il contenuto di ogni record sulla base dei tipi di dato specificati nelle righe di meta-informazioni, e precisamente le righe ##INFO e ##FORMAT. Se tali righe sono mancanti o incomplete, controllerà i tipi riservati menzionati nelle specifiche. In mancanza di ciò, restituirà semplicemente delle stringhe.

Questo pacchetto fornisce degli script ausiliari che usano python3-pyvcf.

Registry entries: Bioconda 
qcat
demultiplexing di letture Oxford Nanopore da file FASTQ
Versions of package qcat
ReleaseVersionArchitectures
trixie1.1.0-6all
sid1.1.0-6all
bullseye1.1.0-2all
bookworm1.1.0-6all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Qcat è uno strumento a riga di comando per fare il demultiplexing di letture Oxford Nanopore da file FASTQ. Accetta file FASTQ con basi identificate e divide le letture in file FASTQ separati secondo il loro codice a barre. Qcat rende gli algoritmi di demultiplexing usati in albacore/guppy e EPI2ME disponibili per essere usati localmente con file FASTQ. Attualmente qcat implementa l'algoritmo EPI2ME.

The package is enhanced by the following packages: qcat-examples
Registry entries: Bioconda 
qcumber
controllo di qualità di sequenze genomiche
Versions of package qcumber
ReleaseVersionArchitectures
sid2.3.0-2all
trixie2.3.0-2all
bookworm2.3.0-2all
bullseye2.3.0-2all
buster1.0.14+dfsg-1all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

QCPipeline è uno strumento per controllo di qualità. Il flusso di lavoro è il seguente:

 1. controllo di qualità con FastQC
 2. taglio delle letture con Trimmomatic
 3. controllo di qualità delle letture tagliate con FastQC
 4. mappatura delle letture sui riferimenti usando bowtie2
 5. classificazione delle letture con Kraken
Registry entries: Bioconda 
qiime
Quantitative Insights Into Microbial Ecology
Versions of package qiime
ReleaseVersionArchitectures
bullseye2020.11.1-1all
bookworm2022.11.1-2all
jessie1.8.0+dfsg-4amd64,armel,armhf,i386
sid2024.5.0-1all
upstream2024.10.1
Debtags of package qiime:
roleprogram
Popcon: 22 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

I microorganismi circondano noi, gli animali, le piante e tutti i loro parassiti con un grande effetto su tutti questi e sull'ambiente in cui vivono. Si può pensare alla qualità del suolo, ma anche all'effetto che i batteri hanno gli uni sugli altri. L'uomo influenza l'abbondanza assoluta e relativa dei batteri con gli antibiotici, il cibo, i fertilizzanti, e ogni altra cosa a cui si può pensare, e questi cambiamenti hanno un effetto su di noi.

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (PubMed,eprint) Nature Biotechnology 37:852 - 857 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Microbial ecology
qtltools
insieme di strumenti per scoperta e analisi di QTL molecolari
Versions of package qtltools
ReleaseVersionArchitectures
trixie1.3.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.3.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.3.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.1+dfsg-3amd64,arm64,armhf
stretch1.1+dfsg-1amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
bullseye1.3.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

QTLtools è un insieme di strumenti per scoperta e analisi di caratteri quantitativi (Quantitative Trait Loci, QTL) molecolari. Permette all'utente di andare da dati di sequenze grezze fino alla raccolta di QTL molecolari in pochi passi facili da eseguire. QTLtools contiene metodi multipli per preparare i dati, per scoprire QTL molecolari distali e prossimali e infine per integrarli con varianti GWAS e annotazioni funzionali del genoma.

The package is enhanced by the following packages: qtltools-example
Please cite: Olivier Delaneau, Halit Ongen, Andrew A. Brown, Alexandre Fort, Nikolaos I. Panousis and Emmanouil T. Dermitzakis: A complete tool set for molecular QTL discovery and analysis. (eprint) Nature Communications (2017)
Registry entries: Bio.tools 
quicktree
algoritmo di unione dei vicini per filogenie
Versions of package quicktree
ReleaseVersionArchitectures
sid2.5-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.5-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.5-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.5-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

QuickTree è un'implementazione efficiente dell'algoritmo Neighbor-Joining (PMID: 3447015), capace di ricostruire filogenie da enormi allineamenti in un tempo inferiore all'età dell'universo.

QuickTree accetta come input sia una matrice di distanze, sia un allineamento di sequenze multiple. Il primo deve essere in formato PHYLIP. L'ultimo in formato Stockholm, che è il formato di allineamento nativo del database Pfam. Allineamenti in vari formati possono essere convertiti nel formato Stockholm con il programma sreformat, che fa parte del pacchetto HMMer (hmmer.org).

Gli alberi sono scritti su stdout nel formato Newick/New-Hampshire usato da PHYLIP e molti altri programmi.

quorum
QUality Optimized Reads di sequenze genomiche
Versions of package quorum
ReleaseVersionArchitectures
bookworm1.1.1-7amd64,arm64,mips64el,ppc64el
buster1.1.1-2amd64,arm64
sid1.1.2-2amd64,arm64,mips64el,ppc64el,riscv64
trixie1.1.2-2amd64,arm64,mips64el,ppc64el,riscv64
bullseye1.1.1-4amd64,arm64,mips64el,ppc64el
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

QuorUM permette di ottenere letture tagliate e con errori corretti che risultano in assemblati con contig più lunghi e meno errori. QuorUM fornisce le migliori prestazioni in confronto ad altri strumenti per correggere errori in svariate metriche. QuorUM è implementato in maniera efficiente facendo uso delle attuali architetture di calcolo multi-core ed è adatto per grandi insiemi di dati (1 miliardo di basi controllate e corrette al giorno per core). L'assemblatore di terze parti (SOAPdenovo) beneficia in maniera significativa dall'uso delle letture con gli errori corretti da QuorUM. Le letture con gli errori corretti da QuorUM risultano in un fattore di miglioramento da 1.1 a 4 nella dimensione dei contig N50 in confronto all'uso delle letture originali con SOAPdenovo per gli insiemi di dati investigati.

Please cite: Guillaume Marçais, James A. Yorke and Aleksey Zimin: QuorUM: An Error Corrector for Illumina Reads. (PubMed,eprint) PLoS One 10(6):e0130821 (2015)
Registry entries: SciCrunch 
qutemol
visualizzazione interattiva di macromolecole
Versions of package qutemol
ReleaseVersionArchitectures
buster0.4.1~cvs20081111-12amd64,arm64,armhf,i386
bullseye0.4.1~cvs20081111-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.4.1~cvs20081111-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.4.1~cvs20081111-3.2amd64,armel,armhf,i386
stretch0.4.1~cvs20081111-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.4.1~cvs20081111-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.4.1~cvs20081111-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package qutemol:
interfacex11
roleprogram
uitoolkitglut, wxwidgets
x11application
Popcon: 9 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

QuteMol è un sistema interattivo di alta qualità per la visualizzazione di molecole. Sfrutta le attuali capacità della GPU attraverso shader OpenGL per offrire una varietà di effetti visivi innovativi. Le tecniche di visualizzazione di QuteMol sono mirate a migliorare la chiarezza e la facilità di comprensione della forma tridimensionale e della struttura di molecole grandi o proteine complesse.

QuteMol usa tecniche OpenGL avanzate e potrebbe non funzionare in modo corretto con tutte le schede video e i driver.

Le funzionalità offerte da QuteMol includono:

  • occlusione di ambienti in tempo reale;
  • evidenziazione dei contorni tenendo conto delle profondità;
  • modalità di visualizzazione a sfere e bastoncini, con riempimento dello spazio e "liquorice";
  • istantanee con anti-aliasing ad alta risoluzione per creare disegni di qualità tipografica;
  • generazione automatica di gif animate di molecole che ruotano per le animazioni in pagine web;
  • rendering interattivo di macromolecole (>100k atomi).

QuteMol legge in input file PDB.

Please cite: Marco Tarini, Paolo Cignoni and Claudio Montani: Ambient Occlusion and Edge Cueing for Enhancing Real Time Molecular Visualization. (eprint) IEEE Transactions on Visualization and Computer Graphics 12(5):1237-1244 (2006)
Registry entries: SciCrunch 
Screenshots of package qutemol
r-bioc-annotate
annotazioni BioConductor per microarray
Versions of package r-bioc-annotate
ReleaseVersionArchitectures
stretch1.52.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.68.0+dfsg-1all
trixie1.82.0+dfsg-1all
buster1.60.0+dfsg-1all
bookworm1.76.0+dfsg-1all
sid1.82.0+dfsg-1all
upstream1.84.0
Popcon: 28 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

Il modulo BioConductor fornisce metodi per annotazione di microarray.

Nel suo stato attuale, lo scopo di base di annotate è di fornire procedure di interfaccia che supportano azioni utente che si affidano ai diversi pacchetti per metadati forniti attraverso il progetto Bioconductor.

Registry entries: Bioconda 
r-bioc-biostrings
oggetti stringa di GNU R che rappresentano sequenze biologiche
Versions of package r-bioc-biostrings
ReleaseVersionArchitectures
sid2.72.1+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye2.58.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.50.2-1amd64,arm64,armhf,i386
trixie2.72.1+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm2.66.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.42.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.32.1-1amd64,armel,armhf,i386
upstream2.74.0
Popcon: 29 users (8 upd.)*
Newer upstream!
License: DFSG free
Git

Contenitori per stringhe, algoritmi di corrispondenza a stringhe e altre utilità efficienti in termini di memoria, per la manipolazione veloce di vaste sequenze biologiche o insiemi di sequenze.

Registry entries: Bio.tools  Bioconda 
r-bioc-bitseq
transcript expression inference and analysis for RNA-seq data
Versions of package r-bioc-bitseq
ReleaseVersionArchitectures
buster1.26.1+dfsg-1amd64,arm64,armhf,i386
bullseye1.34.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

The BitSeq package is targeted for transcript expression analysis and differential expression analysis of RNA-seq data in two stage process. In the first stage it uses Bayesian inference methodology to infer expression of individual transcripts from individual RNA-seq experiments. The second stage of BitSeq embraces the differential expression analysis of transcript expression. Providing expression estimates from replicates of multiple conditions, Log-Normal model of the estimates is used for inferring the condition mean transcript expression and ranking the transcripts based on the likelihood of differential expression.

Please cite: Peter Glaus, Antti Honkela and Magnus Rattray: Identifying differentially expressed transcripts from RNA-seq data with biological variation. (PubMed,eprint) Bioinformatics 28(13):1721–1728 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-cner
rilevazione e visualizzazione di CNE
Versions of package r-bioc-cner
ReleaseVersionArchitectures
buster1.18.1+dfsg-1amd64,arm64,armhf,i386
sid1.40.0+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm1.34.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.40.0+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye1.26.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.42.0
Popcon: 4 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Identificazione su grande scala e visualizzazione avanzata di insiemi di elementi non codificanti conservati.

Registry entries: Bio.tools  Bioconda 
r-bioc-cummerbund
strumento per l'analisi dell'output RNA-Seq di Cufflinks
Versions of package r-bioc-cummerbund
ReleaseVersionArchitectures
jessie2.6.1-1all
sid2.46.0-1all
trixie2.46.0-1all
bookworm2.40.0-1all
bullseye2.32.0-1all
stretch2.16.0-2all
buster2.24.0-2all
upstream2.48.0
Popcon: 5 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Permette l'archiviazione persistente, l'accesso, l'esplorazione e la manipolazione di dati di sequenziamento Cufflinks di grandi dimensioni. Inoltre fornisce numerose funzioni di disegno per le visualizzazioni utilizzate comunemente.

Please cite: L. Goff and C. Trapnell: cummeRbund: Analysis, exploration, manipulation, and visualization of Cufflinks high-throughput sequencing data (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-deseq2
pacchetto R per analisi RNA-Seq di espressione differenziale
Versions of package r-bioc-deseq2
ReleaseVersionArchitectures
trixie1.44.0+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster1.22.2+dfsg-1amd64,arm64,armhf,i386
bullseye1.30.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.14.1-1amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.38.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.44.0+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
upstream1.46.0
Popcon: 21 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Analisi di espressione differenziale dei geni basata sulla distribuzione binomiale negativa. Stima di dipendenza varianza-media in dati di conteggi da saggi di sequenziamento ad alte prestazioni e test per espressione differenziale basata su un modello usando la distribuzione binomiale negativa.

Please cite: Michael I Love, Wolfgang Huber and Simon Anders: Moderated estimation of fold change and dispersion for {RNA}-seq data with {DESeq}2. (eprint) Genome Biol 15(12) (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-ebseq
pacchetto R per analisi RNA-Seq di espressione differenziale
Versions of package r-bioc-ebseq
ReleaseVersionArchitectures
bookworm1.38.0-1all
bullseye1.30.0-1all
trixie2.2.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid2.2.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster1.22.1-2all
stretch1.14.0-1all
upstream2.4.0
Popcon: 4 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

r-bioc-ebseq è un pacchetto R per identificare geni e isoforme differenzialmente espresse (DE) tra due o più condizioni biologiche in un esperimento RNA-seq.

Please cite: Ning Leng, John A. Dawson, James A. Thomson, Victor Ruotti, Anna I. Rissman, Bart M. G. Smits, Jill D. Haag, Michael N. Gould, Ron M. Stewart and Christina Kendziorski: EBSeq: an empirical Bayes hierarchical model for inference in RNA-seq experiments. (eprint) Bioinformatics 29(8):1035-1043 (2013)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-edger
analisi empiriche per dati digitali di espressione genica in R
Versions of package r-bioc-edger
ReleaseVersionArchitectures
stretch3.14.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid4.2.2+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie4.2.2+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm3.40.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.32.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie3.8.2+dfsg-1amd64,armel,armhf,i386
upstream4.4.0
Popcon: 23 users (9 upd.)*
Newer upstream!
License: DFSG free
Git

Il pacchetto bioconductor per analisi dell'espressione differenziale di sequenziamenti di trascrittoma completo (sequenziamento di RNA) e profili digitali di espressione genica con replicazione biologica. Usa stimatori bayesiani empirici e test esatti basati sulla distribuzione binomiale negativa. È anche utile per analisi di segnali differenziali con altri tipi di dati di conteggio a livello di genoma.

Please cite: Mark D. Robinson, Davis J. McCarthy and Gordon K. Smyth: edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. (PubMed,eprint) Bioinformatics 26,:139-140 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-genefilter
metodi per filtrare geni da esperimenti con microarray
Versions of package r-bioc-genefilter
ReleaseVersionArchitectures
sid1.86.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
stretch1.56.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.72.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.64.0-1amd64,arm64,armhf,i386
trixie1.86.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm1.80.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.88.0
Popcon: 13 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Questo modulo per BioConductor fornisce metodi per filtrare geni da esperimenti con microarray. Contiene alcune funzioni di base per filtrare geni.

Registry entries: Bio.tools  Bioconda 
r-bioc-geoquery
ottiene dati da Gene Expression Omnibus (GEO) dell'NCBI
Versions of package r-bioc-geoquery
ReleaseVersionArchitectures
bullseye2.58.0+dfsg-2all
trixie2.72.0+dfsg-1all
sid2.72.0+dfsg-1all
bookworm2.66.0+dfsg-1all
upstream2.74.0
Popcon: 13 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Il Gene Expression Omnibus (GEO) dell'NCBI è un repository pubblico di dati su microarray. Data la natura ricca e variegata di questa risorsa, risulta naturale voler utilizzare strumenti BioConductor su questi dati. GEOquery è il ponte tra GEO e BioConductor.

Please cite: Sean Davis and Paul Meltzer: GEOquery: a bridge between the Gene Expression Omnibus (GEO) and BioConductor Bioinformatics 14,:1846-1847, (2007,)
Registry entries: Bio.tools  Bioconda 
r-bioc-hilbertvis
pacchetto GNU R per visualizzare dati vettoriali lunghi
Versions of package r-bioc-hilbertvis
ReleaseVersionArchitectures
bookworm1.56.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.24.0-1amd64,armel,armhf,i386
sid1.62.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
stretch1.32.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.48.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.40.0-1amd64,arm64,armhf,i386
trixie1.62.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
upstream1.64.0
Debtags of package r-bioc-hilbertvis:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
useanalysing
Popcon: 4 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Questo strumento permette la visualizzazione di vettori di dati molto lunghi in una maniera efficiente dal punto di vista dello spazio occupato, organizzandoli su una curva di Hilbert in due dimensioni. In seguito l'utente può giudicare visivamente la struttura e la distribuzione generali delle caratteristiche contemporaneamente alla forma e intensità approssimate delle singole caratteristiche.

In bioinformatica un caso d'uso tipico è ChIP-Chip e ChIP-Seq o praticamente tutti i generi di dati genomici, che sono convenzionalmente visualizzati come tracciato quantitativo ("wiggle data") in navigatori per genoma come quelli forniti da Ensembl o UCSC.

Please cite: Simon Anders: Visualization of genomic data with the Hilbert curve. (PubMed,eprint) Bioinformatics 25(10):1231-1235 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Remark of Debian Med team: It would be interesting to package HilbertVisGUI as well.
r-bioc-htsfilter
GNU R filter replicated high-throughput transcriptome sequencing data
Versions of package r-bioc-htsfilter
ReleaseVersionArchitectures
trixie1.44.0+dfsg-1all
bookworm1.38.0+dfsg-2all
sid1.44.0+dfsg-1all
bullseye1.30.1+dfsg-1all
upstream1.46.0
Popcon: 3 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

This package implements a filtering procedure for replicated transcriptome sequencing data based on a global Jaccard similarity index in order to identify genes with low, constant levels of expression across one or more experimental conditions.

r-bioc-impute
imputazione per dati di microarray
Versions of package r-bioc-impute
ReleaseVersionArchitectures
bookworm1.72.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.78.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.64.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.78.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.56.0-1amd64,arm64,armhf,i386
upstream1.80.0
Popcon: 8 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

Pacchetto R che fornisce una funzione per eseguire l'imputazione per dati di microarray (attualmente solo KNN).

Registry entries: Bio.tools  Bioconda 
r-bioc-limma
modelli lineari per dati di microarray
Versions of package r-bioc-limma
ReleaseVersionArchitectures
stretch3.30.8+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.46.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.54.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.60.6+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid3.60.6+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
jessie3.22.1+dfsg-1amd64,armel,armhf,i386
buster3.38.3+dfsg-1amd64,arm64,armhf,i386
upstream3.62.1
Popcon: 26 users (17 upd.)*
Newer upstream!
License: DFSG free
Git

I microarray sono piastre microscopiche con filamenti corti di DNA attentamente disposti e/o superfici preparate chimicamente su cui altro DNA si lega in modo preferenziale. La quantità di DNA che si lega in diverse posizioni di questi chip, tipicamente determinata sulla base di un colorante fluorescente, deve essere interpretata. La tecnologia viene tipicamente usata con DNA derivato da RNA, cioè per determinare l'attività di un gene e/o delle sue varianti di splice. La tecnologia però è anche usata per determinare variazioni di sequenza in DNA genomico.

Questo pacchetto Bioconductor gestisce l'analisi di dati microarray di espressione genica, specialmente per l'uso di modelli lineari per l'analisi di esperimenti progettati e la valutazione dell'espressione differenziale. Il pacchetto include funzionalità di pre-elaborazione per array colorati con due colori. I metodi di espressione differenziale si applicano a tutte le piattaforme di array e trattano gli esperimenti Affymetrix, a singolo canale e a due canali in un modo unificato.

Please cite: Gordon K. Smyth: Limma: linear models for microarray data. (eprint) :397-420 (2005)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-megadepth
BioCOnductor BigWig and BAM related utilities
Versions of package r-bioc-megadepth
ReleaseVersionArchitectures
sid1.14.0+ds-1all
bookworm1.8.0+ds-1all
trixie1.14.0+ds-1all
upstream1.16.0
Popcon: 2 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

This package provides an R interface to Megadepth by Christopher Wilks available at https://github.com/ChristopherWilks/megadepth. It is particularly useful for computing the coverage of a set of genomic regions across bigWig or BAM files. With this package, you can build base-pair coverage matrices for regions or annotations of your choice from BigWig files. Megadepth was used to create the raw files provided by https://bioconductor.org/packages/recount3.

Registry entries: Bio.tools  Bioconda 
r-bioc-mergeomics
Integrative network analysis of omics data
Versions of package r-bioc-mergeomics
ReleaseVersionArchitectures
buster1.10.0-1all
stretch1.2.0-1all
bookworm1.26.0-1all
trixie1.32.0-1all
sid1.32.0-1all
bullseye1.18.0-1all
upstream1.34.0
Popcon: 4 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

The Mergeomics pipeline serves as a flexible framework for integrating multidimensional omics-disease associations, functional genomics, canonical pathways and gene-gene interaction networks to generate mechanistic hypotheses. It includes two main parts: 1) Marker set enrichment analysis (MSEA); 2) Weighted Key Driver Analysis (wKDA).

Please cite: Le Shu, Yuqi Zhao, Zeyneb Kurt, Sean Geoffrey Byars, Taru Tukiainen, Johannes Kettunen, Luz D. Orozco, Matteo Pellegrini, Aldons J. Lusis, Samuli Ripatti, Bin Zhang, Michael Inouye, Ville-Petteri Mäkinen and Xia Yang: Mergeomics: multidimensional data integration to identify pathogenic perturbations to biological systems. (eprint) BMC Genomics (2016)
Registry entries: Bio.tools 
r-bioc-metagenomeseq
analisi statistiche per GNU R per sequenziamento sparso ad alte prestazioni
Versions of package r-bioc-metagenomeseq
ReleaseVersionArchitectures
bullseye1.32.0-1all
stretch1.16.0-2all
trixie1.46.0-1all
sid1.46.0-1all
bookworm1.40.0-1all
buster1.24.1-1all
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

MetagenomeSeq è progettato per determinare caratteristiche (che siano OTU (Unità Tassonomiche Operative), specie, ecc.) che hanno differenze di abbondanza tra due o più gruppi di campioni multipli. metagenomeSeq è progettato per affrontare gli effetti sia della normalizzazione sia del sotto-campionamento di comunità microbiche sul rilevamento di associazione di malattie e su test di correlazione di caratteristiche.

Registry entries: Bio.tools  Bioconda 
r-bioc-mofa
Multi-Omics Factor Analysis (MOFA)
Versions of package r-bioc-mofa
ReleaseVersionArchitectures
trixie1.6.1+dfsg-13all
bookworm1.6.1+dfsg-10all
bullseye1.6.1+dfsg-1all
sid1.6.1+dfsg-13all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Multi-Omics Factor Analysis: an unsupervised framework for the integration of multi-omics data sets.

Upstream no longer supports this package. This package only still ships to help with rerunning/comparing/transitioning existing projects. For new projects please upgrade to MOFA2 (MOFA+). Actually, also when adding new data to old projects, MOFA2 has further improved the handling of multiple factors, and to compensate for a batch effect that is likely introduced with additional data, may be an immediate use case for that new version.

Please cite: Ricard Argelaguet, Britta Velten, Damien Arnol, Sascha Dietrich, Thorsten Zenz, John C Marioni, Florian Buettner, Wolfgang Huber and Oliver Stegle: Link to publication Mol Syst Biol 14:e8124 (2018)
Registry entries: Bioconda 
r-bioc-multiassayexperiment
Software for integrating multi-omics experiments in BioConductor
Versions of package r-bioc-multiassayexperiment
ReleaseVersionArchitectures
bullseye1.16.0+dfsg-1all
bookworm1.24.0+dfsg-2all
sid1.30.3+dfsg-2all
trixie1.30.3+dfsg-2all
upstream1.32.0
Popcon: 3 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

MultiAssayExperiment harmonizes data management of multiple assays performed on an overlapping set of specimens. It provides a familiar Bioconductor user experience by extending concepts from SummarizedExperiment, supporting an open-ended mix of standard data classes for individual assays, and allowing subsetting by genomic ranges or rownames.

Registry entries: Bio.tools  Bioconda 
r-bioc-mutationalpatterns
GNU R comprehensive genome-wide analysis of mutational processes
Versions of package r-bioc-mutationalpatterns
ReleaseVersionArchitectures
bullseye3.0.1+dfsg-2all
bookworm3.8.1+dfsg-1all
trixie3.14.0+dfsg-1all
sid3.14.0+dfsg-1all
upstream3.16.0
Popcon: 3 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

This BioConductor package provides an extensive toolset for the characterization and visualization of a wide range of mutational patterns in base substitution catalogs.

r-bioc-phyloseq
gestione ed analisi per GNU R di dati di censimenti di microbiomi ad alte prestazioni
Versions of package r-bioc-phyloseq
ReleaseVersionArchitectures
bullseye1.34.0+dfsg-1all
stretch1.19.1-2all
buster1.26.1+dfsg-1all
sid1.48.0+dfsg-1all
bookworm1.42.0+dfsg-1all
trixie1.48.0+dfsg-1all
upstream1.50.0
Popcon: 4 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Il modulo Bioconductor phyloseq fornisce un insieme di classi e strumenti per facilitare l'importazione, l'archiviazione, l'analisi e la visualizzazione grafica di dati di censimenti di microbioma.

Please cite: Paul J. McMurdie and Susan Holmes: phyloseq: An R package for reproducible interactive analysis and graphics of microbiome census data. PLoS ONE 8(4):e61217 (2013)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-rtracklayer
interfaccia GNU R per navigatori di genomi e loro tracce di annotazione
Versions of package r-bioc-rtracklayer
ReleaseVersionArchitectures
bullseye1.50.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.42.1-2amd64,arm64,armhf,i386
stretch1.34.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.64.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid1.64.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
jessie1.24.2-1amd64,armel,armhf,i386
bookworm1.58.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.66.0
Popcon: 18 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Infrastruttura estensibile per interagire con più navigatori di genomi (attualmente incorporato UCSC) e manipolare tracce di annotazioni in vari formati (attualmente incorporati GFF, BED, bedGraph, BED15, WIG, BigWig e 2bit). L'utente può esportare e importare tracce verso e dai navigatori gestiti, così come interrogare e modificare lo stato del navigatore, come l'attuale porzione visualizzata.

Please cite: Michael Lawrence, Robert Gentleman and "Vincent Carey: rtracklayer: an R package for interfacing with genome browsers. (PubMed,eprint) Bioinformatics 25(14):1841-1842 (2009)
Registry entries: Bio.tools  Bioconda 
r-bioc-scater
Single-Cell Analysis Toolkit for Gene Expression Data in R
Versions of package r-bioc-scater
ReleaseVersionArchitectures
sid1.32.1+ds-1all
bullseye1.18.3+ds-4all
bookworm1.26.1+ds-1all
upstream1.34.0
Popcon: 3 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

A collection of tools for doing various analyses of single-cell RNA-seq gene expression data, with a focus on quality control and visualization.

Please cite: McCarthy DJ, Campbell KR, Lun ATL and Willis QF: Scater: pre-processing, quality control, normalisation and visualisation of single-cell RNA-seq data in R. Bioinformatics 33:1179-1186 (2017)
Registry entries: Bio.tools  Bioconda 
r-bioc-tfbstools
GNU R Transcription Factor Binding Site (TFBS) Analysis
Versions of package r-bioc-tfbstools
ReleaseVersionArchitectures
trixie1.42.0+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm1.36.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.42.0+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster1.20.0+dfsg-1amd64,arm64,armhf,i386
bullseye1.28.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.44.0
Popcon: 4 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

TFBSTools is a package for the analysis and manipulation of transcription factor binding sites. It includes matrices conversion between Position Frequency Matirx (PFM), Position Weight Matirx (PWM) and Information Content Matrix (ICM). It can also scan putative TFBS from sequence/alignment, query JASPAR database and provides a wrapper of de novo motif discovery software.

Please cite: Ge Tan and Boris Lenhard: TFBSTools: an R/bioconductor package for transcription factor binding site analysis. (PubMed,eprint) Bioinformatics 32(10):1555–1556 (2016)
Registry entries: Bio.tools  Bioconda 
r-cran-adegenet
analisi esplorative di GNU R per dati genetici e genomici
Versions of package r-cran-adegenet
ReleaseVersionArchitectures
stretch2.0.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.1.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.1.10-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.1.10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.1.10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.1.1-2amd64,arm64,armhf,i386
Popcon: 11 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Insieme di strumenti per l'esplorazione di dati genetici e genomici. Adegenet fornisce classi formali (S4) per memorizzare e gestire vari dati genetici, inclusi marcatori genetici con ploidia variabile e struttura di popolazione gerarchica (classe "genind"), conteggi di alleli per popolazioni ("genpop") e dati SNP a livello di tutto genoma ("genlight"). Implementa anche metodi multivariati originali (DAPC, sPCA), grafici, test statistici, strumenti di simulazione, misure di distanza e similarità e diversi metodi spaziali. Viene fornita anche una gamma di insiemi di dati, empirici e simulati, per illustrare i vari metodi.

Please cite: Thibaut Jombart: adegenet: a R package for the multivariate analysis of genetic markers. (PubMed,eprint) Bioinformatics 24(11):1403-5 (2008)
Registry entries: SciCrunch 
r-cran-adephylo
analisi esplorative per GNU R per il metodo di confronto filogenetico
Versions of package r-cran-adephylo
ReleaseVersionArchitectures
bookworm1.1-13-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1-11-3amd64,arm64,armhf,i386
sid1.1-16-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.1-11-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1-16-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.1-10-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 9 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto per GNU R fornisce strumenti multivariati per analizzare dati comparativi, cioè una filogenia e alcuni tratti misurati per ciascun taxon.

Please cite: Thibaut Jombart, François Balloux and Stéphane Dray: adephylo: new tools for investigating the phylogenetic signal in biological traits. (PubMed,eprint) Bioinformatics 26(15):1907-1909 (2010)
Registry entries: Bioconda 
r-cran-alakazam
analisi di linee clonali e diversità per immunoglobuline
Versions of package r-cran-alakazam
ReleaseVersionArchitectures
buster0.2.11-1amd64,arm64,armhf,i386
experimental1.3.0-2~0exp0amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid1.3.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.3.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm1.2.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Alakazam fa parte dell'infrastruttura di analisi Immcantation per AIRR-seq (Adaptive Immune Receptor Repertoire sequencing) e fornisce un insieme di strumenti per investigare linee clonali, diversità, uso di geni e altre proprietà a livello di repertorio dei recettori di linfociti, con particolare attenzione al sequenziamento ad alte prestazioni di immunoglobuline (Ig).

Alakazam ha 5 scopi principali:

  • Fornire funzionalità di base per altri pacchetti R nell'infrastruttura Immcantation. Ciò include compiti comuni come I/O su file, manipolazione di base di sequenze di DNA e interazione con segmenti V(D)J e annotazioni di geni.
  • Fornire un'interfaccia R per interagire con l'output delle suite di strumenti pRESTO e Change-O.
  • Effettuare ricostruzioni di linee su popolazioni clonali di sequenze di Ig e analizzare la topologia degli alberi delle linee risultanti.
  • Effettuare analisi di abbondanza e diversità clonali su repertori linfocitari.
  • Effettuare analisi di proprietà fisico-chimiche delle sequenze dei recettori linfocitari.
Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data. (eprint) 31(20):3356–3358 (2017)
r-cran-ape
pacchetto GNU R per analisi su filogenesi ed evoluzione
Versions of package r-cran-ape
ReleaseVersionArchitectures
trixie5.8-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid5.8-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch4.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.1-4-1amd64,armel,armhf,i386
buster5.2-1amd64,arm64,armhf,i386
bullseye5.4-1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm5.7-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 64 users (25 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto fornisce funzioni per leggere, scrivere, disegnare e manipolare alberi filogenetici, analisi di dati comparativi in un'infrastruttura filogenetica, analisi di caratteri ancestrali, analisi di diversificazione e macroevoluzione, calcoli di distanze da sequenze di DNA, lettura e scrittura di sequenze nucleotidiche oltre all'importazione da BioConductor e svariati strumenti come il test di Mantel, grafici skyline generalizzati, esplorazioni grafiche di dati filogenetici (alex, trex, kronoviz), stime di tassi evolutivi assoluti e alberi in stile orologio usando lunghezze di percorsi medi e verosimiglianza con penalità, traduzione di DNA in sequenze di AA e valutazione di allineamenti di sequenze. Le stime filogenetiche possono essere fatte con i metodi NJ, BIONJ, ME, MVR, SDM e triangolare e svariati metodi gestiscono matrici di distanze non complete (NJ, BIONJ, MVR* e il corrispondente metodo triangolare). Alcune funzioni chiamano applicazioni esterne (PhyML, Clustal, T-Coffee, Muscle) i cui risultati vengono restituiti ad R.

Please cite: Emmanuel Paradis and Klaus Schliep: ape 5.0: an environment for modern phylogenetics and evolutionary analyses in R. Bioinformatics (2018)
r-cran-bio3d
pacchetto GNU R per l'analisi di strutture biologiche
Versions of package r-cran-bio3d
ReleaseVersionArchitectures
buster2.3-4-2amd64,arm64,armhf,i386
trixie2.4-4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.4-4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.4-4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.4-1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.3-1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream2.4-5
Popcon: 7 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Il pacchetto bio3d contiene utilità per elaborare, organizzare ed esplorare dati sulla struttura, la sequenza e la dinamica di proteine. Le funzionalità includono la capacità di leggere e scrivere dati su struttura, sequenza e traiettoria dinamica, effettuare rapporti riassuntivi degli atomi, selezione di atomi, ri-orientamento, sovrapposizione, identificazione del core invariabile, clustering, analisi di torsione, analisi con matrice di distanza, analisi di conservazione di struttura e sequenza e analisi dei componenti principali (PCA). In aggiunta sono fornite varie funzioni di utilità per permettere l'uso della potenza statistica e grafica dell'ambiente R con dati di sequenze e strutture biologiche.

Please cite: Barry J. Grant, Ana P. C. Rodrigues, Karim M. ElSawy, J. Andrew McCammon and Leo S. D. Caves: Bio3d: an R package for the comparative analysis of protein structures. (PubMed,eprint) Bioinformatics 22(21):2695-2696 (2006)
r-cran-distory
distanza tra storie filogenetiche per GNU R
Versions of package r-cran-distory
ReleaseVersionArchitectures
buster1.4.3-2amd64,arm64,armhf,i386
bullseye1.4.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.4.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.4.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.4.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.4.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream1.4.5
Popcon: 8 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Questo pacchetto per GNU R abilita il calcolo della distanza geodetica tra alberi filogenetici e le funzioni associate.

r-cran-genabel
pacchetto GNU R per l'analisi di associazioni SNP a livello di intero genoma
Versions of package r-cran-genabel
ReleaseVersionArchitectures
sid1.8-0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1.8-0-1amd64,armel,armhf,i386
stretch1.8-0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.8-0-3amd64,arm64,armhf,i386
bullseye1.8-0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.8-0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.8-0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Il pacchetto offre la libreria R GenABEL per scovare i contributi genetici a una malattia (o qualsiasi altro tratto fenotipico) attraverso la cosiddetta analisi associativa a livello di tutto il genoma. Un ulteriore contributo viene solitamente da esperimenti con microarray di DNA, eseguiti su ciascun soggetto, che determinano le differenze (i polimorfismi) nella popolazione. GenABEL trova le associazioni tra caratteristiche quantitative o binarie e polimorfismi di singoli nucleotidi (SNP).

Il pacchetto "GenABEL" è stato rimosso dal repository CRAN. Il codice è stato preso dall'archivio.

Please cite: Yurii S. Aulchenko, Stephan Ripke, Aaron Isaacs and Cornelia M. van Duijn: GenABEL: an R library for genome-wide association analysis. (PubMed,eprint) Bioinformatics 23(10):1294-1296 (2007)
Registry entries: Bio.tools  SciCrunch 
r-cran-kaos
Encoding of Sequences Based on Frequency Matrix Chaos
Versions of package r-cran-kaos
ReleaseVersionArchitectures
trixie0.1.2-2all
bullseye0.1.2-2all
bookworm0.1.2-2all
sid0.1.2-2all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Sequences encoding by using the chaos game representation. Löchel et al. (2019) .

Please cite: Hannah F. Löchel, Dominic Eger, Theodor Sperlea and Dominik Heider: Deep learning on chaos game representation for proteins. Bioinformatics (2019)
Registry entries: Bioconda 
r-cran-phangorn
GNU R package for phylogenetic analysis
Versions of package r-cran-phangorn
ReleaseVersionArchitectures
sid2.11.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.4.0-2amd64,arm64,armhf,i386
bookworm2.11.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.11.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.5.5-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.1.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream2.12.1
Popcon: 62 users (23 upd.)*
Newer upstream!
License: DFSG free
Git

phangorn is a tool for reconstructing phylogenies, using distance-based methods, maximum parsimony or maximum likelihood, and performing Hadamard conjugation. It also offers functions for comparing trees, phylogenetic models or splits, simulating character data and performing congruence analysis.

Please cite: K.P. Schliep: phangorn: phylogenetic analysis in R. (PubMed) Bioinformatics 27(4):592-593 (2011)
r-cran-phytools
GNU R phylogenetic tools for comparative biology
Versions of package r-cran-phytools
ReleaseVersionArchitectures
bullseye0.7-70-1all
buster0.6-60-1all
bookworm1.5-1-1all
trixie2.3-0-1all
sid2.3-0-1all
Popcon: 9 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

A wide range of functions for phylogenetic analysis. Functionality is concentrated in phylogenetic comparative biology, but also includes a diverse array of methods for visualizing, manipulating, reading or writing, and even inferring phylogenetic trees and data. Included among the functions in phylogenetic comparative biology are various for ancestral state reconstruction, model-fitting, simulation of phylogenies and data, and multivariate analysis. There are a broad range of plotting methods for phylogenies and comparative data which include, but are not restricted to, methods for mapping trait evolution on trees, for projecting trees into phenotypic space or a geographic map, and for visualizing correlated speciation between trees. Finally, there are a number of functions for reading, writing, analyzing, inferring, simulating, and manipulating phylogenetic trees and comparative data not covered by other packages. For instance, there are functions for randomly or non-randomly attaching species or clades to a phylogeny, for estimating supertrees or consensus phylogenies from a set, for simulating trees and phylogenetic data under a range of models, and for a wide variety of other manipulations and analyses that phylogenetic biologists might find useful in their research.

Please cite: Liam J. Revell: phytools: an R package for phylogenetic comparative biology (and other things). (eprint) Methods in Ecology and Evolution 3(2):217-223 (2012)
Registry entries: SciCrunch 
r-cran-pscbs
R package: Analysis of Parent-Specific DNA Copy Numbers
Versions of package r-cran-pscbs
ReleaseVersionArchitectures
buster0.64.0-1all
bullseye0.65.0-3all
bookworm0.66.0-2all
stretch0.62.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.67.0-3all
sid0.67.0-3all
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Segmentation of allele-specific DNA copy number data and detection of regions with abnormal copy number within each parental chromosome. Both tumor-normal paired and tumoronly analyses are supported.

Please cite: Adam B. Olshen, Henrik Bengtsson, Pierre Neuvial, Paul T. Spellman, Richard A. Olshen and Venkatraman E. Seshan: Parent-specific copy number in paired tumor-normal studies using circular binary segmentation. (PubMed,eprint) Bioinformatics 27(15):2038-2046 (2011)
Registry entries: SciCrunch  Bioconda 
r-cran-qtl
pacchetto GNU R per analisi di linkage dei marcatori genetici
Versions of package r-cran-qtl
ReleaseVersionArchitectures
bullseye1.47-9-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.33-7-1amd64,armel,armhf,i386
stretch1.40-8-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.70-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.44-9-1amd64,arm64,armhf,i386
trixie1.70-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.58-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package r-cran-qtl:
devellang:r, library
fieldbiology, statistics
roleapp-data
suitegnu
Popcon: 18 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

R/qtl è un ambiente estensibile e interattivo per mappare loci per tratti quantitativi (QTL) in incroci sperimentali. È implementato come un pacchetto aggiuntivo per il linguaggio/software statistico R che è liberamente disponibile e largamente usato (vedere http://www.r-project.org).

Lo sviluppo di questo software come componente aggiuntivo per R permette di sfruttare le funzioni matematiche e statistiche di base e le potenti capacità di creazione di grafici che sono fornite con R. Inoltre l'utente trae beneficio dall'integrazione perfetta del software di mappatura QTL in un programma di analisi statistica generica. Lo scopo è di rendere i complessi metodi di mappatura QTL disponibili ad una vasta utenza e di permettere agli utenti di concentrarsi sulla creazione dei modelli piuttosto che sul calcolo.

Un componente chiave dei metodi di calcolo per la mappatura QTL è la tecnologia dei modelli di Markov nascosti (HMM) per gestire dati genotipici mancanti. Sono stati implementati i principali algoritmi HMM con gestione della presenza di errori nel genotipo, per reincroci, interincroci e incroci a quattro vie con fase nota.

La versione attuale di R/qtl include funzionalità per stimare mappe genetiche, identificare errori nel genotipo ed effettuare scansioni del genoma per QTL singoli e scansioni del genoma bidimensionali per due QTL, usando mappature di intervalli (con l'algoritmo EM), regressione di Haley-Knott e imputazione multipla. Tutto questo può essere fatto in presenza di covariate (come sesso, età o trattamento). È anche possibile adattare modelli QTL di ordine più alto usando l'imputazione multipla.

Please cite: Karl W. Broman, Hao Wu, Saunak Sen and Gary A. Churchill: R/qtl: QTL mapping in experimental crosses. (PubMed,eprint) Bioinformatics 19:889-890 (2003)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-cran-rotl
interfaccia GNU R all'API di "Open Tree of Life"
Versions of package r-cran-rotl
ReleaseVersionArchitectures
bookworm3.0.14-1all
trixie3.1.0-1all
buster3.0.6-1all
bullseye3.0.11-1all
stretch3.0.1-1all
sid3.1.0-1all
Popcon: 11 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Un'interfaccia all'API di "Open Tree of Life" per ottenere alberi filogenetici, informazioni sugli studi utilizzati per assemblare l'albero sintetico e utilità per trovare corrispondenze tra nomi tassonomici e "identificatori Open Tree". "Open Tree of Life" mira ad assemblare un albero filogenetico esaustivo di tutte le specie conosciute.

r-cran-samr
GNU R significance analysis of microarrays
Versions of package r-cran-samr
ReleaseVersionArchitectures
trixie3.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.0-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3.0-1amd64,arm64,armhf,i386
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

This GNU R package provides significance analysis of microarrays. A microarray is a multiplex lab-on-a-chip. It is a 2D array on a solid substrate (usually a glass slide or silicon thin-film cell) that assays large amounts of biological material using high-throughput screening miniaturized, multiplexed and parallel processing and detection methods.

This package helps analysing this kind of microarrays.

Registry entries: Bio.tools  SciCrunch  Bioconda 
r-cran-sdmtools
Species Distribution Modelling Tools
Versions of package r-cran-sdmtools
ReleaseVersionArchitectures
trixie1.1-221.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.1-221.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1-221.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1-221-1amd64,arm64,armhf,i386
sid1.1-221.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides a set of tools for post processing the outcomes of species distribution modeling exercises. It includes novel methods for comparing models and tracking changes in distributions through time. It further includes methods for visualizing outcomes, selecting thresholds, calculating measures of accuracy and landscape fragmentation statistics, etc.

This package was made possible in part by financial support from the Australian Research Council & ARC Research Network for Earth System Science.

r-cran-seqinr
recupero e analisi di sequenze biologiche per GNU R
Versions of package r-cran-seqinr
ReleaseVersionArchitectures
sid4.2-36-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3.4-5-2amd64,arm64,armhf,i386
bookworm4.2-23-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye4.2-5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.2-36-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch3.3-3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 13 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Analisi esplorativa e visualizzazione dei dati per dati di sequenze biologiche (DNA e proteine). Include anche utilità per gestione di dati di sequenze nel sistema ACNUC.

r-cran-seurat
Tools for Single Cell Genomics
Versions of package r-cran-seurat
ReleaseVersionArchitectures
bookworm4.3.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye4.0.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid5.1.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

A toolkit for quality control, analysis, and exploration of single cell RNA sequencing data. 'Seurat' aims to enable users to identify and interpret sources of heterogeneity from single cell transcriptomic measurements, and to integrate diverse types of single cell data. See Satija R, Farrell J, Gennert D, et al (2015) , Macosko E, Basu A, Satija R, et al (2015) , and Butler A and Satija R (2017) for more details.

Please cite: Rahul Satija, Jeffrey A. Farrell, David Gennert, Alexander F. Schier and Aviv Regev: Spatial reconstruction of single-cell gene expression data. (PubMed) Nature Biotechnology 33:495–502 (2015)
Registry entries: Bioconda 
r-cran-shazam
Immunoglobulin Somatic Hypermutation Analysis
Versions of package r-cran-shazam
ReleaseVersionArchitectures
buster0.1.11-1all
bullseye1.0.2-1all
trixie1.2.0-1all
sid1.2.0-1all
bookworm1.1.2-1all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Provides a computational framework for Bayesian estimation of antigen-driven selection in immunoglobulin (Ig) sequences, providing an intuitive means of analyzing selection by quantifying the degree of selective pressure. Also provides tools to profile mutations in Ig sequences, build models of somatic hypermutation (SHM) in Ig sequences, and make model-dependent distance comparisons of Ig repertoires.

SHazaM is part of the Immcantation analysis framework for Adaptive Immune Receptor Repertoire sequencing (AIRR-seq) and provides tools for advanced analysis of somatic hypermutation (SHM) in immunoglobulin (Ig) sequences. Shazam focuses on the following analysis topics:

  • Quantification of mutational load SHazaM includes methods for determine the rate of observed and expected mutations under various criteria. Mutational profiling criteria include rates under SHM targeting models, mutations specific to CDR and FWR regions, and physicochemical property dependent substitution rates.
  • Statistical models of SHM targeting patterns Models of SHM may be divided into two independent components: 1) a mutability model that defines where mutations occur and 2) a nucleotide substitution model that defines the resulting mutation. Collectively these two components define an SHM targeting model. SHazaM provides empirically derived SHM 5-mer context mutation models for both humans and mice, as well tools to build SHM targeting models from data.
  • Analysis of selection pressure using BASELINe The Bayesian Estimation of Antigen-driven Selection in Ig Sequences (BASELINe) method is a novel method for quantifying antigen-driven selection in high-throughput Ig sequence data. BASELINe uses SHM targeting models can be used to estimate the null distribution of expected mutation frequencies, and provide measures of selection pressure informed by known AID targeting biases.
  • Model-dependent distance calculations SHazaM provides methods to compute evolutionary distances between sequences or set of sequences based on SHM targeting models. This information is particularly useful in understanding and defining clonal relationships.
Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data.. (PubMed,eprint) Bioinformatics 31(20):3356-3358 (2015)
Registry entries: Bioconda 
r-cran-spp
GNU R ChIP-seq processing pipeline
Versions of package r-cran-spp
ReleaseVersionArchitectures
buster1.15.5-1amd64,arm64,armhf,i386
sid1.16.0-2amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.16.0-2amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm1.16.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.16.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

R package for anlaysis of ChIP-seq and other functional sequencing data

  • Assess overall DNA-binding signals in the data and select appropriate quality of tag alignment.
  • Discard or restrict positions with abnormally high number of tags.
  • Calculate genome-wide profiles of smoothed tag density and save them in WIG files for viewing in other browsers.
  • Calculate genome-wide profiles providing conservative statistical estimates of fold enrichment ratios along the genome. These can be exported for browser viewing, or thresholded to determine regions of significant enrichment/depletion.
  • Determine statistically significant point binding positions
  • Assess whether the set of point binding positions detected at a current sequencing depth meets saturation criteria, and if does not, estimate what sequencing depth would be required to do so.
Please cite: Peter V Kharchenko, Michael Y Tolstorukov and Peter J Park: Design and analysis of ChIP-seq experiments for DNA-binding proteins. (PubMed) Nature biotechnology 26(12):1351–1359 (2008)
r-cran-tcr
Advanced Data Analysis of Immune Receptor Repertoires
Versions of package r-cran-tcr
ReleaseVersionArchitectures
bookworm2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.3.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.2.3-1amd64,arm64,armhf,i386
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Cells of the immune system are the grand exception to the rule that all cells of an individuum have (mostly exact) copies of the same DNA. B cells (which produce antibodies) and T cells (which communicate with cells) however have a section of their DNA with genes of the groups V, D and J that are reorganised within the genomic DNA to provide the flexibility to deal with yet unknown pathogens.

This package provides a platform for the advanced analysis of T cell receptor repertoire data and its visualisations.

Caveat: This package is soon to be replaced by http://github.com/immunomind/immunarch which is not yet available as a Debian package.

Please cite: Vadim I. Nazarov, Mikhail V. Pogorelyy, Ekaterina A. Komech, Ivan V. Zvyagin, Dmitry A. Bolotin, Mikhail Shugay, Dmitry M. Chudakov, Yury B. Lebedev and Ilgar Z. Mamedov: tcR: an R package for T cell receptor repertoire advanced data analysis. (eprint) BMC Bioinformatics 16:175 (2015)
Registry entries: Bio.tools  Bioconda 
r-cran-tigger
Infers new Immunoglobulin alleles from Rep-Seq Data
Versions of package r-cran-tigger
ReleaseVersionArchitectures
sid1.1.0-1all
bookworm1.0.1-1all
buster0.3.1-1all
bullseye1.0.0-1all
trixie1.1.0-1all
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Summary: Infers the V genotype of an individual from immunoglobulin (Ig) repertoire-sequencing (Rep-Seq) data, including detection of any novel alleles. This information is then used to correct existing V allele calls from among the sample sequences.

High-throughput sequencing of B cell immunoglobulin receptors is providing unprecedented insight into adaptive immunity. A key step in analyzing these data involves assignment of the germline V, D and J gene segment alleles that comprise each immunoglobulin sequence by matching them against a database of known V(D)J alleles. However, this process will fail for sequences that utilize previously undetected alleles, whose frequency in the population is unclear.

TIgGER is a computational method that significantly improves V(D)J allele assignments by first determining the complete set of gene segments carried by an individual (including novel alleles) from V(D)J-rearrange sequences. TIgGER can then infer a subject’s genotype from these sequences, and use this genotype to correct the initial V(D)J allele assignments.

The application of TIgGER continues to identify a surprisingly high frequency of novel alleles in humans, highlighting the critical need for this approach. TIgGER, however, can and has been used with data from other species.

Core Abilities:

  • Detecting novel alleles
  • Inferring a subject’s genotype
  • Correcting preliminary allele calls

Required Input

  • A table of sequences from a single individual, with columns containing the following:
  • V(D)J-rearranged nucleotide sequence (in IMGT-gapped format)
  • Preliminary V allele calls
  • Preliminary J allele calls
  • Length of the junction region
  • Germline Ig sequences in IMGT-gapped fasta format (e.g., as those downloaded from IMGT/GENE-DB)

The former can be created through the use of IMGT/HighV-QUEST and Change-O.

Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data. (eprint) 31(20):3356–3358 (2017)
Registry entries: Bioconda 
r-cran-treespace
esplorazione statistica di panorami di alberi filogenetici
Versions of package r-cran-treespace
ReleaseVersionArchitectures
buster1.1.3+dfsg-1amd64,arm64,armhf,i386
sid1.1.4.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.1.4.3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.1.4.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.4.0+dfsg-1amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Strumenti per l'esplorazione di distribuzioni di alberi filogenetici. Questo pacchetto include una bella interfaccia che può essere avviata da R usando "treespaceServer()".

r-cran-tsne
t-distributed stochastic neighbor embedding per R (t-SNE)
Versions of package r-cran-tsne
ReleaseVersionArchitectures
bullseye0.1-3-3all
sid0.1-3.1-1all
trixie0.1-3.1-1all
bookworm0.1-3.1-1all
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Un'implementazione in "puro R" dell'algoritmo t-SNE.

r-cran-vegan
pacchetto per ecologia delle comunità per R
Versions of package r-cran-vegan
ReleaseVersionArchitectures
buster2.5-4+dfsg-3amd64,arm64,armhf,i386
stretch2.4-2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.0-10-1amd64,armel,armhf,i386
bullseye2.5-7+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.6-8+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.6-4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.6-8+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 159 users (101 upd.)*
Versions and Archs
License: DFSG free
Git

Pacchetto R per i ricercatori nel campo dell'ecologia delle comunità. Contiene la maggior parte delle analisi multivariate necessarie per analizzare comunità ecologiche, e strumenti per analisi della diversità. La maggior parte dei metodi delle diversità hanno come assunto che i dati siano conteggi di individui.

Questi strumenti sono a volte usati al di fuori del campo dell'ecologia, ad esempio per studiare popolazioni di globuli bianchi o di molecole di RNA.

Registry entries: SciCrunch 
r-cran-webgestaltr
find over-represented properties in gene lists
Versions of package r-cran-webgestaltr
ReleaseVersionArchitectures
bookworm0.4.5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.4.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.4.6-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.4.6-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

The web version WebGestalt http://www.webgestalt.org supports 12 organisms, 354 gene identifiers and 321,251 function categories. Users can upload the data and functional categories with their own gene identifiers. In addition to the Over-Representation Analysis, WebGestalt also supports Gene Set Enrichment Analysis and Network Topology Analysis. The user-friendly output report allows interactive and efficient exploration of enrichment results. The WebGestaltR package not only supports all above functions but also can be integrated into other pipeline or simultaneously analyze multiple gene lists.

r-cran-wgcna
Weighted Correlation Network Analysis
Versions of package r-cran-wgcna
ReleaseVersionArchitectures
bullseye1.69-1amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.72-1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.73-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.73-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
Popcon: 5 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Functions necessary to perform Weighted Correlation Network Analysis on high-dimensional data as originally described in Horvath and Zhang (2005) and Langfelder and Horvath (2008) . Includes functions for rudimentary data cleaning, construction of correlation networks, module identification, summarization, and relating of variables and modules to sample traits. Also includes a number of utility functions for data manipulation and visualization.

Please cite: Peter Langfelder and Steve Horvath: WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics 9:559 (2012)
Registry entries: Bio.tools  Bioconda 
r-other-ascat
Allele-Specific Copy Number Analysis of Tumours
Versions of package r-other-ascat
ReleaseVersionArchitectures
sid3.1.2-1all
bookworm3.1.1-1all
trixie3.1.2-1all
bullseye2.5.2-3all
upstream3.2.0
Popcon: 3 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

ASCAT (allele-specific copy number analysis of tumors) is a allele- specific copy number analysis of the in vivo breast cancer genome. It can be used to accurately dissect the allele-specific copy number of solid tumors, simultaneously estimating and adjusting for both tumor ploidy and nonaberrant cell admixture.

Please cite: Peter Van Loo, Silje H Nordgard, Ole Christian Lingjærde, Hege G Russnes, Inga H Rye, Wei Sun, Victor J Weigman, Peter Marynen, Anders Zetterberg, Bjørn Naume, Charles M Perou, Anne-Lise Børresen-Dale and Vessela N Kristensen: Allele-specific Copy Number Analysis of Tumors. (PubMed) PNAS 107(39):16910-5 (2010)
Registry entries: Bio.tools  Bioconda 
r-other-mott-happy.hbrem
pacchetto GNU R per mappatura fine di malattie complesse
Versions of package r-other-mott-happy.hbrem
ReleaseVersionArchitectures
trixie2.4-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.4-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.4-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.4-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4-3amd64,arm64,armhf,i386
stretch2.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.4-1amd64,armel,armhf,i386
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Happy è un'interfaccia R al pacchetto C HAPPY per la mappatura fine di QTL (Quantitative Trait Loci) in HS (Heterogenous Stocks). Un HS è un incrocio avanzato all'interno di (solitamente otto) ceppi inbred fondatori di topi. Gli HS sono adatti per la mappatura fine di QTL. Usa un'analisi multipunto che offre miglioramenti significativi della potenza statistica nel rilevamento di QTL rispetto a quello ottenuto da associazioni a singolo marker.

Il pacchetto happy è un'estensione del programma C happy originale; usa il codice C per calcolare la probabilità di discendenza da ciascuno dei fondatori per ogni posizione di locus, ma il pacchetto happy permette una gamma molto più ricca di modelli con cui fare il fit dei dati.

Per una spiegazione più dettagliata leggere /usr/share/doc/r-other-mott-happy/README.Debian

Please cite: Richard Mott, Christopher J. Talbot, Maria G. Turri, Allan C. Collins and Jonathan Flint: A method for fine mapping quantitative trait loci in outbred animal stocks. (PubMed,eprint) Proc. Natl. Acad. Sci. USA 97(23):12649-12654 (2000)
Registry entries: SciCrunch 
r-other-rajewsky-dropbead
Basic Exploration and Analysis of Drop-seq Data
Versions of package r-other-rajewsky-dropbead
ReleaseVersionArchitectures
sid0.3.1+git20180221.d746c6f+ds-3all
bookworm0.3.1+git20180221.d746c6f+ds-3all
trixie0.3.1+git20180221.d746c6f+ds-3all
bullseye0.3.1+git20180221.d746c6f+ds-3all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Dropbead offers a quick and straightforward way to explore and perform basic analysis of single cell sequencing data coming from droplet sequencing. It has been particularly tailored for Drop-seq.

Please cite: J. Alles, N. Karaiskos, S. Praktiknjo, S. Grosswendt, P. Wahle, P.-L. Ruffault, S. Ayoub, L. Schreyer, A. Boltengagen, C. Birchmeier, R. Zinzen an, C. Kocks and N. Rajewsky: Cell fixation and preservation for droplet-based single-cell transcriptomics. (PubMed,eprint) BMC Biology 15(44) (2017)
racon
consensus module for raw de novo DNA assembly of long uncorrected reads
Versions of package racon
ReleaseVersionArchitectures
stretch-backports1.3.1-1~bpo9+1amd64
bullseye1.4.20-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.5.0-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.5.0-3amd64,arm64,mips64el,ppc64el,s390x
buster1.3.2-1amd64
trixie1.5.0-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch-backports-sloppy1.4.10-1~bpo9+1amd64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Racon is intended as a standalone consensus module to correct raw contigs generated by rapid assembly methods which do not include a consensus step. The goal of Racon is to generate genomic consensus which is of similar or better quality compared to the output generated by assembly methods which employ both error correction and consensus steps, while providing a speedup of several times compared to those methods. It supports data produced by both Pacific Biosciences and Oxford Nanopore Technologies.

Racon can be used as a polishing tool after the assembly with either Illumina data or data produced by third generation of sequencing. The type of data inputed is automatically detected.

Racon takes as input only three files: contigs in FASTA/FASTQ format, reads in FASTA/FASTQ format and overlaps/alignments between the reads and the contigs in MHAP/PAF/SAM format. Output is a set of polished contigs in FASTA format printed to stdout. All input files can be compressed with gzip.

Racon can also be used as a read error-correction tool. In this scenario, the MHAP/PAF/SAM file needs to contain pairwise overlaps between reads including dual overlaps.

A wrapper script is also available to enable easier usage to the end- user for large datasets. It has the same interface as racon but adds two additional features from the outside. Sequences can be subsampled to decrease the total execution time (accuracy might be lower) while target sequences can be split into smaller chunks and run sequentially to decrease memory consumption. Both features can be run at the same time as well.

Please cite: Robert Vaser, Ivan Sovic, Niranjan Nagarajan and Mile Sikic: Fast and accurate de novo genome assembly from long uncorrected reads. (PubMed,eprint) Genome Research 27(5):737-746 (2017)
Registry entries: Bioconda 
radiant
esplora dati gerarchici di metagenomi con grafici a torta con zoom
Versions of package radiant
ReleaseVersionArchitectures
trixie2.8.1+dfsg-2all
stretch-backports2.7+dfsg-2~bpo9+1all
bullseye2.7.1+dfsg-4all
bookworm2.8.1+dfsg-2all
sid2.8.1+dfsg-2all
buster2.7+dfsg-2all
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Krona permette di esplorare dati gerarchici con grafici a torta con zoom. I grafici di Krona includono la gestione di diversi strumenti bioinformatici e di formati per dati grezzi. I grafici possono essere visualizzati con una versione recente di qualsiasi web browser comune.

Please cite: Brian D Ondov, Nicholas H Bergman and Adam M Phillippy: Interactive metagenomic visualization in a Web browser. (PubMed,eprint) BMC Bioinformatics 12:385 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
ragout
Reference-Assisted Genome Ordering UTility
Versions of package ragout
ReleaseVersionArchitectures
bookworm2.3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.3-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.3-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Ragout (Reference-Assisted Genome Ordering UTility) è uno strumento per creare scaffold a livello di cromosoma che usa riferimenti multipli. Dati dei frammenti iniziali di assemblamento (contig/scaffold) e uno o più riferimenti correlati (completi o bozze), produce un assemblato su scala di cromosoma (come insieme di scaffold).

L'approccio è basato sull'analisi di riarrangiamenti genomici (come inversioni o traslocazioni cromosomiche) tra i genomi di input e sulla ricostruzione della struttura più parsimoniosa del genoma obiettivo.

Ragout ora gestisce genomi sia piccoli sia grandi (di scala e complessità dei Mammiferi). L'assemblaggio di genomi altamente polimorfici è attualmente limitato.

Please cite: Mikhail Kolmogorov, Joel Armstrong, Brian J. Raney, Ian Streeter, Matthew Dunn, Fengtang Yang, Duncan Odom, Paul Flicek, Thomas M. Keane, David Thybert, Benedict Paten and Son Pham: Chromosome assembly of large and complex genomes using multiple references. (PubMed,eprint) Genome Research 28(11):1720-1732 (2018)
Registry entries: Bioconda 
rambo-k
Read Assignment Method Based On K-mers
Versions of package rambo-k
ReleaseVersionArchitectures
bullseye1.21+dfsg-3all
buster1.21+dfsg-2all
stretch1.21+dfsg-1all
bookworm1.21+dfsg-4all
trixie1.21+dfsg-4all
sid1.21+dfsg-4all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

RAMBO-K is a tool for rapid and sensitive removal of background sequences from Next Generation Sequencing data.

RAMBO-K is a reference-based tool for rapid and sensitive extraction of one organisms reads from a mixed dataset. It is based on a Markov chain implementation, which uses genomic characteristics of each reference to assign reads to the associated set.

Please cite: Simon H. Tausch, Bernhard Y. Renard, Andreas Nitsche and Piotr Wojciech Dabrowski: RAMBO-K: Rapid and Sensitive Removal of Background Sequences from Next Generation Sequencing Data. (PubMed,eprint) PLOS one 10(9):e0137896 (20015)
Registry entries: Bio.tools 
rampler
modulo per campionare sequenze genomiche
Versions of package rampler
ReleaseVersionArchitectures
sid2.1.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.1.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.1.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.0.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1.0-1amd64,arm64,armhf,i386
stretch-backports1.1.0-1~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Modulo autonomo per il campionamento di sequenze genomiche. Gestisce due modalità: sottocampionamento casuale di dati di sequenziamento ad una profondità desiderata (data la lunghezza di riferimento) e suddivisione di file ad una dimensione desiderata in byte.

Rampler prende come primo argomento di input un file in formato FASTA/FASTQ che può essere compresso con gzip. Il resto dei parametri di input dipende dalla modalità di funzionamento. L'output è memorizzato in uno o più file che sono nello stesso formato del file di input ma non compressi.

rapmap
rapid sensitive and accurate DNA read mapping via quasi-mapping
Versions of package rapmap
ReleaseVersionArchitectures
stretch0.4.0+dfsg-2amd64
buster0.12.0+dfsg-3amd64,arm64
sid0.15.0+dfsg-4amd64
trixie0.15.0+dfsg-4amd64
bookworm0.15.0+dfsg-3amd64
bullseye0.15.0+dfsg-1amd64
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

RapMap is a testing ground for ideas in quasi-mapping / (lightweight / pseudo) transcriptome alignment. That means that, at this point, it is somewhat experimental. The develop branch will have the latest improvements and additions, but is not guaranteed to be stable between commits. Breaking changes to the master branch will be accompanied by a tag to the version before the breaking change. Currently, RapMap is a stand-alone quasi-mapper that can be used with other tools. It is also being used as part of Sailfish and Salmon. Eventually, the hope is to create and stabilize an API so that it can be used as a library from other tools.

Quasi-mapping / (lightweight / pseudo)-alignment is the term that is used here for the type of information required for certain tasks (e.g. transcript quantification) that is less "heavyweight" than what is provided by traditional alignment. For example, one may only need to know the transcripts / contigs to which a read aligns and, perhaps, the position within those transcripts rather than the optimal alignment and base-for-base CIGAR string that aligns the read and substring of the transcript. For details on RapMap (quasi-mapping in particular), please check out the associated paper. Note: RapMap implements both quasi- mapping and pseudo-alignment (originally introduced in Bray et al. 2016), these two are not the same thing. They are distinct concepts, and RapMap simply happens to implement algorithms for computing both.

Please cite: Avi Srivastava, Hirak Sarkar, Nitish Gupta and Rob Patro: RapMap: a rapid, sensitive and accurate tool for mapping RNA-seq reads to transcriptomes. (PubMed,eprint) Bioinformatics 32(12):i192-i200 (2016)
Registry entries: Bio.tools  Bioconda 
rasmol
visualizza macromolecole biologiche
Versions of package rasmol
ReleaseVersionArchitectures
stretch2.7.5.2-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,s390x
sid2.7.6.0-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.7.6.0-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.7.6.0-1amd64,arm64,armhf,i386
bullseye2.7.6.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.7.6.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.7.5.2-2amd64,armel,armhf,i386
Debtags of package rasmol:
fieldchemistry
interfacex11
roleprogram
scopeutility
uitoolkitgtk
uselearning, viewing
x11application
Popcon: 21 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

RasMol è un programma di disegno molecolare progettato per visualizzare proteine, acidi nucleici e piccole molecole. Il programma è volto a fini illustrativi, didattici e alla produzione di immagini di qualità per la pubblicazione.

Il programma legge da un file le coordinate molecolari e visualizza interattivamente la molecola sullo schermo in una varietà di colori e di rappresentazioni. Attualmente le rappresentazioni disponibili includono insiemi di linee, con segmenti cilindrici rappresentanti i legami, con sfere solide (CPK), con palline e bastoncini, con nastri macromolecolari (sia nastri solidi ombreggiati che filamenti paralleli), con etichette per gli atomi e superfici punteggiate.

I formati di input attualmente supportati comprendono: Protein Data Bank (BPD), i formati Mol2 per Alchemy e Sybyl della Tripos, il formato Mol della Molecular Design Limited (MDL), il formato XMol XYZ del Minnesota Supercomputer Center (MSC), il formato CHARMm, il formato CIF e il formato mmCIF.

Questo pacchetto installa due versioni di RasMol, rasmol-gtk ha una moderna interfaccia basata su GTK e rasmol-classic è la vecchia versione con la GUI Xlib.

The package is enhanced by the following packages: rasmol-doc
Please cite: Roger A. Sayle and E. James Milner-White: RasMol: Biomolecular graphics for all. (PubMed) Trends in Biochemical Sciences (TIBS) 20(9):374 (1995)
Registry entries: Bio.tools 
Screenshots of package rasmol
raster3d
strumenti per generare immagini di proteine o di altre molecole
Versions of package raster3d
ReleaseVersionArchitectures
trixie3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.0-3-5amd64,arm64,armhf,i386
bookworm3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch3.0-3-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie3.0-3-1amd64,armel,armhf,i386
sid3.0-7-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package raster3d:
fieldbiology, biology:structural
interfacecommandline
roleprogram
scopeapplication
useconverting, viewing
works-with3dmodel, image, image:raster
works-with-formatjpg, png
Popcon: 7 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Raster3D è un insieme di strumenti per generare immagini raster di alta qualità di proteine o di altre molecole. Il programma principale fa il rendering di superfici di sfere, triangoli, cilindri e quadriche con punti luce riflessi, Phong shading e ombreggiature. Usa un algoritmo Z-buffer software efficiente che è indipendente da ogni hardware grafico. Programmi ausiliari elaborano coordinate atomiche da file PDB in descrizioni di rendering per immagini composte da nastri, atomi che riempono lo spazio, legami, sfere e stecche, ecc. Raster3D può anche essere usato per fare il rendering di immagini composte in altri programmi come Molscript in glorioso 3D con effetto luci, ombreggiatura, ecc. L'output è composto da file di immagini di pixel con 24 bit di informazioni sul colore per pixel.

Please cite: E.A. Merritt and D.J. Bacon: Raster3D Photorealistic Molecular Graphics. (PubMed) Methods in Enzymology 277:505-524 (1997)
Registry entries: Bio.tools 
rate4site
rilevatore di siti amminoacidici conservati
Versions of package rate4site
ReleaseVersionArchitectures
bullseye3.0.0-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.0.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch3.0.0-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.0.0-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.0.0-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.0.0-6amd64,arm64,armhf,i386
jessie3.0.0-1amd64,armel,armhf,i386
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Rate4Site calcola il tasso di evoluzione relativo di ogni sito usando un modello evolutivo basato su metodi probabilistici. Ciò permette di tenere in considerazione il processo stocastico sottostante l'evoluzione delle sequenze all'interno di famiglie di proteine e l'albero filogenetico delle proteine nella famiglia. Il punteggio di conservazione in un sito corrisponde al suo tasso di evoluzione.

Please cite: I. Mayrose, D. Graur, N. Ben-Tal and T. and Pupko: Comparison of site-specific rate-inference methods: Bayesian methods are superior. (PubMed,eprint) Mol Biol Evol 21(2):1781-1791 (2004)
raxml
RAxML (Randomized Axelerated Maximum Likelihood) di alberi filogenetici
Versions of package raxml
ReleaseVersionArchitectures
buster8.2.12+dfsg-1amd64,i386
stretch8.2.9+dfsg-1amd64,i386
sid8.2.13+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye8.2.12+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm8.2.12+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie8.1.1-3amd64,i386
trixie8.2.13+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package raxml:
fieldbiology
roleprogram
Popcon: 12 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

RAxML è un programma per l'inferenza di grandi alberi filogenetici basata sul metodo della massima verosimiglianza sequenziale e parallela. In origine è stato derivato da fastDNAml.

Please cite: Alexandros Stamatakis: RAxML version 8: a tool for phylogenetic analysis and post-analysis of large phylogenies. (PubMed,eprint) Bioinformatics Epub ahead of print (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
ray
de novo genome assemblies of next-gen sequencing data
Versions of package ray
ReleaseVersionArchitectures
sid2.3.1-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2.3.1-1amd64,armel,armhf,i386
bookworm2.3.1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.3.1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.3.1-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.3.1-6amd64,arm64,armhf,i386
trixie2.3.1-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Ray is a parallel software that computes de novo genome assemblies with next-generation sequencing data. Ray is written in C++ and can run in parallel on numerous interconnected computers using the message-passing interface (MPI) standard. Included:

  • Ray de novo assembly of single genomes
  • Ray Méta de novo assembly of metagenomes
  • Ray Communities microbe abundance + taxonomic profiling
  • Ray Ontologies gene ontology profiling
Please cite: Sébastien Boisvert, François Laviolette and Jacques Corbeil: Ray: Simultaneous Assembly of Reads from a Mix of High-Throughput Sequencing Technologies. (PubMed,eprint) Journal of Computational Biology 17(11):1519-1533 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
rdp-alignment
pacchetto di strumenti di allineamento del Ribosomal Database Project (RDP)
Versions of package rdp-alignment
ReleaseVersionArchitectures
stretch1.2.0-2all
trixie1.2.0-8all
bullseye1.2.0-6all
bookworm1.2.0-8all
sid1.2.0-8all
buster1.2.0-5all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Il pacchetto di strumenti "Alignment" contiene comandi per eseguire analisi di comunità definite, allineamenti a coppie e modelli di Markov nascosti (modelli HMMER3, senza training).

Il pacchetto contiene anche la libreria Java AlignmentTools che è usata da altri strumenti RDP.

Please cite: Jordan A. Fish, Benli Chai, Qiong Wang, Yanni Sun, C. Titus Brown, James M. Tiedje and James R Cole: FunGene: the functional gene pipeline and repository. (PubMed,eprint) Front Microbiology 4:291 (2013)
rdp-classifier
extensible sequence classifier for fungal lsu, bacterial and archaeal 16s
Versions of package rdp-classifier
ReleaseVersionArchitectures
trixie2.10.2-7all
bullseye2.10.2-5all
bookworm2.10.2-6all
stretch2.10.2-1all
sid2.10.2-7all
buster2.10.2-4all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The RDP Classifier is a naive Bayesian classifier which was developed to provide rapid taxonomic placement based on rRNA sequence data. The RDP Classifier can rapidly and accurately classify bacterial and archaeal 16s rRNA sequences, and Fungal LSU sequences. It provides taxonomic assignments from domain to genus, with confidence estimates for each assignment. The RDP Classifier likely can be adapted to additional phylogenetically coherent bacterial taxonomies.

Please cite: Qiong Wang, George M. Garrity, James M. Tiedje and James R. Cole: Naive Bayesian classifier for rapid assignment of rRNA sequences into the new bacterial taxonomy. (PubMed,eprint) Appl Environ Microbiol. 73(16):5261-7 (2007)
rdp-readseq
lettura e scrittura di sequenze RDP (Ribosomal Database Project)
Versions of package rdp-readseq
ReleaseVersionArchitectures
buster2.0.2-6all
stretch2.0.2-2all
trixie2.0.2-9all
sid2.0.2-9all
bullseye2.0.2-7all
bookworm2.0.2-9all
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Rdp-readseq è una semplice interfaccia utente per la libreria di lettura di sequenze sviluppata dal Ribosomal Database Project. Può gestire file genbank, embl, fasta, fastq, sff e sto. Può leggere da file o flussi e può gestire file di indicizzazione.

Il pacchetto contiene anche la libreria Java ReadSeq che è utilizzata da altri strumenti RDP.

Registry entries: Bioconda 
readseq
conversione tra formati di sequenze
Versions of package readseq
ReleaseVersionArchitectures
stretch1-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie1-11amd64,armel,armhf,i386
sid1-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1-13amd64,arm64,armhf,i386
Debtags of package readseq:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useconverting
works-with-formatplaintext
Popcon: 2 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Legge e scrive sequenze nucleiche/proteiche in vari formati. I file dati possono avere sequenze multiple. Readseq è particolarmente utile dato che rileva automaticamente e fa conversioni tra molti formati di sequenza.

Please cite: Don Gilbert: Sequence file format conversion with command-line readseq. (PubMed,eprint) Current Protocols in Bioinformatics Appendix 1:E (2003)
Registry entries: Bio.tools  Bioconda 
readucks
Nanopore read de-multiplexer (read demux -> readux -> readucks, innit)
Versions of package readucks
ReleaseVersionArchitectures
sid0.0.3-5all
bullseye0.0.3-2all
bookworm0.0.3-5all
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

This package is inspired by the demultiplexing options in porechop but without the adapter trimming options - it just demuxes. It uses the parasail library with its Python bindings to do pairwise alignment which provides a considerable speed up over the seqan library used by porechop due to its low-level use of vector processor instructions.

reapr
strumento universale per valutazione di assemblaggi genomici
Versions of package reapr
ReleaseVersionArchitectures
bullseye1.0.18+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster1.0.18+dfsg-4amd64,arm64,armhf
sid1.0.18+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.18+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.18+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
stretch1.0.18+dfsg-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

REAPR è uno strumento che valuta l'accuratezza di un assemblaggio genomico usando letture a terminali accoppiati mappate, senza l'uso di un genoma di riferimento come confronto. Può essere utilizzato in qualunque stadio di una catena di elaborazione di assemblaggio, per spezzare automaticamente strutture non corrette e segnalare altri errori nell'assemblaggio per l'ispezione manuale. Riporta assemblaggi non corretti e altri avvertimenti, e produce un nuovo assemblaggio spezzato sulla base degli errori.

Il software richiede come input un assemblaggio in formato FASTA e letture accoppiate mappate sull'assemblaggio in un file BAM. Le informazioni di mappatura, come la copertura di un frammento e la distribuzione delle dimensioni di inserimento, vengono analizzate per trovare assemblaggi non corretti. REAPR funziona meglio usando coppie di letture mappate da un catalogo di grandi inserimenti (almeno 1000pb). In aggiunta, se è disponibile anche un catalogo Illumina di inserimenti corti, REAPR può combinarlo con quello dei grandi inserimenti per dare un punteggio a ciascuna base dell'assemblaggio.

Please cite: Martin Hunt, Taisei Kikuchi, Mandy Sanders, Chris Newbold, Matthew Berriman and Thomas D Otto: REAPR: a universal tool for genome assembly evaluation. (PubMed,eprint) Genome Biology 14(5):R47 (2013)
recan
disegno della distanza genetica per analisi di eventi di ricombinazione
Versions of package recan
ReleaseVersionArchitectures
trixie0.5+dfsg-1all
bullseye0.1.2-2all
sid0.5+dfsg-1all
bookworm0.1.5+dfsg-2all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

recan è un pacchetto Python che permette di costruire grafici della distanza genetica per esplorare e scoprire eventi di ricombinazione in genomi virali.

Questo metodo è stato precedentemente implementato in strumenti software per il desktop: RAT, Simplot e RDP4.

relion
toolkit per ricostruzioni 3D in microscopia crio-elettronica
Versions of package relion
ReleaseVersionArchitectures
bookworm3.1.3-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.1.3-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.1.3-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.1.0-4amd64,i386
upstream4.0.2
Popcon: 1 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

RELION (per REgularised LIkelihood OptimisatioN) è un programma autonomo per computer per affinamento Massimo A Posteriori di ricostruzioni 3D (multiple) * medie di classe 2D in microscopia crio-elettronica.

RELION fornisce una GUI e diversi strumenti a riga di comando in versioni parallele (MPI) e seriali, opzionalmente con gestione di CUDA/GPU.

relion fornisce gli strumenti a riga di comando seriali e paralleli (MPI) senza gestione di CUDA/GPU.

Please cite: Sjors H. W. Scheres: RELION: implementation of a Bayesian approach to cryo-EM structure determination. (PubMed) J. Struct. Biol. 180(3):519-30 (2012)
relion-gui
toolkit per ricostruzioni 3D in microscopia crio-elettronica (applicazioni GUI)
Versions of package relion-gui
ReleaseVersionArchitectures
bullseye3.1.0-4amd64,i386
sid3.1.3-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.1.3-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.1.3-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream4.0.2
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

RELION (per REgularised LIkelihood OptimisatioN) è un programma autonomo per computer per affinamento Massimo A Posteriori di ricostruzioni 3D (multiple) * medie di classe 2D in microscopia crio-elettronica.

RELION fornisce una GUI e diversi strumenti a riga di comando in versioni parallele (MPI) e seriali, opzionalmente con gestione di CUDA/GPU.

relion-gui fornisce l'interfaccia utente grafica senza gestione di CUDA/GPU.

Please cite: Sjors H. W. Scheres: RELION: implementation of a Bayesian approach to cryo-EM structure determination. (PubMed) J. Struct. Biol. 180(3):519-30 (2012)
repeatmasker-recon
trova famiglie di ripetizioni in sequenze biologiche
Versions of package repeatmasker-recon
ReleaseVersionArchitectures
stretch1.08-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.08-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.08-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.08-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.08-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.08-4amd64,arm64,armhf,i386
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Il pacchetto RECON implementa un algoritmo de novo per l'identificazione di famiglie di ripetizioni in sequenze biologiche.

Il programma implementa un approccio per l'identificazione e classificazione de novo di famiglie di sequenze ripetute, che è basato su estensioni al consueto approccio con raggruppamento in cluster con linkage singoli di allineamenti a coppie locali tra sequenze genomiche. Le estensioni usano informazioni di allineamenti multipli per definire i limiti di copie individuali delle ripetizioni, e per distinguere famiglie di elementi ripetuti omologhe ma distinte. In test sul genoma umano questo approccio è stato in grado di identificare e raggruppare correttamente gli elementi trasponibili conosciuti. Il programma dovrebbe essere utile per il primo passaggio di classificazione automatica di ripetizioni in genomi sequenziati per la prima volta.

Please cite: Zhirong Bao and Sean R. Eddy: Automated De Novo Identification of Repeat Sequence Families in Sequenced Genomes. (PubMed,eprint) Genome Research 12(8):1269-76 (2002)
reprof
protein secondary structure and accessibility predictor
Versions of package reprof
ReleaseVersionArchitectures
trixie1.0.1-8all
sid1.0.1-8all
jessie1.0.1-1all
stretch1.0.1-4all
buster1.0.1-6all
bullseye1.0.1-7all
bookworm1.0.1-8all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

'reprof' is an improved implementation of 'prof', a popular protein secondary structure and accessibility predictor. Prediction is either done from protein sequence alone or from an alignment - the latter should be used for optimal performance.

This package provides the 'reprof' command. It is only a command line interface to the functionality provided by the modules in librg-reprof-bundle-perl.

Registry entries: Bio.tools 
resfinder
identifica geni acquisiti di resistenza agli antimicrobici
Versions of package resfinder
ReleaseVersionArchitectures
bookworm4.3.0-1all
trixie4.4.2-2all
bullseye3.2-3all
sid4.4.2-2all
upstream4.5.0
Popcon: 0 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

ResFinder identifica geni acquisiti di resistenza agli antimicrobici in isolati batterici totalmente o parzialmente sequenziati.

ResFinder usa BLAST per l'identificazione di geni acquisiti di resistenza agli antimicrobici in dati di genomi interi. Come input il metodo può usare sia genomi completi o parziali pre-assemblati sia letture corte di sequenze da quattro diverse piattaforme di sequenziamento. Il metodo è stato valutato su 1862 file GenBank contenenti 1411 differenti geni di resistenza, oltre a 23 isolati sequenziati de-novo.

Please cite: Ea Zankari, Henrik Hasman, Salvatore Cosentino, Martin Vestergaard, Simon Rasmussen, Ole Lund, Frank M. Aarestrup and Mette Voldby Larsen: Identification of acquired antimicrobial resistance genes. (PubMed,eprint) Journal of Antimicrobial Chemotherapy 67(11):2640-4 (2012)
rna-star
allineatore universale e ultraveloce di sequenziamento di RNA
Versions of package rna-star
ReleaseVersionArchitectures
trixie2.7.11b+dfsg-2amd64,arm64,mips64el,ppc64el,riscv64
stretch2.5.2b+dfsg-1amd64,arm64,mips64el,ppc64el
stretch-backports2.7.0a+dfsg-1~bpo9+1amd64,arm64,mips64el,ppc64el
buster2.7.0a+dfsg-1amd64,arm64
bullseye2.7.8a+dfsg-2amd64,arm64,mips64el,ppc64el
bookworm2.7.10b+dfsg-2amd64,arm64,mips64el,ppc64el
sid2.7.11b+dfsg-2amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 5 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

Software STAR (Spliced Transcripts Alignment to a Reference) basato su un algoritmo di allineamento per RNA-seq mai descritto prima, che usa la ricerca di seed mappabili sequenziali massimi in array di suffissi non compressi seguita da raggruppamento in cluster dei seed e procedure di cucitura. STAR supera in prestazioni altri strumenti di allineamento di un fattore maggiore di 50 in velocità di mappatura, facendo l'allineamento con il genoma umano di 550 milioni di letture a terminali accoppiati 2 x 76 pb all'ora su un modesto server con 12 core, al contempo migliorando la sensibilità e la precisione dell'allineamento. In aggiunta a rilevazioni de novo senza bias di giunzioni canoniche, STAR può anche scoprire trascritti chimerici (fusione) e splice non canonici, ed è anche in grado di mappare sequenze di RNA a sequenza intera. Usando il sequenziamento Roche 454 di ampliconi PCR di trascrizione inversa, gli autori hanno validato sperimentalmente 1960 nuove giunzioni di splice intergeniche con un tasso di successo dell'80-90%, confermando l'elevata precisione della strategia di mappatura di STAR.

The package is enhanced by the following packages: multiqc
Please cite: Alexander Dobin, Carrie A. Davis, Felix Schlesinger, Jorg Drenkow, Chris Zaleski, Sonali Jha, Philippe Batut, Mark Chaisson and Thomas R. Gingeras: STAR: ultrafast universal RNA-seq aligner. (PubMed,eprint) Bioinformatics 29(1):15-21 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence analysis
rnahybrid
predizione veloce ed efficace di doppiette microRNA/obiettivo
Versions of package rnahybrid
ReleaseVersionArchitectures
bookworm2.1.2-7amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.1.1-2amd64,armel,armhf,i386
stretch2.1.2-1amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.1.2-5amd64,arm64,armhf,i386
bullseye2.1.2-6amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.1.2-8amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.1.2-8amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package rnahybrid:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

RNAhybrid è uno strumento per trovare l'ibridizzazione con minore energia libera di un lungo filamento di RNA con uno corto. L'ibridizzazione viene fatta in una sorta di modalità a domini, cioè la sequenza corta viene ibridizzata con la parte che meglio corrisponde nella sequenza lunga. Lo strumento è pensato principalmente come mezzo per predire le sequenze obiettivo di microRNA.

Please cite: Marc Rehmsmeier, Peter Steffen, Matthias Höchsmann and Robert Giegerich: Fast and effective prediction of microRNA/target duplexes. (PubMed,eprint) RNA 10(10):1507-1517 (2004)
Registry entries: Bio.tools  SciCrunch 
roary
catena di strumenti autonoma ad alta velocità per pan-genomi
Versions of package roary
ReleaseVersionArchitectures
buster3.12.0+dfsg-2all
sid3.13.0+dfsg-1all
bookworm3.13.0+dfsg-1all
trixie3.13.0+dfsg-1all
stretch3.8.0+dfsg-1all
bullseye3.13.0+dfsg-1all
stretch-backports3.12.0+dfsg-2~bpo9+1all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Roary è una catena di strumenti autonoma ad alta velocità per pan-genomi, che accetta assemblati annotati in formato GFF3 (come prodotti, ad esempio, da Prokka) e calcola il pan-genoma. Utilizzando un PC desktop standard può analizzare insiemi di dati con migliaia di campioni, cosa che è impossibile, dal punto di vista del calcolo, con i metodi esistenti senza compromettere la qualità dei risultati. 128 campioni possono essere analizzati in meno di 1 ora, usando 1 GB di RAM e un processore singolo. Per effettuare questa analisi utilizzando metodi esistenti servirebbero settimane e centinaia di GB di RAM. Roary non è pensato per la meta-genomica o per confrontare insiemi estremamente diversi di genomi.

Please cite: Andrew J. Page, Carla A. Cummins, Martin Hunt, Vanessa K. Wong, Sandra Reuter, Matthew T. G. Holden, Maria Fookes, Daniel Falush, Jacqueline A. Keane and Julian Parkhill: Roary: Rapid large-scale prokaryote pan genome analysis. (PubMed,eprint) Bioinformatics 31(22):3691-3693 (2015)
Registry entries: Bioconda 
rockhopper
system for analyzing bacterial RNA-seq data
Versions of package rockhopper
ReleaseVersionArchitectures
bookworm2.0.3+dfsg2-3all
trixie2.0.3+dfsg2-4all
sid2.0.3+dfsg2-4all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Rockhopper is a comprehensive and user-friendly system for computational analysis of bacterial RNA-seq data. As input, Rockhopper takes RNA sequencing reads output by high-throughput sequencing technology (FASTQ, QSEQ, FASTA, SAM, or BAM files). Rockhopper supports the following tasks:

  • Reference based transcript assembly (when one or more reference genomes are available)
  • Aligning reads to genomes
  • Assembling transcripts
  • Identifying transcript boundaries and novel transcripts such as small RNAs
  • De novo transcript assembly (when reference genomes are unavailable)
  • Normalizing data from different experiments
  • Quantifying transcript abundance
  • Testing for differential gene expression
  • Characterizing operon structures
  • Visualizing results in a genome browser
The package is enhanced by the following packages: multiqc
Please cite: Brian Tjaden: De novo assembly of bacterial transcriptomes from RNA-seq data. (PubMed,eprint) Genome Biology (2015)
roguenarok
algoritmo versatile e scalabile per identificazione di taxa sconosciuti
Versions of package roguenarok
ReleaseVersionArchitectures
trixie1.0.1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0-3amd64,arm64,armhf,i386
sid1.0.1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

RogueNaRok è un algoritmo versatile e scalabile per identificazione di taxa sconosciuti. Include anche implementazioni del sottoalbero di massima concordanza, dell'indice di stabilità delle foglie e dell'indice di instabilità tassonomica.

Please cite: Andre J. Aberer, Denis Krompass and Alexandros Stamatakis: Pruning Rogue Taxa Improves Phylogenetic Accuracy: An Efficient Algorithm and Webservice. (PubMed,eprint) Systematic Biology 62(1):162-166 (2013)
rsem
RNA-Seq tramite Expectation-Maximization
Versions of package rsem
ReleaseVersionArchitectures
sid1.3.3+dfsg-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster1.3.1+dfsg-1amd64,arm64
bullseye1.3.3+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
bookworm1.3.3+dfsg-2amd64,arm64,mips64el,ppc64el,s390x
trixie1.3.3+dfsg-3amd64,arm64,mips64el,ppc64el,riscv64,s390x
stretch1.2.31+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

RSEM è un pacchetto software per stimare i livelli di espressione di isoforme e geni da dati RNA-Seq. Il pacchetto RSEM fornisce un'interfaccia facile da usare, gestisce i thread per il calcolo parallelo dell'algoritmo EM, dati di lettura a terminali accoppiati e singoli, punteggi di qualità, letture a lunghezza variabile e stima RSPD. Inoltre, fornisce stime per la media a posteriori e per l'intervallo di confidenza al 95% per i livelli di espressione. Per la visualizzazione, può generare file BAM e Wiggle sia in coordinate dei trascritti sia in coordinate genomiche. I file in coordinate genomiche possono essere visualizzati sia dal navigatore UCSC Genome sia dall'Integrative Genomics Viewer (IGV) del Broad Institute. I file in coordinate dei trascritti possono essere visualizzati da IGV. RSEM ha anche i propri script per generare grafici della profondità di lettura dei trascritti in formato PDF. La funzionalità che distingue RSEM è che i grafici della profondità di lettura possono essere sovrapposti, con la profondità di lettura attribuibile a letture uniche mostrata in nero e quella attribuibile a letture multiple mostrata in rosso. Inoltre, i modelli dedotti dai dati possono anche essere visualizzati. Ultimo, ma non meno importante, RSEM contiene un simulatore.

The package is enhanced by the following packages: multiqc
Please cite: Bo Li and Colin Dewey: RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. (PubMed,eprint) BMC Bioinformatics 12(1):323 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
rtax
classificazione di letture di sequenze di geni per RNA ribosomiale 16S
Versions of package rtax
ReleaseVersionArchitectures
trixie0.984-8all
jessie0.984-2all
buster0.984-6all
bookworm0.984-8all
bullseye0.984-7all
sid0.984-8all
stretch0.984-5all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Le tecnologie a letture corte per la profilazione di comunità microbiche sono sempre più popolari, eppure le tecniche passate per assegnazioni tassonomiche a letture paired-end hanno prestazioni non buone. RTAX fornisce assegnazioni tassonomiche rapide di letture paired-end che usano un algoritmo di consenso.

Please cite: David A. W. Soergel, Neelendu Dey, Rob Knight and Steven E. Brenner: Selection of primers for optimal taxonomic classification of environmental 16S rRNA gene sequences. (PubMed,eprint) The ISME Journal 6:1440–1444 (2012)
runcircos-gui
strumento GUI per eseguire Circos
Versions of package runcircos-gui
ReleaseVersionArchitectures
buster0.0+git20180828.97703b9-1amd64,arm64,armhf,i386
sid0.0+git20200528.82dda8c-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.0+git20200528.82dda8c-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.0+git20200528.82dda8c-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.0+git20200528.82dda8c-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports0.0+git20180828.97703b9-1~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

runCircos-gui è un software multipiattaforma semplice ma completo per eseguire Circos da un'interfaccia utente grafica. Il software elimina la necessità di usare la riga di comando per eseguire Circos senza compromettere la potenza di opzioni e parametri dalla riga di comando completi.

runCircos-gui ottimizza i parametri di esecuzione (sia opzioni attivabili che opzioni con argomenti) e installa pacchetti Perl senza usare la riga di comando.

saint
Significance Analysis of INTeractome - analisi di significato di interactomi
Versions of package saint
ReleaseVersionArchitectures
bullseye2.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.4.0+dfsg-1amd64,armel,armhf,i386
stretch2.5.0+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.5.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.5.0+dfsg-3amd64,arm64,armhf,i386
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SAINT implementa l'algoritmo di punteggio per dati di interazioni proteina-proteina usando dati di proteomica quantitativa "label-free" in esperimenti AP-MS. È stato usato per dati di conteggi spettrali nel lavoro sull'interactoma lievito-chinasi non incorporando la purificazione del controllo, così come implementazione generalizzata per dati di conteggio spettrale con e senza purificazione del controllo.

In alternativa, si può anche eseguire SAINT insieme a ProHits.

Il pacchetto è stato scritto per fare analisi con o senza IP di controllo.

Please cite: A. Breitkreutz, H. Choi, J.R. Sharom, L. Boucher, V. Neduva, B. Larsen, Z.Y. Lin, B.J. Breitkreutz, C. Stark, G. Liu, J. Ahn, D. Dewar-Darch, T. Reguly, X. Tang, R. Almeida, Z.S. Qin, T. Pawson, A.-C. Gingras, A.I. Nesvizhskii and M. Tyers: A global protein kinase and phosphatase interaction network in yeast. (PubMed) Science 328(5981):1043-6 (2010)
Registry entries: Bio.tools 
salmid
identificatore rapido di Salmonella basato su k-meri da dati di sequenza
Versions of package salmid
ReleaseVersionArchitectures
bullseye0.1.23-2all
sid0.1.23-5all
trixie0.1.23-5all
bookworm0.1.23-5all
buster0.1.23-1all
stretch-backports0.1.23-1~bpo9+1all
Popcon: 10 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

SalmID permette la conferma rapida di specie e sottospecie di Salmonella da dati di sequenza. Ciò viene fatto controllando gli ID tassonomici di singoli campioni isolati. Attualmente identifica solo specie e sottospecie di Salmonella e alcuni contaminanti comuni (Listeria, Escherichia).

salmon
wicked-fast transcript quantification from RNA-seq data
Versions of package salmon
ReleaseVersionArchitectures
trixie1.10.2+ds1-1amd64,arm64
buster0.12.0+ds1-1amd64
bullseye1.4.0+ds1-1amd64,arm64
stretch0.7.2+ds1-2amd64
sid1.10.2+ds1-1amd64,arm64
bookworm1.10.1+ds1-1amd64,arm64
upstream1.10.3
Popcon: 1 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Salmon is a wicked-fast program to produce a highly-accurate, transcript-level quantification estimates from RNA-seq data. Salmon achieves is accuracy and speed via a number of different innovations, including the use of lightweight alignments (accurate but fast-to-compute proxies for traditional read alignments) and massively-parallel stochastic collapsed variational inference. The result is a versatile tool that fits nicely into many different pipelines. For example, you can choose to make use of the lightweight alignments by providing Salmon with raw sequencing reads, or, if it is more convenient, you can provide Salmon with regular alignments (e.g. computed with your favorite aligner), and it will use the same wicked-fast, state-of-the-art inference algorithm to estimate transcript-level abundances for your experiment.

The package is enhanced by the following packages: multiqc
Please cite: Rob Patro, Geet Duggal, Michael I Love, Rafael A Irizarry and Carl Kingsford: Salmon provides fast and bias-aware quantification of transcript expression. (eprint) Nature Methods 14(4):417-419 (2017)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sambamba
strumenti per lavorare con dati SAM/BAM
Versions of package sambamba
ReleaseVersionArchitectures
bookworm1.0+dfsg-1amd64,arm64
sid1.0.1+dfsg-2amd64,arm64,riscv64
bullseye0.8.0-1amd64,arm64
Popcon: 5 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Sambamba si posiziona come alternativa performante a samtools e fornisce strumenti per:

  • filtraggio potente con sambamba view --filter;
  • unione di intestazioni in stile Picard nello strumento merge;
  • opzionale per operazioni su interi BAM;
  • copia veloce di una regione su un nuovo file con lo strumento slice;
  • marcatura/rimozione di duplicati usando il criterio Picard.
Please cite: Artem Tarasov, Albert J. Vilella, Edwin Cuppen, Isaac J. Nijman and Pjotr Prins: Sambamba: fast processing of NGS alignment formats. (PubMed,eprint) Bioinformatics 31(12):2032-2034 (2015)
Registry entries: Bio.tools  Bioconda 
samblaster
marks duplicates, extracts discordant/split reads
Versions of package samblaster
ReleaseVersionArchitectures
bullseye0.1.26-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.24-2amd64,arm64,armhf,i386
sid0.1.26-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.1.26-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.1.26-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Current "next-generation" sequencing technologies cannot tell what exact sequence they will be reading. They take what is available. And if some sequences are read very often, then this needs some extra biomedical thinking. The genome could for instance be duplicated.

samblaster is a fast and flexible program for marking duplicates in read-id grouped paired-end SAM files. It can also optionally output discordant read pairs and/or split read mappings to separate SAM files, and/or unmapped/clipped reads to a separate FASTQ file. When marking duplicates, samblaster will require approximately 20MB of memory per 1M read pairs.

The package is enhanced by the following packages: multiqc
Please cite: Gregory G. Faust and Ira M. Hall: SAMBLASTER: fast duplicate marking and structural variant read extraction. (PubMed,eprint) Bioinformatics 30(17):2503-2505 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
samclip
filter SAM file for soft and hard clipped alignments
Versions of package samclip
ReleaseVersionArchitectures
bookworm0.4.0-4all
sid0.4.0-4all
bullseye0.4.0-2all
trixie0.4.0-4all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Most short read aligners perform local alignment of reads to the reference genome. Examples includes bwa mem, minimap2, and bowtie2 (unless in --end-to-end mode). This means the ends of the read may not be part of the best alignment.

This can be caused by:

  • adapter sequences (aren't in the reference)
  • poor quality bases (mismatches only make the alignment score worse)
  • structural variation in your sample compared to the reference
  • reads overlapping the start and end of contigs (including circular genomes)

Read aligners output a SAM file. Column 6 in this format stores the CIGAR string. which describes which parts of the read aligned and which didn't. The unaligned ends of the read can be "soft" or "hard" clipped, denoted with S and H at each end of the CIGAR string. It is possible for both types to be present, but that is not common. Soft and hard don't mean anything biologically, they just refer to whether the full read sequence is in the SAM file or not.

Registry entries: Bioconda 
samtools
elaborazioni di allineamenti di sequenze nei formati SAM, BAM e CRAM
Versions of package samtools
ReleaseVersionArchitectures
stretch-backports1.7-2~bpo9+1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.11-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
experimental1.21-0+exp1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.1.19-1amd64,armhf,i386
bookworm1.16.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.20-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.20-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.9-4amd64,arm64,armhf
stretch1.3.1-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
upstream1.21
Debtags of package samtools:
fieldbiology
interfacecommandline
networkclient
roleprogram
scopeutility
uitoolkitncurses
useanalysing, calculating, filtering
works-withbiological-sequence
Popcon: 56 users (26 upd.)*
Newer upstream!
License: DFSG free
Git

Samtools è un insieme di utilità che manipolano allineamenti di sequenze di nucleotidi nel formato binario BAM. Importa ed esporta nei formati SAM (Sequence Alignment/Map - allineamento/mappa di sequenze) e CRAM ASCII, effettua ordinamenti, unioni e indicizzazioni e permette di rintracciare letture in qualsiasi regione in modo veloce. È stato progettato per funzionare su flussi di dati ed è in grado di aprire un file BAM o CRAM (non SAM) su un server FTP o HTTP remoto.

The package is enhanced by the following packages: libbio-samtools-perl multiqc
Please cite: Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan, Nils Homer, Gabor Marth, Goncalo Abecasis, Richard Durbin and 1000 Genome Project Data Processing Subgroup: The Sequence Alignment/Map (SAM) Format and SAMtools. (PubMed,eprint) Bioinformatics 25(16):2078-2079 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package samtools
savvy-util
strumento di conversione per il formato di file SAV
Versions of package savvy-util
ReleaseVersionArchitectures
bookworm2.1.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.1.0-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.1.0-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Savvy è l'interfaccia C++ ufficiale per il formato di file SAV e offre una gestione perfetta per i file BCF e VCF.

Il binario sav può essere utilizzato per gestire file SAV.

Registry entries: Bioconda 
scoary
studi di associazione per intero pangenoma
Versions of package scoary
ReleaseVersionArchitectures
stretch-backports1.6.16-1~bpo9+1all
bullseye1.6.16-2all
sid1.6.16-9all
buster1.6.16-1all
trixie1.6.16-9all
bookworm1.6.16-5all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Scoary è progettato per prendere il file gene_presence_absence.csv da Roary e un file dei tratti creato dall'utente e calcolare le associazioni tra tutti i geni nel genoma accessorio e i tratti. Produce un elenco dei geni ordinato per forza di associazione per tratto.

Please cite: Ola Brynildsrud, Jon Bohlin, Lonneke Scheffer and Vegard Eldholm: Rapid scoring of genes in microbial pan-genome-wide association studies with Scoary. (PubMed,eprint) Genome Biology 17(238) (2016)
Registry entries: Bio.tools  Bioconda 
scrappie
basecaller for Nanopore sequencer
Versions of package scrappie
ReleaseVersionArchitectures
trixie1.4.2-8amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
experimental1.4.2-9~0exp0simdeamd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.4.2-8amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
bullseye1.4.2-7amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
sid1.4.2-8amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The Nanopore is a device for DNA/RNA sequencing that does not require an amplification of the material. The polynucleotides are threaded through a pore and while these pass through, the change in the electrostatic potential allows one to identify ("call") the actual base that resides in the pore. Scrappie goes a step further and also attempts to describe modifications to the nucleic acid.

Please cite: Ryan R. Wick, Louise M. Judd and Kathryn E. Holt: Performance of neural network basecalling tools for Oxford Nanopore sequencing.. (eprint) Genome Biol. 20:129 (2019)
Registry entries: Bioconda 
scrm
simulatore di evoluzione di sequenze genetiche
Versions of package scrm
ReleaseVersionArchitectures
buster1.7.3-1amd64,arm64,armhf,i386
sid1.7.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.7.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.7.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.7.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.7.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

scrm simula l'evoluzione di sequenze genetiche.

Prende in input un modello evoluzionistico neutrale e genera sequenze casuali che sono evolute sotto il modello. Come simulatore di coalescenza traccia l'ascendenza delle sequenze campione indietro nel tempo ed è perciò estremamente efficiente. In confronto ad altri simulatori di coalescenza, può simulare sequenze su scala cromosomica senza una riduzione misurabile del linkage genetico tra siti diversi.

Please cite: Paul R. Staab, Sha Zhu, Dirk Metzler and Gerton Lunter: scrm: efficiently simulating long sequences using the approximated coalescent with recombination.. (2015)
Registry entries: Bioconda 
scythe
strumento bayesiano di taglio di adattatori per letture di sequenze
Versions of package scythe
ReleaseVersionArchitectures
stretch0.994-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.994+git20141017.20d3cff-1amd64,arm64,armhf,i386
bullseye0.994+git20141017.20d3cff-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.994+git20141017.20d3cff-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.994+git20141017.20d3cff-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.994+git20141017.20d3cff-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Scythe utilizza un approccio bayesiano naive per classificare sottostringhe contaminanti in letture di sequenze. Considera le informazioni sulla qualità e ciò lo può rendere robusto nella scelta di adattatori dell'estremità 3', che spesso includono basi con scarsa qualità.

Registry entries: SciCrunch 
seaview
interfaccia multipiattaforma per l'allineamento di sequenze e filogenia
Versions of package seaview
ReleaseVersionArchitectures
bullseye5.0.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster4.7-1amd64,arm64,armhf,i386
trixie5.0.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm5.0.5-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid5.0.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch4.6.1.2-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie4.5.3.1-2amd64,armel,armhf,i386
Debtags of package seaview:
fieldbiology, biology:bioinformatics
interfacex11
networkclient
roleprogram
scopeutility
uitoolkitfltk
usecomparing, editing, printing, viewing
works-withbiological-sequence
works-with-formatplaintext
x11application
Popcon: 6 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SeaView è un visualizzatore ed editor per allineamenti multipli di sequenze, cioè sequenze di DNA o proteine sono posizionate ciascuna nella propria riga separata, in modo che il nucleotide/aminoacido in una particolare posizione (colonna) sia considerato avere la stessa proprietà biochimica.

SeaView legge e scrive vari formati di file (NEXUS, MSF, CLUSTAL, FASTA, PHYLIP, MASE, Newick) di sequenze di DNA e proteiche e di alberi filogenetici. Gli allineamenti possono essere modificati a mano. È il motore dei programmi Muscle o Clustal Omega per l'allineamento multiplo di sequenze e permette anche di utilizzare qualsiasi algoritmo esterno di allineamento in grado di leggere e scrivere file in formato FASTA. Calcola gli alberi filogenetici in base alla parsimonia usando l'algoritmo dnapars/protpars di PHYLIP, in base alla distanza su una varietà di distanze evolutive con l'algoritmo NJ o BioNJ oppure in base alla massima verosimiglianza usando il programma PhyML 3.0.

SeaView disegna alberi filogenetici sullo schermo o in file PostScript e permette di scaricare sequenze da EMBL/GenBank/UniProt usando Internet.

The package is enhanced by the following packages: muscle muscle3
Please cite: Manolo Gouy, Stephane Guindon and Olivier Gascuel: SeaView version 4: a multiplatform graphical user interface for sequence alignment and phylogenetic tree building. (PubMed,eprint) Mol Biol Evol 27(2):221-224 (2010)
Registry entries: Bio.tools  SciCrunch 
Screenshots of package seaview
seer
analisi di arricchimento di elementi di sequenze genomiche (k-meri)
Versions of package seer
ReleaseVersionArchitectures
bookworm1.1.4-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.4-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1.4-2amd64,arm64,armhf,i386
stretch-backports1.1.4-2~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.1.2-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.1.4-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.1.4-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

I genomi batterici variano ampiamente in termini di contenuto dei geni e sequenze dei geni, questa plasticità ostacola l'uso di metodi tradizionali basti su SNP per identificare tutte le associazioni genetiche con variazione fenotipica. SEER fornisce un metodo statistico largamente applicabile e computazionalmente scalabile per l'identificazione di elementi di sequenze che siano significativamente arricchiti in un fenotipo di interesse. SEER è applicabile anche a decine di migliaia di genomi contando k-meri a lunghezza variabile usando un algoritmo distribuito di ricerca di stringhe. Sono fornite opzioni robuste per l'analisi di associazione che applicano anche correzioni per la struttura della popolazione clonale dei batteri. Usando grandi raccolte di genomi del principale patogeno umano Streptococcus pneumoniae, SEER identifica i rilevanti determinanti di resistenza precedentemente caratterizzati per svariati antibiotici.

Please cite: John A Lees, Minna Vehkala, Niko Välimäki, Simon R Harris, Claire Chewapreecha, Nicholas J Croucher, Pekka Marttinen, Mark R Davies, Andrew C Steer, Stephen Y C Tong, Antti Honkela, Julian Parkhill, Stephen D Bentley and Jukka Corander: Sequence element enrichment analysis to determine the genetic basis of bacterial phenotypes. (eprint) bioRxiv (2016)
Registry entries: SciCrunch  Bioconda 
segemehl
mappatura di letture corte con gap
Versions of package segemehl
ReleaseVersionArchitectures
bullseye0.3.4-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.3.4-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.3.4-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.3.4-1amd64,arm64,armhf
trixie0.3.4-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Segemehl è un software per mappare letture corte di sequenziamento verso genomi di riferimento. Segemehl implementa una strategia di corrispondenza basata su ESA (Enhanced Suffix Arrays). Segemehl accetta interrogazioni fasta e fastq (compresse con gzip e bgzip). Oltre all'allineamento di letture da protocolli standard DNA-seq e RNA-seq, permette anche la mappatura di letture convertite con bisolfito (Lister e Cokus) e implementa una strategia di mappatura di letture separate. L'output di segemehl è un file di allineamenti formattato come BAM o SAM. In caso di letture separate, vengono scritti su disco dei file BED aggiuntivi. Tali file BED possono essere riassunti con lo strumento di post-elaborazione haarz. Nel caso dell'allineamento di letture convertite con bisolfito, anche i tassi grezzi di metilazione possono essere ottenuti con haarz.

In breve, per ogni suffisso di una lettura, Segemehl ha lo scopo di trovare il seme con il miglior punteggio. I semi possono contenere inserzioni, delezioni e non corrispondenze (differenze). Il numero di differenze permesse all'interno di un singolo seme è controllato dell'utente ed è cruciale per il tempo di esecuzione del programma. Di conseguenza, i semi che invalidano il valore E definito dall'utente sono passati a una procedura di allineamento esatta semi-globale. Infine, le letture all'interno di una percentuale minima di accuratezza sono segnalate all'utente.

Please cite: Steve Hoffmann, Christian Otto, Stefan Kurtz, Cynthia M. Sharma, Philipp Khaitovich, Jörg Vogel, Peter F. Stadler and Jörg Hackermüller: Fast Mapping of Short Sequences with Mismatches, Insertions and Deletions Using Index Structures. (PubMed,eprint) PLoS Computational Biology 5(9):e1000502 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
sepp
phylogeny with ensembles of Hidden Markov Models
Versions of package sepp
ReleaseVersionArchitectures
bullseye4.3.10+dfsg-5amd64
sid4.5.5+dfsg-1amd64,arm64
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

The tool SEPP implementing these methods uses ensembles of Hidden Markov Models (HMMs) in different ways, each focusing on a different problem.

SEPP stands for "SATe-enabled Phylogenetic Placement", and addresses the problem of phylogenetic placement of short reads into reference alignments and trees.

Registry entries: Bioconda 
seqan-apps
libreria C++ per l'analisi di sequenze biologiche
Versions of package seqan-apps
ReleaseVersionArchitectures
trixie2.4.0+dfsg-16amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.4.0+dfsg-11amd64,arm64,armhf,i386
stretch-backports2.4.0+dfsg-11~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.4.0+dfsg-16amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.4.0+dfsg-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.3.1+dfsg-4amd64,arm64,i386,mips64el,ppc64el,s390x
jessie1.4.1+dfsg-2amd64,armhf,i386
experimental2.5.0~rc2+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm2.4.0+dfsg-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package seqan-apps:
devellibrary
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SeqAn è una libreria di template C++ di algoritmi e strutture dati efficienti per l'analisi di sequenze, pensata principalmente per i dati biologici. Questa libreria applica un modello progettuale generico unico che garantisce alte prestazioni, generalità, estensibilità e integrazione con le altre librerie. SeqAn è facile da usare e semplifica lo sviluppo di nuovi strumenti software con minime perdite in termini di prestazioni. Questo pacchetto contiene le applicazioni dfi, pair_align, micro_razers, seqan_tcoffee, seqcons, razers e tree_recon.

Please cite: Andreas Doring, David Weese, Tobias Rausch and Knut Reinert: SeqAn An efficient, generic C++ library for sequence analysis. (PubMed,eprint) BMC Bioinformatics 9(1):11 (2008)
Registry entries: Bio.tools  Bioconda 
seqan-needle
pre-filter for the counting of very large collections of nucleotide sequences
Versions of package seqan-needle
ReleaseVersionArchitectures
bookworm1.0.1.0.0.git.3011926+ds-4amd64,arm64,mips64el,ppc64el
sid1.0.3+ds-1amd64,arm64,mips64el,ppc64el,riscv64
trixie1.0.3+ds-1amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Needle is a tool for semi-quantitative analysis of very large collections of nucleotide sequences.

Needle stores its data in multiple interleaved Bloom filter, a fast and space efficient probabilistic data structure and uses a windowing scheme (also called minimisers) to reduce the amount of data to store. How many interleaved Bloom filter are used is defined by the user. Each interleaved Bloom filter has a so called expression threshold and stores minimisers with an occurrence greater than or equal to its own expression threshold and smaller than the next biggest expression threshold (if there is no bigger expression threshold, all greater than or equal to the threshold are stored). These expression thresholds are then used during the query (called estimate) to approximate the expression values of given transcripts.

Registry entries: Bioconda 
seqan-raptor
pre-filter for querying very large collections of nucleotide sequences
Versions of package seqan-raptor
ReleaseVersionArchitectures
bookworm2.0.0.0.git.fecfbca+ds-3amd64,arm64,mips64el,ppc64el
trixie3.0.1+ds-5amd64,arm64,mips64el,ppc64el,riscv64
sid3.0.1+ds-5amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Raptor is a system for approximately searching many queries such as next-generation sequencing reads or transcripts in large collections of nucleotide sequences. Raptor uses winnowing minimizers to define a set of representative k-mers, an extension of the interleaved Bloom filters (IBFs) as a set membership data structure and probabilistic thresholding for minimizers. This approach allows compression and partitioning of the IBF to enable the effective use of secondary memory.

Please cite: Enrico Seiler, Svenja Mehringer, Mitra Darvish, Etienne Turc and Knut Reinert: Raptor: A fast and space-efficient pre-filter for querying very large collections of nucleotide sequences. iScience 24(7) (2021)
Registry entries: Bio.tools  Bioconda 
seqkit
toolkit multipiattaforma e ultraveloce per manipolazione di file FASTA/Q
Versions of package seqkit
ReleaseVersionArchitectures
sid2.8.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.3.1+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.8.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.15.0+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream2.9.0
Popcon: 2 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

SeqKit descrive un toolkit completo, multipiattaforma e ultraveloce per elaborazione di FASTA/Q. SeqKit fornisce file binari eseguibili per tutti i principali sistemi operativi, inclusi Windows, Linux e Mac OS X, e può essere usato direttamente senza alcuna dipendenza o pre-configurazione. SeqKit dimostra prestazioni competitive in tempo di esecuzione e uso di memoria in confronto a strumenti simili. L'efficienza e l'usabilità di SeqKit permettono ai ricercatori di compiere rapidamente manipolazioni comuni su file FASTA/Q.

Please cite: Wei Shen, Shuai Le, Yan Li and Fuquan Hu: SeqKit: A Cross-Platform and Ultrafast Toolkit for FASTA/Q File Manipulation. (PubMed,eprint) PlosOne 11(10):e0163962 (2016)
Registry entries: Bio.tools  Bioconda 
seqmagick
interfaccia simile a imagemagick per Biopython SeqIO
Versions of package seqmagick
ReleaseVersionArchitectures
bullseye0.8.4-1all
buster0.7.0-1all
sid0.8.6-3all
trixie0.8.6-3all
bookworm0.8.4-3all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Seqmagick è una piccola utilità per esporre la conversione di formato di file in BioPython in un modo comodo.

Le funzionalità includono:

  • Modifica di sequenze:
  • rimozione di gap;
  • invertita e complementare invertita;
  • taglio dei residui ad un intervallo;
  • modifica di maiuscole/minuscole;
  • ordinamento per lunghezza o ID.
  • Visualizzazione di informazioni sui file di sequenza.
  • Sottoinsieme dei file di sequenza in base a:
  • posizione;
  • ID;
  • deduplicazione.
  • Filtraggio delle sequenze in base al punteggio di qualità.
  • Taglio degli allineamenti ad una regione di interesse definita dai primer forward e reverse.
Registry entries: Bioconda 
seqprep
rimozione di adattatori e/o unione di letture accoppiate di sequenze di DNA con sovrapposizioni
Versions of package seqprep
ReleaseVersionArchitectures
sid1.3.2-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.3.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.3.2-3amd64,arm64,armhf,i386
bullseye1.3.2-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.3.2-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.3.2-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SeqPrep è un programma per unire letture Illumina con estremità accoppiate che si sovrappongono in un'unica lettura più lunga. Può anche essere usato per la sua funzionalità di taglio dell'adattatore, senza fare alcuna sovrapposizione delle estremità accoppiate. Quando è presente una sequenza adattatore, ciò significa che le due letture devono sovrapporsi (nella maggior parte dei casi) perciò vengono forzatamente unite. Quando le letture non hanno una sequenza adattatore devono essere trattate con cautela durante l'unione, perciò viene utilizzato un approccio molto più specifico. I parametri predefiniti sono stati scelti pensando alla specificità, perciò possono essere usati con insiemi di dati dove ci si aspetta di trovare molte poche letture con sovrapposizioni. Tuttavia la cosa più sicura è sempre quella di riservare la procedura di sovrapposizione per gli insiemi di dati per i quali si hanno conoscenze pregresse sul fatto che una porzione significativa delle sequenze ha delle sovrapposizioni.

Registry entries: Bio.tools  SciCrunch  Bioconda 
seqsero
serotipizzazione di Salmonella da dati di sequenziamento del genoma
Versions of package seqsero
ReleaseVersionArchitectures
stretch-backports1.0-2~bpo9+1all
sid1.0.1+dfsg-6amd64,arm64
trixie1.0.1+dfsg-6amd64,arm64
bookworm1.0.1+dfsg-6amd64,arm64
bullseye1.0.1+dfsg-4all
buster1.0.1+dfsg-1all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SeqSero è una catena di elaborazione dati per la determinazione del serotipo di Salmonella da letture grezze di sequenziamento o assemblati genomici.

SeqSero è uno strumento innovativo per determinare i serotipi di salmonelle usando dati di sequenziamento genomico ad alte prestazioni. SeqSero è basato su database curati di determinanti dei serotipi per Salmonella (cluster di geni rfb, alleli fliC e fljB) e ci si attende che determini il serotipo rapidamente e accuratamente per quasi l'intero spettro di serotipi di Salmonella (più di 2.300 serotipi), sia da letture grezze di sequenziamento sia da assemblati genomici. Le prestazioni di SeqSero sono state valutate testando:

 1. letture grezze dai genomi di 308 isolati di Salmonella di serotipo
    noto;
 2. letture grezze dai genomi di 3.306 isolati di Salmonella sequenziati e
    resi pubblicamente disponibili da GenomeTrakr, una rete di monitoraggio
    nazionale degli Stati Uniti operata dalla Food and Drug Administration,
 3. 354 altre bozze di genomi o genomi completi di Salmonella pubblicamente
    disponibili.
SeqSero può aiutare a mantenere l'utilità ben consolidata della

serotipizzazione di Salmonella quando integrata in una piattaforma di sottotipizzazione e caratterizzazione di patogeni basate su WGS.

Please cite: Shaokang Zhang, Yanlong Yin, Marcus B. Jones, Zhenzhen Zhang, Brooke L. Deatherage Kaiser, Blake A. Dinsmore, Collette Fitzgerald, Patricia I. Fields and Xiangyu Deng: Salmonella Serotype Determination Utilizing High-throughput Genome Sequencing Data. (PubMed,eprint) Journal of Clinical Microbiology 53(5):1685-92 (2015)
seqtk
strumento veloce e leggero per elaborare sequenze in formato FASTA o FASTQ
Versions of package seqtk
ReleaseVersionArchitectures
jessie1.0-1amd64,armel,armhf,i386
stretch1.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.3-1amd64,arm64,armhf,i386
bullseye1.3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.3-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.4-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.4-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Attualmente, seqtk gestisce il taglio basato sulla qualità con l'algoritmo phred, convertendo fastq in fasta, sequenze complementari inverse, l'estrazione o il mascheramento di sottosequenze in regioni date in un file BED/elenco di nomi e altro. Contiene un modulo di sottocampionamento per campionare esattamente n sequenze o una frazione di sequenze.

seqtk gestisce file di input sia fasta sia fastq, che possono opzionalmente essere compressi con gzip.

Registry entries: Bio.tools  Bioconda 
Screenshots of package seqtk
sga
assemblatore de novo di genoma che usa grafi di stringhe
Versions of package sga
ReleaseVersionArchitectures
stretch0.10.15-2amd64,arm64,mips64el,ppc64el
sid0.10.15-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie0.10.15-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm0.10.15-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye0.10.15-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster0.10.15-4amd64,arm64
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

L'obiettivo principale di SGA è di essere molto efficiente in termini di memoria, il che è raggiunto usando una rappresentazione compressa delle letture di sequenze di DNA.

SGA è un assemblatore de novo per letture di sequenze di DNA. È basato sulla formulazione di assemblaggio di grafi di stringhe di Gene Myers e usa l'FM-index/trasformata di Burrows-Wheeler per trovare in maniera efficiente le sovrapposizioni tra letture di sequenze.

Please cite: Jared T. Simpson and Richard Durbin: Efficient de novo assembly of large genomes using compressed data structures.. (PubMed,eprint) Genome Res 22(3):549-555 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
shasta
nanopore whole genome assembly (binaries and scripts)
Versions of package shasta
ReleaseVersionArchitectures
bullseye0.7.0-3amd64,arm64
bookworm0.11.1-1amd64,arm64
trixie0.12.0-1amd64,arm64
sid0.12.0-1amd64,arm64
upstream0.13.0
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

De novo assembly from Oxford Nanopore reads. The goal of the Shasta long read assembler is to rapidly produce accurate assembled sequence using as input DNA reads generated by Oxford Nanopore flow cells.

Computational methods used by the Shasta assembler include:

  • Using a run-length representation of the read sequence. This makes the assembly process more resilient to errors in homopolymer repeat counts, which are the most common type of errors in Oxford Nanopore reads.

  • Using in some phases of the computation a representation of the read sequence based on markers, a fixed subset of short k-mers (k ≈ 10).

Shasta assembly quality is comparable or better than assembly quality achieved by other long read assemblers.

This package contains the executable binaries (tools) and accommodating scripts.

Please cite: K. Shafin, T. Pesout and R. Lorig-Roach et al.: Nanopore sequencing and the Shasta toolkit enable efficient de novo assembly of eleven human genomes. Nature Biotechnology (2020)
shovill
assemblaggio di genomi di isolati batterici da letture Illumina a terminali accoppiati
Versions of package shovill
ReleaseVersionArchitectures
bullseye1.1.0-4amd64
trixie1.1.0-9amd64
sid1.1.0-9amd64
bookworm1.1.0-9amd64
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Shovill è una pipeline che usa SPAdes come suo nucleo centrale, ma modifica i passaggi prima e dopo il passo di assemblaggio primario, per ottenere risultati simili in un tempo minore. Shovill gestisce anche altri strumenti per assemblaggio, come SKESA, Velvet e Megahit, perciò si può sfruttare la pre- e post-elaborazione fornita da Shovill anche con essi.

sibelia
strumento per genomica comparativa
Versions of package sibelia
ReleaseVersionArchitectures
bookworm3.0.7+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid3.0.7+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.0.7+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.0.7+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Sibelia (Synteny Block ExpLoration tool) è uno strumento per genomica comparativa: assiste i biologi nell'analisi di variazioni genomiche che correlano con patogeni o dei cambiamenti genomici che aiutano i microorganismi ad adattarsi ad ambienti diversi. Sibelia è anche d'aiuto per gli studi evoluzionistici e di riarrangiamento genomico per ceppi multipli di microorganismi.

Sibelia è utile per trovare:

 1) regioni condivise;
 2) regioni che sono presenti in un gruppo di genomi, ma non in altri;
 3) riarrangiamenti che trasformano un genoma in altri genomi.
Please cite: Ilya Minkin, Anand Patel, Mikhail Kolmogorov, Nikolay Vyahhi and Son Pham: Sibelia: A Scalable and Comprehensive Synteny Block Generation Tool for Closely Related Microbial Genomes. Lecture Notes in Computer Science (2013)
Registry entries: Bio.tools  Bioconda 
sibsim4
allinea sequenze RNA espresse su un modello DNA
Versions of package sibsim4
ReleaseVersionArchitectures
buster0.20-4amd64,arm64,armhf,i386
stretch0.20-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.20-2amd64,armel,armhf,i386
sid0.20-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.20-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.20-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.20-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package sibsim4:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing, searching
works-with-formatplaintext
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Il progetto SIBsim4 si basa su sim4, che è un programma progettato per allineare una sequenza DNA espressa con una sequenza genomica, permettendo la presenza di introni. SIBsim4 è una riscrittura piuttosto estesa del codice originale con in mente i seguenti obiettivi:

  • miglioramento della velocità;
  • possibilità di usare grandi, dell'ordine di cromosomi, sequenze di DNA;
  • output più dettagliato sui tipi di splicing;
  • output più dettagliato sui siti polyA;
  • varie correzioni e ripuliture del codice.
Registry entries: Bio.tools 
sickle
windowed adaptive trimming tool for FASTQ files using quality
Versions of package sickle
ReleaseVersionArchitectures
trixie1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.33+git20150314.f3d6ae3-1amd64,arm64,armhf,i386
stretch1.33-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm1.33+git20150314.f3d6ae3-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Most modern sequencing technologies produce reads that have deteriorating quality towards the 3'-end. Incorrectly called bases here negatively impact assembles, mapping, and downstream bioinformatics analyses.

Sickle is a tool that uses sliding windows along with quality and length thresholds to determine when quality is sufficiently low to trim the 3'-end of reads. It will also discard reads based upon the length threshold. It takes the quality values and slides a window across them whose length is 0.1 times the length of the read. If this length is less than 1, then the window is set to be equal to the length of the read. Otherwise, the window slides along the quality values until the average quality in the window drops below the threshold. At that point the algorithm determines where in the window the drop occurs and cuts both the read and quality strings there. However, if the cut point is less than the minimum length threshold, then the read is discarded entirely.

Sickle supports four types of quality values: Illumina, Solexa, Phred, and Sanger. Note that the Solexa quality setting is an approximation (the actual conversion is a non-linear transformation). The end approximation is close.

Sickle also supports gzipped file inputs.

The package is enhanced by the following packages: multiqc
Registry entries: Bio.tools  SciCrunch  Bioconda 
sigma-align
semplici allineamenti multipli "greedy" di sequenze di DNA non codificante
Versions of package sigma-align
ReleaseVersionArchitectures
jessie1.1.3-3amd64,armel,armhf,i386
sid1.1.3-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.1.3-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.1.3-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.1.3-6amd64,arm64,armhf,i386
bullseye1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.1.3-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package sigma-align:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Sigma ("Simple greedy multiple alignment") è un programma per allineamenti. Il suo algoritmo e lo schema dei punteggi sono progettati specificatamente per le sequenze non codificanti di DNA.

Usa una strategia di ricerca del miglior allineamento locale possibile senza gap. Questo succede ad ogni passo creando il miglior allineamento possibile che sia coerente con gli allineamenti esistenti. Assegna un punteggio alla significatività dell'allineamento in base alla lunghezza dei frammenti allineati e ad un modello di fondo. Questi possono essere forniti * stimati da un file ausiliario di DNA intergenico.

Please cite: Siddharthan, Rahul: Sigma: multiple alignment of weakly-conserved non-coding DNA sequence. (PubMed) BMC Bioinformatics 7(1):143 (2006)
Registry entries: Bio.tools 
sim4
strumento per allineare cDNA e DNA genomico
Versions of package sim4
ReleaseVersionArchitectures
bullseye0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie0.0.20121010-1amd64,armel,armhf,i386
trixie0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.0.20121010-5amd64,arm64,armhf,i386
stretch0.0.20121010-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm0.0.20121010-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package sim4:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing, searching
works-with-formatplaintext
Popcon: 12 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

sim4 è uno strumento che si basa su criteri di somiglianza per allineare sequenze di DNA espresse (EST, cDNA, mRNA) con sequenze genomiche per un gene. Rileva anche le sequenze di fine quando due sequenze si sovrappongono ad una estremità (cioè l'inizio di una sequenza si sovrappone alla fine di un'altra).

sim4 utilizza una tecnica basata su "blast" per determinare dapprima i blocchi di corrispondenza di base che rappresentano i nuclei centrali degli esoni. In questa prima fase, rileva tutte le possibili corrispondenze esatte di N-meri (cioè parole di DNA di dimensione N) tra le due sequenze e le estende a segmenti ininterrotti con il punteggio massimo. Nella seconda fase, i nuclei degli esoni vengono estesi nei frammenti adiacenti ancora senza corrispondenze usando algoritmi di allineamento "greedy" e vengono utilizzati metodi euristici per favorire le configurazioni che sono conformi ai segnali di riconoscimento dei siti di splicing (GT-AG, CT-AC). Se necessario il processo viene ripetuto sui frammenti senza corrispondenze, con parametri meno stringenti.

Please cite: Liliana Florea, George Hartzell, Zheng Zhang, Gerald M. Rubin and Webb Miller: A Computer Program for Aligning a cDNA Sequence with a Genomic DNA Sequence. (PubMed,eprint) Genome Research 8:967-974 (1998)
Registry entries: Bio.tools 
sim4db
batch spliced alignment of cDNA sequences to a target genome
Versions of package sim4db
ReleaseVersionArchitectures
bookworm0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0~20150903+r2013-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0~20150903+r2013-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0~20150903+r2013-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0~20150903+r2013-6amd64,arm64,armhf,i386
bullseye0~20150903+r2013-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Sim4db performs fast batch alignment of large cDNA (EST, mRNA) sequence sets to a set of eukaryotic genomic regions. It uses the sim4 and sim4cc algorithms to determine the alignments, but incorporates a fast sequence indexing and retrieval mechanism, implemented in the sister package 'leaff', to speedily process large volumes of sequences.

While sim4db produces alignments in the same way as sim4 or sim4cc, it has additional features to make it more amenable for use with whole-genome annotation pipelines. A script file can be used to group pairings between cDNAs and their corresponding genomic regions, to be aligned as one run and using the same set of parameters. Sim4db also optionally reports more than one alignment for the same cDNA within a genomic region, as long as they meet user-defined criteria such as minimum length, percentage sequence identity or coverage. This feature is instrumental in finding all alignments of a gene family at one locus. Lastly, the output is presented either as custom sim4db alignments or as GFF3 gene features.

This package is part of the Kmer suite.

The package is enhanced by the following packages: kmer-examples
Please cite: B. Walenz and L. Florea: Sim4db and leaff: Utilities for fast batched spliced alignment and sequence indexing. (PubMed) Bioinformatics 27(13):1869-1870 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
simka
metodo metagenomico comparativo dedicato a insiemi di dati NGS
Versions of package simka
ReleaseVersionArchitectures
sid1.5.3-8amd64,arm64,mips64el,ppc64el,riscv64
bullseye1.5.3-4amd64,arm64,i386,ppc64el,s390x
trixie1.5.3-8amd64,arm64,mips64el,ppc64el,riscv64
bookworm1.5.3-7amd64,arm64,mips64el,ppc64el
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Simka è uno strumento metagenomico comparativo de novo. Simka rappresenta ciascun insieme di dati come spettro di k-meri e calcola svariate distanze ecologiche classiche tra essi.

Please cite: Gaëtan Benoit, Pierre Peterlongo, Mahendra Mariadassou, Erwan Drezen, Sophie Schbath, Domonique Lavenier and Claire Lemaitre: Multiple comparative metagenomics using multiset k-mer counting. :25 (2016)
Registry entries: Bioconda 
simkamin
metodo metagenomico comparativo approssimato dedicato a insiemi di dati NGS
Versions of package simkamin
ReleaseVersionArchitectures
sid1.5.3-8all
bookworm1.5.3-7all
bullseye1.5.3-4all
trixie1.5.3-8all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Simka è uno strumento metagenomico comparativo de novo. Simka rappresenta ciascun insieme di dati come spettro di k-meri e calcola svariate distanze ecologiche classiche tra essi.

La differenza rispetto a Simka sta nel fatto che SimkaMin produce in output risultati approssimati (ma molto simili) sottocampionando lo spazio dei k-meri. Con questa strategia e con i parametri predefiniti, SimkaMin è di un ordine di grandezza più veloce, usa 10 volte meno memoria e 70 volte meno disco di Simka.

Please cite: Gaëtan Benoit, Pierre Peterlongo, Mahendra Mariadassou, Erwan Drezen, Sophie Schbath, Domonique Lavenier and Claire Lemaitre: Multiple comparative metagenomics using multiset k-mer counting. :25 (2016)
Registry entries: Bioconda 
ska
Split Kmer Analysis
Versions of package ska
ReleaseVersionArchitectures
trixie1.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SKA (Split Kmer Analysis) is a toolkit for prokaryotic (and any other small, haploid) DNA sequence analysis using split kmers. A split kmer is a pair of kmers in a DNA sequence that are separated by a single base. Split kmers allow rapid comparison and alignment of small genomes, and is particulalry suited for surveillance or outbreak investigation. SKA can produce split kmer files from fasta format assemblies or directly from fastq format read sequences, cluster them, align them with or without a reference sequence and provide various comparison and summary statistics. Currently all testing has been carried out on high-quality Illumina read data, so results for other platforms may vary.

Registry entries: Bioconda 
skesa
strategic Kmer extension for scrupulous assemblies
Versions of package skesa
ReleaseVersionArchitectures
bookworm2.4.0-6amd64,arm64
bullseye2.4.0-1amd64,i386
sid2.4.0-6amd64,arm64
trixie2.4.0-6amd64,arm64
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SKESA is a DeBruijn graph-based de-novo assembler designed for assembling reads of microbial genomes sequenced using Illumina. Comparison with SPAdes and MegaHit shows that SKESA produces assemblies that have high sequence quality and contiguity, handles low-level contamination in reads, is fast, and produces an identical assembly for the same input when assembled multiple times with the same or different compute resources. SKESA has been used for assembling over 272,000 read sets in the Sequence Read Archive at NCBI and for real-time pathogen detection.

Please cite: Alexandre Souvorov, Richa Agarwala and David J. Lipman: SKESA: strategic k-mer extension for scrupulous assemblies. (PubMed,eprint) Genome Biology 19(1):153 (2018)
Registry entries: Bioconda 
skewer
post-processing of high-throughput DNA sequence reads
Versions of package skewer
ReleaseVersionArchitectures
bookworm0.2.2-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.2.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.2.2-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.2.2-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

skewer implements the bit-masked k-difference matching algorithm dedicated to the task of adapter trimming and it is specially designed for processing next-generation sequencing (NGS) paired-end sequences.

Features

  • Detection and removal of adapter sequences
  • Insertion and deletion allowed in pattern matching
  • Targeted at Single End, Paired End (PE), and Long Mate Pair (LMP) reads
  • Demultiplexing of barcoded sequencing runs
  • Multi-threading support
  • Trimming based on phred quality scores
  • IUPAC characters for barcodes and adapters
  • Compressed input and output support
The package is enhanced by the following packages: multiqc
Please cite: H. Jiang, R. Lei, S. W. Ding and S. Zhu: Skewer: a fast and accurate adapter trimmer for next-generation sequencing paired-end reads.. (eprint) BMC Bioinformatics 15:182 (2014)
Registry entries: Bio.tools  Bioconda 
smalt
strumento per mappatura e allineamento di sequenze
Versions of package smalt
ReleaseVersionArchitectures
stretch0.7.6-6amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
buster0.7.6-8amd64,arm64,armhf
bullseye0.7.6-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.7.6-4amd64,armhf,i386
bookworm0.7.6-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.7.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.7.6-13amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

SMALT allinea in modo efficiente letture di sequenziamenti di DNA con un genoma di riferimento. Le letture da una vasta gamma di piattaforme di sequenziamento, per esempio Illumina, Roche-454, Ion Torrent, PacBio o ABI-Sanger, possono essere elaborate incluse letture accoppiate.

Il software utilizza un indice di hash perfetto di brevi parole (lunghezza < 20 nucleotidi), campionate a intervalli equidistanti lungo le sequenze genomiche di riferimento.

Per ogni lettura, i segmenti nel riferimento che potenzialmente corrispondono vengono identificati a partire da corrispondenze con "seed" nell'indice e successivamente vengono allineati con la lettura usando un algoritmo Smith-Waterman a bande.

Vengono riportati i migliori allineamenti con gap di ciascuna lettura, incluso un punteggio per l'affidabilità dell'allineamento migliore. L'utente può regolare il compromesso tra sensibilità e velocità, regolando la lunghezza e la spaziatura fra le parole di cui viene fatto l'hash.

È fornita una modalità per l'identificazione delle letture divise (chimere). È gestita l'esecuzione del programma in modalità multi-thread.

Registry entries: Bio.tools  SciCrunch  Bioconda 
Remark of Debian Med team: This can be regarded as successor of ssaha2

This program is from the same author as ssaha2 and according to its author faster and more precise than ssaha2 (except for sequences > 2000bp).

smithwaterman
determina regioni simili tra due stringhe o sequenze genomiche
Versions of package smithwaterman
ReleaseVersionArchitectures
trixie0.0+git20160702.2610e25-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster0.0+git20160702.2610e25-7amd64,arm64,armhf,i386
bullseye0.0+git20160702.2610e25-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.0+git20160702.2610e25-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.0+git20160702.2610e25-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.0+20160702-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el
stretch-backports0.0+git20160702.2610e25-4~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

L'algoritmo Smith-Waterman effettua allineamenti di sequenze locali; determina, cioè, regioni simili tra due stringhe o sequenze di nucleotidi o proteiche. Invece di guardare alla totalità della sequenza, l'algoritmo Smith-Waterman confronta segmenti di tutte le lunghezze possibili e ottimizza la misura di similarità.

smrtanalysis
suite software per sequenziamento in tempo reale di molecole singole
Versions of package smrtanalysis
ReleaseVersionArchitectures
stretch0~20161126all
bullseye0~20210111all
bookworm0~20210112all
sid0~20210112all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

SMRT® Analysis è una suite di software per bioinformatica potente e open source disponibile per l'analisi di dati di sequenziamento di DNA dalla tecnologia SMRT di Pacific Biosciences. Gli utenti possono scegliere tra una varietà di protocolli di analisi che utilizzano PacBio® e strumenti di terze parti. I protocolli di analisi includono assemblaggio de novo di genoma, mappatura cDNA, rilevazione delle modifiche delle basi del DNA e analisi di ampliconi lunghi per determinare sequenze di consenso con fase.

Questo è un metapacchetto che dipende dai componenti di SMRT Analysis.

Registry entries: Bio.tools  SciCrunch 
snap
posizione di geni da sequenze di DNA con modelli di Markov nascosti
Versions of package snap
ReleaseVersionArchitectures
sid2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie2013-11-29-1amd64,armel,armhf,i386
stretch2013-11-29-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2013-11-29-9amd64,arm64,armhf,i386
bullseye2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2013-11-29-11amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1533 users (90 upd.)*
Versions and Archs
License: DFSG free
Git

SNAP è un programma generico per trovare geni, per i genomi sia di eucarioti sia di procarioti. SNAP è un acronimo di Semi-HMM-based Nucleic Acid Parser (analizzatore di acidi nucleici semi-basato su modelli semi-markoviani nascosti).

Please cite: Ian Korf: Gene finding in novel Genomes. (PubMed,eprint) BMC Bioinformatics 5:59 (2004)
Registry entries: Bio.tools 
Screenshots of package snap
snap-aligner
programma scalabile per allineamento di nucleotidi
Versions of package snap-aligner
ReleaseVersionArchitectures
stretch1.0~beta.18+dfsg-1amd64,arm64,mips64el,ppc64el
buster1.0~beta.18+dfsg-3amd64,arm64
bookworm2.0.2+dfsg-1amd64,arm64,mips64el,ppc64el
trixie2.0.3+dfsg-2amd64,arm64,mips64el,ppc64el,riscv64
bullseye1.0.0+dfsg-2amd64,arm64,mips64el,ppc64el
sid2.0.3+dfsg-2amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SNAP (Scalable Nucleotide Alignment Program) è un nuovo allineatore di sequenze che è da 3 a 20 volte più veloce, e altrettanto accurato, rispetto agli strumenti esistenti come BWA-mem, Bowtie2 e Novoalign. Gira su normali processori x86 e gestisce un ricco modello di errori che gli permette con poco sforzo di trovare corrispondenze per letture con più differenze rispetto a quelle di riferimento, di quanto non facciano altri strumenti. Questo dà a SNAP un tasso di errore fino a due volte inferiore agli strumenti esistenti (in certi casi) e gli permette di trovare corrispondenze in caso di mutazioni più ampie che essi potrebbero non trovare. Inoltre SNAP legge nativamente BAM, FASTQ o FASTQ compresso con gzip, e scrive nativamente SAM o BAM, con ordinamento incorporato, marcatura di duplicati e indicizzazione BAM.

Please cite: Matei Zaharia, William J. Bolosky, Kristal Curtis, Armando Fox, David Patterson, Scott Shenker, Ion Stoica, Richard M. Karp and Taylor Sittler: Faster and More Accurate Sequence Alignment with SNAP. (eprint) arXiv preprint arXiv:1111.5572 (2011)
Registry entries: SciCrunch 
sniffles
strumento per identificare varianti strutturali usando sequenziamento di terza generazione
Versions of package sniffles
ReleaseVersionArchitectures
trixie2.2-1all
stretch1.0.2+ds-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.11+ds-1amd64,arm64,armhf,i386
bullseye1.0.12b+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2-1all
bookworm2.0.7-1all
upstream2.5.2
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Sniffles è uno strumento per identificare varianti strutturali (SV) usando dati di sequenziamento di terza generazione come quelli delle piattaforme Pacific Biosciences o Oxford Nanopore. Rileva tutti i tipi di SV usando allineamenti di letture divise, regioni con elevata non corrispondenza e analisi di copertura come indizi.

Please cite: Fritz J. Sedlazeck, Philipp Rescheneder, Moritz Smolka, Han Fang, Maria Nattestad, Arndt von Haeseler and Michael Schatz: Accurate detection of complex structural variations using single molecule sequencing. (eprint) bioRxiv (2017)
Registry entries: Bio.tools  Bioconda 
snippy
identificazione rapida di varianti aploidi e allineamento di genoma core
Versions of package snippy
ReleaseVersionArchitectures
sid4.6.0+dfsg-4all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Snippy trova gli SNP tra un genoma di riferimento aploide e le letture di sequenziamento NGS dell'utente. Trova sia le sostituzioni (snps) sia le inserzioni/delezioni (indels). Usa tante CPU quante gliene vengono fornite in un unico computer (testato con 64 core). È progettato pensando alla velocità e produce un insieme coerente di file di output in un'unica cartella. Può poi prendere un insieme di risultati di Snippy che usano lo stesso riferimento e generare un allineamento di SNP core (e da ultimo un albero filogenomico).

Registry entries: Bioconda 
snp-sites
codice binario per il pacchetto snp-sites
Versions of package snp-sites
ReleaseVersionArchitectures
trixie2.5.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.5.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4.1-1amd64,arm64,armhf,i386
jessie1.5.0-1amd64,armel,armhf,i386
sid2.5.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.3.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm2.5.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Questo programma trova siti di polimorfismo a singolo nucleotide (SNP) da file di input di allineamenti multi-fasta (che possono essere compressi). Il suo output può essere in vari formati largamente usati (Multi Fasta Alignment, Vcf, phylip).

Il software è stato sviluppato al Wellcome Trust Sanger Institute.

Un polimorfismo a singolo nucleotide (SNP, pronunciato snip) è una variazione della sequenza di DNA che si verifica quando un singolo nucleotide, A, T, C o G, nel genoma (o un'altra sequenza condivisa) è differente nei membri di una specie biologica o in coppie di cromosomi. Per esempio, due frammenti di sequenze di DNA da individui diversi, AAGCCTA e AAGCTTA, contengono una differenza in un unico nucleotide. In questo caso ci sono due alleli. Quasi tutti i comuni SNP hanno due alleli.

Please cite: Andrew J. Page, Ben Taylor, Aidan J. Delaney, Jorge Soares, Torsten Seemann, Jacqueline A. Keane and Simon R. Harris: SNP-sites: rapid efficient extraction of SNPs from multi-FASTA alignments. (eprint) Microbial Genomics 2(4) (2016)
Topics: Genetic variation
Screenshots of package snp-sites
snpeff
genetic variant annotation and effect prediction toolbox - tool
Versions of package snpeff
ReleaseVersionArchitectures
bookworm5.1+d+dfsg-3all
sid5.2.e+dfsg-1all
trixie5.2.e+dfsg-1all
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

"We are all different!" Geneticists agree to this. Even twins, who are said to be identical are on a molecular level only "mostly" identical. And even within the exact same individual, healthy cells acquire mutations such that we are all genetic mosaics. Changes to individual cells may be induced by environmental factors, e.g. like UV light, or happen sporadically as mishaps during cellular divisions.

Because there are so many genetic differences, and most have just no particular meaning for the development of a phenotype, i.e. most have no effect, it would be nice to have heuristics implemented that direct the researcher towards single-nucleotide polymorphisms (SNPs) that are most likely to be relevant. This identifies the gene that causes or contributes to, e.g, an illness, and possibly also genes that are affected by that change. Such mechanistic understanding of a disease, particularly when multiple genes and multiple genetic variants are contributing to the then "polygenic" phenotype, is at the onset of drug development and increasingly also for selecting individualized therapies in the clinic.

SnpEff is a variant annotation and effect prediction tool. It annotates and predicts the effects of variants on genes (such as amino acid changes). The inputs are predicted variants (SNPs, insertions, deletions and MNPs). The input file is usually obtained as a result of a sequencing experiment, and it is usually in variant call format (VCF).

SnpEff analyzes the input variants. It annotates the variants and calculates the effects they produce on known genes (e.g. amino acid changes).

This package contains the command line tool.

The package is enhanced by the following packages: multiqc
Please cite: Pablo Cingolani, Adrian Platts, Le Lily Wang, Melissa Coon, Tung Nguyen, Luan Wang, Susan J. Land, Douglas M. Ruden and Xiangyi Lu: A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w^1118; iso-2; iso-3. (PubMed,eprint) Fly 6(2):80-92 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
snpomatic
software per mappatura di letture corte veloce e stringente
Versions of package snpomatic
ReleaseVersionArchitectures
bookworm1.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0-4amd64,arm64,armhf,i386
stretch1.0-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0-7amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Le tecnologie di sequenziamento ad alte prestazioni generano grandi quantità di letture corte. La mappatura di queste ultime in una sequenza di riferimento consuma grandi quantità di tempo di elaborazione e memoria, e gli errori di mappatura delle letture possono portare a allineamenti con rumore o non corretti.

SNP-o-matic è un software per mappatura di letture corte veloce e stringente. Gestisce una moltitudine di tipi e formati di output, per l'utilizzo nel filtraggio di letture, allineamenti, identificazione di genotipi sulla base di sequenze, riassemblaggio assistito di contigui, ecc.

Please cite: Heinrich Magnus Manske and Dominic P. Kwiatkowski: SNP-o-matic. (PubMed,eprint) Bioinformatics 25(18):2434-2435 (2009)
Registry entries: Bio.tools  Bioconda 
Topics: Genetic variation; Mapping
snpsift
tool to annotate and manipulate genome variants - tool
Versions of package snpsift
ReleaseVersionArchitectures
sid5.2.e+dfsg-1all
trixie5.2.e+dfsg-1all
bookworm5.1+dfsg2-2all
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SnpSift is a toolbox that allows one to filter and manipulate annotated files. Once the genomic variants have been annotated, one needs to filter them out in order to find the "interesting / relevant variants". Given the large data files, this is not a trivial task (e.g. one cannot load all the variants into XLS spreadsheet). SnpSift helps to perform this VCF file manipulation and filtering required at this stage in data processing pipelines.

This package contains the command line tool.

soapaligner
allineatore di letture corte di sequenziatori di prossima generazione
Versions of package soapaligner
ReleaseVersionArchitectures
bookworm2.20-5amd64
sid2.20-5amd64
trixie2.20-5amd64
bullseye2.20-5amd64
buster2.20-3amd64
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto affronta un problema comune della bioinformatica che è ora diventato di routine anche nella ricerca clinica: l'assemblaggio e il confronto di sequenze molto lunghe di DNA genomico da molte letture corte che la macchina fornisce.

SOAPaligner/soap2 fa parte del Short Oligonucleotide Analysis Package (SOAP) ed è una versione aggiornata del software SOAP per l'allineamento di oligonucleotidi corti (soap v1). Il nuovo programma fornisce un allineamento super-veloce ed accurato per enormi quantità di letture corte generate da Illumina/Solexa Genome Analyzer. In confronto a soap v1, è di un ordine di grandezza più veloce. Richiede solo 2 minuti per allineare un milione di letture a terminale singolo sul genoma umano di riferimento. Un altro miglioramento notevole di SOAPaligner è che ora supporta una vasta gamma di lunghezze delle letture.

SOAPaligner/soap2 ha beneficiato in termini di efficienza nel tempo e nello spazio di una rivoluzione nelle strutture dati di base e negli algoritmi utilizzati. Gli algoritmi centrali e le strutture dati di indicizzazione (2way-BWT) sono sviluppati dal gruppo di ricerca sugli algoritmi del Department of Computer Science dell'University of Hong Kong (T.W. Lam, Alan Tam, Simon Wong, Edward Wu e S.M. Yiu).

Please cite: Ruiqiang Li, Yingrui Li, Karsten Kristiansen and Jun Wang: SOAP: short oligonucleotide alignment program. (PubMed,eprint) Genome Res. 24(5):713-714 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
soapdenovo
metodo per assemblaggio di letture corte per costruire assemblati bozza de novo
Versions of package soapdenovo
ReleaseVersionArchitectures
sid1.05-6amd64
bullseye1.05-6amd64
bookworm1.05-6amd64
stretch1.05-3amd64
buster1.05-5amd64
jessie1.05-2amd64
trixie1.05-6amd64
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SOAPdenovo è un nuovo metodo per assemblaggio di sequenze corte che può creare una bozza di assemblaggio de novo per genomi di dimensioni come quelle umane. Il programma è specificamente progettato per assemblare sequenze corte Illumina GA.

Crea nuove opportunità per creare sequenze di riferimento ed effettuare analisi accurate di genomi inesplorati in un modo efficiente dal punto di vista dei costi.

Questa versione non è più mantenuta, considerare l'utilizzo di soapdenovo2.

Please cite: Ruiqiang Li, Hongmei Zhu, Jue Ruan, Wubin Qian, Xiaodong Fang, Zhongbin Shi, Yingrui Li, Shengting Li, Gao Shan, Karsten Kristiansen, Songgang Li, Huanming Yang, Jian Wang and Jun Wang: De novo assembly of human genomes with massively parallel short read sequencing. (PubMed,eprint) Genome Research 20(2):265-72 (2009)
Registry entries: Bio.tools  SciCrunch 
soapdenovo2
metodo per assemblaggio di letture corte per costruire assemblati bozza de novo
Versions of package soapdenovo2
ReleaseVersionArchitectures
bookworm242+dfsg-3amd64
sid242+dfsg-4amd64
stretch240+dfsg1-2amd64
trixie242+dfsg-4amd64
jessie240+dfsg-2amd64
bullseye242+dfsg-1amd64
buster241+dfsg-3amd64
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SOAPdenovo è un nuovo metodo per assemblaggio di sequenze corte che può creare una bozza di assemblaggio de novo per genomi di dimensioni come quelle umane. Il programma è specificamente progettato per assemblare sequenze corte Illumina GA.

Crea nuove opportunità per creare sequenze di riferimento ed effettuare analisi accurate di genomi inesplorati in un modo efficiente dal punto di vista dei costi.

Please cite: Ruibang Luo, Binghang Liu, Yinlong Xie, Zhenyu Li, Weihua Huang, Jianying Yuan, Guangzhu He, Yanxiang Chen, Qi Pan, Yunjie Liu, Jingbo Tang, Gengxiong Wu, Hao Zhang, Yujian Shi, Yong Liu, Chang Yu, Bo Wang, Yao Lu, Changlei Han, David W Cheung, Siu-Ming Yiu, Shaoliang Peng, Zhu Xiaoqian, Guangming Liu, Xiangke Liao, Yingrui Li, Huanming Yang, Jian Wang, Tak-Wah Lam and Jun Wang: SOAPdenovo2: an empirically improved memory-efficient short-read de novo assembler. Giga Science 1(1):18 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
soapsnp
utilità di risequenziamento che può assemblare sequenze di consenso di genomi
Versions of package soapsnp
ReleaseVersionArchitectures
buster1.03-3amd64,arm64,armhf,i386
bookworm1.03-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.03-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.03-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.03-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Per avere idee sulla causa delle malattie o sulla loro risposta a terapie, e per capire una o l'altra per un particolare paziente, i dottori di tutto il mondo stanno iniziando a guardare i geni o l'intero genoma e come tale sequenza differisce da quella di un individuo sano o che risponde bene.

SOAPsnp fa parte di SOAP (Short Oligonucleotide Analysis Package). Il programma è un'utilità per risequenziamento. Assembla la sequenza di consenso per il genoma di un individuo con un nuovo sequenziamento sulla base dell'allineamento delle letture grezze di sequenziamento su un riferimento noto. Gli SNP possono essere poi identificati sulla sequenza di consenso attraverso il confronto con il riferimento.

SOAPsnp usa un metodo basato sul teorema di Bayes (il modello di probabilità inversa) per identificare il genotipo di consenso, considerando attentamente la qualità dei dati, l'allineamento e gli errori sperimentali ricorrenti. Tutti questi tipi di informazione sono stati integrati in un unico punteggio di qualità per ogni base nella scala PHRED, per misurare l'accuratezza dell'identificazione di consenso. Attualmente gestisce il formato di allineamento di SOAPaligner (soap2).

Please cite: Li R, Li Y, Fang X, Yang H, Wang J, Kristiansen K and Wang J.: SNP detection for massively parallel whole-genome resequencing. (PubMed,eprint) Genome Res. 19(6):1124-1132 (2009)
Registry entries: Bio.tools  SciCrunch 
sortmerna
strumento per filtraggio, mappatura e scelta di OTU per letture NGS
Versions of package sortmerna
ReleaseVersionArchitectures
stretch2.1-1amd64,i386
bookworm4.3.6-2amd64,i386
trixie4.3.7-1amd64,i386
buster2.1-3amd64,i386
sid4.3.7-1amd64,i386
bullseye2.1-5amd64,i386
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SortMeRNA è uno strumento per analisi di sequenze biologiche per filtrare, mappare e scegliere OTU per letture NGS. L'algoritmo centrale è basato su seed approssimati e permette analisi veloci e sensibili di sequenze nucleotidiche. L'applicazione principale di SortMeRNA è filtrare rRNA da dati di metatrascrittomica. Applicazioni aggiuntive includono la scelta di OTU e assegnamenti tassonomici disponibili attraverso QIIME v1.9+ (http://qiime.org - v1.9.0-rc1). SortMeRNA prende come input un file di letture (in formato fasta o fastq) e uno o più file di database di rRNA, e suddivide gli rRNA e le letture scartate in due file specificati dall'utente. Opzionalmente può fornire allineamenti locali di alta qualità di letture rRNA rispetto al database di rRNA. SortMeRNA funziona con dati Illumina, 454, Ion Torrent e PacBio, e può produrre allineamenti SAM e simili a BLAST.

The package is enhanced by the following packages: multiqc
Please cite: Evguenia Kopylova, Laurent Noé and Hélène Touzet: SortMeRNA: fast and accurate filtering of ribosomal RNAs in metatranscriptomic data". (PubMed,eprint) Bioinformatics 28(24):3211-3217 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
spaced
alignment-free sequence comparison using spaced words
Versions of package spaced
ReleaseVersionArchitectures
stretch1.0.2+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.2.0-201605+dfsg-1amd64,arm64,armhf,i386
bullseye1.2.0-201605+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.2.0-201605+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.2.0-201605+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.2.0-201605+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Spaced (Words) is a new approach to alignment-free sequence comparison. While most alignment-free algorithms compare the word-composition of sequences, spaced uses a pattern of care and don't care positions. The occurrence of a spaced word in a sequence is then defined by the characters at the match positions only, while the characters at the don't care positions are ignored. Instead of comparing the frequencies of contiguous words in the input sequences, this new approach compares the frequencies of the spaced words according to the pre-defined pattern. An information-theoretic distance measure is then used to define pairwise distances on the set of input sequences based on their spaced-word frequencies. Systematic test runs on real and simulated sequence sets have shown that, for phylogeny reconstruction, this multiple-spaced-words approach is far superior to the classical alignment-free approach based on contiguous word frequencies.

Please cite: Burkhard Morgenstern, Bingyao Zhu, Sebastian Horwege and Chris-Andre Leimeister: Estimating evolutionary distances between genomic sequences from spaced-words matches. (PubMed,eprint) Algorithms for Molecular Biology 10(1):1-12 (2015)
spades
assemblatore di genomi per singola-cellula e insiemi di dati di isolati
Versions of package spades
ReleaseVersionArchitectures
stretch3.9.1+dfsg-1amd64
sid3.15.5+dfsg-7amd64
trixie3.15.5+dfsg-7amd64
bookworm3.15.5+dfsg-2amd64
bullseye3.13.1+dfsg-2amd64
stretch-backports-sloppy3.13.1+dfsg-2~bpo9+1amd64
buster3.13.0+dfsg2-2amd64
stretch-backports3.12.0+dfsg-1~bpo9+1amd64
experimental4.0.0+dfsg1-1amd64
upstream4.0.0
Popcon: 1 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

L'assemblatore di genomi SPAdes - St. Petersburg è pensato per assemblaggi di isolati standard e di MDA batterici da singola cellula. Funziona con letture Illumina o IonTorrent ed è in grado di fornire assemblati ibridi usando letture PacBio e Sanger. Si possono anche fornire contigui aggiuntivi che verranno usati come letture lunghe.

Questo pacchetto fornisce le seguenti catene di elaborazione aggiuntive:

  • metaSPAdes – catena per insiemi di dati metagenomici
  • plasmidSPAdes – catena per estrarre e assemblare plasmidi da insiemi di dati WGS
  • metaplasmidSPAdes – catena per estrarre e assemblare plasmidi da insiemi di dati metagenomici
  • rnaSPAdes – assemblatore de novo di trascrittomi da dati RNA-Seq
  • truSPAdes – modulo per assemblamento di barcode TruSeq
  • biosyntheticSPAdes – modulo per assemblamento di cluster di geni per biosintesi con letture a estremità accoppiate

SPAdes fornisce diversi binari autonomi con un'interfaccia a riga di comando relativamente semplice: conteggio di k-meri (spades-kmercounter), costruzione di grafi di assemblamento (spades-gbuilder) e allineatore da letture lunghe a grafo (spades-gmapper).

Please cite: Anton Bankevich, Sergey Nurk, Dmitry Antipov, Alexey A. Gurevich, Mikhail Dvorkin, Alexander S. Kulikov, Valery M. Lesin, Sergey I. Nikolenko, Son Pham, Andrey D. Prjibelski, Alexey V. Pyshkin, Alexander V. Sirotkin, Nikolay Vyahhi, Glenn Tesler, Max A. Alekseyev and Pavel A. Pevzner: SPAdes: A New Genome Assembly Algorithm and Its Applications to Single-Cell Sequencing. (PubMed,eprint) Journal of Computational Biology 19(5):455-477 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
spaln
splicing-aware transcript-alignment to genomic DNA
Versions of package spaln
ReleaseVersionArchitectures
sid3.0.2+dfsg-2amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie3.0.2+dfsg-2amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye2.4.1+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.4.13f+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
upstream3.0.6b
Popcon: 2 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Spaln (space-efficient spliced alignment) is a stand-alone program that maps and aligns a set of cDNA or protein sequences onto a whole genomic sequence in a single job. It also performs spliced or ordinary alignment after rapid similarity search against a protein sequence database, if a genomic segment or an amino acid sequence is given as a query.

spaln supports a combination of protein sequence database and a given genomic segment and performs rapid similarity searches and (semi-)global alignments of a set of protein sequence queries against a protein sequence database. Spaln adopts multi-phase heuristics that makes it possible to perform the job on a conventional personal computer.

Registry entries: Bioconda 
spoa
SIMD partial order alignment tool
Versions of package spoa
ReleaseVersionArchitectures
buster1.1.5-1amd64
bullseye4.0.7+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch-backports-sloppy3.0.1-1~bpo9+1amd64
sid4.1.4-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.1.4-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch-backports1.1.3-2~bpo9+1amd64
bookworm4.0.8-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Spoa (SIMD POA) is a c++ implementation of the partial order alignment (POA) algorithm (as described in 10.1093/bioinformatics/18.3.452) which is used to generate consensus sequences (as described in 10.1093/bioinformatics/btg109). It supports three alignment modes: local (Smith-Waterman), global (Needleman-Wunsch) and semi-global alignment (overlap).

Registry entries: Bioconda 
sprai
single-pass sequencing read accuracy improver
Versions of package sprai
ReleaseVersionArchitectures
stretch0.9.9.22+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie0.9.9.23+dfsg1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.9.9.23+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.9.9.23+dfsg-2amd64,arm64,armhf,i386
bookworm0.9.9.23+dfsg1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.9.9.23+dfsg1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Sprai is a tool to correct sequencing errors in single-pass reads for de novo assembly. It is originally designed for correcting sequencing errors in single-molecule DNA sequencing reads, especially in Continuous Long Reads (CLRs) generated by PacBio RS sequencers. The goal of Sprai is not maximizing the accuracy of error-corrected reads. Instead, Sprai aims at maximizing the continuity (i.e., N50 contig length) of assembled contigs after error correction.

spread-phy
analizza e visualizza ricostruzioni filogeografiche
Versions of package spread-phy
ReleaseVersionArchitectures
jessie1.0.5+dfsg-1 (contrib)all
sid1.0.7+dfsg-5all
stretch1.0.7+dfsg-1all
buster1.0.7+dfsg-2all
bullseye1.0.7+dfsg-3all
bookworm1.0.7+dfsg-5all
trixie1.0.7+dfsg-5all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SPREAD è un'applicazione facile da usare per analizzare e visualizzare ricostruzioni filogeografiche risultanti da inferenza bayesiana di diffusione spazio-temporale.

C'è un tutorial per SPREAD in linea all'indirizzo http://www.kuleuven.be/aidslab/phylogeography/tutorial/spread_tutorial.html

Originalmente questo programma è chiamato "spread". Tuttavia, c'è proprio un pacchetto con quel nome in Debian e perciò è stato aggiunto "phy" per phylogeny.

Please cite: Filip Bielejec, Andrew Rambaut, Marc A. Suchard and Philippe Lemey: SPREAD: spatial phylogenetic reconstruction of evolutionary dynamics. (PubMed,eprint) Bioinformatics 27(20):2910-2912 (2011)
sra-toolkit
utilità per Sequence Read Archive di NCBI
Versions of package sra-toolkit
ReleaseVersionArchitectures
bookworm3.0.3+dfsg-6~deb12u1amd64,arm64
trixie3.0.3+dfsg-9amd64,arm64
sid3.0.9+dfsg-7amd64,arm64
jessie2.3.5-2+dfsg-1amd64,i386
stretch2.8.1-2+dfsg-2amd64,i386
buster2.9.3+dfsg-1amd64
bullseye2.10.9+dfsg-2amd64
upstream3.1.1
Popcon: 10 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

Strumenti per leggere l'archivio SRA, generalmente convertendo singole corse in alcuni formati comunemente usati come fastq.

In questo rilascio sono forniti gli strumenti per dump testuali "sra-dump" e "vbd-dump", per aiutare nell'ispezione a vista. È probabile che l'effettiva formattazione del loro output venga in futuro modificata in una rappresentazione più stringente e formalizzata. NON FARE AFFIDAMENTO SUL FORMATO DI OUTPUT VISTO IN QUESTO RILASCIO.

Altri strumenti distribuiti in questo pacchetto:

 abi-dump, abi-load
 align-info
 bam-load
 cache-mgr
 cg-load
 copycat
 fasterq-dump
 fastq-dump, fastq-load
 helicos-load
 illumina-dump, illumina-load
 kar
 kdbmeta
 latf-load
 pacbio-load
 prefetch
 rcexplain
 remote-fuser
 sff-dump, sff-load
 sra-pileup, sra-sort, sra-stat, srapath
 srf-load
 test-sra
 vdb-config, vdb-copy, vdb-decrypt, vdb-encrypt, vdb-get, vdb-lock,
 vdb-passwd, vdb-unlock, vdb-validate

Le informazioni dell'"Aiuto" verranno migliorate nei prossimi rilasci e le opzioni per gli strumenti verranno standardizzate tra gli insiemi. Ulteriore documentazione verrà anche fornita sul sito web dell'NCBI.

Nel prossimo rilascio le opzioni per gli strumenti potrebbero essere modificate. La versione 1 delle opzioni per gli strumenti continuerà ad essere gestita ovunque sia possibile, per preservare il funzionamento degli script esistenti.

Please cite: Rasko Leinonen, Ruth Akhtar, Ewan Birney, James Bonfield, Lawrence Bower, Matt Corbett, Ying Cheng, Fehmi Demiralp, Nadeem Faruque, Neil Goodgame, Richard Gibson, Gemma Hoad, Christopher Hunter, Mikyung Jang, Steven Leonard, Quan Lin, Rodrigo Lopez, Michael Maguire, Hamish McWilliam, Sheila Plaister, Rajesh Radhakrishnan, Siamak Sobhany, Guy Slater, Petra Ten Hoopen, Franck Valentin, Robert Vaughan, Vadim Zalunin, Daniel Zerbino and Guy Cochrane: Improvements to services at the European Nucleotide Archive. (PubMed,eprint) Nucleic Acids Research 38(Database issue):D39-45 (2010)
Registry entries: Bio.tools  Bioconda 
srst2
tipizzazione di sequenze di letture corte per batteri patogeni
Versions of package srst2
ReleaseVersionArchitectures
buster0.2.0-6amd64
sid0.2.0-12amd64,arm64,mips64el,ppc64el,riscv64
trixie0.2.0-12amd64,arm64,mips64el,ppc64el,riscv64
bookworm0.2.0-9amd64,arm64,mips64el,ppc64el
bullseye0.2.0-8amd64,arm64,mips64el,ppc64el
stretch0.2.0-4amd64
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Questo programma è progettato per prendere dati di sequenziamento Illumina, un database MLST e/o un database di sequenze geniche (es. geni di resistenza, geni di virulenza, ecc.) e riporta la presenza di ST o di geni di riferimento.

Please cite: Michael Inouye, Harriet Dashnow, Lesley-Ann Raven, Mark B Schultz, Bernard J Pope, Takehiro Tomita, Justin Zobel and Kathryn E Holt: SRST2: Rapid genomic surveillance for public health and hospital microbiology labs. (PubMed,eprint) Genome Medicine 6(11):90 (2014)
Registry entries: Bioconda 
ssake
applicazione genomica per assemblare milioni di cortissime sequenze di DNA
Versions of package ssake
ReleaseVersionArchitectures
buster4.0-2all
bookworm4.0.1-1all
bullseye4.0-3all
trixie4.0.1-2all
stretch3.8.4-1all
sid4.0.1-2all
jessie3.8.2-1all
Debtags of package ssake:
biologynuceleic-acids
fieldbiology
interfaceshell
roleprogram
scopeutility
useanalysing
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SSAKE (Short Sequence Assembly by K-mer search and 3′ read Extension, assemblaggio di sequenze corte con ricerca di K-meri ed estensione per lettura 3') è un'applicazione genomica per assemblare in modo aggressivo milioni di corte sequenze di nucleotidi cercando progressivamente k-meri all'estremità 3' perfetti usando un albero di prefissi di DNA. SSAKE è progettato per aiutare a sfruttare le informazioni provenienti dalla lettura di corte sequenze riunendole in maniera stringente in frammenti continui che possono essere usati per caratterizzare innovativi target di sequenziamento.

Please cite: Rene L. Warren, Granger G. Sutton, Steven J. M. Jones and Robert A. Holt: Assembling millions of short DNA sequences using SSAKE. (PubMed,eprint) Bioinformatics 23(4):500-501 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequence assembly
sspace
scaffolding pre-assembled contigs after extension
Versions of package sspace
ReleaseVersionArchitectures
stretch2.1.1+dfsg-2all
sid2.1.1+dfsg-7all
trixie2.1.1+dfsg-7all
bookworm2.1.1+dfsg-7all
bullseye2.1.1+dfsg-5all
buster2.1.1+dfsg-4all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SSAKE-based Scaffolding of Pre-Assembled Contigs after Extension (SSPACE) is a script able to extend and scaffold pre-assembled contigs using one or more mate pairs or paired-end libraries, or even a combination.

SSPACE is built based on SSAKE. Code of SSAKE is changed to be able to extend and scaffold pre-assembled contigs for multiple paired reads libraries.

This is the free 'basic' version of SSPACE. The non-free 'standard' version is available directly from Baseclear.

Please cite: Marten Boetzer, Christiaan V. Henkel, Hans J. Jansen, Derek Butler and Walter Pirovano: Scaffolding pre-assembled contigs using SSPACE. (PubMed,eprint) Bioinformatics 27(4):578-579 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
ssw-align
Smith-Waterman aligner based on libssw
Versions of package ssw-align
ReleaseVersionArchitectures
bullseye1.1-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.1-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.1-1amd64
buster1.1-2amd64
bookworm1.1-13amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.1-15amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
experimental1.2.5-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream1.2.5
Popcon: 1 users (7 upd.)*
Newer upstream!
License: DFSG free
Git

This package provides a command-line aligner based on the libssw library, a fast SIMD accelerated implementation of the Smith-Waterman algorithm. The input files can be in FASTA or FASTQ format. Both target and query files can contain multiple sequences. Each sequence in the query file will be aligned with all sequences in the target file. Output is provided in SAM or BLAST-like text format.

stacks
pipeline for building loci from short-read DNA sequences
Versions of package stacks
ReleaseVersionArchitectures
buster2.2+dfsg-1amd64,arm64,armhf
trixie2.68+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.62+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.55+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.44-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
sid2.68+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Stacks is a software pipeline for building loci from short-read sequences, such as those generated on the Illumina platform. Stacks was developed to work with restriction enzyme-based data, such as RAD-seq, for the purpose of building genetic maps and conducting population genomics and phylogeography.

Note that this package installs Stacks such that all commands must be run as: $ stacks

The package is enhanced by the following packages: multiqc
Please cite: Julian Catchen, Paul A. Hohenlohe, Susan Bassham, Angel Amores and William A. Cresko: Stacks: an analysis tool set for population genomics. (PubMed) Molecular Ecology 22(11):3124-40 (2013)
Registry entries: Bio.tools  SciCrunch  Bioconda 
staden
strumenti per assemblaggio (Gap4/Gap5), modifica e analisi di sequenze di DNA
Versions of package staden
ReleaseVersionArchitectures
buster2.0.0+b11-4amd64,arm64,armhf,i386
sid2.0.0+b11-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.0.0+b11-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.0.0+b11-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.0.0+b10-1.1amd64,armel,armhf,i386
bookworm2.0.0+b11-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.0.0+b11-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 7 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Staden è un insieme completamente sviluppato di strumenti per assemblaggio (Gap4 e Gap5), modifica e analisi di sequenze di DNA.

Gap4 effettua l'assemblaggio di sequenze, l'ordinamento di contigui basato su dati di coppie di letture, l'unione di contigui basata sul confronto di sequenze, il controllo di assemblaggi, la ricerca di sequenze ripetute, il suggerimento di esperimenti, l'analisi di coppie di letture e la modifica di contigui. Ha viste grafiche di contigui, modelli, letture e tracce, tutte con scorrimento nel registro. Le funzioni di suggerimento di esperimenti e le ricerche dell'editor di contigui usano valori di confidenza per calcolare la confidenza della sequenza di consenso e perciò identificare solamente le posizioni che richiedono l'ispezione visiva delle tracce o dati aggiuntivi. Il risultato è un tempo estremamente rapido e un consenso di accuratezza nota.

Pregap4 fornisce un'interfaccia utente grafica per impostare l'elaborazione necessaria per preparare dati di tracce per l'assemblaggio o l'analisi e automatizza questi processi.

Trev è un visualizzatore e un editor rapido e flessibile per file di traccia ABI, ALF, SCF e ZTR.

Prefinish analizza assemblaggi di sequenze parzialmente completi e suggerisce l'insieme più efficiente di esperimenti per aiutare a completare il progetto.

Tracediff e hetscan localizzano automaticamente mutazioni confrontando dati di tracce con tracce di riferimento. Annotano le mutazioni trovate in modo che siano pronte per la visualizzazione in gap4.

Spin analizza sequenze di nucleotidi per trovare geni, siti di restrizione, motivi, ecc. Può effettuare traduzioni, trovare frame di lettura aperti, contare i codoni, ecc. Molti risultati sono presentati graficamente e una finestra per sequenza con scorrimento è collegata al cursore grafico. Spin inoltre confronta coppie di sequenze in molti modi. Ha un'analisi a matrice di punti molto veloce, algoritmi di allineamento globale e locale più una finestra per sequenza con scorrimento collegata ai tracciati grafici. Può confrontare acidi nucleici con acidi nucleici, proteine con proteine e proteine con acidi nucleici.

Please cite: James K. Bonfield and Andrew Whitwham: Gap5--editing the billion fragment sequence assembly. (PubMed,eprint) Bioinformatics 26(14):1699-1703 (2010)
Registry entries: Bio.tools  SciCrunch 
staden-io-lib-utils
programmi per manipolare file di sequenziamento del DNA
Versions of package staden-io-lib-utils
ReleaseVersionArchitectures
jessie1.13.7-1amd64,armel,armhf,i386
stretch1.14.8-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.14.11-6amd64,arm64,armhf,i386
bullseye1.14.13-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.14.15-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.15.0-1.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.15.0-1.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package staden-io-lib-utils:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing
Popcon: 6 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

io_lib dal pacchetto Staden è una libreria di codice per leggere e scrivere file allo scopo di fornire un'interfaccia per la lettura di file di tracciamento (e file esperimento) di scopo generale. È stata compilata e testata su diversi sistemi Unix, MacOS X e MS Windows.

Questo pacchetto contiene i programmi che sono distribuiti con io_lib di Staden per la manipolazione e la conversione di file di dati di sequenziamento, e in particolare di file per manipolare letture corte generate da sequenziatori di seconda e terza generazione e memorizzate in formato SRF.

Registry entries: Bioconda 
stringtie
assemble short RNAseq reads to transcripts
Versions of package stringtie
ReleaseVersionArchitectures
bookworm2.2.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2.1+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie2.2.1+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.1.4+ds-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream2.2.3
Popcon: 0 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

The abundance of transcripts in a human tissue sample can be determined by RNA sequencing. The exact sequence sampled may be random, depending on the technology used. And it may be short, i.e. shorter than the transcript. At some point, many shorter reads need to be assembled to the model the complete transcripts.

StringTie knows how to assemble of RNA-Seq into potential transcripts without the need of a reference genome and provides a quantification also of the splice variants.

Please cite: Mihaela Pertea, Geo M. Pertea, Corina .M. Antonescu, Tsung-Cheng Chang, Joshua T. Mendell and Steven L. Salzberg: StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology 33:290–295 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
subread
toolkit per elaborare dati di sequenziamento di nuova generazione
Versions of package subread
ReleaseVersionArchitectures
trixie2.0.7+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye2.0.1+dfsg-1amd64,arm64,armel,armhf,i386,ppc64el
buster-backports2.0.0+dfsg-1~bpo10+1amd64,arm64,armel,armhf,i386,ppc64el
buster1.6.3+dfsg-1amd64,arm64,armhf,i386
stretch1.5.1+dfsg-4amd64,arm64,armel,armhf,i386,ppc64el
bookworm2.0.3+dfsg-1amd64,arm64,armel,armhf,i386,ppc64el
sid2.0.7+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
upstream2.0.8
Popcon: 7 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

L'allineatore Subread può essere utilizzato per allineare sia letture di sequenze gDNA che RNA. L'allineatore Subjunc è stato specificatamente progettato per rilevare giunzioni esone-esone. Per fare la mappa di letture di sequenze di RNA, Subread esegue allineamenti locali e Subjunc esegue allineamenti globali.

Please cite: Yang Lian, Gordon K. Smyth and Wei Shi: The R package Rsubread is easier, faster, cheaper and better for alignment and quantification of RNA sequencing reads. (PubMed) Nucleic Acids Research 47(8):e47-e47 (2019)
Registry entries: Bio.tools  SciCrunch  Bioconda 
suitename
categorize each suite in an RNA backbone
Versions of package suitename
ReleaseVersionArchitectures
trixie0.4.130509+git20210223.ebb1325-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch0.3.070628-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.3.070628-2amd64,arm64,armhf,i386
bullseye0.3.070919+git20180613.ebb1325-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.4.130509+git20210223.ebb1325-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.4.130509+git20210223.ebb1325-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Suitename is a program that supports the ROC RNA Ontology Consortium consensus RNA backbone nomenclature and conformer-list development.

From dihedral-angle input for a specific RNA structure (usually from Dangle), Suitename categorizes the RNA backbone geometry of each suite (the sugar-to-sugar version of a residue) either as an outlier or as belonging to one of the 53 defined conformer bins. The output is either a one-line-per-suite report, or a linear conformer string (as shown below the image here) in one of several variant formats. Suitename is built into MolProbity, producing entries in the multi-criterion chart for an RNA model and also a suitestring file.

Please cite: Jane S. Richardson, Bohdan Schneider, Laura W. Murray, Gary J. Kapral, Robert M. Immormino, Jeffrey J. Headd, David C. Richardson, Daniela Ham, Eli Hershkovits, Loren Dean Williams, Kevin S. Keating, Anna Marie Pyle, David Micallef, John Westbrook and Helen M. Berman: RNA backbone: Consensus all-angle conformers and modular string nomenclature (an RNA Ontology Consortium contribution). (PubMed,eprint) RNA 14(3):465-481 (2008)
sumaclust
raggruppamento veloce in cluster di sequenze genomiche
Versions of package sumaclust
ReleaseVersionArchitectures
bullseye1.0.36+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.31-2amd64,arm64,armhf,i386
stretch1.0.20-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Con lo sviluppo del sequenziamento di prossima generazione, sono necessari strumenti efficienti per gestire milioni di sequenze in un tempo ragionevole. Sumaclust è un programma sviluppato da LECA; mira a raggruppare sequenze in cluster in un modo che sia veloce e corretto al tempo stesso. Questo strumento è stato sviluppato per essere adattato ai tipi di dati generati dal DNA metabarcoding, cioè marcatori corti, interamente sequenziati. Sumaclust raggruppa le sequenze in cluster usando lo stesso algoritmo di clustering di UCLUST e CD-HIT. Questo algoritmo è utile principalmente per rilevare sequenze "erronee" create durante i protocolli di amplificazione e sequenziamento e che derivano da sequenze "vere".

Registry entries: Bioconda 
sumatra
confronto e raggruppamento in cluster di sequenze veloci ed esatti
Versions of package sumatra
ReleaseVersionArchitectures
bookworm1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.31-2amd64,arm64,armhf,i386
stretch1.0.20-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0.36+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.36+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Con lo sviluppo del sequenziamento di prossima generazione, sono necessari strumenti efficienti per gestire milioni di sequenze in quantità di tempo ragionevoli. Sumatra è un programma sviluppato dal LECA. Sumatra mira a confrontare sequenze in un modo che sia veloce e al contempo esatto. Questo strumento è stato sviluppato per essere adattato al tipo di dati generati da metabarcoding di DNA, cioè marcatori corti interamente sequenziati. Sumatra calcola i punteggi di allineamenti a coppie per un insieme di dati * tra due insiemi di dati, con la possibilità di specificare una soglia di similarità, per cui sequenze che hanno una similarità al di sotto di essa non vengono riportate. L'output può quindi passare attraverso un processo di classificazione con programmi quali MCL e MOTHUR.

Registry entries: SciCrunch 
sumtrees
Phylogenetic Tree Summarization and Annotation
Versions of package sumtrees
ReleaseVersionArchitectures
sid4.6.1-1all
stretch4.2.0+dfsg-1all
bullseye4.5.1-1all
bookworm4.5.2-1all
buster4.4.0-1all
trixie4.6.1-1all
upstream5.0.1
Popcon: 1 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

SumTrees is a program to summarize non-parameteric bootstrap or Bayesian posterior probability support for splits or clades on phylogenetic trees.

The basis of the support assessment is typically given by a set of non-parametric bootstrap replicate tree samples produced by programs such as GARLI or RAxML, or by a set of MCMC tree samples produced by programs such as Mr. Bayes or BEAST. The proportion of trees out of the samples in which a particular split is found is taken to be the degree of support for that split as indicated by the samples. The samples that are the basis of the support can be distributed across multiple files, and a burn-in option allows for an initial number of trees in each file to be excluded from the analysis if they are not considered to be drawn from the true support distribution.

Please cite: Jeet Sukumaran and Mark T. Holder: DendroPy: a Python library for phylogenetic computing. (PubMed,eprint) Bioinformatics 26(12):1569-1571 (2010)
surankco
assegnazione supervisionata di ranghi ai contig in assemblaggi de novo
Versions of package surankco
ReleaseVersionArchitectures
sid0.0.r5+dfsg-4all
bookworm0.0.r5+dfsg-3all
buster0.0.r5+dfsg-2all
stretch0.0.r5+dfsg-1all
trixie0.0.r5+dfsg-4all
bullseye0.0.r5+dfsg-3all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SuRankCo è un software basato su apprendimento macchina per assegnare punteggi e ranghi a contig da assemblaggi de novo di dati da sequenziamento di prossima generazione. Viene allenato con allineamenti di contig con genomi di riferimento noti, e predice punteggi e ranghi per i contig che non hanno ancora un genoma di riferimento correlato.

Please cite: Mathias Kuhring, Piotr Wojtek Dabrowski, Vitor C. Piro, Andreas Nitsche and Bernhard Y. Renard: SuRankCo: supervised ranking of contigs in de novo assemblies. (PubMed,eprint) BMC Bioinformatics 16(1):240 (2015)
surpyvor
modifica di file VCF con SURVIVOR
Versions of package surpyvor
ReleaseVersionArchitectures
sid0.5-2all
bookworm0.5-2all
trixie0.5-2all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SURVIVOR è un insieme di strumenti per simulare/valutare variazioni strutturali, unire e confrontare SV all'interno di campioni e tra campioni e include vari metodi per riformattare o riassumere variazioni strutturali.

Questo pacchetto fornisce un wrapper Python per facilitare la sua integrazione in vari flussi di lavoro basati su Python.

Registry entries: Bioconda 
survivor
insieme di strumenti per simulare/valutare SV
Versions of package survivor
ReleaseVersionArchitectures
bullseye1.0.7-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.0.7-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.0.7-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.0.7-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

SURVIVOR è un insieme di strumenti per simulare/valutare variazioni strutturali, unire e confrontare SV all'interno e fra i campioni, e include vari metodi per riformattare o riassumere le variazioni strutturali.

Registry entries: Bioconda 
svim
Structural variant caller for long sequencing reads
Versions of package svim
ReleaseVersionArchitectures
bullseye1.4.2+ds-1all
bookworm2.0.0-3all
sid2.0.0-3all
trixie2.0.0-3all
Popcon: 0 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

SVIM is a structural variant caller for long sequencing reads. It is able to detect, classify and genotype five different classes of structural variants. Unlike existing methods, SVIM integrates information from across the genome to precisely distinguish similar events, such as tandem and interspersed duplications and simple insertions.

Please cite: David Heller and Martin Vingron: Link to publication (PubMed,eprint) Bioinformatics 35(17):2907-2915 (2019)
Registry entries: Bioconda 
swarm
metodo robusto e veloce per raggruppamento in cluster per studi basati su ampliconi
Versions of package swarm
ReleaseVersionArchitectures
trixie3.1.5+dfsg-2amd64,arm64,ppc64el
bullseye3.0.0+dfsg-2amd64
bookworm3.1.2+dfsg-1amd64,arm64,ppc64el
stretch2.1.12+dfsg-1amd64
buster2.2.2+dfsg-2amd64
sid3.1.5+dfsg-2amd64,arm64,ppc64el
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Lo scopo di swarm è di fornire un innovativo algoritmo di raggruppamento in cluster per gestire vasti insiemi di ampliconi. I risultati degli algoritmi tradizionali di raggruppamento in cluster sono fortemente dipendenti dall'ordine di input e si basano su una soglia arbitraria globale di raggruppamento in cluster. I risultati di swarm sono resilienti a cambiamenti nell'ordine di input e si basano su una piccola soglia di linking locale d: il numero massimo di differenze tra due ampliconi. swarm forma cluster stabili ad alta risoluzione che contengono una grande quantità di informazioni biologiche.

Please cite: Frédéric Mahé, Torbjørn Rognes, Christopher Quince, Colomban de Vargas and Micah Dunthorn: Swarm v2: highly-scalable and high-resolution amplicon clustering. (PubMed,eprint) PeerJ 3(e1420) (2015)
Registry entries: Bio.tools 
sweed
valutazione degli SNP per il loro vantaggio evoluzionistico
Versions of package sweed
ReleaseVersionArchitectures
sid3.2.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye3.2.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.2.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.2.1+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster3.2.1+dfsg-1amd64,arm64,armhf,i386
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Sequenze biologiche sono disponibili con abbondanza sempre crescente su popolazioni sempre più grandi per frazioni sempre crescenti del genoma. Questo strumento ordina gli SNP per il loro contributo attivo o passivo alla deriva genetica, cioè per vedere particolari sequenze con una frazione più grande nel corso del tempo.

Please cite: Pavlos Pavlidis, Daniel Živković, Alexandros Stamatakis and Nikolaos Alachiotis: SweeD: Likelihood-Based Detection of Selective Sweeps in Thousands of Genomes. (eprint) Molecular Biology and Evolution 30(9):2224–2234 (2013)
Registry entries: Bio.tools 
t-coffee
allineamento di sequenze multiple
Versions of package t-coffee
ReleaseVersionArchitectures
bullseye13.41.0.28bdc39+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster12.00.7fb08c2-4amd64,arm64,armhf,i386
bookworm13.45.0.4846264+really13.41.0.28bdc39+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie13.45.0.4846264+really13.41.0.28bdc39+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid13.45.0.4846264+really13.41.0.28bdc39+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch11.00.8cbe486-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie11.00.8cbe486-1amd64,armel,armhf,i386
Debtags of package t-coffee:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 11 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

T-Coffee è un pacchetto per allineamenti di sequenze multiple. Dato un insieme di sequenze (proteiche o di DNA), T-Coffee genera un allineamento di sequenze multiple. La versione 2.00 e le successive possono mescolare sequenze e strutture.

T-Coffee permette di combinare una raccolta di allineamenti multipli/di coppie, globali o locali, in un singolo modello. Permette anche di stimare il livello di coerenza di ogni posizione all'interno del nuovo allineamento rispetto agli altri allineamenti. Si veda pre-print per maggiori informazioni.

T-Coffee ha una versione speciale, che si chiama M-Coffee, che rende possibile combinare l'output di molti pacchetti di allineamento di sequenze multiple. Nella sua versione pubblicata, usa MUSCLE, PROBCONS, POA, DiAlign-TS, MAFFT, Clustal W, PCMA e T-Coffee. Per Debian è stata creata una versione speciale, DM-Coffee, che usa solo software libero rimpiazzando Clustal W con Kalign. Usare gli 8 metodi forniti da M-Coffee può a volte essere un po' pesante; se si preferisce si può usare un sottoinsieme con i propri metodi preferiti.

The package is enhanced by the following packages: clustalw dialign-tx kalign mafft muscle muscle3 ncbi-blast+ poa prank probcons tm-align
Please cite: Cédric Notredame, Desmond G. Higgins and Jaap Heringa: T-coffee: a novel method for fast and accurate multiple sequence alignment. (PubMed) Journal of Molecular Biology 302(1):205-217 (2000)
Registry entries: Bio.tools  SciCrunch  Bioconda 
tabix
indicizzatore generico per file di posizioni del genoma delimitate da TAB
Versions of package tabix
ReleaseVersionArchitectures
jessie1.1-1amd64,armel,i386
experimental1.21+ds-0+exp2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.20+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.20+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.16+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.11-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.9-12~deb10u1amd64,arm64,armhf,i386
stretch-backports1.7-2~bpo9+1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
stretch1.3.2-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
jessie0.2.6-2armhf
upstream1.21
Debtags of package tabix:
roleprogram
works-with-formathtml
Popcon: 26 users (30 upd.)*
Newer upstream!
License: DFSG free
Git

Tabix indicizza i file in cui alcune colonne indicano coordinate di sequenze: nome (solitamente un cromosoma), inizio e fine. Il file di dati di input deve essere ordinato in base alla posizione e compresso con bgzip (fornito in questo pacchetto), che ha un'interfaccia simile a gzip. Dopo l'indicizzazione, tabix è in grado di recuperare velocemente righe di dati in base alle coordinate cromosomiche. Il veloce recupero dei dati funziona anche via rete se viene fornito un URI come nome di file.

Questo pacchetto è compilato dai sorgenti di HTSlib e fornisce gli strumenti bgzip, htsfile e tabix.

Please cite: Heng Li: Tabix: fast retrieval of sequence features from generic TAB-delimited files. (PubMed,eprint) Bioinformatics 27(5):718-719 (2011)
Registry entries: Bio.tools  Bioconda 
Screenshots of package tabix
tantan
mascheratore di complessità bassa e ripetizioni tandem per biosequenze
Versions of package tantan
ReleaseVersionArchitectures
sid51-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch13-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster22-1amd64,arm64,armhf,i386
bullseye23-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm40-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie51-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

tantan è uno strumento per mascherare regioni semplici (a bassa complessità e con ripetizioni tandem a periodo breve) in sequenze di DNA, RNA e proteiche. Lo scopo di tantan è di evitare predizioni false quando si cercano regioni omologhe tra due sequenze. Le ripetizioni semplici spesso danno allineamenti robusti tra di loro, causando false predizioni di omologia.

Please cite: Frith, Martin C.: A new repeat-masking method enables specific detection of homologous sequences. (PubMed) Nucleic Acids Research 39(4):e23 (2011)
Registry entries: Bioconda 
Topics: Sequence composition, complexity and repeats
terraphast
enumerate terraces in phylogenetic tree space
Versions of package terraphast
ReleaseVersionArchitectures
sid0.0+git20200413.8af2e4c+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.0+git20200413.8af2e4c+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.0+git20200413.8af2e4c+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Terraphast takes a .nkw file in Newick format and a genes/sites file, which denotes whether (1) or not (0) gene i is present in species j.

Program output states some imput data properties, the species whose leaf edge is used as a new tree root, and the resulting supertree in compressed newick format.

Please cite: Michael J. Sanderson, Michelle M. McMahon and Mike Steel: Terraces in phylogenetic tree space. (PubMed) Science 333(6041):448-450 (2011)
theseus
sovrappone macromolecole usando la massima verosimiglianza
Versions of package theseus
ReleaseVersionArchitectures
buster3.3.0-8amd64,arm64,armhf,i386
bullseye3.3.0-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.3.0-14amd64,i386
trixie3.3.0-14amd64,i386
sid3.3.0-14amd64,i386
jessie3.0.0-1amd64,armel,armhf,i386
stretch3.3.0-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package theseus:
biologypeptidic
fieldbiology, biology:bioinformatics, biology:structural
interfacecommandline
roleprogram
useanalysing, comparing
works-with-formatplaintext
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Theseus è un programma che sovrappone simultaneamente strutture macromolecolari multiple. Trova la soluzione ottimale al problema della sovrapposizione usando il metodo della massima verosimiglianza. Dando meno peso alle regioni variabili della sovrapposizione e apportando correzioni in base alle correlazioni tra gli atomi, il metodo della massima verosimiglianza per la sovrapposizione produce allineamenti strutturali molto accurati.

Quando vengono sovrapposte macromolecole con differenti sequenze di residui, gli altri programmi ed algoritmi non tengono conto dei residui allineati con gap. Theseus, invece, usa un algoritmo di sovrapposizione innovativo che include tutti i dati.

The package is enhanced by the following packages: theseus-examples
Please cite: Douglas L. Theobald and Deborah S. Wuttke: THESEUS: maximum likelihood superpositioning and analysis of macromolecular structures. (eprint) Bioinformatics 22(17):2171-2172 (2006)
thesias
test di effetti di aplotipi in studi di associazione
Versions of package thesias
ReleaseVersionArchitectures
bullseye3.1.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster-backports3.1.1-1~bpo10+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.1.1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.1.1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm3.1.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

L'obiettivo del programma THESIAS (Testing Haplotype Effects In Association Studies) è di eseguire analisi di associazione basate su aplotipi in individui senza legami di parentela. Questo programma è basato sul modello di massima verosimiglianza descritto in Tregouet et al. 2002 (Hum Mol Genet 2002,11: 2015-2023) ed è collegato all'algoritmo SEM (Tregouet et al. Ann Hum Genet 2004,68: 165-177). THESIAS permette la stima simultanea delle frequenze degli aplotipi e dei loro effetti associati sul fenotipo di interesse. In questo nuovo rilascio di THESIAS, possono essere studiati i risultati quantitativi, qualitativi (analisi logistica e per coppie corrispondenti), categorici e di sopravvivenza. È anche fattibile l'analisi degli aplotipi legati al cromosoma X. Possono anche essere investigati gli effetti degli aplotipi aggiustati per covariate e le interazioni aplotipo x covariata.

Please cite: David-Alexandre Trégouët and Valérie Garelle: "A new JAVA interface implementation of THESIAS: testing haplotype effects in association studies". (eprint) Bioinformatics 23(8):1038-1039 (2007)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Screenshots of package thesias
tiddit
structural variant calling
Versions of package tiddit
ReleaseVersionArchitectures
bookworm3.5.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid3.6.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie3.6.1+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye2.12.0+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream3.8.0
Popcon: 0 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

TIDDIT is a tool to used to identify chromosomal rearrangements using Mate Pair or Paired End sequencing data. TIDDIT identifies intra and inter- chromosomal translocations, deletions, tandem-duplications and inversions, using supplementary alignments as well as discordant pairs.

TIDDIT has two analysis modules. The sv mode, which is used to search for structural variants. And the cov mode that analyse the read depth of a bam file and generates a coverage report.

Registry entries: Bio.tools  Bioconda 
tigr-glimmer
rilevamento di geni in archibatteri e batteri
Versions of package tigr-glimmer
ReleaseVersionArchitectures
sid3.02b-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
jessie3.02-3amd64,armel,armhf,i386
stretch3.02b-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster3.02b-2amd64,arm64,armhf,i386
bullseye3.02b-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm3.02b-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie3.02b-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package tigr-glimmer:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usesearching
works-with-formatplaintext
Popcon: 10 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Questo software, sviluppato dall'istituto TIGR, rileva sequenze codificanti in batteri e archibatteri.

Glimmer è un sistema per trovare geni nel DNA microbico, specialmente nel genoma di batteri e archibatteri. Glimmer (Gene Locator and Interpolated Markov Modeler) usa modelli di Markov interpolati (IMM) per identificare le regioni codificanti e per distinguerle dal DNA non codificante.

Please cite: Steven L. Salzberg, Arthur L. Delcher, S. Kasif and O. White: Microbial gene identification using interpolated Markov models. (PubMed,eprint) Nucleic Acids Research 26(2):544-8 (1998)
Registry entries: Bio.tools  SciCrunch  Bioconda 
tipp
tool for Taxonomic Identification and Phylogenetic Profiling
Versions of package tipp
ReleaseVersionArchitectures
sid1.0+dfsg-3amd64,arm64
Popcon: users ( upd.)*
Versions and Archs
License: DFSG free
Git

TIPP is a modification of SEPP for classifying query sequences (i.e. reads) using phylogenetic placement.

TIPP inserts each read into a taxonomic tree and uses the insertion location to identify the taxonomic lineage of the read. The novel idea behind TIPP is that rather than using the single best alignment and placement for taxonomic identification, it uses a collection of alignments and placements and considers statistical support for each alignment and placement.

TIPP can also be used for abundance estimation by computing an abundance profile on the reads binned to marker genes in a reference dataset.

tm-align
allineamento strutturale di proteine
Versions of package tm-align
ReleaseVersionArchitectures
bookworm20190822+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie20140601+dfsg-1amd64,armel,armhf,i386
stretch20160521+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid20190822+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie20190822+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster20170708+dfsg-2amd64,arm64,armhf,i386
bullseye20190822+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package tm-align:
roleprogram
Popcon: 11 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

TM-align è un algoritmo informatico per allineamento di strutture proteiche che usa la programmazione dinamica. Il punteggio viene assegnato con la matrice di rotazione TM-score. Ciò è simile a RMSD per il fatto che le porzioni non allineate della struttura influenzano il punteggio meno delle regioni più strutturalmente conservate.

Please cite: Yang Zhang and Jeffrey Skolnick: TM-align: A protein structure alignment algorithm based on TM-score. (PubMed,eprint) Nucleic Acids Research 33(7):2302-2309 (2005)
Screenshots of package tm-align
tnseq-transit
statistical calculations of essentiality of genes or genomic regions
Versions of package tnseq-transit
ReleaseVersionArchitectures
bullseye3.2.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.3.4-1amd64
trixie3.3.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid3.3.4-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch-backports2.2.1-2~bpo9+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bookworm3.2.7-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream3.3.9
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

This is a software that can be used to analyze Tn-Seq datasets. It includes various statistical calculations of essentiality of genes or genomic regions (including conditional essentiality between 2 conditions). These methods were developed and tested as a collaboration between the Sassetti lab (UMass) and the Ioerger lab (Texas A&M)

TRANSIT is capable of analyzing TnSeq libraries constructed with Himar1 or Tn5 datasets.

TRANSIT assumes you have already done pre-processing of raw sequencing files (.fastq) and extracted read counts into a .wig formatted file. The .wig file should contain the counts at all sites where an insertion could take place (including sites with no reads). For Himar1 datasets this is all TA sites in the genome. For Tn5 datasets this would be all nucleotides in the genome.

Please cite: Michael A. DeJesus, Chaitra Ambadipudi, Richard Baker, Christopher Sassetti and Thomas R. Ioerger: TRANSIT - A Software Tool for Himar1 TnSeq Analysis. (PubMed,eprint) PLOS 11(10):e1004401 (2015)
Registry entries: Bio.tools  Bioconda 
toil
motore per flusso di lavoro multipiattaforma
Versions of package toil
ReleaseVersionArchitectures
sid6.1.0-4all
bullseye5.2.0-5all
bookworm5.9.2-2+deb12u1all
buster3.18.0-2all
upstream7.0.0
Popcon: 2 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Toil è un motore per flusso di lavoro in Python puro scalabile, efficiente, multipiattaforma e facile da usare. Funziona con svariati bilanciatori del carico di comune utilizzo, come Slurm o Sun Grid Engine. Toil è anche compatibile con CWL (Common Workflow Language) attraverso l'interfaccia "toil-cwl-runner", che questo pacchetto rende disponibile per mezzo del sistema delle alternative di Debian sotto l'alias "cwl-runner".

Please cite: John Vivian, Arjun Arkal Rao, Frank Austin Nothaft, Christopher Ketchum, Joel Armstrong, Adam Novak, Jacob Pfeil, Jake Narkizian Alden D. Deran, Audrey Musselman-Brown, Hannes Schmidt, Peter Amstutz, Brian Craft, Mary Goldman, Kate Rosenbloom, Melissa Cline, Brian O'Connor, Megan Hanna, Chet Birger, W. James Kent David A. Patterson, Anthony D. Joseph, Jingchun Zhu, Sasha Zaranek, Gad Getz, David Haussler and Benedict Paten: Toil enables reproducible, open source, big biomedical data analyses. Nature Biotechnology 35(4):314–316 (2017)
Registry entries: Bioconda 
tombo
identificazione di nucleotidi modificati da dati grezzi di sequenziamento Nanopore
Versions of package tombo
ReleaseVersionArchitectures
sid1.5.1-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.5.1-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.5.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.5.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Tombo è una suite di strumenti principalmente per l'identificazione di nucleotidi modificati da dati di sequenziamento Nanopore. Tombo fornisce anche strumenti per l'analisi e la visualizzazione di segnali grezzi Nanopore.

Please cite: Marcus Stoiber, Joshua Quick, Rob Egan, Ji Eun Lee, Susan Celniker, Robert K. Neely, Nicholas Loman, Len A Pennacchio and James Brown: De novo Identification of DNA Modifications Enabled by Genome-Guided Nanopore Signal Processing. (eprint) bioRxiv (2016)
Registry entries: Bioconda 
tophat
veloce mappatore di giunzioni di splice per letture RNA-Seq
Versions of package tophat
ReleaseVersionArchitectures
stretch2.1.1+dfsg-2amd64
jessie2.0.13+dfsg-1amd64
buster2.1.1+dfsg1-2amd64,arm64
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

TopHat allinea sequenze RNA-Seq in genomi della dimensione di quelli dei mammiferi, usando l'allineatore di letture corte per grandissime quantità di dati Bowtie, e successivamente analizza i risultati della mappatura per identificare giunzioni di splice tra gli esoni. TopHat è uno sforzo collaborativo tra il Center for Bioinformatics and Computational Biology dell'Università del Maryland e i Departments of Mathematics and Molecular and Cell Biology dell'Università della California, Berkeley.

The package is enhanced by the following packages: cufflinks multiqc
Please cite: Cole Trapnell, Lior Pachter and Steven L. Salzberg: TopHat: discovering splice junctions with RNA-Seq. (PubMed,eprint) Bioinformatics 25(9):1105-1111 (2009)
Registry entries: Bio.tools  SciCrunch  Bioconda 
tophat-recondition
post-processore per letture di TopHat non mappate
Versions of package tophat-recondition
ReleaseVersionArchitectures
trixie1.4-3all
bookworm1.4-3all
bullseye1.4-3all
sid1.4-3all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

tophat-recondition è un post-processore per letture di TopHat non mappate (contenute in unmapped.bam), che le rende compatibili con strumenti a valle (es. la suite Picard, samtools, GATK) (TopHat difetto #17). Aggira anche i bug in TopHat:

  • l'indicatore di SAM "mate is unmapped" non è impostato in nessuna lettura nel file unmapped.bam (TopHat difetto #3)
  • il mapped mate di una lettura non mappata può essere assente da accepted_hits.bam, creando una non corrispondenza tra il file e gli indicatori della lettura non mappata (TopHat difetto #16)
Please cite: Christian Brueffer and Lao H. Saal: A post-processor for TopHat unmapped reads. Bioinformatics 17(1):199 (2016)
Registry entries: Bio.tools  Bioconda 
topp
insieme di programmi che implementano TOPP (The OpenMS Proteomic Pipeline)
Versions of package topp
ReleaseVersionArchitectures
trixie2.6.0+cleaned1-4amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
sid2.6.0+cleaned1-4amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.6.0+cleaned1-3amd64,arm64,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.6.0+cleaned1-3amd64,arm64,i386,mips64el,mipsel,ppc64el,s390x
buster2.4.0-real-1amd64,arm64,i386
jessie1.11.1-5amd64,armel,armhf,i386
Debtags of package topp:
uitoolkitqt
Popcon: 6 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

TOPP (The OpenMS Proteomic Pipeline) è un flusso elaborativo per l'analisi di dati HPLC/MS. Consiste di un insieme di numerose piccole applicazioni che possono essere concatenate assieme per creare un flusso elaborativo di analisi confezionato per un problema specifico. Le applicazioni utilizzano la libreria libopenms. Alcuni esempi di tali applicazioni sono:

  • TOPPView: un visualizzatore per dati di spettrometria di massa;
  • TOPPAS: un assistente per la progettazione di flussi di lavoro TOPP guidati da una GUI;
  • DTAExtractor: estrae gli spettri di un file di un'analisi MS in diversi file in formato DTA;
  • FileConverter: converte tra diversi formati di file MS;
  • FileFilter: estrae o manipola porzioni di dati da file di picco, di funzionalità o di funzionalità di consenso;
  • SpectraMerger: unisce gli spettri da una mappa LC/MS, sia da precursori sia da blocchi RT;
  • BaselineFilter: rimuove la base di rilevamento da un profilo di uno spettro utilizzando un filtro top-hat;
  • InternalCalibration: applica una calibrazione interna;
  • PTModel: addestra un modello per la predizione di peptidi proteici da un insieme di addestramento;
  • RTPredict: predice il tempo di ritenzione dei peptidi utilizzando un modello addestrato da RTModel;
  • ExecutePipeline: esegue flussi di lavoro creati da TOPPAS.
Please cite: Marc Sturm, Andreas Bertsch, Clemens Gröpl, Andreas Hildebrandt, Rene Hussong, Eva Lange, Nico Pfeifer, Ole Schulz-Trieglaff, Alexandra Zerck, Knut Reinert and Oliver Kohlbacher: OpenMS – an Open-Source Software Framework for Mass Spectrometry. (PubMed,eprint) BMC Bioinformatics 9(163) (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
toppred
predizione della topologia transmembrana
Versions of package toppred
ReleaseVersionArchitectures
bookworm1.10-10amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.10-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.10-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster1.10-7amd64,arm64,armhf,i386
bullseye1.10-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.10-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Toppred è un programma per determinare la topologia di una proteina transmembrana basandosi sull'algoritmo di G. von Heijne.

Ciascuna sequenza dai dati di sequenziamento in formato fasta è elaborata e toppred genera il profilo Hydrophobycity della sequenza e i corrispondenti valori di idrofobicità nel file sequence-ID.hydro.

Inoltre, le topologie predette sono rappresentate come immagini PNG. Ciascuna topologia è memorizzata nel file sequence-ID-number.png.

Il profilo di idrofobicità è calcolato usando una finestra formata da una finestra centrale rettangolare di dimensione n, affiancata da 2 finestre triangolari di dimensione q. N.B.: rettangolare e triangolare indicano che i valori di ponderazione all'interno di tali finestre sono rispettivamente costanti e variabili.

Questo programma è una nuova implementazione del programma toppred originale, basato sull'algoritmo di G. von Heijne.

Please cite: Gunnar von Heijne: Membrane protein structure prediction. Hydrophobicity analysis and the positive-inside rule. (PubMed) Journal of Molecular Biology 225(2):487-94 (1992)
tortoize
Application to calculate ramachandran z-scores
Versions of package tortoize
ReleaseVersionArchitectures
bookworm2.0.11-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.0.13-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye2.0.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.0.11-1s390x
trixie2.0.11-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Tortoize validates protein structure models by checking the Ramachandran plot and side-chain rotamer distributions. Quality Z-scores are given at the residue level and at the model level (ramachandran-z and torsions-z). Higher scores are better. To compare models or to describe the reliability of the model Z-scores jackknife- based standard deviations are also reported (ramachandran-jackknife-sd and torsion-jackknife-sd).

Please cite: Oleg V. Sobolev, Pavel V. Afonine, Nigel W. Moriarty and Robbie P. Joosten: A Global Ramachandran Score Identifies Protein Structures with Unlikely Stereochemistry, Structure. (2020)
trace2dbest
bulk submission of chromatogram data to dbEST
Versions of package trace2dbest
ReleaseVersionArchitectures
bullseye3.0.1-2all
trixie3.0.1-2all
sid3.0.1-2all
buster3.0.1-1all
bookworm3.0.1-2all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ESTs are short sequences derived from reverse-transcribed RNA. Their abundances yield insights in the expression of genes across tissues, support the discovery of new genes and allow one to assess the coverage of whole genome sequencing projects. Public databases like dbEST at the NCBI collect this data.

trace2dbEST process raw sequenceing chromatograph trace files from EST projects into quality-checked sequences, ready for submission to dbEST. trace2dbEST guides you through the creation of all the necessary files for submission of ESTs to dbEST. trace2dbest makes use of other software (available free under academic licence) that you will need to have installed, namely phred, cross_match and (optionally) BLAST.

Please cite: John Parkinson, Alasdair Anthony, James Wasmuth, Ralf Schmid, Ann Hedley and Mark Blaxter: PartiGene—constructing partial genomes. (eprint) Bioinformatics 20(9):1398–1404 (2004)
tracetuner
interpretation of DNA Sanger sequencing data
Versions of package tracetuner
ReleaseVersionArchitectures
bookworm3.0.6~beta+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye3.0.6~beta+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.0.6~beta+dfsg-1amd64,arm64,armhf,i386
sid3.0.6~beta+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie3.0.6~beta+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Tracetuner is a tool for base and quality calling of trace files from DNA sequencing instruments. Traditional DNA sequencing yields curves from four different channels or light frequencies that human or (preferably) machines are interpreting to determine the actual base (A,C,G or T) and the confidence with which this is determined.

TraceTuner is a DNA sequencing quality value, base calling and trace processing software application originally developed by Paracel, Inc. While providing a flexible interface and capability to adopt the "pure" base calls produced by Phred, KB or any other "original" caller, it offers competitive features not currently available in other tools, such as customized calibration of quality values, advanced heterozygote and mixed base calling and deconvolving the "mixed" electropherograms resulting from the presence of indels into a couple of "pure" electropherograms.

Later versions Previous versions of TraceTuner were used by Celera Genomics to process over 27 million reads from both Drosophila and human genome projects. In 2000, Applied Biosystems bundled TraceTuner with ABI3700 Genome Analyzers and shipped it to the customers of these capillary electrophoresis sequencers. its SNP detection and genotyping software product SeqScape.

TraceTuner implements an advanced peak processing technology for resolving overlapping peaks of the same dye color into individual, or "intrinsic" peaks. TraceTuner, for its support of mixed base calling, have been used by the research community, the private biotech sector, and the U.S. government as components of different variant detection, genotyping and forensic software applications (e.g. Applied Biosystems SeqScape, Paracel Genome Assembler, MTexpert, etc.).

This technology was protected by US Patent #6,681,186. Currently, TraceTuner is an open source software, which has been used by J. Craig Venter Institute's DNA Sequencing and Resequencing pipelines.

This package prepares an important piece of human history to be used with new data on new machines or to revisit older observations..

Please cite: G.A.Denisov, A.B.Arehart and M.D.Curtin: A system and method for improving the accuracy of DNA sequencing and error probability estimation through application of a mathematical model to the analysis of electropherograms. US Patent 6681186. (2004)
Registry entries: SciCrunch 
Screenshots of package tracetuner
transdecoder
find coding regions within RNA transcript sequences
Versions of package transdecoder
ReleaseVersionArchitectures
sid5.7.1-2all
bookworm5.0.1-5all
bullseye5.0.1-3all
buster5.0.1-2all
stretch3.0.1+dfsg-1all
trixie5.7.1-2all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

TransDecoder identifies candidate coding regions within transcript sequences, such as those generated by de novo RNA-Seq transcript assembly using Trinity, or constructed based on RNA-Seq alignments to the genome using Tophat and Cufflinks.

TransDecoder identifies likely coding sequences based on the following criteria:

  • a minimum length open reading frame (ORF) is found in a transcript sequence
  • a log-likelihood score similar to what is computed by the GeneID software is > 0.
  • the above coding score is greatest when the ORF is scored in the 1st reading frame as compared to scores in the other 5 reading frames.
  • if a candidate ORF is found fully encapsulated by the coordinates of another candidate ORF, the longer one is reported. However, a single transcript can report multiple ORFs (allowing for operons, chimeras, etc).
  • optional the putative peptide has a match to a Pfam domain above the noise cutoff score.
Registry entries: Bioconda 
transrate-tools
ausilio per transrate
Versions of package transrate-tools
ReleaseVersionArchitectures
bullseye1.0.0-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.0-2amd64,arm64,armhf,i386
stretch1.0.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.0.0-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.0-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Transrate è una libreria e uno strumento a riga di comando per la valutazione della qualità di assemblati di trascrittomi de-novo.

Questo pacchetto fornisce strumenti a riga di comando usati da transrate per elaborare file BAM.

Please cite: Richard Smith-Unna, Chris Boursnell, Rob Patro, Julian M. Hibberd and Steven Kelly: TransRate: reference-free quality assessment of de novo transcriptome assemblies.. (PubMed,eprint) Genome Research 26(8):1134-1144 (2016)
Registry entries: Bioconda 
transtermhp
trova terminatori di trascrizione indipendenti da rho in genomi batterici
Versions of package transtermhp
ReleaseVersionArchitectures
bullseye2.09-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.09-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.09-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.09-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.09-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.09-2amd64,armel,armhf,i386
buster2.09-4amd64,arm64,armhf,i386
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

TransTermHP trova terminatori di trascrizione indipendenti da rho in genomi batterici. Ad ogni terminatore trovato dal programma viene assegnato un valore di confidenza che stima la sua probabilità di essere un terminatore reale. TransTermHP è il successore di TransTerm che utilizzava algoritmi di ricerca e punteggio molto differenti.

Please cite: Carleton L Kingsford, Kunmi Ayanbule and Steven L Salzberg: Rapid, accurate, computational discovery of Rho-independent transcription terminators illuminates their relationship to DNA uptake. (PubMed,eprint) Genome Biology 8(2):R22 (2007)
Registry entries: SciCrunch  Bioconda 
tree-ppuzzle
ricostruzione in parallelo di alberi filogenetici con il metodo della massima verosimiglianza
Versions of package tree-ppuzzle
ReleaseVersionArchitectures
bullseye5.3~rc16+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch5.2-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie5.2-7amd64,armel,armhf,i386
sid5.3~rc16+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie5.3~rc16+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm5.3~rc16+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster5.2-11amd64,arm64,armhf,i386
Debtags of package tree-ppuzzle:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

TREE-PUZZLE (nuovo nome di PUZZLE) è un programma interattivo per console che implementa un veloce algoritmo di ricerca di alberi chiamato "quartet puzzling" che permette l'analisi di grandi insiemi di dati e che assegna automaticamente stime di verosimiglianza per ciascun ramo interno. TREE-PUZZLE calcola anche la massima distanza verosimile per coppie di elementi, nonché la lunghezza di rami per alberi specificati dall'utente. Le lunghezze dei rami possono anche essere calcolate in base all'ipotesi dell'orologio molecolare. In aggiunta, TREE-PUZZLE offre un metodo nuovo, la mappatura di verosimiglianza, per studiare la verosimiglianza di un ramo interno ipotizzato senza calcolare un albero totale e per visualizzare il contenuto filogenetico di un allineamento di sequenze.

Questa è la versione in parallelo di tree-puzzle.

Please cite: Heiko A. Schmidt, Korbinian Strimmer, Martin Vingron and Arndt von Haeseler: TREE-PUZZLE: maximum likelihood phylogenetic analysis using quartets and parallel computing. (PubMed,eprint) Bioinformatics 18(3):502-504 (2002)
Registry entries: Bio.tools 
tree-puzzle
ricostruzione di alberi filogenetici con il metodo della massima verosimiglianza
Versions of package tree-puzzle
ReleaseVersionArchitectures
bullseye5.3~rc16+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie5.2-7amd64,armel,armhf,i386
stretch5.2-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster5.2-11amd64,arm64,armhf,i386
sid5.3~rc16+dfsg-12amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie5.3~rc16+dfsg-10amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm5.3~rc16+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package tree-puzzle:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing
works-with-formatplaintext
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

TREE-PUZZLE (nuovo nome di PUZZLE) è un programma interattivo per console che implementa un veloce algoritmo di ricerca di alberi chiamato "quartet puzzling" che permette l'analisi di grandi insiemi di dati e che assegna automaticamente stime di verosimiglianza per ciascun ramo interno. TREE-PUZZLE calcola anche la massima distanza verosimile per coppie di elementi, nonché la lunghezza di rami per alberi specificati dall'utente. Le lunghezze dei rami possono anche essere calcolate in base all'ipotesi dell'orologio molecolare. In aggiunta, TREE-PUZZLE offre un metodo nuovo, la mappatura di verosimiglianza, per studiare la verosimiglianza di un ramo interno ipotizzato senza calcolare un albero totale e per visualizzare il contenuto filogenetico di un allineamento di sequenze.

Please cite: Heiko A. Schmidt, Korbinian Strimmer, Martin Vingron and Arndt von Haeseler: TREE-PUZZLE: maximum likelihood phylogenetic analysis using quartets and parallel computing. (PubMed,eprint) Bioinformatics 18(3):502-504 (2002)
Registry entries: Bio.tools 
treeview
re-implementazione in Java di TreeView di Michael Eisen
Versions of package treeview
ReleaseVersionArchitectures
stretch1.1.6.4+dfsg1-2all
jessie1.1.6.4+dfsg-1 (contrib)all
bullseye1.2.0+dfsg-1all
bookworm1.2.0+dfsg-1all
trixie1.2.0+dfsg-2all
sid1.2.0+dfsg-2all
buster1.1.6.4+dfsg1-4all
upstream1.2.1
Popcon: 3 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

TreeView crea una visualizzazione simile a una matrice di dati di espressione, conosciuta come raggruppamento di Eisen. L'implementazione originale era un programma per Windows chiamato TreeView creato da Michael Eisen. Questo pacchetto TreeView, talvolta chiamato jTreeView, è stato riscritto in Java sotto una licenza libera.

Java TreeView è un visualizzatore estensibile dati di microarray in formato CDT o PCL.

Please cite: Alok J. Saldanha: Java Treeview -- extensible visualization of microarray data. (PubMed,eprint) Bioinformatics 20(17):3246-3248 (2004)
Registry entries: Bio.tools  SciCrunch 
treeviewx
visualizza e stampa alberi filogenetici
Versions of package treeviewx
ReleaseVersionArchitectures
bookworm0.5.1+git20100823.7e4d0e9-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.5.1+git20100823.7e4d0e9-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.5.1+git20100823.7e4d0e9-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.5.1+git20100823.7e4d0e9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.5.1+git20100823.7e4d0e9-1amd64,arm64,armhf,i386
stretch0.5.1+20100823-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.5.1+20100823-3amd64,armel,armhf,i386
Debtags of package treeviewx:
fieldbiology, biology:bioinformatics
interfacex11
roleprogram
scopeutility
uitoolkitwxwidgets
useviewing
works-with-formatpdf, plaintext, postscript, svg
x11application
Popcon: 3 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

TreeView X è un programma open source e multipiattaforma per visualizzare alberi filogenetici. Può leggere e mostrare file di alberi in formato NEXUS e Newick (come quelli prodotti da PAUP*, ClustalX, TREE-PUZZLE e altri programmi). Può permettere l'ordinamento dei rami degli alberi e l'esportazione degli alberi in formato SVG.

Please cite: Page, Roderic D. M.: TreeView: an application to display phylogenetic trees on personal computers. (PubMed) Comput. Appl. Biosci. 12(4):357-8 (1996)
Registry entries: Bio.tools 
Screenshots of package treeviewx
trf
localizza e visualizza ripetizioni tandem in sequenze di DNA
Versions of package trf
ReleaseVersionArchitectures
bullseye4.09.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.09.1-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid4.09.1-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.09.1-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Una ripetizione tandem nel DNA è costituita da due o più copie adiacenti approssimate di un motivo di nucleotidi. Tandem Repeats Finder è un programma per localizzare e visualizzare ripetizioni tandem in sequenze di DNA. Per poter usare il programma, l'utente fornisce una sequenza in formato FASTA. Non è necessario specificare il motivo, la dimensione del motivo o qualsiasi altro parametro. L'output è costituito da due file: un file della tabella delle ripetizioni e un file di allineamento. La tabella delle ripetizioni, visualizzabile in un browser web, contiene informazioni su ogni ripetizione, inclusi la sua posizione, la dimensione, il numero di copie e il contenuto in nucleotidi. Cliccando sugli indici delle posizioni di una delle voci della tabella si apre una seconda pagina del browser che mostra un allineamento delle copie rispetto ad un motivo di consenso. Il programma è molto veloce e analizza sequenze dell'ordine di 0,5Mb in appena qualche secondo. Le sequenze fornite possono avere lunghezza arbitraria. Vengono rilevate ripetizioni con la dimensione del motivo nell'intervallo compreso tra 1 e 2000 basi.

The package is enhanced by the following packages: trf-examples
Please cite: Gary Benson: Tandem repeats finder: a program to analyze DNA sequences. (PubMed,eprint) Nucleic Acids Research 27(2):573–580 (1999)
Registry entries: Bioconda 
trim-galore
automate quality and adapter trimming for DNA sequencing
Versions of package trim-galore
ReleaseVersionArchitectures
trixie0.6.10-1all
sid0.6.10-1all
bullseye0.6.6-1all
bookworm0.6.10-1all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Trim Galore! is a wrapper script to automate quality and adapter trimming as well as quality control, with some added functionality to remove biased methylation positions for RRBS sequence files (for directional, non-directional (or paired-end) sequencing). It's main features are:

  • For adapter trimming, Trim Galore! uses the first 13 bp of Illumina standard adapters ('AGATCGGAAGAGC') by default (suitable for both ends of paired-end libraries), but accepts other adapter sequence, too
  • For MspI-digested RRBS libraries, Trim Galore! performs quality and adapter trimming in two subsequent steps. This allows it to remove 2 additional bases that contain a cytosine which was artificially introduced in the end-repair step during the library preparation
  • For any kind of FastQ file other than MspI-digested RRBS, Trim Galore! can perform single-pass adapter- and quality trimming
  • The Phred quality of basecalls and the stringency for adapter removal can be specified individually
  • Trim Galore! can remove sequences if they become too short during the trimming process. For paired-end files Trim Galore! removes entire sequence pairs if one (or both) of the two reads became shorter than the set length cutoff. Reads of a read-pair that are longer than a given threshold but for which the partner read has become too short can optionally be written out to single-end files. This ensures that the information of a read pair is not lost entirely if only one read is of good quality
  • Trim Galore! can trim paired-end files by 1 additional bp from the 3' end of all reads to avoid problems with invalid alignments with Bowtie 1
  • Trim Galore! accepts and produces standard or gzip compressed FastQ files
  • FastQC can optionally be run on the resulting output files once trimming has completed
Registry entries: Bio.tools  Bioconda 
trimmomatic
strumento flessibile per il taglio di letture per i dati NGS di Illumina
Versions of package trimmomatic
ReleaseVersionArchitectures
sid0.39+dfsg-2all
bullseye0.39+dfsg-2all
buster0.38+dfsg-1all
jessie0.32+dfsg-4all
bookworm0.39+dfsg-2all
trixie0.39+dfsg-2all
stretch0.36+dfsg-1all
Popcon: 6 users (16 upd.)*
Versions and Archs
License: DFSG free
Git

Trimmomatic effettua una varietà di utili compiti di ritaglio per i dati Illumina a terminali accoppiati e singoli. La selezione dei passi di ritaglio e i loro parametri associati sono forniti sulla riga di comando.

I passi attuali di ritaglio sono:

  • ILLUMINACLIP: taglia l'adattatore e altre sequenze specifiche di Illumina dalla lettura;
  • SLIDINGWINDOW: effettua un ritaglio a finestra mobile, tagliando una volta che la qualità media all'interno della finestra scende al di sotto di una soglia;
  • LEADING: taglia basi dall'inizio di una lettura, se al di sotto di una soglia di qualità;
  • TRAILING: taglia basi dalla fine di una lettura, se al di sotto di una soglia di qualità;
  • CROP: taglia la lettura ad una lunghezza specificata;
  • HEADCROP: taglia il numero specificato di basi dall'inizio di una lettura;
  • MINLEGHT: elimina la lettura se è al di sotto di una lunghezza specificata;
  • TOPHRED33: converte punteggi di qualità in Phred-33;
  • TOPHRED64: converte punteggi di qualità in Phred-64. Funziona con FASTQ (usando punteggi di qualità Phred+33 o Phred+64, a seconda della pipeline Illumina usata), sia non compresso sia compresso con gzip. L'uso del formato gzip viene determinato sulla base dell'estensione .gz.
The package is enhanced by the following packages: multiqc
Please cite: A.M. Bolger, M. Lohse and B. Usadel: Trimmomatic: a flexible trimmer for Illumina sequence data. (PubMed,eprint) Bioinformatics 30(15):2114-2120 (2014)
Registry entries: Bio.tools  SciCrunch  Bioconda 
Topics: Sequencing
Screenshots of package trimmomatic
trinityrnaseq
assemblati de novo di RNA-Seq
Versions of package trinityrnaseq
ReleaseVersionArchitectures
sid2.15.2+dfsg-1amd64,arm64,ppc64el,riscv64
buster2.6.6+dfsg-6amd64
bullseye2.11.0+dfsg-6amd64,arm64
stretch2.2.0+dfsg-2amd64
trixie2.15.2+dfsg-1amd64,arm64,ppc64el,riscv64
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Trinity rappresenta un metodo innovativo per una ricostruzione de novo efficiente e robusta di trascrittomi da dati di RNA-seq. Trinity combina tre moduli software indipendenti: Inchworm, Chrysalis e Butterfly, applicati sequenzialmente per elaborare grandi volumi di letture di RNA-seq. Trinity partiziona i dati delle sequenze in molti grafi de Bruijn individuali, ciascuno dei quali rappresenta la complessità trascrizionale ad un dato gene o locus, e poi elabora ciascun grafo indipendentemente per estrarre isoforme di splicing a lunghezza intera e per separare i trascritti derivati da geni paraloghi.

Please cite: Manfred G Grabherr, Brian J Haas, Moran Yassour, Joshua Z Levin, Dawn A Thompson, Ido Amit, Xian Adiconis, Lin Fan, Raktima Raychowdhury, Qiandong Zeng, Zehua Chen, Evan Mauceli, Nir Hacohen, Andreas Gnirke, Nicholas Rhind, Federica di Palma, Bruce W Birren, Chad Nusbaum, Kerstin Lindblad-Toh, Nir Friedman and Aviv Regev: Full-length transcriptome assembly from RNA-Seq data without a reference genome.. (PubMed) Nature Biotechnology 29(7):644-652 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
tvc
strumento per identificare varianti per le piattaforme di sequenziamento Ion Torrent
Versions of package tvc
ReleaseVersionArchitectures
sid5.0.3+git20151221.80e144e+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster5.0.3+git20151221.80e144e+dfsg-2amd64,arm64,armhf,i386
trixie5.0.3+git20151221.80e144e+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye5.0.3+git20151221.80e144e+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm5.0.3+git20151221.80e144e+dfsg-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Torrent Variant Caller (TVC) è uno strumento per identificare varianti per le piattaforme di sequenziamento Ion Torrent ed è specialmente ottimizzato per sfruttare le informazioni del flusso di segnali sottostante nel modello statistico per valutare le varianti. Torrent Variant Caller è progettato per identificare polimorfismi a singolo nucleotide (SNP), polimorfismi a nucleotide multiplo (MNP), inserzioni, delezioni e sostituzioni di blocchi.

twopaco
costruzione del grafo de Bruijn compatto da molti genomi completi
Versions of package twopaco
ReleaseVersionArchitectures
sid1.0.0+dfsg-1amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.0+dfsg-1amd64,arm64,armhf,i386,mips64el,ppc64el,s390x
trixie1.0.0+dfsg-1amd64,arm64,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

TwoPaCo è un'implementazione dell'algoritmo descritto nell'articolo "TwoPaCo: An efficient algorithm to build the compacted de Bruijn graph from many complete genomes".

Questo pacchetto contiene due programmi:

 twopaco: strumento per costruzione diretta del grafo compresso da più
          genomi completi;
 graphdump: utilità che trasforma l'output di twopaco in un formato
            testuale.
Please cite: Ilia Minkin, Son Pham and Paul Medvedev: TwoPaCo: an efficient algorithm to build the compacted de Bruijn graph from many complete genomes. (PubMed,eprint) Bioinformatics 33(24):4024-4032 (2017)
Registry entries: Bioconda 
uc-echo
algoritmo a correzione di errore progettato per letture corte per NGS
Versions of package uc-echo
ReleaseVersionArchitectures
bookworm1.12-18amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.12-15amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.12-11amd64,arm64,armhf,i386
jessie1.12-7amd64,armel,armhf,i386
sid1.12-19amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.12-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.12-19amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

ECHO è un algoritmo a correzione di errore progettato per letture corte per le piattaforme di sequenziamento di prossima generazione come Genome Analyzer II di Illumina. L'algoritmo usa un'infrastruttura Bayesiana per migliorare la qualità delle letture in un insieme di dati fornito impiegando una stima del massimo a posteriori.

Please cite: W.-C. Kao, A.H. Chan and Y.S. Song: ECHO: A reference-free short-read error correction algorithm. (PubMed,eprint) Genome Research 21:1181-1192 (2011)
Registry entries: Bio.tools  SciCrunch 
Topics: Data management; Sequencing
ugene
toolkit integrato per bioinformatica
Versions of package ugene
ReleaseVersionArchitectures
sid51.0+dfsg-2amd64,arm64,mips64el
trixie51.0+dfsg-2amd64,arm64,mips64el
bullseye34.0+dfsg-2 (non-free)amd64
jessie1.12.3+dfsg-1 (non-free)amd64
stretch1.25.0+dfsg-1 (non-free)amd64
buster-backports33.0+dfsg-1~bpo10+1 (non-free)amd64
Debtags of package ugene:
uitoolkitqt
Popcon: 1 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Unipro UGENE è un ambiente visuale multipiattaforma per analisi di sequenze di DNA e proteine. UGENE integra i più importanti algoritmi di calcolo per bioinformatica e fornisce una GUI facile da usare per effettuare analisi complesse dei dati genomici. Una delle funzionalità principali di UGENE è uno strumento di progettazione per flussi di lavoro personalizzati per bioinformatica.

Please cite: Konstantin Okonechnikov, Olga Golosova, Mikhail Fursov and the UGENE team: Unipro UGENE: a unified bioinformatics toolkit. (PubMed,eprint) Bioinformatics 28(8):1166-1167 (2012)
Registry entries: Bio.tools  SciCrunch 
Other screenshots of package ugene
VersionURL
1.7.1+repack-0ubuntu2https://screenshots.debian.net/shrine/screenshot/5684/simage/large-bc495f14ab9dd03226b8e70eb64b2ad9.png
Screenshots of package ugene
umap-learn
Uniform Manifold Approximation and Projection
Versions of package umap-learn
ReleaseVersionArchitectures
sid0.5.4+dfsg-1all
bookworm0.5.3+dfsg-2all
bullseye0.4.5+dfsg-2all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Uniform Manifold Approximation and Projection (UMAP) is a dimension reduction technique that can be used for visualisation similarly to t- SNE, but also for general non-linear dimension reduction. The algorithm is founded on three assumptions about the data:

 1. The data is uniformly distributed on a Riemannian manifold;
 2. The Riemannian metric is locally constant (or can be
    approximated as such);
 3. The manifold is locally connected.

From these assumptions it is possible to model the manifold with a fuzzy topological structure. The embedding is found by searching for a low dimensional projection of the data that has the closest possible equivalent fuzzy topological structure.

Please cite: Leland McInnes, John Healy and James Melville: UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction. (eprint) arXiv (2018)
umis
tools for processing UMI RNA-tag data
Versions of package umis
ReleaseVersionArchitectures
trixie1.0.9-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm1.0.8-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid1.0.9-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye1.0.7-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Umis provides tools for estimating expression in RNA-Seq data which performs sequencing of end tags of transcript, and incorporate molecular tags to correct for amplification bias.

There are four steps in this process.

 1. Formatting reads
 2. Filtering noisy cellular barcodes
 3. Pseudo-mapping to cDNAs
 4. Counting molecular identifiers
Please cite: Valentine Svensson, Kedar Nath Natarajan, Lam-Ha Ly, Ricardo J Miragaia, Charlotte Labalette, Iain C Macaulay, Ana Cvejic and Sarah A Teichmann: Power analysis of single-cell RNA-sequencing experiments. (PubMed) Nature methods 14:381–387 (2017)
Registry entries: Bioconda 
uncalled
Utility for Nanopore Current Alignment to Large Expanses of DNA
Versions of package uncalled
ReleaseVersionArchitectures
trixie2.3+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.2+ds1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.3+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Streaming algorithm for mapping raw nanopore signal to DNA references

Enables real-time enrichment or depletion on Oxford Nanopore Technologies (ONT) MinION runs via ReadUntil.

Also supports standalone signal mapping of fast5 reads

Please cite: Sam Kovaka, Yunfan Fan, Bohan Ni, Winston Timp and Michael C. Schatz: Targeted nanopore sequencing by real-time mapping of raw electrical signal with UNCALLED. (eprint) Nature Biotechnology (2020)
unicycler
hybrid assembly pipeline for bacterial genomes
Versions of package unicycler
ReleaseVersionArchitectures
buster0.4.7+dfsg-2amd64
stretch-backports-sloppy0.4.8+dfsg-1~bpo9+1amd64
bullseye0.4.8+dfsg-2amd64
sid0.5.0+dfsg-1amd64
stretch-backports0.4.7+dfsg-1~bpo9+1amd64
trixie0.5.0+dfsg-1amd64
bookworm0.5.0+dfsg-1amd64
upstream0.5.1
Popcon: 1 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Unicycler is an assembly pipeline for bacterial genomes. It can assemble Illumina-only read sets where it functions as a SPAdes-optimiser. It can also assembly long-read-only sets (PacBio or Nanopore) where it runs a miniasm+Racon pipeline. For the best possible assemblies, give it both Illumina reads and long reads, and it will conduct a hybrid assembly.

Please cite: Ryan R. Wick, Louise M. Judd, Claire L. Gorrie and Kathryn E. Holt: Unicycler: Resolving bacterial genome assemblies from short and long sequencing reads. (PubMed,eprint) PLOS Computational Biology 13(6):e1005595 (2017)
Registry entries: Bio.tools  Bioconda 
unikmer
Toolkit for nucleic acid k-mer analysis
Versions of package unikmer
ReleaseVersionArchitectures
trixie0.20.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.19.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.20.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

unikmer is a golang package and a toolkit for nucleic acid k-mer analysis, providing functions including set operation k-mers optional with TaxIDs but without count information.

K-mers are either encoded (k<=32) or hashed (arbitrary k) into uint64, and serialized in binary file with extension .unik.

TaxIDs can be assigned when counting k-mers from genome sequences, and LCA (Lowest Common Ancestor) is computed during set opertions including computing union, intersecton, set difference, unique and repeated k-mers.

varna
applet per visualizzazione di RNA
Versions of package varna
ReleaseVersionArchitectures
trixie3-93+ds-7all
sid3-93+ds-7all
stretch3-93+ds-1all
buster3-93+ds-2all
bullseye3-93+ds-3all
bookworm3-93+ds-4all
Popcon: 4 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

VARNA è una leggera applet Java dedicata al disegno della struttura secondaria dell'RNA. È anche una componente Swing che può essere inclusa molto facilmente in un codice Java esistente che lavora con la struttura secondaria di RNA, per fornire una visualizzazione veloce e interattiva.

Non dipendendo da particolari librerie esterne o dall'accesso alla rete, l'applet VARNA può essere utilizzata come base per un'applet autonoma. Ha un aspetto ragionevolmente bello e si ridimensiona bene in grande e in piccolo per adattarsi allo spazio disponibile in una pagina web, grazie alle primitive di disegno con anti-aliasing di Swing.

Please cite: Kévin Darty, Alain Denise and Yann Ponty: VARNA: Interactive drawing and editing of the RNA secondary structure. (eprint) Bioinformatics 25(15):1974-1975 (2009)
vcfanno
annotate a VCF with other VCFs/BEDs/tabixed files
Versions of package vcfanno
ReleaseVersionArchitectures
bookworm0.3.5+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.3.5+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.3.2+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.3.5+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Vcfanno allows you to quickly annotate your VCF with any number of INFO fields from any number of VCFs or BED files. It uses a simple conf file to allow the user to specify the source annotation files and fields and how they will be added to the info of the query VCF.

  • For VCF, values are pulled by name from the INFO field with special cases of ID and FILTER to pull from those VCF columns.
  • For BED, values are pulled from (1-based) column number.
  • For BAM, depth (count), "mapq" and "seq" are currently supported.

Vcfanno is written in go and it supports custom user-scripts written in Lua. It can annotate more than 8000 variants per second with 34 annotations from 9 files on a modest laptop and over 30K variants per second using 12 processes on a server.

Please cite: Brent S. Pedersen, Ryan M. Layer and Aaron R. Quinlan: Vcfanno: fast, flexible annotation of genetic variants. (PubMed,eprint) Genome Biology 17(1):118 (2016)
Registry entries: Bio.tools  Bioconda 
vcftools
raccolta di strumenti per lavorare con file VCF
Versions of package vcftools
ReleaseVersionArchitectures
jessie-security0.1.12+dfsg-1+deb8u1amd64,armel,armhf,i386
sid0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.1.16-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.1.16-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.16-1amd64,arm64,armhf,i386
stretch0.1.14+dfsg-4+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.1.12+dfsg-1amd64,armel,armhf,i386
Debtags of package vcftools:
roleprogram
Popcon: 17 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

VCFtools è un pacchetto di programmi progettato per lavorare con file VCF, come quelli generati dal 1000 Genomes Project. Lo scopo di VCFtools è quello di fornire metodi per lavorare con file VCF: validare, unire, confrontare e calcolare alcune statistiche di base di genetica di popolazione.

The package is enhanced by the following packages: multiqc
Please cite: Petr Danecek, Adam Auton, Goncalo Abecasis, Cornelis A. Albers, Eric Banks, Mark A. DePristo, Robert E. Handsaker, Gerton Lunter, Gabor T. Marth, Stephen T. Sherry, Gilean McVean and Richard Durbin: The variant call format and VCFtools. (PubMed,eprint) Bioinformatics 27(15):2156-8 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
velvet
assemblatore di sequenze di acidi nucleici da sequenze molto corte
Versions of package velvet
ReleaseVersionArchitectures
bookworm1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.2.10+dfsg1-1amd64,armel,armhf,i386
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.2.10+dfsg1-5amd64,arm64,armhf,i386
trixie1.2.10+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid1.2.10+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.2.10+dfsg1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package velvet:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet è un assemblatore genomico de novo progettato specificatamente per le tecnologie di sequenziamento basate su sequenze corte, come Solexa o 454, sviluppato da Daniel Zerbino e Ewan Birney all'European Bioinformatics Institute (EMBL-EBI), vicino a Cambridge, in Gran Bretagna.

Velvet attualmente accetta sequenze molto corte, rimuove errori e poi produce frammenti contigui unici di alta qualità. Poi usa informazioni sulle paired-read, se disponibili, per recuperare le aree ripetute tra i vari frammenti contigui.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
velvet-long
assemblatore di sequenze di acidi nucleici da sequenze molto corte, versione lunga
Versions of package velvet-long
ReleaseVersionArchitectures
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.2.10+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.2.10+dfsg1-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.2.10+dfsg1-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.2.10+dfsg1-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.2.10+dfsg1-5amd64,arm64,armhf,i386
jessie1.2.10+dfsg1-1amd64,armel,armhf,i386
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet è un assemblatore genomico de novo progettato specificatamente per le tecnologie di sequenziamento basate su sequenze corte, come Solexa o 454, sviluppato da Daniel Zerbino e Ewan Birney all'European Bioinformatics Institute (EMBL-EBI), vicino a Cambridge, in Gran Bretagna.

Velvet attualmente accetta sequenze molto corte, rimuove errori e poi produce frammenti contigui unici di alta qualità. Poi usa informazioni sulle paired-read, se disponibili, per recuperare le aree ripetute tra i vari frammenti contigui.

Questo pacchetto installa versioni speciali in modalità lunga di Velvet, come raccomandato nei tutorial di Velvet.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.tools  SciCrunch  Bioconda 
velvetoptimiser
ottimizza automaticamente i parametri per assemblaggio de novo di Velvet
Versions of package velvetoptimiser
ReleaseVersionArchitectures
buster2.2.6-2all
bullseye2.2.6-3all
bookworm2.2.6-5all
trixie2.2.6-5all
sid2.2.6-5all
jessie2.2.5-2all
stretch2.2.5-5all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

VelvetOptimiser è uno script multi-thread in Perl per ottimizzare automaticamente le opzioni dei tre parametri primari (K, -exp_cov, -cov_cutoff) per l'assemblatore di sequenze de novo Velvet.

Registry entries: Bio.tools  Bioconda 
veryfasttree
velocizzazione della stima di alberi filogenetici da sequenze
Versions of package veryfasttree
ReleaseVersionArchitectures
sid4.0.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie4.0.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

VeryFastTree è un'implementazione altamente efficiente, ispirata allo strumento FastTree-2, progettata per velocizzare l'inferenza di alberi filogenetici approssimatamente per massima verosimiglianza a partire da allineamenti di sequenze nucleotidiche o di proteine. È un'implementazione ottimizzata progettata per accelerare la stima di filogenie per allineamenti vasti. Sfruttando strategie di parallelizzazione e vettorizzazione, VeryFastTree migliora significativamente le prestazioni e la scalabilità di analisi filogenetiche, permettendo di costruire alberi filogenetici in una frazione del tempo richiesto in precedenza.

Mantenendo l'integrità di FastTree-2, VeryFastTree mantiene le stesse fasi, metodi ed euristiche utilizzati per la stima di alberi filogenetici. Ciò assicura che l'accuratezza topologica degli alberi prodotti da VeryFastTree rimanga equivalente a quella di FastTree-2. Inoltre, a differenza della versione parallela di FastTree-2, VeryFastTree garantisce risultati deterministici, eliminando ogni potenziale variazione nell'output.

Per facilitare una transizione senza problemi per gli utenti, VeryFastTree adotta esattamente gli stessi argomenti per la riga di comando di FastTree-2. Ciò significa che, semplicemente sostituendo FastTree-2 con VeryFastTree e usando lo stesso insieme di opzioni, gli utenti possono migliorare significativamente le prestazioni globali delle loro analisi filogenetiche.

vg
tools for working with genome variation graphs
Versions of package vg
ReleaseVersionArchitectures
sid1.30.0+ds-1amd64,mips64el
bullseye1.30.0+ds-1amd64,mips64el
upstream1.61.0
Popcon: 1 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

variation graph data structures, interchange formats, alignment, genotyping, and variant calling methods

Variation graphs provide a succinct encoding of the sequences of many genomes. A variation graph (in particular as implemented in vg) is composed of:

  • nodes, which are labeled by sequences and ids
  • edges, which connect two nodes via either of their respective ends
  • paths, describe genomes, sequence alignments, and annotations (such as gene models and transcripts) as walks through nodes connected by edges

This model is similar to a number of sequence graphs that have been used in assembly and multiple sequence alignment. Paths provide coordinate systems relative to genomes encoded in the graph, allowing stable mappings to be produced even if the structure of the graph is changed.

Please cite: Erik Garrison, Jouni Sirén, Adam M Novak, Glenn Hickey, Jordan M Eizenga, Eric T Dawson, William Jones, Shilpa Garg, Charles Markello, Michael F Lin, Benedict Paten and Richard Durbin: Variation graph toolkit improves read mapping by representing genetic variation in the reference. (PubMed) Nature Biotechnology 36(9):875–879 (2018)
Registry entries: Bioconda 
viewmol
interfaccia grafica per programmi di chimica computazionale
Versions of package viewmol
ReleaseVersionArchitectures
jessie2.4.1-22amd64,armel,armhf,i386
buster2.4.1-25amd64,arm64,armhf,i386
stretch2.4.1-24amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package viewmol:
fieldchemistry
interface3d, x11
roleprogram
uitoolkitmotif
uselearning, viewing
x11application
Popcon: 8 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Viewmol è in grado di aiutare graficamente nella generazione di strutture molecolari per la computazione e la visualizzazione dei loro risultati.

Attualmente Viewvol include filtri in input per Discover, DMo13, Gamess, Gaussian 9x/03, Gulp, Mopac, PQS, Turbomole, output di Vamp e file PDB. Le strutture possono essere salvate come file car di Accelrys, file MDL e file di coordinate Turbomole. Viewmol può generare file di input per Gaussian 9x/03. Il formato dei file di Viewmol è stato aggiunto a OpenBabel in modo che OpenBabel possa servire da filtro di input o di output per le coordinate.

Registry entries: SciCrunch 
Screenshots of package viewmol
virulencefinder
identifica geni di virulenza in isolati batterici sequenziati totalmente o parzialmente
Versions of package virulencefinder
ReleaseVersionArchitectures
sid2.0.5-2all
bullseye2.0.3+git20190809.dde157a-3all
bookworm2.0.4-3all
trixie2.0.5-2all
upstream3.0.2
Popcon: 0 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Il servizio VirulenceFinder contiene uno script Python, virulencefinder.py, che è lo script della più recente versione del servizio VirulenceFinder. VirulenceFinder identifica geni di virulenza in isolati batterici sequenziati totalmente o parzialmente, al momento sono disponibili solo E. coli, Enterococcus, S. aureus e Listeria.

Please cite: Katrine Grimstrup Joensen, Flemming Scheutz, Ole Lund, Henrik Hasman, Rolf S. Kaas, Eva M. Nielsen and Frank M. Aarestrup: Real-Time Whole-Genome Sequencing for Routine Typing, Surveillance, and Outbreak Detection of Verotoxigenic Escherichia coli. (PubMed,eprint) Journal of Clinical Microbiology 52(5):1501-10 (2014)
vmatch
software per analisi di sequenze su grande scala
Versions of package vmatch
ReleaseVersionArchitectures
trixie2.3.1+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye2.3.1+dfsg-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.3.1+dfsg-9amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.3.1+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Vmatch è uno strumento software versatile per risolvere in maniera efficiente compiti di corrispondenza di sequenze su grande scala. Incorpora lo strumento software REPuter, ma è molto più generale, con un'interfaccia utente molto flessibile e requisiti migliorati per spazio e tempo.

Registry entries: Bio.tools  Bioconda 
vsearch
strumento per elaborare sequenze metagenomiche
Versions of package vsearch
ReleaseVersionArchitectures
stretch2.3.4-1amd64
buster2.10.4-1amd64
bullseye2.15.2-3amd64,arm64,ppc64el
bookworm2.22.1-1amd64,arm64,ppc64el
trixie2.29.1-1amd64,arm64,mips64el,ppc64el,riscv64
sid2.29.1-1amd64,arm64,mips64el,ppc64el,riscv64
Popcon: 4 users (10 upd.)*
Versions and Archs
License: DFSG free
Git

Strumento versatile e multi-thread a 64 bit per elaborare sequenze metagenomiche, incluse ricerca, raggruppamento in cluster, rilevamento di chimere, dereplicazione, ordinamento, mascheramento e rimescolamento.

Lo scopo di questo progetto è di creare un'alternativa allo strumento USEARCH sviluppato da Robert C. Edgar (2010). Il nuovo strumento dovrebbe:

  • avere un design a 64 bit che gestisca database molto grandi e molto più di 4 GB di memoria;
  • essere accurato almeno quanto usearch o di più;
  • essere veloce almeno quanto usearch o di più.
The package is enhanced by the following packages: vsearch-examples
Please cite: Torbjørn Rognes, Tomáš Flouri, Ben Nichols, Christopher Quince and Frédéric Mahé: VSEARCH: a versatile open source tool for metagenomics. (eprint) PeerJ 4:e2584
Registry entries: Bio.tools  Bioconda 
vt
toolset for short variant discovery in genetic sequence data
Versions of package vt
ReleaseVersionArchitectures
bookworm0.57721+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.57721+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.57721+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.57721+ds-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

vt is a variant tool set that discovers short variants from Next Generation Sequencing data.

Vt-normalize is a tool to normalize representation of genetic variants in the VCF. Variant normalization is formally defined as the consistent representation of genetic variants in an unambiguous and concise way. In vt a simple general algorithm to enforce this is implemented.

The package is enhanced by the following packages: vt-examples
Please cite: Adrian Tan, Gonçalo R. Abecasis and Hyun Min Kang: Unified representation of genetic variants. (PubMed,eprint) Bioinformatics 31(13):2202–2204 (2015)
Registry entries: Bio.tools  Bioconda 
wham-align
Wisconsin's High-Throughput Alignment Method
Versions of package wham-align
ReleaseVersionArchitectures
sid0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.1.5-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto fornisce funzionalità analoghe a BWA o bowtie nell'allineamento di letture da macchine di sequenziamento del DNA di prossima generazione rispetto a un genoma di riferimento.

Please cite: Yinan Li, Allie Terrell and Jignesh M. Patel: WHAM: A High-throughput Sequence Alignment Method (eprint) Proceedings of the ACM SIGMOD International Conference on Management of Data, SIGMOD 2011, Athens, Greece (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
wigeon
reimplementazione dell'utilità Pintail di rilevazione di anomalie nel DNA 16S
Versions of package wigeon
ReleaseVersionArchitectures
stretch20101212+dfsg1-1all
jessie20101212+dfsg-1all
bookworm20101212+dfsg1-5all
trixie20101212+dfsg1-6all
sid20101212+dfsg1-6all
buster20101212+dfsg1-2all
bullseye20101212+dfsg1-4all
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

WigeoN esamina la conservazione delle sequenze tra un'interrogazione e una sequenza di riferimento fidata, entrambe nel formato di allineamento NAST. Sulla base dell'identità della sequenza tra l'interrogazione e la sequenza di riferimento esiste una quantità attesa di variazione nell'allineamento. Se la variazione osservata è maggiore del quantile del 95% della distribuzione di variazione osservata tra sequenze non anomale, allora è segnalata come anomalia.

WigeoN è una reimplementazione flessibile a riga di comando dell'algoritmo Pintail pubblicato in Appl Environ Microbiol. 2005 Dec;7112:7724-36.

WigeoN è utile per contrassegnare chimere e anomalie solo in sequenze di rRNA 16S di lunghezza quasi completa. WigeoN non ha la sensibilità per sequenze inferiori a 1000 pb.

Per eseguire WigeoN servono delle sequenze in formato NAST generate dall'utilità nast-ier.

WigeoN fa parte della suite microbiomeutil.

The package is enhanced by the following packages: microbiomeutil-data
Please cite: Brian J. Haas, Dirk Gevers, Ashlee M. Earl, Mike Feldgarden, Doyle V. Ward, Georgia Giannoukos, Dawn Ciulla, Diana Tabbaa, Sarah K. Highlander, Erica Sodergren, Barbara Methé, Todd Z. DeSantis, The Human Microbiome Consortium, Joseph F. Petrosino, Rob Knight and Bruce W. Birren: Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. (PubMed,eprint) Genome Research 21(3):494-504 (2011)
Registry entries: SciCrunch 
wise
confronto tra biopolimeri, come DNA e sequenze proteiche
Versions of package wise
ReleaseVersionArchitectures
buster2.4.1-21amd64,arm64,armhf,i386
stretch2.4.1-19amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.4.1-17amd64,armel,armhf,i386
trixie2.4.1-25amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.4.1-25amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.4.1-23amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.4.1-23amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package wise:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
usecomparing
Popcon: 14 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Wise2 è un pacchetto incentrato sul confronto tra biopolimeri, tipicamente sequenze di DNA e proteiche. Ci sono molti altri pacchetti che lo fanno, tra i quali i più noti sono probabilmente BLAST (dal NCBI) e Fasta (di Bill Pearson). Ci sono altri pacchetti, come HMMER (Sean Eddy) o SAM (UC Santa Cruz) che si incentrano su modelli di Markov nascosti (HMM) relativi a biopolimeri.

Il punto di forza caratteristico di Wise2 è il confronto tra sequenze di DNA a livello della loro traduzione in proteine. Il confronto permette la predizione simultanea di, per esempio, strutture di geni con allineamenti basati sulle omologie.

Wise2 contiene anche altri algoritmi, come il venerando Smith-Waterman oppure altri più moderni, come l'algoritmo con penalità per i gap di Stephen Altschul, fino a persino alcuni algoritmi sperimentali sviluppati all'interno del progetto come dba. Lo sviluppo di questi algoritmi è dovuto alla facilità di sviluppare algoritmi simili nell'ambiente usato da Wise2.

Wise2 è stato scritto tenendo a mente anche la facilità di riutilizzo e di gestione. Sebbene sia un pacchetto in puro C, si può accedere alle sue funzioni direttamente dal Perl. Alcune parti del pacchetto (o tutto il pacchetto) possono essere usate da altri programmi C o C++ senza conflitti nello spazio dei nomi dato che tutte le variabili con link esterno hanno nel nome il prefisso Wise2.

Please cite: Ewan Birney, Michele Clamp and Richard Durbin: GeneWise and Genomewise. (PubMed,eprint) Genome Research 14(5):988-95 (2004)
Registry entries: Bio.tools  Bioconda 
xpore
Nanopore analysis of differential RNA modifications
Versions of package xpore
ReleaseVersionArchitectures
bookworm2.1-1all
sid2.1-2all
trixie2.1-2all
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

RNA is transcribed from DNA, possibly spliced and exported to the cytoplasm - fine - but its bases can also be modified, edited, and not all such modifications are visible by Sanger sequencing methods and its derivatives.

The Nanopore measures potentials, and if the bases have a different shape then this is measured - not necessarily in an interpretable manner, something must be left for mass spectrometry, but one may be pointed to a difference. And maybe one can even statistically associate such differences with a molecular or clinical phenotype.

yaha
find split-read mappings on single-end queries
Versions of package yaha
ReleaseVersionArchitectures
buster0.1.83-1amd64,arm64,armhf,i386
bookworm0.1.83-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.1.83-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.83-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.1.83-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

yaha is an open source, flexible, sensitive and accurate DNA aligner designed for single-end reads. It supports three major modes of operation:

  • The default “Optimal Query Coverage” (-OQC) mode reports the best set of alignments that cover the length of each query.
  • Using “Filter By Similarity” (-FBS), along with the best set of alignments, yaha will also output alignments that are highly similar to an alignment in the best set.
  • Finally, yaha can output all the alignments found for each query. The -OQC and -FBS modes are specifically tuned to form split read mappings that can be used to accurately identify structural variation events (deletions, duplications, insertions or inversions) between the subject query and the reference genome.
Please cite: Gregory G. Faust and Ira M. Hall: YAHA: fast and flexible long-read alignment with optimal breakpoint detection. (PubMed,eprint) Bioinformatics 28(19):2417–2424 (2012)
Registry entries: Bioconda 
yanagiba
filter low quality Oxford Nanopore reads basecalled with Albacore
Versions of package yanagiba
ReleaseVersionArchitectures
sid1.0.0-5all
trixie1.0.0-5all
bookworm1.0.0-5all
bullseye1.0.0-2all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Yanagiba is used to filter short or low quality Oxford Nanopore reads which have been basecalled with Albacore. It takes fastq.gz and an Albacore summary file as input. If no Albacore summary file is provided attempt to calculate mean qscore from directly from fastq file using NanoMath. Note: Calculated quality scores appear to be lower for reads called with Metrichor, you may need to lower your minqual setting in this case.

yanosim
read simulator nanopore DRS datasets
Versions of package yanosim
ReleaseVersionArchitectures
bookworm0.1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie0.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
sid0.1-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye0.1-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Yanosim has three options:

  1. yanosim model:

    Creates an model of mismatches, insertions and deletions based on an alignment of nanopore DRS reads to a reference. Reads should be aligned to a transcriptome i.e. without spliced alignment, using minimap2. They should have the cs tag. 2. yanosim quantify:

    Quantify the number of reads mapping to each transcript in a reference, so that the right number of reads can be simulated. 3. yanosim simulate:

    Given a model created using yanosim model, and per-transcript read counts created using yanosim simulate, simulate error-prone long-reads from the given fasta file.

Official Debian packages with lower relevance

adun.app
simulatore molecolare per GNUstep (GUI)
Versions of package adun.app
ReleaseVersionArchitectures
jessie0.81-6amd64,armel,armhf,i386
stretch0.81-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.81-13amd64,arm64,armhf,i386
bullseye0.81-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.81-14amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.81-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.81-14amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package adun.app:
fieldbiology, biology:structural
interfacex11
roleprogram
scopeapplication
suitegnustep
uitoolkitgnustep
useanalysing, organizing, viewing
works-with3dmodel, db
x11application
Popcon: 8 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Adun è un simulatore biomolecolare che include anche capacità di gestione e analisi di dati. È stato sviluppato presso il Laboratorio di Biofisica e Biochimica Computazionale, una sezione dell'Unità di Ricerca sull'Informatica Biomedica dell'UPF (Universitat Pompeu Fabra).

Questo pacchetto contiene UL, il frontend con interfaccia utente grafica per Adun.

Please cite: Michael A. Johnston, Ignacio Fdez. Galván and Jordi Villà-Freixa: Framework-based design of a new all-purpose molecular simulation application: The Adun simulator. (PubMed) J. Comp. Chem. 26(15):1647-1659 (2005)
Screenshots of package adun.app
catfishq
concatena file fastq
Versions of package catfishq
ReleaseVersionArchitectures
sid1.4.0+ds-1all
trixie1.4.0+ds-1all
bookworm1.4.0+ds-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

FASTQ è il più comune formato per archiviazione di letture da sequenziamento biologico ad alte prestazioni. Questo strumento accetta percorsi ad un numero arbitrario di file FASTQ compressi o meno con zip o cartelle contenenti file FASTQ compressi o meno con zip, li concatena e li stampa sullo standard out (predefinito) o in un file di output non compresso con zip.

Le estensioni di file gestite sono: ".fastq", ".fastq.gz", ".fasta", ".fasta.gz", ".fa", ".fa.gz", ".fq", ".fq.gz".

conda-package-handling
creazione ed estrazione di pacchetti conda in vari formati
Versions of package conda-package-handling
ReleaseVersionArchitectures
bookworm2.0.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.3.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid2.3.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.7.2-2+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream2.4.0
Popcon: 14 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

Cph è un'astrazione della gestione dei pacchetti conda e uno strumento per estrarre, creare e convertire tra formati.

Al momento della scrittura di questo testo, il formato standard di un pacchetto conda è un file .tar.bz2. Ciò dovrà essere mantenuto per un tempo piuttosto lungo, a causa dalla grande quantità di persone che usano ancora versioni vecchie di conda. Esiste un nuovo formato per conda, descritto in https://docs.google.com/document/d/1HGKsbg_j69rKXPihhpCb1kNQSE8Iy3yOsUU2x68x8uw/edit?usp=sharing. Questo nuovo formato è progettato per avere un accesso molto più veloce ai metadati e per utilizzare algoritmi di compressione più moderni, facilitando al contempo la firma dei pacchetti senza aggiungere file di accompagnamento.

Remark of Debian Med team: Dead upstream

The homepage of this project vanished as well as the Download area. An old unmaintained version remained at code.google.com. Please drop the maintainer a note if you have any news of this project.

dascrubber
alignment-based scrubbing pipeline for DNA sequencing reads
Versions of package dascrubber
ReleaseVersionArchitectures
bookworm1.1-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0~20160601-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.1-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye1.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1-1amd64,arm64,armhf,i386
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The Dazzler Scrubbing Suite produces a set of edited reads that are guaranteed to

  • be continuous stretches of the underlying genome (i.e. no unremoved adapters and not chimers)
  • have no very low quality stretches (i.e. the error rate never exceeds some reasonable maximum, 20% or so in the case of Pacbio data). Its secondary goal is to do so with the minimum removal of data and splitting of reads.
dnapi
previsione di adattatori per sequenziamento di piccoli RNA - utilità
Versions of package dnapi
ReleaseVersionArchitectures
bullseye1.1-3all
trixie1.1-3all
sid1.1-3all
bookworm1.1-3all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto fornisce un algoritmo (iterativo) di previsione per adattatori de novo per dati di sequenziamento di piccoli RNA.

DNApi può prevedere correttamente la maggior parte degli adattatori 3' con i parametri predefiniti. Si possono mettere a punto i parametri ed eseguire differenti modalità di previsione.

Please cite: Junko Tsuji and Zhiping Weng: DNApi: A De Novo Adapter Prediction Algorithm for Small RNA Sequencing Data. (PubMed,eprint) PLoS One 11(10):e0164228 (2016)
Registry entries: Bioconda 
emboss-explorer
GUI basata su web per EMBOSS
Versions of package emboss-explorer
ReleaseVersionArchitectures
jessie2.2.0-8all
stretch2.2.0-8all
buster2.2.0-10all
bullseye2.2.0-11all
bookworm2.2.0-11all
trixie2.2.0-12all
sid2.2.0-12all
Debtags of package emboss-explorer:
biologyemboss
fieldbiology, biology:bioinformatics
interfaceweb
roleplugin
webapplication, cgi
Popcon: 1 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

EMBOSS explorer è un'interfaccia grafica basata su web alla suite di strumenti bioinformatici EMBOSS. È scritta in Perl.

Se si usa il server HTTP Apache, si dovrà al massimo riavviarlo prima di usare EMBOSS explorer. Per altri server web, si dovrà fare la configurazione da soli.

getdata
gestione di database esterni
Versions of package getdata
ReleaseVersionArchitectures
jessie0.2-1all
stretch0.2-1all
bullseye0.2-4all
sid0.2-4all
buster0.2-3all
trixie0.2-4all
bookworm0.2-4all
Popcon: 3 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Molte comunità scientifiche condividono il problema di dover aggiornare regolarmente database esterni. Ad ogni aggiornamento devono anche essere eseguite varie attività per l'aggiornamento degli indici che devono essere ricreati. Questo lavoro dipende dagli strumenti che sono disponibili localmente e non è sempre del tutto semplice.

Questo pacchetto fornisce lo script Perl getData, che in una maniera non troppo complicata effettua la chiamata a wget per scaricare i dati e poi sa come fare l'indicizzazione. Deve solamente essere compilata una tabella hash con i comandi da eseguire. I manutentori di pacchetti scientifici che sono fortemente legati a insiemi di dati pubblici sono incoraggiati ad aggiungere una dipendenza runtime da questo pacchetto e le istruzioni che getData deve seguire.

hts-nim-tools
tools biological sequences: bam-filter, count-reads, vcf-check
Versions of package hts-nim-tools
ReleaseVersionArchitectures
bookworm0.2.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid0.2.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bullseye0.2.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides several tools that (at least at the time of their creation) provide functionalities beyond the routine provided by samtools and other reverse dependencies of the htslib.

These new tools are

 • bam-filter : filter BAM/CRAM/SAM files with a simple expression language
 • count-reads: count BAM/CRAM reads in regions given in a BED file
 • vcf-check  : check regions of a VCF against a background for missing chunks

and yes, as the name suggests, these tools are all implemented in nim, using the nim-hts (upstream: hts-nim) wrapper for the htslib.

Registry entries: Bioconda 
idseq-bench
Benchmark generator for the IDseq Portal
Versions of package idseq-bench
ReleaseVersionArchitectures
sid0.0~git20210602.27fb6dc-1all
bookworm0.0~git20210602.27fb6dc-1all
bullseye0.0~git20200902.8241a9a-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

IDseq (Infectious Disease Sequencing Platform) is an unbiased global software platform that helps scientists identify pathogens in metagenomic sequencing data.

  • Discover - Identify the pathogen landscape
  • Detect - Monitor and review potential outbreaks
  • Decipher - Find potential infecting organisms in large datasets

This package provides the benchmark generator for the IDseq Portal.

illustrate
cartoonish representations of large biological molecules
Versions of package illustrate
ReleaseVersionArchitectures
trixie0.0+git20200923.217db48-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.0+git20200923.217db48-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.0+git20200923.217db48-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream0.0+git20240817.e469df4
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

This package provides a binary to transform PDF-formatted proteins into simplified but instructive graphics. The software has been used for the Protein-of-the-month's biomolecular illustrations for the past 20 years.

Please cite: D.S. Goodsell and A.J. Olson: Molecular Illustration in Black and White. (PubMed) J. Mol. Graphics 10(4):235-240 (1992)
Registry entries: Bio.tools 
libhdf5-dev
HDF5 - file di sviluppo - versione seriale
Maintainer: Gilles Filippini
Versions of package libhdf5-dev
ReleaseVersionArchitectures
experimental1.14.5+repack-1~exp4i386,mips64el,ppc64el,s390x
jessie-security1.8.13+docs-15+deb8u1amd64,armel,armhf,i386
jessie1.8.13+docs-15+deb8u1amd64,armel,armhf,i386
experimental1.14.4.3+repack-1~exp3armel,armhf
sid1.10.10+repack-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.10.10+repack-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.10.8+repack1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.10.6+repack-4+deb11u1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster-security1.10.4+repack-10+deb10u1amd64,arm64,armhf,i386
buster1.10.4+repack-10amd64,arm64,armhf,i386
stretch1.10.0-patch1+docs-3+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
experimental1.14.5+repack-1~exp3amd64,arm64,riscv64
upstream1.14.3
Debtags of package libhdf5-dev:
devellibrary
roledevel-lib
Popcon: 329 users (284 upd.)*
Newer upstream!
License: DFSG free
Git

Hierarchical Data Format 5 (HDF5) è un formato file ed una libreria per l'archiviazione di dati scientifici. HDF5 è stato pensato ed implementato per ovviare alle mancanze di HDF4.x. Ha un modello dei dati più potente e flessibile, supporta file più grandi di 2 GB e supporta l'I/O in parallelo.

Questo pacchetto contiene i file di sviluppo per le piattaforme seriali.

libhnswlib-dev
fast approximate nearest neighbor search
Versions of package libhnswlib-dev
ReleaseVersionArchitectures
trixie0.8.0-1all
sid0.8.0-1all
bookworm0.6.2-2+deb12u1all
bullseye0.4.0-3+deb11u1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Header-only C++ HNSW implementation with Python bindings.

A common task in data analysis but also in scientific computations is to find data that is very close (multi-dimensional space) or similar (same thing) to a given data point. Also as heuristics for physics engines, it is the objects closest to you that you are most likely to collide with. This library knows how to do this fast.

Please cite: Yu. A. Malkov and D. A. Yashunin: Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs. (eprint) arXiv.org arXiv(1603.0932) (2016)
maude
infrastruttura logica ad alte prestazioni
Versions of package maude
ReleaseVersionArchitectures
trixie3.4-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye3.1-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.6-6amd64,armel,armhf,i386
bookworm3.2-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.7-2amd64,arm64,armhf,i386
stretch2.7-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid3.4-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
upstream3.5
Debtags of package maude:
uitoolkitncurses
Popcon: 3 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

Maude è un linguaggio riflessivo e un sistema ad alte prestazioni che gestisce la specificazione di logica sia equazionale sia con riscrittura e la programmazione per una vasta gamma di applicazioni. Maude è stato influenzato in modo importante dal linguaggio OBJ3 che può essere considerato un sottolinguaggio di logica equazionale. Oltre a gestire la specificazione e la programmazione equazionale, Maude gestisce anche il calcolo con logica con riscrittura.

La logica con riscrittura è una logica di cambiamento concorrente che può naturalmente affrontare stati e calcoli concorrenti. Ha buone proprietà come infrastruttura semantica generica per fornire semantiche eseguibili ad una vasta gamma di linguaggi e modelli di concorrenza. In particolare, gestisce molto bene calcoli concorrenti orientati agli oggetti. Questi stessi motivi fanno della logica con riscrittura una buona infrastruttura logica, cioè una metalogica in cui molte altre logiche possono essere naturalmente rappresentate ed eseguite.

Maude gestisce in modo sistematico ed efficiente la riflessione logica. Ciò rende Maude particolarmente estensibile e potente, gestisce un'algebra estensibile di operazione di composizione di moduli e permette molte applicazioni avanzate di metaprogrammazione e metalinguaggio. Difatti, alcune delle applicazioni più interessanti di Maude sono applicazioni con metalinguaggi, in cui Maude viene usato per creare ambienti eseguibili per logiche diverse, dimostratori di teoremi, linguaggi e modelli di calcolo.

Maude è interessante per la comunità biomedica per fare modelli e analisi di sistemi biologici.

Please cite: M. Matsumoto and T. Nishimura: Mersenne Twister: A 623-Dimensionally Equidistributed Uniform Pseudo-Random Number Generator. ACM Transactions on Modeling and Computer Simulation 8(1):3-30 (1998)
metastudent-data
strumento di predizione di termini Gene Ontology da sequenze proteiche - file dei dati
Versions of package metastudent-data
ReleaseVersionArchitectures
jessie1.0.1-2all
buster2.0.1-4all
bullseye2.0.1-7all
bookworm2.0.1-8all
trixie2.0.1-8all
sid2.0.1-8all
stretch2.0.1-2all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Spesso è nota solo la sequenza di una proteina, ma non le sue funzioni. Metastudent cercherà di predire le annotazioni funzionali mancanti attraverso ricerche di omologia (BLAST).

Tutte le funzioni predette corrispondono a termini Gene Ontology (GO) da MFO (Molecular Function Ontology) e BPO (Biological Process Ontology) e sono associati ad un punteggio di affidabilità.

Questo pacchetto contiene i file dei dati per metastudent.

Please cite: Tobias Hamp, Rebecca Kassner, Stefan Seemayer, Esmeralda Vicedo, Christian Schaefer, Dominik Achten, Florian Auer, Ariane Boehm, Tatjana Braun, Maximilian Hecht, Mark Heron, Peter Hönigschmid, Thomas A. Hopf, Stefanie Kaufmann, Michael Kiening, Denis Krompass, Cedric Landerer, Yannick Mahlich, Manfred Roos and Burkhard Rost: Homology-based inference sets the bar high for protein function prediction. (PubMed) BMC Bioinformatics 14(Suppl 3):S7 (2013)
Registry entries: Bio.tools 
metastudent-data-2
strumento di predizione di termini Gene Ontology da sequenze proteiche - dati n.2
Versions of package metastudent-data-2
ReleaseVersionArchitectures
jessie1.0.0-1all
stretch1.0.0-2all
trixie1.0.0-6all
bookworm1.0.0-6all
buster1.0.0-4all
bullseye1.0.0-5all
sid1.0.0-6all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Spesso è nota solo la sequenza di una proteina, ma non le sue funzioni. Metastudent cercherà di predire le annotazioni funzionali mancanti attraverso ricerche di omologia (BLAST).

Tutte le funzioni predette corrispondono a termini Gene Ontology (GO) da MFO (Molecular Function Ontology) e BPO (Biological Process Ontology) e sono associati ad un punteggio di affidabilità.

Questo pacchetto contiene file dei dati addizionali per metastudent.

Please cite: Tobias Hamp, Rebecca Kassner, Stefan Seemayer, Esmeralda Vicedo, Christian Schaefer, Dominik Achten, Florian Auer, Ariane Boehm, Tatjana Braun, Maximilian Hecht, Mark Heron, Peter Hönigschmid, Thomas A. Hopf, Stefanie Kaufmann, Michael Kiening, Denis Krompass, Cedric Landerer, Yannick Mahlich, Manfred Roos and Burkhard Rost: Homology-based inference sets the bar high for protein function prediction. (PubMed) BMC Bioinformatics 14(Suppl 3):S7 (2013)
mrs
sistema di recupero di informazioni per banche dati biomediche
Versions of package mrs
ReleaseVersionArchitectures
jessie6.0.5+dfsg-1amd64
stretch6.0.5+dfsg-2amd64
buster6.0.5+dfsg-7amd64,arm64,armhf,i386
Popcon: users ( upd.)*
Versions and Archs
License: DFSG free
Git

MRS è un sistema completo per recuperare, indicizzare e interrogare banche dati biologiche e mediche. Viene fornito con tutto il codice richiesto per recuperare i dati usando FTP o rsync, poi crea una banca dati locale con indici usando un analizzatore specifico per banche dati scritto in Perl. Può quindi servire questi dati usando un'applicazione web e servizi web incorporati.

La ricerca può essere fatta su parole e interrogazioni booleane. Come bonus si possono cercare sequenze proteiche usando un algoritmo Blast personalizzato.

Please cite: Maarten L. Hekkelman and Gert Vriend: MRS: a fast and compact retrieval system for biological data. (PubMed,eprint) Nucleic Acids Res. 33:W766-W769 (2005)
Registry entries: Bio.tools 
Remark of Debian Med team: mrs might occupy a lot of space on users disk - so you want to avoid this package from the metapackage recommends
python3-alignlib
distanze di edit e di Hamming per sequenze biologiche
Versions of package python3-alignlib
ReleaseVersionArchitectures
bookworm0.1.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.1.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.1.1+dfsg-1.1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.1.1+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Piccolo modulo Python che fornisce il calcolo della distanza di edit e di Hamming. È una dipendenza del pacchetto IgDiscover e probabilmente di altri in futuro.

python3-anndata
annotated gene by sample numpy matrix
Versions of package python3-anndata
ReleaseVersionArchitectures
sid0.10.6-1all
bookworm0.8.0-4all
bullseye0.7.5+ds-3all
upstream0.11.1
Popcon: 0 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

AnnData provides a scalable way of keeping track of data together with learned annotations. It is used within Scanpy, for which it was initially developed. Both packages have been introduced in Genome Biology (2018).

Please cite: F. Alexander Wolf, Philipp Angerer and Fabian J. Theis: SCANPY: large-scale single-cell gene expression data analysis.. (PubMed) Genome Biol. 19:15 (2018)
Registry entries: Bioconda 
python3-cgecore
modulo Python 3 per il Center for Genomic Epidemiology
Versions of package python3-cgecore
ReleaseVersionArchitectures
bookworm1.5.6+ds-1all
bullseye1.5.6+ds-1all
trixie1.5.6+ds-1all
sid1.5.6+ds-2all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Questo modulo Python 3 contiene classi e funzioni necessarie per eseguire i wrapper dei servizi e gli script delle catene di pipe sviluppati dal Center for Genomic Epidemiology.

Registry entries: Bioconda 
python3-cyvcf2
VCF parser based on htslib (Python 3)
Versions of package python3-cyvcf2
ReleaseVersionArchitectures
trixie0.31.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.30.4-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm0.30.18-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.10.4-1amd64,arm64,armhf,i386
sid0.31.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

This modules allows fast parsing of VCF and BCF including region-queries with Python. This is essential for efficient analyses of nucleotide variation with Python on high-throughput sequencing data.

cyvcf2 is a cython wrapper around htslib. Attributes like variant.gt_ref_depths return a numpy array directly so they are immediately ready for downstream use.

This package installs the library for Python 3.

Please cite: Brent S. Pedersen and Aaron R. Quinlan: cyvcf2: fast, flexible variant analysis with Python. (eprint) Bioinformatics 33(12):1867–1869 (2017)
Registry entries: Bio.tools  Bioconda 
python3-deeptools
platform for exploring biological deep-sequencing data
Versions of package python3-deeptools
ReleaseVersionArchitectures
bullseye3.5.0-1all
bookworm3.5.1-3all
trixie3.5.5+dfsg-1all
sid3.5.5+dfsg-1all
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Aiming for compatibility with the Galaxy worklfow environment, but also independently contributing to a series of workflows in genomics, this package provides a series of tools to address common tasks for the processing of high-throughput DNA/RNA sequencing.

Please cite: Fidel Ramirez, Devon P. Ryan, Björn Grüning, Sarah Diehl, Vivek Bhardwaj, Fabian Kilpert, Andreas S Richter, Steffen Heyne, Friederike Dündar and Thomas Manke: deepTools2: a next generation web server for deep-sequencing data analysis. (eprint) Nucleic Acids Research :W160–W165 (2016)
Registry entries: Bio.tools  Bioconda 
python3-deeptoolsintervals
handlig GTF-like sequence-associated interal-annotation
Versions of package python3-deeptoolsintervals
ReleaseVersionArchitectures
trixie0.1.9-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.1.9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.1.9-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.1.9-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Regions in biological sequences are described (annotated) as genes, transcription factor binding sites, low complexity, ... whatever biological research brings.

This package supports the efficienct operation with this information.

python3-htseq
utilità per analizzare letture di sequenziamento ad alta efficienza del genoma per Python 3
Versions of package python3-htseq
ReleaseVersionArchitectures
bookworm1.99.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye0.13.5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid2.0.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
trixie2.0.5-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
buster0.11.2-1amd64,arm64
Popcon: 27 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

HTSeq può essere usato per eseguire numerosi compiti comuni di analisi quando si lavora con letture di sequenziamento ad alta efficienza del genoma:

  • ottenere riepiloghi statistici sui punteggi di qualità dell'identificazione delle basi per studiare la qualità dei dati;
  • calcolare un vettore di copertura ed esportarlo per la visualizzazione in un browser di genoma;
  • leggere dati di annotazione da un file GFF;
  • assegnare letture allineate da esperimenti RNA-Seq a esoni e geni.
Please cite: Simon Anders, Paul Theodor Pyl and Wolfgang Huber: HTSeq—a Python framework to work with high-throughput sequencing data. (PubMed,eprint) Bioinformatics 31(2):166-169 (2015)
Registry entries: Bio.tools  SciCrunch  Bioconda 
python3-intake
lightweight package for finding and investigating data
Versions of package python3-intake
ReleaseVersionArchitectures
bookworm0.6.6-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.6.6-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream2.0.7
Popcon: 1 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

Intake is a lightweight set of tools for loading and sharing data in data science projects. Intake helps you:

 1. Load data from a variety of formats into containers you already know,
    like Pandas dataframes, Python lists, NumPy arrays and more.
 2. Convert boilerplate data loading code into reusable intake plugins.
 3. Describe data sets in catalog files for easy reuse and sharing
    between projects and with others.
 4. Share catalog information (and data sets) over the network with the
    Intake server.
python3-loompy
access loom formatted files for bioinformatics
Versions of package python3-loompy
ReleaseVersionArchitectures
sid3.0.7+dfsg-3amd64,arm64,mips64el,ppc64el,s390x
bookworm3.0.7+dfsg-2amd64,arm64,mips64el,ppc64el,s390x
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Loom is an efficient file format for very large omics datasets, consisting of a main matrix, optional additional layers, a variable number of row and column annotations. Loom also supports sparse graphs. Loom files are used to store single-cell gene expression data: the main matrix contains the actual expression values (one column per cell, one row per gene); row and column annotations contain metadata for genes and cells, such as Name, Chromosome, Position (for genes), and Strain, Sex, Age (for cells).

Loom files (.loom) are created in the HDF5 file format, which supports an internal collection of numerical multidimensional datasets. HDF5 is supported by many computer languages, including Java, MATLAB, Mathematica, Python, R, and Julia. .loom files are accessible from any language that supports HDF5.

Registry entries: Bioconda 
python3-nanoget
extract information from Oxford Nanopore sequencing data and alignments
Versions of package python3-nanoget
ReleaseVersionArchitectures
trixie1.19.3-1all
bullseye1.12.2-4all
sid1.19.3-1all
bookworm1.16.1-2all
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The Python3 module nanoget provides functions to extract useful metrics from Oxford Nanopore sequencing reads and alignments.

Data can be presented in the following formats, using the following functions:

  • sorted bam file process_bam(bamfile, threads)
  • standard fastq file process_fastq_plain(fastqfile, 'threads')
  • fastq file with metadata from MinKNOW or Albacore process_fastq_rich(fastqfile)
  • sequencing_summary file generated by Albacore process_summary(sequencing_summary.txt, 'readtype')

Fastq files can be compressed using gzip, bzip2 or bgzip. The data is returned as a pandas DataFrame with standardized headernames for convenient extraction. The functions perform logging while being called and extracting data.

The package is enhanced by the following packages: python3-nanoget-examples
python3-nanomath
simple math function for other Oxford Nanopore processing scripts
Versions of package python3-nanomath
ReleaseVersionArchitectures
bullseye1.2.0+ds-1all
bookworm1.2.1+ds-1all
trixie1.2.1+ds-1all
sid1.2.1+ds-1all
upstream1.4.0
Popcon: 0 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

This Python3 module provides a few simple math and statistics functions for other scripts processing Oxford Nanopore sequencing data.

  • Calculate read N50 from a set of lengths get_N50(readlenghts)
  • Remove extreme length outliers from a dataset remove_length_outliers(dataframe, columname)
  • Calculate the average Phred quality of a read ave_qual(qualscores)
  • Write out the statistics report after calling readstats function write_stats(dataframe, outputname)
  • Compute a number of statistics, return a dictionary calc_read_stats(dataframe)
python3-ncls
datastructure for interval overlap queries
Versions of package python3-ncls
ReleaseVersionArchitectures
bullseye0.0.57+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.0.63-hotfix+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.0.63-hotfix+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.0.63-hotfix+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The Nested Containment List is a datastructure for interval overlap queries, like the interval tree. It is usually an order of magnitude faster than the interval tree both for building and query lookups.

The implementation here is a revived version of the one used in the now defunct PyGr library, which died of bitrot. It was now made less memory-consuming and wrapper functions allow batch-querying the NCLS for further speed gains.

This package was implemented to be the cornerstone of the PyRanges project, but was made available to the Python community as a stand-alone library.

Please cite: Endre Bakken Stovner and Pål Sætrom: PyRanges: efficient comparison of genomic intervals in Python. Bioinformatics 36(3):918–919 (2020)
python3-py2bit
access to 2bit files
Versions of package python3-py2bit
ReleaseVersionArchitectures
bookworm0.3.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
bullseye0.3.0-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
trixie0.3.1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
sid0.3.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

From https://genome.ucsc.edu/FAQ/FAQformat.html#format7: A .2bit file stores multiple DNA sequences (up to 4 Gb total) in a compact randomly-accessible format. The file contains masking information as well as the DNA itself.

Registry entries: Bioconda 
python3-pybel
linguaggio per espressioni biologiche
Versions of package python3-pybel
ReleaseVersionArchitectures
bookworm0.14.10-1all
sid0.14.10-1all
trixie0.14.10-1all
buster0.12.1-1all
bullseye0.14.10-1all
upstream0.15.5
Popcon: 2 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

PyBEL è un pacchetto in puro Python per analizzare e gestire reti biologiche codificate in BEL (Biological Expression Language, linguaggio per espressioni biologiche) versione 2. Facilita anche lo scambio di dati tra i formati comuni e i database come NetworkX, JSON, CSV, SIF, Cytoscape, CX, NDEx, SQL e Neo4J.

Questo pacchetto installa la libreria per Python 3.

Please cite: Charles Tapley Hoyt, Andrej Konotopez and Christian Ebeling: PyBEL: a computational framework for Biological Expression Language. (eprint) Bioinformatics 34(4):703–704 (2018)
Registry entries: Bio.tools  Bioconda 
python3-pychopper
identify, orient and trim full-length Nanopore cDNA reads
Versions of package python3-pychopper
ReleaseVersionArchitectures
bullseye2.5.0-1all
sid2.7.10-1all
bookworm2.7.2-1all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Pychopper v2 is a Python module to identify, orient and trim full-length Nanopore cDNA reads. It is also able to rescue fused reads and provides the script 'pychopper.py'. The general approach of Pychopper v2 is the following:

  • Pychopper first identifies alignment hits of the primers across the length of the sequence. The default method for doing this is using nhmmscan with the pre-trained strand specific profile HMMs, included with the package. Alternatively, one can use the edlib backend, which uses a combination of global and local alignment to identify the primers within the read.
  • After identifying the primer hits by either of the backends, the reads are divided into segments defined by two consecutive primer hits. The score of a segment is its length if the configuration of the flanking primer hits is valid (such as SPP,-VNP for forward reads) or zero otherwise.
  • The segments are assigned to rescued reads using a dynamic programming algorithm maximizing the sum of used segment scores (hence the amount of rescued bases). A crucial observation about the algorithm is that if a segment is included as a rescued read, then the next segment must be excluded as one of the primer hits defining it was "used up" by the previous segment. This put constraints on the dynamic programming graph. The arrows in read define the optimal path for rescuing two fused reads with the a total score of l1 + l3.

A crucial parameter of Pychopper v2 is -q, which determines the stringency of primer alignment (E-value in the case of the pHMM backend). This can be explicitly specified by the user, however by default it is optimized on a random sample of input reads to produce the maximum number of classified reads.

Registry entries: Bioconda 
python3-pyfaidx
accesso casuale efficiente per sottosequenze FASTA in Python 3
Versions of package python3-pyfaidx
ReleaseVersionArchitectures
stretch0.4.8.1-1all
trixie0.8.1.3-1all
sid0.8.1.3-1all
buster0.5.5.2-1all
bookworm0.7.1-2all
bullseye0.5.9.2-1all
Popcon: 6 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Samtools fornisce una funzione "faidx" (FAsta InDeX) che crea un piccolo file indice piatto ".fai" che permette un accesso casuale veloce a qualsiasi sottosequenza del file FASTA indicizzato, caricando solo una quantità minima del file in memoria. Questo modulo Python implementa classi Python pure per indicizzazione, recupero e modifica sul posto di file FASTA usando un indice compatibile con samtools. Il modulo pyfaidx è compatibile a livello di API con il modulo seqdb di pygr. Uno script "faidx" a riga di comando viene installato accanto al modulo pyfaidx e facilita manipolazioni complesse di file FASTA senza alcuna conoscenza di programmazione.

Questo pacchetto fornisce i moduli Python 3 per accedere a file FASTA.

Please cite: Matthew D. Shirley, Zhaorong Ma, Brent S. Pedersen and Sarah J. Wheelan: Efficient "pythonic" access to FASTA files using pyfaidx. PeerJ PrePrints 3:e1196 (2015)
Registry entries: Bio.tools 
python3-pyflow
leggero motore per compiti paralleli per Python
Versions of package python3-pyflow
ReleaseVersionArchitectures
bookworm1.1.20-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.20-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.1.20-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

pyFlow è uno strumento per gestire compiti nel contesto di un grafo di dipendenze di compiti. Ha alcune similarità con make. pyFlow non è un programma, è un modulo Python, e i flussi di lavoro sono definiti usando pyFlow scrivendo del normale codice Python con l'API di pyFlow.

python3-pyranges
rappresentazione 2D di intervalli genomici e delle loro annotazioni
Versions of package python3-pyranges
ReleaseVersionArchitectures
sid0.0.111+ds-8all
bullseye0.0.85+ds-1all
trixie0.0.111+ds-8all
bookworm0.0.111+ds-4all
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Un oggetto PyRanges deve avere le colonne Chromosome, Start ed End. Queste descrivono la posizione genomica e funzionano da etichette implicite di riga. Una colonna Strand è opzionale e aggiunge informazioni sul filamento agli intervalli. Ogni altra colonna è permessa ed è considerata metadato.

La struttura può essere riempita a partire da file .bed, .bam o .gff, e anche da rappresentazioni tabellari o testuali.

Please cite: Endre Bakken Stovner and Pål Sætrom: PyRanges: efficient comparison of genomic intervals in Python. Bioinformatics 36(3):918–919 (2020)
Registry entries: Bio.tools  Bioconda 
python3-pyrle
run length arithmetic in Python
Versions of package python3-pyrle
ReleaseVersionArchitectures
bookworm0.0.33-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.0.31-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.0.33-4.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.0.33-4.1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

As opposed to S4Vectors, pyrle does not rotate the shortest vector, but rather extends the shorter Rle with zeroes. This is likely the desired behavior in almost all cases.

python3-pysam
interfaccia al formato SAM/BAM per allineamento e mappatura di sequenze (Python 3)
Versions of package python3-pysam
ReleaseVersionArchitectures
bullseye0.15.4+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
stretch0.10.0+ds-2amd64,arm64,mips64el,ppc64el
trixie0.22.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
sid0.22.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm0.20.0+ds-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
stretch-backports0.14+ds-2~bpo9+1amd64,arm64,mips64el,ppc64el
buster0.15.2+ds-2amd64,arm64
Popcon: 35 users (17 upd.)*
Versions and Archs
License: DFSG free
Git

Pysam è un modulo Python per leggere e manipolare Samfile. È un wrapper leggero per l'API C di samtools. Pysam include anche un'interfaccia per tabix.

Questo pacchetto installa il modulo per Python 3.

The package is enhanced by the following packages: python-pysam-tests
Registry entries: Bio.tools  Bioconda 
python3-tinyalign
rappresentazione numerica delle differenze tra stringhe
Versions of package python3-tinyalign
ReleaseVersionArchitectures
bookworm0.2.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.2.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.2-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.2.2-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Un piccolo modulo Python che fornisce il calcolo della distanza di modifica (alias distanza di Levenshtein, cioè contare inserzioni, delezioni e sostituzioni) e della distanza di Hamming.

Il suo scopo principale è di velocizzare il calcolo della distanza di modifica, permettendo di specificare un numero massimo di differenze maxdiff (banding). Se viene fornito tale parametro, la distanza di modifica restituita è accurata solo fino a maxdiff. Cioè, se l'effettiva distanza di modifica è più grande di maxdiff, viene restituito un valore più grande di maxdiff, ma non necessariamente l'effettiva distanza di modifica.

Registry entries: Bioconda 
q2-alignment
plugin di QIIME 2 per generare e manipolare allineamenti
Versions of package q2-alignment
ReleaseVersionArchitectures
sid2024.5.0-1all
bookworm2022.11.1-2all
bullseye2020.11.1-2all
upstream2024.10.0
Popcon: 22 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-cutadapt
plugin QIIME 2 per lavorare con adattatori in dati di sequenze
Versions of package q2-cutadapt
ReleaseVersionArchitectures
sid2024.5.0-1amd64,arm64,mips64el,ppc64el,riscv64
bullseye2020.11.1-1amd64,arm64,mips64el,ppc64el
bookworm2022.11.1-2amd64,arm64,mips64el,ppc64el
upstream2024.10.0
Popcon: 22 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-dada2
plugin QIIME 2 per lavorare con adattatori in dati di sequenze
Versions of package q2-dada2
ReleaseVersionArchitectures
sid2024.5.0-1amd64
bookworm2022.11.2-2amd64
bullseye2020.11.1-3amd64
upstream2024.10.0
Popcon: 22 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Questo pacchetto fa da wrapper per il pacchetto R dada2 in BioConductor per modellare e correggere errori di ampliconi sequenziati con Illumina. Ciò ha dimostrato di migliorare la sensibilità di analisi di diversità.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-demux
plugin QIIME 2 fare il demultiplexing delle letture di sequenze
Versions of package q2-demux
ReleaseVersionArchitectures
sid2024.5.0+dfsg-1all
bullseye2020.11.1-1all
bookworm2022.11.1+dfsg-2all
upstream2024.10.0
Popcon: 23 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-emperor
plugin QIIME2 per visualizzazione di "ordination plot"
Versions of package q2-emperor
ReleaseVersionArchitectures
sid2024.5.0-2all
bookworm2022.11.1-2all
upstream2024.10.0
Popcon: 22 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-feature-classifier
plugin QIIME 2 per gestione di classificazione tassonomica
Versions of package q2-feature-classifier
ReleaseVersionArchitectures
bookworm2022.11.1-2all
sid2024.2.0-1all
bullseye2020.11.1-2all
upstream2024.10.0
Popcon: 22 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
Registry entries: Bio.tools 
q2-feature-table
plugin QIIME 2 per gestione di operazioni su tabelle di caratteristiche
Versions of package q2-feature-table
ReleaseVersionArchitectures
sid2024.5.0+dfsg-1all
bookworm2022.11.1+dfsg-2all
bullseye2020.11.1+dfsg-1all
upstream2024.10.0
Popcon: 23 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-fragment-insertion
plugin di QIIME 2 per inserzione di frammenti
Versions of package q2-fragment-insertion
ReleaseVersionArchitectures
sid2024.5.0-1amd64,arm64,mips64el,ppc64el,riscv64
bookworm2022.11.1-3amd64,arm64,mips64el,ppc64el
upstream2024.10.0
Popcon: 22 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-metadata
plugin per QIIME 2 per lavorare con Metadati e visualizzarli
Versions of package q2-metadata
ReleaseVersionArchitectures
bookworm2022.8.0-1amd64,arm64,mips64el,ppc64el
bullseye2020.11.1+dfsg-1amd64,arm64,mips64el,ppc64el
sid2024.5.0+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64
upstream2024.10.0
Popcon: 22 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-phylogeny
plugin QIIME 2 per filogenia
Versions of package q2-phylogeny
ReleaseVersionArchitectures
bookworm2022.11.1-3amd64
sid2024.5.0-1amd64
experimental2022.11.1-1all
upstream2024.10.0
Popcon: 22 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

Plugin QIIME 2 per ricostruzione filogenetica e operazioni su alberi filogenetici.

q2-quality-control
plugin QIIME 2 per controllo qualità di dati di caratteristiche e sequenze
Versions of package q2-quality-control
ReleaseVersionArchitectures
bullseye2020.11.1-3all
sid2024.5.0-1all
bookworm2022.11.1-2all
upstream2024.10.0
Popcon: 22 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-quality-filter
plugin QIIME 2 per filtraggio e taglio basato su PHRED
Versions of package q2-quality-filter
ReleaseVersionArchitectures
bookworm2022.11.1-2all
sid2024.5.0-1all
bullseye2020.11.1-2all
upstream2024.10.0
Popcon: 22 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-sample-classifier
plugin QIIME 2 per la predizione con apprendimento macchina di dati campionari
Versions of package q2-sample-classifier
ReleaseVersionArchitectures
sid2024.5.0-2all
bookworm2022.11.1-3all
bullseye2020.11.1-3all
upstream2024.10.0
Popcon: 22 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Gli studi sul microbioma spesso mirano a predire risultati o a differenziare campioni sulla base della loro composizione microbica, compiti che possono essere effettuati efficientemente da metodi di apprendimento supervisionato. Il plugin q2-sample-classifier rende tali metodi più accessibili, riproducibili e interpretabili per una vasta platea di microbiologi, clinici e altri che desiderano utilizzare metodi di apprendimento supervisionato per predire caratteristiche dei campioni sulla base della composizione del microbioma o altri dati di "omica".

Registry entries: Bio.tools 
q2-taxa
plugin QIIME 2 per lavorare con annotazioni tassonomiche di caratteristiche
Versions of package q2-taxa
ReleaseVersionArchitectures
bookworm2022.11.1+dfsg-2all
bullseye2020.11.1+dfsg-2all
sid2024.5.0+dfsg-1all
upstream2024.10.0
Popcon: 22 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-types
plugin QIIME 2 che definisce tipi per analisi di microbioma
Versions of package q2-types
ReleaseVersionArchitectures
bookworm2022.11.1-2all
sid2024.5.0-1all
bullseye2020.11.1-1all
upstream2024.10.0
Popcon: 22 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2cli
interfaccia a riga di comando basata su clic per QIIME 2
Versions of package q2cli
ReleaseVersionArchitectures
bullseye2020.11.1-1all
sid2024.5.0-2all
bookworm2022.11.1-2all
upstream2024.10.1
Popcon: 23 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2templates
pacchetto per modello di struttura per plugin QIIME 2
Versions of package q2templates
ReleaseVersionArchitectures
bullseye2020.11.1+dfsg-1all
bookworm2022.11.1+ds-2all
sid2024.5.0+ds-1all
trixie2024.5.0+ds-1all
upstream2024.10.0
Popcon: 25 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 è un pacchetto per analisi del microbioma potente, estensibile e decentralizzato con attenzione a trasparenza di analisi e dati. QIIME2 permette ai ricercatori di iniziare un'analisi con dati di sequenze di DNA grezze e finire con figure di qualità di pubblicazione e risultati statistici. Caratteristiche principali:

  • tracciamento integrato e automatico della provenienza dei dati;
  • sistema di tipi semantici;
  • sistema a plugin per estendere le funzionalità di analisi del microbioma;
  • gestione per più tipi di interfacce utente (es. API, riga di comando, grafica).

QIIME 2 è un completo rifacimento e riscrittura della catena di analisi di microbioma QIIME 1. QIIME 2 risolve molte delle limitazioni di QIIME 1 mantenendo al contempo le funzionalità che fanno di QIIME 1 una catena di analisi potente e ampiamente utilizzata.

QIIME 2 attualmente gestisce una catena di elaborazione iniziale end-to-end per analisi del microbioma. Nuove funzionalità diventeranno regolarmente disponibili attraverso plugin per QIIME 2. Si può vedere un elenco dei plugin attualmente disponibili sulla pagina dei plugin disponibili di QIIME 2. La pagina dei plugin futuri elenca i plugin che sono in fase di sviluppo.

Questo pacchetto fornisce modelli per plugin QIIME2.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
r-bioc-annotationhub
client GNU R per accedere a risorse AnnotationHug
Versions of package r-bioc-annotationhub
ReleaseVersionArchitectures
stretch2.6.4-1all
bookworm3.6.0+dfsg-1all
buster2.14.3+dfsg-1all
trixie3.12.0+dfsg-1all
sid3.12.0+dfsg-1all
bullseye2.22.0+dfsg-1all
upstream3.14.0
Popcon: 15 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

Questo pacchetto fornisce un client per la risorsa web AnnotationHub per Bioconductor. La risorsa web AnnotationHub fornisce una posizione centralizzata in cui possono essere trovati file genomici (es. VCF, bed, wig) e altre risorse da posizioni standard (es. UCSC, Ensembl). Le risorse includono metadati su ciascuna risorsa, es. una descrizione testuale, etichette e data di modifica. Il client crea e gestisce una cache locale di file recuperati dall'utente, favorendo un accesso veloce e riproducibile.

Registry entries: Bio.tools 
r-bioc-aroma.light
BioConductor methods normalization and visualization of microarray data
Versions of package r-bioc-aroma.light
ReleaseVersionArchitectures
buster3.12.0-1all
trixie3.34.0-1all
bookworm3.28.0-1all
bullseye3.20.0-1all
stretch3.4.0-1all
sid3.34.0-1all
upstream3.36.0
Popcon: 6 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

This BioConductor module provides light-weight methods for normalization and visualization of microarray data using only basic R data types.

Methods for microarray analysis that take basic data types such as matrices and lists of vectors. These methods can be used standalone, be utilized in other packages, or be wrapped up in higher-level classes.

Please cite: Henrik Bengtsson, Pierre Neuvial and Terence P. Speed: TumorBoost: Normalization of allele-specific tumor copy numbers from a single pair of tumor-normal genotyping microarrays. (PubMed,eprint) BMC Bioinformatics 11:245 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-beachmat
I/O for several formats storing matrix data
Versions of package r-bioc-beachmat
ReleaseVersionArchitectures
bookworm2.14.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie2.20.0+ds-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
sid2.20.0+ds-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye2.6.4+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream2.22.0
Popcon: 8 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Provides a consistent C++ class interface for reading from and writing data to a variety of commonly used matrix types. Ordinary matrices and several sparse/dense Matrix classes are directly supported, third-party S4 classes may be supported by external linkage, while all other matrices are handled by DelayedArray block processing.

r-bioc-biocneighbors
Nearest Neighbor Detection for Bioconductor Packages
Versions of package r-bioc-biocneighbors
ReleaseVersionArchitectures
bullseye1.8.2+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.22.0+ds-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm1.16.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.22.0+ds-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
upstream2.0.0
Popcon: 8 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Implements exact and approximate methods for nearest neighbor detection, in a framework that allows them to be easily switched within Bioconductor packages or workflows. Exact searches can be performed using the k-means for k-nearest neighbors algorithm or with vantage point trees. Approximate searches can be performed using the Annoy or HNSW libraries. Searching on either Euclidean or Manhattan distances is supported. Parallelization is achieved for all methods by using BiocParallel. Functions are also provided to search for all neighbors within a given distance.

r-bioc-biocsingular
decomposizione ai valori singolari per pacchetti Bioconductor
Versions of package r-bioc-biocsingular
ReleaseVersionArchitectures
sid1.20.0+ds-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.20.0+ds-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye1.6.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm1.14.0+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.22.0
Popcon: 8 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Implementa metodi esatti ed approssimati per decomposizione ai valori singolari e analisi delle componenti principali in un'infrastruttura che permette di commutarli facilmente all'interno di pacchetti o flussi di lavoro Bioconductor. Dove possibile la parallelizzazione è ottenuta usando l'infrastruttura BiocParallel.

r-bioc-ctc
conversione di cluster e alberi (Cluster and Tree Conversion)
Versions of package r-bioc-ctc
ReleaseVersionArchitectures
trixie1.78.0-1all
bookworm1.72.0-1all
bullseye1.64.0-1all
sid1.78.0-1all
upstream1.80.0
Popcon: 2 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

Strumenti per esportare e importare cluster e alberi di classificazione in altri programmi.

Registry entries: Bioconda 
r-bioc-dnacopy
R package: DNA copy number data analysis
Versions of package r-bioc-dnacopy
ReleaseVersionArchitectures
bookworm1.72.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.78.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster1.56.0-1amd64,arm64,armhf,i386
stretch1.48.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
trixie1.78.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye1.64.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.80.0
Popcon: 6 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Implements the circular binary segmentation (CBS) algorithm to segment DNA copy number data and identify genomic regions with abnormal copy number.

This package is for analyzing array DNA copy number data, which is usually (but not always) called array Comparative Genomic Hybridization (array CGH) data It implements a methodology for finding change-points in these data which are points after which the (log) test over reference ratios have changed location. This model is that the change-points correspond to positions where the underlying DNA copy number has changed. Therefore, change-points can be used to identify regions of gained and lost copy number. Also provided is a function for making relevant plots of these data.

Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-ensembldb
utilità per GNU R per creare e usare un database di annotazioni basato su Ensembl
Versions of package r-bioc-ensembldb
ReleaseVersionArchitectures
stretch1.6.2-1all
buster2.6.5+dfsg-1all
trixie2.28.1+dfsg-1all
bullseye2.14.0+dfsg-1all
sid2.28.1+dfsg-1all
bookworm2.22.0+dfsg-1all
upstream2.30.0
Popcon: 16 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Il pacchetto fornisce funzioni per creare ed usare database/pacchetti di annotazioni relative a trascritti. Le annotazioni per i database sono ottenute direttamente da Ensembl usando la sua API Perl. Le funzionalità e i dati sono simili a quelli dei pacchetti TxDb dal pacchetto GenomicFeatures, ma oltre a recuperare tutti i modelli e annotazioni per geni/trascritti dal database, il pacchetto ensembldb fornisce anche un'infrastruttura per filtri che permette di recuperare annotazioni per voci specifiche come geni codificati su una regione di cromosoma o modelli di trascritti di geni lincRNA.

Registry entries: Bio.tools  Bioconda 
r-bioc-experimenthub
BioConductor client to access ExperimentHub resources
Versions of package r-bioc-experimenthub
ReleaseVersionArchitectures
trixie2.12.0+ds-1all
bookworm2.6.0+ds-1all
bullseye1.16.0+ds-1all
sid2.12.0+ds-1all
upstream2.14.0
Popcon: 13 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

This package provides a client for the Bioconductor ExperimentHub web resource. ExperimentHub provides a central location where curated data from experiments, publications or training courses can be accessed. Each resource has associated metadata, tags and date of modification. The client creates and manages a local cache of files retrieved enabling quick and reproducible access.

r-bioc-geneplotter
pacchetto R di funzioni per disegnare dati genomici
Versions of package r-bioc-geneplotter
ReleaseVersionArchitectures
trixie1.82.0+dfsg-1all
bullseye1.68.0-1all
stretch1.52.0-2all
bookworm1.76.0-1all
buster1.60.0-1all
sid1.82.0+dfsg-1all
upstream1.84.0
Popcon: 21 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

geneplotter contiene funzioni di disegno per microarray.

Le funzioni cPlot e cColor permettono all'utente di associare dati di espressione di microarray con posizioni sui cromosomi. I grafici possono includere qualsiasi sottoinsieme (in modo predefinito vengono mostrati tutti i cromosomi) dei cromosomi per l'organismo considerato.

Registry entries: Bio.tools  Bioconda 
r-bioc-genomicalignments
rappresentazione e manipolazione di allineamenti genomici corti per BioConductor
Versions of package r-bioc-genomicalignments
ReleaseVersionArchitectures
bullseye1.26.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.40.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.40.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster1.18.1-1amd64,arm64,armhf,i386
bookworm1.34.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.0.6-1amd64,armel,armhf,i386
stretch1.10.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream1.42.0
Popcon: 23 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Questo pacchetto BioConductor fornisce contenitori efficienti per memorizzare e manipolare allineamenti genomici corti (ottenuti tipicamente allineando letture corte ad un genoma di riferimento). Ciò include contare le letture, calcolare la copertura, rilevare le giunzioni e lavorare con il contenuto in nucleotidi degli allineamenti.

Please cite: Michael Lawrence, Wolfgang Huber, Hervé Pagès, Patrick Aboyoun, Marc Carlson, Robert Gentleman, Martin T. Morgan and Vincent J. Carey: Software for Computing and Annotating Genomic Ranges. (PubMed,eprint) PLoS Computational Biology 9(8):e1003118 (2013)
Registry entries: Bio.tools  Bioconda 
r-bioc-genomicfiles
Distributed computing by file or by range
Versions of package r-bioc-genomicfiles
ReleaseVersionArchitectures
bookworm1.34.0-1all
trixie1.40.0+dfsg-1all
sid1.40.0+dfsg-1all
bullseye1.26.0-1all
upstream1.42.0
Popcon: 2 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

This package provides infrastructure for parallel computations distributed 'by file' or 'by range'. User defined MAPPER and REDUCER functions provide added flexibility for data combination and manipulation.

Registry entries: Bio.tools  Bioconda 
r-bioc-genomicranges
rappresentazione e manipolazione di intervalli genomici di BioConductor
Versions of package r-bioc-genomicranges
ReleaseVersionArchitectures
jessie1.16.4-2amd64,armel,armhf,i386
bullseye1.42.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.26.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.56.2+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie1.56.1+dfsg-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
buster1.34.0+dfsg-1amd64,arm64,armhf,i386
bookworm1.50.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.58.0
Popcon: 31 users (9 upd.)*
Newer upstream!
License: DFSG free
Git

La capacità di archiviare in modo efficiente le annotazioni e gli allineamenti genomici ha un ruolo centrale nell'analisi di dati di sequenziamento ad alte prestazioni (alias dati NGS). Il pacchetto definisce contenitori generici per archiviare intervalli genomici oltre a contenitori più specializzati per archiviare allineamenti rispetto ad un genoma di riferimento.

Registry entries: Bio.tools  SciCrunch  Bioconda 
r-bioc-go.db
annotation maps describing the entire Gene Ontology
Versions of package r-bioc-go.db
ReleaseVersionArchitectures
sid3.19.1-1all
trixie3.19.1-1all
bookworm3.16.0-1all
stretch3.4.0-1all
bullseye3.12.1-1all
buster3.7.0-1all
upstream3.20.0
Popcon: 23 users (7 upd.)*
Newer upstream!
License: DFSG free
Git

This package is part of BioConductor and provides a set of annotation maps describing the entire Gene Ontology assembled using data from GO.

The package helps running the test suites of some BioConductor packages.

Registry entries: Bioconda 
r-bioc-grohmm
GRO-seq Analysis Pipeline
Versions of package r-bioc-grohmm
ReleaseVersionArchitectures
bookworm1.32.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.38.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bullseye1.24.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.38.0-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

This BioConductor package provides a pipeline for the analysis of GRO- seq data. Among the more advanced features, r-bioc-grohmm predicts the boundaries of transcriptional activity across the genome de novo using a two-state hidden Markov model (HMM).

The used model essentially divides the genome into transcribed and non- transcribed regions in a strand specific manner. HMMs are used to identify the leading edge of Pol II at genes activated by a stimulus in GRO-seq time course data. This approach allows the genome-wide interrogation of transcription rates in cells.

Please cite: Minho Chae, Charles G. Danko and and W. Lee Kraus: groHMM: a computational tool for identifying unannotated and cell type-specific transcription units from global run-on sequencing data. (PubMed) BMC Bioinformatics 16:222.0 (2015)
Registry entries: Bio.tools  Bioconda 
r-bioc-gviz
disegno di dati e informazioni di annotazioni vicino a coordinate genomiche
Versions of package r-bioc-gviz
ReleaseVersionArchitectures
buster1.26.4-1all
bullseye1.34.0+dfsg-1all
stretch1.18.1-1all
bookworm1.42.1+dfsg-1all
sid1.48.0+dfsg-1all
trixie1.48.0+dfsg-1all
jessie1.8.4-1all
upstream1.50.0
Popcon: 6 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Le analisi di dati genomici richiedono una visualizzazione integrata delle informazioni genomiche note e dei nuovi dati sperimentali. Gviz usa i pacchetti biomaRt e rtracklayer per effettuare le interrogazioni dal vivo delle annotazioni su Ensembl e UCSC e le traduce, ad esempio, in strutture gene/trascritto in viewport del pacchetto grafico grid. Ciò porta al disegno delle informazioni genomiche insieme ai dati dell'utente.

Please cite: Michael Lawrence, Robert Gentleman and "Vincent Carey: rtracklayer: an R package for interfacing with genome browsers. (PubMed,eprint) Bioinformatics 25(14):1841-1842 (2009)
Registry entries: Bio.tools  Bioconda 
r-bioc-isoformswitchanalyzer
Identify, Annotate and Visualize Alternative Splicing and
Versions of package r-bioc-isoformswitchanalyzer
ReleaseVersionArchitectures
sid2.4.0+ds-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
trixie2.4.0+ds-1amd64,arm64,mips64el,ppc64el,riscv64,s390x
bookworm1.20.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream2.6.0
Popcon: 1 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

Isoform Switches with Functional Consequences from both short- and long-read RNA-seq data. Analysis of alternative splicing and isoform switches with predicted functional consequences (e.g. gain/loss of protein domains etc.) from quantification of all types of RNASeq by tools such as Kallisto, Salmon, StringTie, Cufflinks/Cuffdiff etc.

Registry entries: Bio.tools  Bioconda 
r-bioc-org.hs.eg.db
annotazioni a livello di tutto genoma per l'Uomo
Versions of package r-bioc-org.hs.eg.db
ReleaseVersionArchitectures
bullseye3.12.0-1all
bookworm3.16.0-1all
trixie3.19.1-1all
sid3.19.1-1all
upstream3.20.0
Popcon: 19 users (2 upd.)*
Newer upstream!
License: DFSG free
Git

Questo pacchetto fornisce le descrizioni di parti del genoma umano che sono state identificate come codificanti RNA, e probabilmente anche per proteine. Offre anche collegamenti a voci di geni equivalenti (ortologhi) in altre specie.

Questo pacchetto è preparato dalla comunità di BioConductor e contribuisce a molti flussi di lavoro e analisi di routine in biologia computazionale.

Registry entries: Bioconda 
r-bioc-qusage
qusage: Quantitative Set Analysis for Gene Expression
Versions of package r-bioc-qusage
ReleaseVersionArchitectures
bookworm2.32.0-1all
trixie2.38.0-1all
sid2.38.0-1all
bullseye2.24.0-1all
upstream2.40.0
Popcon: 2 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

This package is an implementation the Quantitative Set Analysis for Gene Expression (QuSAGE) method described in (Yaari G. et al, Nucl Acids Res, 2013). This is a novel Gene Set Enrichment-type test, which is designed to provide a faster, more accurate, and easier to understand test for gene expression studies. qusage accounts for inter-gene correlations using the Variance Inflation Factor technique proposed by Wu et al. (Nucleic Acids Res, 2012). In addition, rather than simply evaluating the deviation from a null hypothesis with a single number (a P value), qusage quantifies gene set activity with a complete probability density function (PDF). From this PDF, P values and confidence intervals can be easily extracted. Preserving the PDF also allows for post-hoc analysis (e.g., pair-wise comparisons of gene set activity) while maintaining statistical traceability. Finally, while qusage is compatible with individual gene statistics from existing methods (e.g., LIMMA), a Welch-based method is implemented that is shown to improve specificity. For questions, contact Chris Bolen (cbolen1@gmail.com) or Steven Kleinstein (steven.kleinstein@yale.edu)

Please cite: Gur Yaari, Christopher R. Bolen, Juilee Thakar and Steven H. Kleinstein: Quantitative set analysis for gene expression: a method to quantify gene set differential expression including gene-gene correlations. (PubMed,eprint) Nucleic Acids Res. 41(18):e170 (2013)
Registry entries: Bioconda 
r-bioc-savr
analisi di file SAV di Illumina per GNU R
Versions of package r-bioc-savr
ReleaseVersionArchitectures
trixie1.37.0-4all
bullseye1.28.0-1all
stretch1.12.0-1all
sid1.37.0-4all
buster1.20.0-1all
bookworm1.36.0-2all
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Questo modulo BioConductor permette di analizzare file SAV (Sequence Analysis Viewer) di Illumina, accedere ai dati e generare grafici QC.

Registry entries: Bio.tools  Bioconda 
r-bioc-singlecellexperiment
S4 Classes for Single Cell Data
Versions of package r-bioc-singlecellexperiment
ReleaseVersionArchitectures
sid1.26.0+ds-1all
bookworm1.20.0+ds-1all
bullseye1.12.0+ds-1all
trixie1.26.0+ds-1all
upstream1.28.1
Popcon: 17 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Defines a S4 class for storing data from single-cell experiments. This includes specialized methods to store and retrieve spike-in information, dimensionality reduction coordinates and size factors for each cell, along with the usual metadata for genes and libraries.

r-bioc-structuralvariantannotation
Variant annotations for structural variants
Versions of package r-bioc-structuralvariantannotation
ReleaseVersionArchitectures
bookworm1.13.0+ds-1all
sid1.20.0+ds-1all
trixie1.20.0+ds-1all
upstream1.22.0
Popcon: 1 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

StructuralVariantAnnotation contains useful helper functions for dealing with structural variants in VCF format. The packages contains functions for parsing VCFs from a number of popular callers as well as functions for dealing with breakpoints involving two separate genomic loci encoded as GRanges objects.

Registry entries: Bio.tools  Bioconda 
r-bioc-tximport
transcript-level estimates for biological sequencing
Versions of package r-bioc-tximport
ReleaseVersionArchitectures
trixie1.32.0+dfsg-1all
sid1.32.0+dfsg-1all
bookworm1.26.1+dfsg-1all
bullseye1.18.0+dfsg-1all
upstream1.34.0
Popcon: 9 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

Imports transcript-level abundance, estimated counts and transcript lengths, and summarizes into matrices for use with downstream gene-level analysis packages. Average transcript length, weighted by sample-specific transcript abundance estimates, is provided as a matrix which can be used as an offset for different expression of gene-level counts.

Please cite: Charlotte Soneson, Michael I. Love and Mark D. Robinson: Differential analyses for RNA-seq: transcript-level estimates improve gene-level inferences. F1000Research 4:1521 (2015)
Registry entries: Bio.tools  Bioconda 
r-cran-amap
un altro pacchetto di analisi multidimensionale
Versions of package r-cran-amap
ReleaseVersionArchitectures
trixie0.8-19-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.8-19-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.8-20-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye0.8-18-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Strumenti per raggruppamento in cluster e analisi delle componenti principali (PCA) (con metodi robusti e funzioni parallelizzate).

r-cran-biwt
biweight mean vector and covariance and correlation
Versions of package r-cran-biwt
ReleaseVersionArchitectures
trixie1.0.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.0.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Compute multivariate location, scale, and correlation estimates based on Tukey's biweight M-estimator.

r-cran-boolnet
assemblaggio, analisi e visualizzazione di reti booleane
Versions of package r-cran-boolnet
ReleaseVersionArchitectures
trixie2.1.9-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch2.1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie2.0-1amd64,armel,armhf,i386
buster2.1.4-1amd64,arm64,armhf,i386
bullseye2.1.5-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.1.9-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm2.1.7-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 6 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

BoolNet è un pacchetto R che fornisce strumenti per assemblare, analizzare e visualizzare reti booleane sincrone e asincrone, così come reti booleane probabilistiche.

Please cite: Christoph Muessel, Martin Hopfensitz and Hans A. Kestler: BoolNet -- an R package for generation, reconstruction and analysis of Boolean networks. (eprint) Bioinformatics 26(6):1378-1380 (2010)
r-cran-corrplot
visualizzazione di una matrice di correlazione
Versions of package r-cran-corrplot
ReleaseVersionArchitectures
trixie0.94-1all
bookworm0.92-1all
buster-backports0.84-3~bpo10+1all
bullseye0.84-3all
sid0.94-1all
upstream0.95
Popcon: 44 users (23 upd.)*
Newer upstream!
License: DFSG free
Git

Una visualizzazione grafica di una matrice di correlazione o matrice generica. Contiene anche alcuni algoritmi per il riordinamento di matrici. In aggiunta, corrplot è buono a curare i dettagli, inclusi la scelta dei colori, le etichette di testo, le etichette colorate, la disposizione, ecc.

r-cran-dynamictreecut
Methods for Detection of Clusters in Hierarchical Clustering
Versions of package r-cran-dynamictreecut
ReleaseVersionArchitectures
bullseye1.63-1-3all
sid1.63-1-3all
trixie1.63-1-3all
bookworm1.63-1-3all
Popcon: 29 users (70 upd.)*
Versions and Archs
License: DFSG free
Git

Dendrograms Contains methods for detection of clusters in hierarchical clustering dendrograms.

r-cran-epir
funzioni GNU R per analisi di dati epidemiologici
Versions of package r-cran-epir
ReleaseVersionArchitectures
bullseye2.0.19-1all
jessie0.9-59-1all
bookworm2.0.57+dfsg-1all
stretch0.9-79-1all
buster0.9-99-1all
sid2.0.76+dfsg-1all
Debtags of package r-cran-epir:
devellang:r
fieldmedicine
interfacecommandline
roleprogram
useanalysing
Popcon: 44 users (30 upd.)*
Versions and Archs
License: DFSG free
Git

Un pacchetto per analizzare dati epidemiologici. Contiene funzioni per regolare direttamente e indirettamente misure della frequenza di malattie, quantificare misure di associazioni sulla base di strati singoli o multipli di dati numerici presentati in una tabella di contingenza e calcolare intervalli di confidenza sul rischio di incidenza e le stime delle percentuali di incidenza. Sono fornite funzioni varie per l'uso in meta-analisi, interpretazione di test diagnostici e calcoli della dimensione del campione.

r-cran-fitdistrplus
support fit of parametric distribution
Versions of package r-cran-fitdistrplus
ReleaseVersionArchitectures
buster-backports1.1-3-1~bpo10+1all
sid1.2-1-1all
bookworm1.1-8-1all
bullseye1.1-3-1all
trixie1.2-1-1all
stretch-backports-sloppy1.1-1-1~bpo9+1all
Popcon: 7 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Extends the fitdistr() function (of the MASS package) with several functions to help the fit of a parametric distribution to non-censored or censored data. Censored data may contain left censored, right censored and interval censored values, with several lower and upper bounds. In addition to maximum likelihood estimation (MLE), the package provides moment matching (MME), quantile matching (QME) and maximum goodness-of-fit estimation (MGE) methods (available only for non-censored data). Weighted versions of MLE, MME and QME are available. See e.g. Casella & Berger (2002). Statistical inference. Pacific Grove.

Please cite: Marie Laure Delignette-Muller Christophe Dutang: fitdistrplus: An R Package for Fitting Distributions. Journal of Statistical Software 64(4):1-34 (2015)
r-cran-forecast
GNU R forecasting functions for time series and linear models
Versions of package r-cran-forecast
ReleaseVersionArchitectures
bullseye8.13-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm8.20-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie8.23.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid8.23.0-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 52 users (24 upd.)*
Versions and Archs
License: DFSG free
Git

Methods and tools for displaying and analysing univariate time series forecasts including exponential smoothing via state space models and automatic ARIMA modelling.

r-cran-gprofiler2
Interface to the 'g:Profiler' Toolset
Versions of package r-cran-gprofiler2
ReleaseVersionArchitectures
trixie0.2.3+dfsg-1all
bookworm0.2.1+dfsg-1all
sid0.2.3+dfsg-1all
Popcon: 3 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

A toolset for functional enrichment analysis and visualization, gene/protein/SNP identifier conversion and mapping orthologous genes across species via 'g:Profiler' (https://biit.cs.ut.ee/gprofiler). The main tools are: (1) 'g:GOSt' - functional enrichment analysis and visualization of

    gene lists;
(2) 'g:Convert' - gene/protein/transcript identifier conversion across
    various namespaces;
(3) 'g:Orth' - orthology search across species;

(4) 'g:SNPense' - mapping SNP rs identifiers to chromosome positions,

    genes and variant effects This package is an R interface
    corresponding to the 2019 update of 'g:Profiler' and provides access
    to 'g:Profiler' for versions 'e94_eg41_p11' and higher. See the
    package 'gProfileR' for accessing older versions from the
    'g:Profiler' toolset.
Registry entries: Bio.tools  SciCrunch 
r-cran-minerva
Maximal Information-Based Nonparametric Exploration
Versions of package r-cran-minerva
ReleaseVersionArchitectures
bullseye1.5.8-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie1.5.10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm1.5.10-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.5.10-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 3 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Wrapper for 'minepy' implementation of Maximal Information-based Nonparametric Exploration statistics (MIC and MINE family). Detailed information of the ANSI C implementation of 'minepy' can be found at http://minepy.readthedocs.io/en/latest.

r-cran-optimalcutpoints
calcolo dei punti di cut-off ottimali in test diagnostici
Versions of package r-cran-optimalcutpoints
ReleaseVersionArchitectures
trixie1.1-5-1all
sid1.1-5-1all
bookworm1.1-5-1all
bullseye1.1-4-2all
Popcon: 3 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Calcola cut-off ottimali per test diagnostici o marcatori continui. Sono stati implementati vari approcci per selezionare cutoff ottimali, inclusi metodi basati su analisi dei costi-benefici e misure di accuratezza dei test (sensitività/specificità, valori predittivi e rapporti di verosimiglianza diagnostica). È facile ottenere un output numerico e grafico per tutti i metodi.

Please cite: Mónica López-Ratón María Xosé Rodríguez-Álvarez, Carmen Cadarso Suárez and Francisco Gude Sampedro: OptimalCutpoints: An R Package for Selecting Optimal Cutpoints in Diagnostic Tests. Journal of Statistical Software 61(8):1-36 (2014)
r-cran-parmigene
Parallel Mutual Information to establish Gene Networks
Versions of package r-cran-parmigene
ReleaseVersionArchitectures
bookworm1.1.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.1.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.1.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 4 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

The package provides a parallel estimation of the mutual information based on entropy estimates from k-nearest neighbors distances and algorithms for the reconstruction of gene regulatory networks.

r-cran-pheatmap
pacchetto GNU R per creare belle mappe di calore
Versions of package r-cran-pheatmap
ReleaseVersionArchitectures
buster1.0.12-1all
bullseye1.0.12-2all
sid1.0.12-2all
stretch1.0.8-1all
trixie1.0.12-2all
bookworm1.0.12-2all
Popcon: 29 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Implementazione per GNU R di mappe di calore che offre più controllo sulle dimensioni e sull'aspetto.

Registry entries: Bio.tools 
r-cran-qqman
pacchetto R per visualizzare i risultati di GWAS usando grafi Q-Q e Manhattan
Versions of package r-cran-qqman
ReleaseVersionArchitectures
trixie0.1.9+dfsg-1all
stretch0.1.2-1all
buster0.1.4-6all
bookworm0.1.8+dfsg-1all
bullseye0.1.4-7all
sid0.1.9+dfsg-1all
Popcon: 5 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

qqman è un pacchetto aggiuntivo per l'ambiente statistico R. Questo pacchetto fornisce funzioni per visualizzare risultati di studi di associazione a livello di tutto il genoma (GWAS, Genome-Wide Association Study) utilizzando grafi Manhattan e Quantile-Quantile.

r-cran-rcpphnsw
R bindings for a Library for Approximate Nearest Neighbors
Versions of package r-cran-rcpphnsw
ReleaseVersionArchitectures
sid0.5.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.4.1+ds-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.3.0.9001+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.5.0+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
upstream0.6.0
Popcon: 11 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

'Hnswlib' is a C++ library for Approximate Nearest Neighbors. This package provides a minimal R interface by relying on the 'Rcpp' package. See https://github.com/nmslib/hnswlib for more on 'hnswlib'. 'hnswlib' is released under Version 2.0 of the Apache License.

r-cran-rentrez
interfaccia GNU R all'API EUtils di NCBI
Versions of package r-cran-rentrez
ReleaseVersionArchitectures
trixie1.2.3+dfsg-1all
sid1.2.3+dfsg-1all
buster1.2.1-2all
stretch1.0.4-1all
bullseye1.2.3+dfsg-1all
bookworm1.2.3+dfsg-1all
Popcon: 11 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Fornisce un'interfaccia R all'API EUtils di NCBI permettendo agli utenti di cercare in database come GenBank e PubMed, elaborare i risultati di queste ricerche e inserire i dati nelle loro sessioni di R.

r-cran-sctransform
Variance Stabilizing Transformations for Single Cell UMI Data
Versions of package r-cran-sctransform
ReleaseVersionArchitectures
trixie0.4.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
sid0.4.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm0.3.5-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.3.2-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

A normalization method for single-cell UMI count data using a variance stabilizing transformation. The transformation is based on a negative binomial regression model with regularized parameters. As part of the same regression framework, this package also provides functions for batch correction, and data correction. See Hafemeister and Satija 2019 for more details.

Registry entries: Bio.tools 
resfinder-db
il database di ResFinder è un database curato di geni acquisiti di resistenza
Versions of package resfinder-db
ReleaseVersionArchitectures
sid0.0+git20220524.fa32d9a-1all
trixie0.0+git20220524.fa32d9a-1all
bullseye0.0+git20200408.0322c0d-1all
bookworm0.0+git20220524.fa32d9a-1all
upstream0.0+git20240923.e0525f2
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

ResFinder identifica geni acquisiti di resistenza agli antimicrobici in isolati batterici totalmente o parzialmente sequenziati.

ResFinder usa BLAST per l'identificazione di geni acquisiti di resistenza agli antimicrobici in dati di genomi interi. Come input il metodo può usare sia genomi completi o parziali pre-assemblati sia letture corte di sequenze da quattro diverse piattaforme di sequenziamento. Il metodo è stato valutato su 1862 file GenBank contenenti 1411 differenti geni di resistenza, oltre a 23 isolati sequenziati de-novo.

Questo pacchetto fornisce il database necessario a resfinder.

Please cite: Ea Zankari, Henrik Hasman, Salvatore Cosentino, Martin Vestergaard, Simon Rasmussen, Ole Lund, Frank M. Aarestrup and Mette Voldby Larsen: Identification of acquired antimicrobial resistance genes. (PubMed,eprint) Journal of Antimicrobial Chemotherapy 67(11):2640-4 (2012)
science-workflow
sistemi di gestione dei flussi di lavoro per ricerca scientifica
Versions of package science-workflow
ReleaseVersionArchitectures
trixie1.14.6all
buster1.10all
bullseye1.14.2all
bookworm1.14.5all
sid1.14.6all
stretch1.7all
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Questo task elenca alcuni pacchetti che forniscono sistemi di gestione dei flussi di lavoro utili per la ricerca scientifica.

Debian packages in contrib or non-free

arb
phylogenetic sequence analysis suite - main program
Versions of package arb
ReleaseVersionArchitectures
buster6.0.6-4 (non-free)amd64,i386
sid6.0.6-8 (non-free)amd64,arm64,armel,armhf,i386,mips64el,riscv64,s390x
trixie6.0.6-8 (non-free)amd64,arm64,armel,armhf,i386,mips64el,riscv64,s390x
bookworm6.0.6-5 (non-free)amd64,i386
bullseye6.0.6-4 (non-free)amd64,i386
stretch6.0.6-1 (non-free)amd64,i386
jessie6.0.2-1+deb8u1 (non-free)amd64,i386
upstream7.0
Debtags of package arb:
fieldbiology
roleprogram
uitoolkitmotif
x11application
Popcon: 0 users (0 upd.)*
Newer upstream!
License: non-free
Git

ARB is a graphical suite of tools for sequence database handling and data analysis. A central database of processed (aligned) sequences and any type of additional data linked to the sequence entries is structured according to phylogeny or other user-defined criteria.

The ARB project (from the Latin "arbor", a tree) is a joint initiative of the Lehrstuhl für Mikrobiologie and the LRR of the Technische Universität München in 1992. Since 2014 the ARB project is continued by the Department of Molecular Ecology http://www.mpi-bremen.de/en/Department_of_Molecular_Ecology.html at the Max Planck Institute for Marine Microbiology in Bremen in cooperation with Ribocon GmbH http://www.ribocon.com .

bcbio
toolkit for analysing high-throughput sequencing data
Versions of package bcbio
ReleaseVersionArchitectures
bookworm1.2.9-2 (contrib)all
sid1.2.9-2 (contrib)all
buster1.1.2-3all
bullseye1.2.5-1 (contrib)all
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free, but needs non-free components
Git

This package installs the command line tools of the bcbio-nextgen toolkit implementing best-practice pipelines for fully automated high throughput sequencing analysis.

A high-level configuration file specifies inputs and analysis parameters to drive a parallel pipeline that handles distributed execution, idempotent processing restarts and safe transactional steps. The project contributes a shared community resource that handles the data processing component of sequencing analysis, providing researchers with more time to focus on the downstream biology.

This package builds and having it in Debian unstable helps the Debian developers to synchronize their efforts. But unless a series of external dependencies are not installed manually, the functionality of bcbio in Debian is only a shadow of itself. Please use the official distribution of bcbio for the time being, which means "use conda". The TODO file in the Debian directory should give an overview on progress for Debian packaging.

Registry entries: Bio.tools  Bioconda 
blimps-utils
blocks database improved searcher
Versions of package blimps-utils
ReleaseVersionArchitectures
bookworm3.9+ds-1 (non-free)amd64
trixie3.9+ds-3 (non-free)amd64
bullseye3.9+ds-1 (non-free)amd64
sid3.9+ds-3 (non-free)amd64
buster3.9+ds-1 (non-free)amd64
stretch3.9-1 (non-free)amd64
jessie3.9-1 (non-free)amd64
Popcon: 0 users (1 upd.)*
Versions and Archs
License: non-free
Git

BLIMPS (BLocks IMProved Searcher) is a searching tool that scores a protein sequence against blocks or a block against sequences.

This package contains the binaries.

The package is enhanced by the following packages: blimps-examples
Please cite: J. G. Henikoff, S. Pietrokovski, C. M. McCallum and S. Henikoff: Blocks-based methods for detecting protein homology. (PubMed,eprint) Electrophoresis 21(9):1700-6 (2000)
caftools
maintenance of DNA sequence assemblies
Maintainer: Steffen Moeller
Versions of package caftools
ReleaseVersionArchitectures
bullseye2.0.3-1 (non-free)amd64
Popcon: 0 users (0 upd.)*
Versions and Archs
License: non-free
Git

This package contains code from different authors that allow sequence assemblies to be converted into formats such as CAF (Common Assembly Format) or GAP4.

CAF is a text format for describing sequence assemblies. It is acedb-compliant and is an extension of the ace-file format used earlier, but with support for base quality measures and a more extensive description of the Sequence data. CAF was designed during the Sanger sequencing era. Its modern-day successor is the SAM format, or its binary equivalents BAM and CRAM.

Please cite: Simon Dear, Richard Durbin, LaDeana Hillier, Gabor Marth, Jean Thierry-Mieg and and Richard Mott: Sequence assembly with CAFTOOLS. (PubMed,eprint) Genome research 8(3):260-267 (1998)
Registry entries: Bio.tools 
cluster3
Reimplementation of the Eisen-clustering software
Versions of package cluster3
ReleaseVersionArchitectures
bullseye1.59+ds-3 (non-free)amd64
sid1.59+ds-6 (non-free)amd64
stretch1.52a-1 (non-free)amd64
jessie1.52a-1 (non-free)amd64
buster1.57-1 (non-free)amd64
bookworm1.59+ds-5 (non-free)amd64
trixie1.59+ds-6 (non-free)amd64
Popcon: 2 users (0 upd.)*
Versions and Archs
License: non-free
Git

The open source clustering software available here contains clustering routines that can be used to analyze gene expression data. Routines for hierarchical (pairwise simple, complete, average, and centroid linkage) clustering, k-means and k-medians clustering, and 2D self-organizing maps are included. The routines are available in the form of a C clustering library, an extension module to Python, a module to Perl, as well as an enhanced version of Cluster, which was originally developed by Michael Eisen of Berkeley Lab. The C clustering library and the associated extension module for Python was released under the Python license. The Perl module was released under the Artistic License. Cluster 3.0 is covered by the original Cluster/TreeView license.

This package only contains the command line and motif gui versions of Cluster 3.0.

Please cite: M. J. L. de Hoon, S. Imoto, J. Nolan and S. Miyano: Open Source Clustering Software. (PubMed,eprint) Bioinformatics 20(9):1453-1454 (2004)
cufflinks
Transcript assembly, differential expression and regulation for RNA-Seq
Versions of package cufflinks
ReleaseVersionArchitectures
trixie2.2.1+dfsg.1-10 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
buster2.2.1+dfsg.1-3 (non-free)amd64,arm64,armhf,i386
stretch2.2.1-3 (non-free)amd64
jessie2.2.1-1 (non-free)amd64
bullseye2.2.1+dfsg.1-8 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm2.2.1+dfsg.1-9 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2.1+dfsg.1-10 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (1 upd.)*
Versions and Archs
License: non-free
Git

Cufflinks assembles transcripts, estimates their abundances, and tests for differential expression and regulation in RNA-Seq samples. It accepts aligned RNA-Seq reads and assembles the alignments into a parsimonious set of transcripts. Cufflinks then estimates the relative abundances of these transcripts based on how many reads support each one.

This package provides the binary of cufflinks and associated tools, i.e. compress_gtf, cuffcompare, cuffdiff, cuffmerge, cuffnorm, cuffquant and gtf_to_sam.

Please cite: Cole Trapnell, Brian A Williams, Geo Pertea, Ali Mortazavi, Gordon Kwan, Marijke J van Baren, Steven L Salzberg, Barbara J Wold and Lior Pachter: Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. (PubMed) Nature Biotechnology 28(5):511-515 (2010)
Registry entries: Bio.tools  SciCrunch  Bioconda 
embassy-phylip
EMBOSS conversions of the programs in the phylip package
Versions of package embassy-phylip
ReleaseVersionArchitectures
stretch3.69.660-1 (non-free)amd64
jessie3.69.650-2 (non-free)amd64
buster3.69.660-3 (non-free)amd64
Popcon: 0 users (0 upd.)*
Versions and Archs
License: non-free
Git

This package is the adaptation of the PHYLIP package in which its programs can operate with the biological sequence formats and databases of the European Molecular Biology Open Software Suite (EMBOSS). The software packages adapted for EMBOSS are called EMBASSY.

PHYLIP (the PHYLogeny Inference Package) is a package of programs for inferring phylogenies (evolutionary trees). Methods that are available in the package include parsimony, distance matrix, and likelihood methods, including bootstrapping and consensus trees. Data types that can be handled include molecular sequences, gene frequencies, restriction sites and fragments, distance matrices, and discrete characters.

The EMBASSY PHYLIP programs all have the prefix "f" to distinguish them from the original programs and avoid namespace conflict.

relion-cuda
parallel toolkit for 3D reconstructions in cryo-electron microscopy
Versions of package relion-cuda
ReleaseVersionArchitectures
sid3.1.3-2 (contrib)amd64
bullseye3.1.0-2 (contrib)amd64
bookworm3.1.3-2 (contrib)amd64
upstream4.0.2
Popcon: 2 users (0 upd.)*
Newer upstream!
License: DFSG free, but needs non-free components
Git

RELION (for REgularised LIkelihood OptimisatioN) is a stand-alone computer program for Maximum A Posteriori refinement of (multiple) 3D reconstructions or 2D class averages in cryo-electron microscopy.

RELION provides a GUI, several command-line tools in parallel (MPI) and serial versions, optionally with CUDA/GPU support.

relion-cuda provides the serial and parallel (MPI) command-line tools with CUDA/GPU support.

relion-gui-cuda
toolkit for 3D reconstructions in cryo-electron microscopy (gui apps)
Versions of package relion-gui-cuda
ReleaseVersionArchitectures
bookworm3.1.3-2 (contrib)amd64
bullseye3.1.0-2 (contrib)amd64
sid3.1.3-2 (contrib)amd64
upstream4.0.2
Popcon: 2 users (0 upd.)*
Newer upstream!
License: DFSG free, but needs non-free components
Git

RELION (for REgularised LIkelihood OptimisatioN) is a stand-alone computer program for Maximum A Posteriori refinement of (multiple) 3D reconstructions or 2D class averages in cryo-electron microscopy.

RELION provides a GUI, several command-line tools in parallel (MPI) and serial versions, optionally with CUDA/GPU support.

relion-gui-cuda provides the graphical user interface with CUDA/GPU support.

seq-gen
simulate the evolution of nucleotide or amino acid sequences
Versions of package seq-gen
ReleaseVersionArchitectures
bookworm1.3.4-2 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.3.4-2 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.3.4-2 (non-free)amd64,arm64,armhf,i386
sid1.3.4-2 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
stretch1.3.3-1 (non-free)amd64,armel,armhf,i386,mips,mipsel,s390x
jessie1.3.3-1 (non-free)amd64,armel,armhf,i386
trixie1.3.4-2 (non-free)amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Debtags of package seq-gen:
roleprogram
Popcon: 1 users (1 upd.)*
Versions and Archs
License: non-free
Git

Seq-Gen is a program that will simulate the evolution of nucleotide or amino acid sequences along a phylogeny, using common models of the substitution process. A range of models of molecular evolution are implemented including the general reversible model. State frequencies and other parameters of the model may be given and site-specific rate heterogeneity may also be incorporated in a number of ways. Any number of trees may be read in and the program will produce any number of data sets for each tree. Thus large sets of replicate simulations can be easily created. It has been designed to be a general purpose simulator that incorporates most of the commonly used (and computationally tractable) models of molecular sequence evolution.

Please cite: A. Rambaut and N. C. Grassly: Seq-Gen: An application for the Monte Carlo simulation of DNA sequence evolution along phylogenetic trees. (PubMed,eprint) Comput. Appl. Biosci. 13(3):235-238 (1997)
Registry entries: SciCrunch  Bioconda 
seqcluster
analysis of small RNA in NGS data
Versions of package seqcluster
ReleaseVersionArchitectures
bullseye1.2.7+ds-1 (contrib)all
trixie1.2.9+ds-4 (contrib)all
bookworm1.2.9+ds-3 (contrib)all
sid1.2.9+ds-4 (contrib)all
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free, but needs non-free components
Git

Seqcluster investigates small RNA sequences of all sorts in RNA sequencing data. This is especially helpful for the identification of RNA that is neither coding nor belonging to the already well-established group of miRNA, towards many tools feel constrained to.

Please cite: Lorena Pantano, Marc R. Friedländer, Georgia Escaramís, Esther Lizano, Joan Pallarès-Albanell, Isidre Ferrer, Xavier Estivill and Eulàlia Martí: Specific small-RNA signatures in the amygdala at premotor and motor stages of Parkinson's disease revealed by deep sequencing analysis. (PubMed) Bioinformatics (2015)
Registry entries: Bio.tools 
sift
predicts if a substitution in a protein has a phenotypic effect
Versions of package sift
ReleaseVersionArchitectures
buster4.0.3b-6 (non-free)amd64
sid4.0.3b-6 (non-free)amd64
bookworm4.0.3b-6 (non-free)amd64
bullseye4.0.3b-6 (non-free)amd64
stretch4.0.3b-4 (non-free)amd64
jessie4.0.3b-4 (non-free)amd64
Popcon: 0 users (1 upd.)*
Versions and Archs
License: non-free
Git

SIFT is a sequence homology-based tool that sorts intolerant from tolerant amino acid substitutions and predicts whether an amino acid substitution in a protein will have a phenotypic effect. SIFT is based on the premise that protein evolution is correlated with protein function. Positions important for function should be conserved in an alignment of the protein family, whereas unimportant positions should appear diverse in an alignment.

Please cite: Prateek Kumar, Steven Henikoff and Pauline C Ng: Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. (PubMed,eprint) Nature Protocols 4(7):1073-81 (2009)
Registry entries: Bio.tools  SciCrunch 
solvate
arranges water molecules around protein structures
Versions of package solvate
ReleaseVersionArchitectures
sid1.0-3 (non-free)amd64
trixie1.0-3 (non-free)amd64
buster1.0-2 (non-free)amd64
bookworm1.0-3 (non-free)amd64
bullseye1.0-3 (non-free)amd64
Popcon: 0 users (1 upd.)*
Versions and Archs
License: non-free
Git

For molecular dynamics simulations it is sometimes appropriate not to model in the vacuum but to have the proteins surrounded by their solvent. This program computes the location of water molecules such that the resulting PDB files become suitable for further analyses.

trnascan-se
detection of transfer RNA genes in genomic sequence
Versions of package trnascan-se
ReleaseVersionArchitectures
buster2.0.0-3 (non-free)amd64
bookworm2.0.10+ds-1 (non-free)amd64,i386
bullseye2.0.7+ds-1 (non-free)amd64,i386
trixie2.0.12+ds-1 (non-free)amd64,arm64,i386
sid2.0.12+ds-1 (non-free)amd64,arm64,i386
Popcon: 0 users (1 upd.)*
Versions and Archs
License: non-free
Git

tRNAscan-SE identifies 99-100% of transfer RNA genes in DNA sequence while giving less than one false positive per 15 gigabases. Two previously described tRNA detection programs are used as fast, first-pass prefilters to identify candidate tRNAs, which are then analyzed by a highly selective tRNA covariance model. This work represents a practical application of RNA covariance models, which are general, probabilistic secondary structure profiles based on stochastic context-free grammars. tRNAscan-SE searches at ~ 30 000 bp/s. Additional extensions to tRNAscan-SE detect unusual tRNA homologues such as selenocysteine tRNAs, tRNA-derived repetitive elements and tRNA pseudogenes.

Please cite: Todd M Lowe and Sean R Eddy: tRNAscan-SE: A program for improved detection of transfer RNA genes in genomic sequence. (PubMed,eprint) Nucleic Acids Research 25(5):955-964 (1997)
Registry entries: Bio.tools  SciCrunch  Bioconda 
varscan
variant detection in next-generation sequencing data
Versions of package varscan
ReleaseVersionArchitectures
stretch2.4.3+dfsg-1 (non-free)amd64
bookworm2.4.3+dfsg-4 (non-free)amd64
jessie2.3.7+dfsg-1 (non-free)amd64
trixie2.4.3+dfsg-4 (non-free)amd64
sid2.4.3+dfsg-4 (non-free)amd64
bullseye2.4.3+dfsg-3 (non-free)amd64
buster2.4.3+dfsg-3 (non-free)amd64
Popcon: 1 users (2 upd.)*
Versions and Archs
License: non-free
Git

Variant detection in massively parallel sequencing. For one sample, calls SNPs, indels, and consensus genotypes. For tumor-normal pairs, further classifies each variant as Germline, Somatic, or LOH, and also detects somatic copy number changes.

Please cite: Daniel C. Koboldt, Qunyuan Zhang, David E. Larson, Dong Shen, Michael D. McLellan, Ling Lin, Christopher A. Miller, Elaine R. Mardis, Li Ding and Richard K. Wilson: VarScan 2: somatic mutation and copy number alteration discovery in cancer by exome sequencing". (PubMed,eprint) Genome Res. 22(3):568-576 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
vdjtools
framework for post-analysis of B/T cell repertoires
Versions of package vdjtools
ReleaseVersionArchitectures
trixie1.2.1+git20190311+repack-2 (non-free)all
bookworm1.2.1+git20190311+repack-1 (non-free)all
sid1.2.1+git20190311+repack-2 (non-free)all
bullseye1.2.1+git20190311-5 (non-free)all
Popcon: 0 users (1 upd.)*
Versions and Archs
License: non-free
Git

VDJtools is an open-source Java/Groovy-based framework designed to facilitate analysis of immune repertoire sequencing (RepSeq) data. VDJtools computes a wide set of statistics and is able to perform various forms of cross-sample analysis. Both comprehensive tabular output and publication-ready plots are provided.

The main aims of the VDJtools Project are:

  • To ensure consistency between post-analysis methods and results
  • To save the time of bioinformaticians analyzing RepSeq data
  • To create an API framework facilitating development of new RepSeq analysis applications
  • To provide a simple enough command line tool so it could be used by immunologists and biologists with little computational background
Please cite: M Shugay, D.V. Bagaev, M.A. Turchaninova, D.A. Bolotin, O.V. Britanova, E.V. Putintseva, M.V. Pogorelyy, V.I. Nazarov VI, I.V. Zvyagin, V.I. Kirgizova, K.I. Kirgizov, E.V. Skorobogatova and D.M. Chudakov: VDJtools: Unifying Post-analysis of T Cell Receptor Repertoires. (PubMed,eprint) PLoS Comput Biol. 11(11):e1004503 (2015)
vienna-rna
RNA sequence analysis
Versions of package vienna-rna
ReleaseVersionArchitectures
sid2.6.4+dfsg-1 (non-free)amd64,arm64,armel,armhf,mips64el,ppc64el,riscv64,s390x
trixie2.6.4+dfsg-1 (non-free)amd64,arm64,armel,armhf,mips64el,ppc64el,riscv64,s390x
bullseye2.4.17+dfsg-2 (non-free)amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
bookworm2.5.1+dfsg-1 (non-free)amd64,arm64,mips64el,ppc64el,s390x
upstream2.7.0
Popcon: 0 users (2 upd.)*
Newer upstream!
License: non-free
Git

The Vienna RNA Package consists of a C code library and several stand-alone programs for the prediction and comparison of RNA secondary structures. It is developed and maintained by the group of Ivo Hofacker in Vienna.

RNA secondary structure prediction through energy minimization is the most used function in the package. It provides three kinds of dynamic programming algorithms for structure prediction:

  • the minimum free energy algorithm of (Zuker & Stiegler 1981) which yields a single optimal structure,
  • the partition function algorithm of (McCaskill 1990) which calculates base pair probabilities in the thermodynamic ensemble, and the suboptimal folding algorithm of (Wuchty et.al 1999) which generates all suboptimal structures within a given energy range of the optimal energy.

For secondary structure comparison, the package contains several measures of distance (dissimilarities) using either string alignment or tree-editing (Shapiro & Zhang 1990). Finally, is provided an algorithm to design sequences with a predefined structure (inverse folding). The RNAforester package is a tool for aligning RNA secondary structures and it's user interface integrates to those of the tools of the Vienna RNA package.

Please cite: Ronny Lorenz, Stephan H. Bernhart, Christian Höner zu Siederdissen, Hakim Tafer, Christoph Flamm, Peter F. Stadler and Ivo L. Hofacker: ViennaRNA Package 2.0. (eprint) Algorithms for Molecular Biology 6(1):26 (2011)
Registry entries: Bio.tools  SciCrunch 

Debian packages in New queue (hopefully available soon)

sourmash
tools for comparing DNA sequences with MinHash sketches
Versions of package sourmash
ReleaseVersionArchitectures
NEW4.8.11-1all
Versions and Archs
License: unknown
Git
Version: 4.8.11-1

Compute MinHash signatures for nucleotide (DNA/RNA) and protein sequences.

MinHash sketches provide a lightweight way to store “signatures” of large DNA or RNA sequence collections, and then compare or search them using a Jaccard index. MinHash sketches can be used to identify samples, find similar samples, identify data sets with shared sequences, and build phylogenetic trees (Ondov et al. 2015).

sourmash provides a command line script, a Python library, and a CPython module for MinHash sketches

Please cite: C. Titus Brown and Luiz Irber: sourmash: a library for MinHash sketching of DNA. (eprint) The Journal of Open Source Software 1(5):27 (2016)
Registry entries: Bio.tools  Bioconda 

Packaging has started and developers might try the packaging code in VCS

acacia
Error-corrector for pyrosequenced amplicon reads.
Versions of package acacia
ReleaseVersionArchitectures
VCS1.53-0biolinux3all
Versions and Archs
License: GPL-3
Debian package not available
Git
Version: 1.53-0biolinux3

Acacia is a java program developed to quickly and conservatively correct errors, whilst simultaneously de-replicating, amplicon sequences.

The main purpose of Acacia is to correct the over-call, under-call errors prevalent in Roche 454 GS-FLX data, and more recently, with the Titanium chemistry. Acacia will only ectively correct errors in amplicons - as it assumes that the 5' end of the sequences start at the same position, the MID, followed by the primer. Acacia uses empirically-derived models to identify homopolymer regions where there are more `errors' than expected by chance - these imply that the differences are due to population differences rather than error-induced polymorphisms.

Nat Methods. 2012 Apr 27;9(5):425-6. doi: 10.1038/nmeth.1990. Fast, accurate error-correction of amplicon pyrosequences using Acacia. Bragg L, Stone G, Imelfort M, Hugenholtz P, Tyson GW.

Please cite: Lauren Bragg, Glenn Stone, Michael Imelfort, Philip Hugenholtz and Gene W. Tyson: Fast, accurate error-correction of amplicon pyrosequences using Acacia. (PubMed) Nature Methods 9(5):425-426 (2012)
Registry entries: SciCrunch 
agat
another GFF analysis toolkit
Versions of package agat
ReleaseVersionArchitectures
VCS0.5.0-1all
Versions and Archs
License: GPL-3
Debian package not available
Git
Version: 0.5.0-1

Suite of tools to handle gene annotations in any GTF/GFF format.

It has the power to check, fix, pad missing information of any kind of gtf and gff to create complete, sorted and standardised gff3 format.

Registry entries: Bioconda 
amos-assembler
modular whole genome assembler
Versions of package amos-assembler
ReleaseVersionArchitectures
VCS3.1.0-1all
Versions and Archs
License: Artistic
Debian package not available
Git
Version: 3.1.0-1

The AMOS consortium is committed to the development of open-source whole genome assembly software. The project acronym (AMOS) represents our primary goal - to produce A Modular, Open-Source whole genome assembler. Open-source so that everyone is welcome to contribute and help build outstanding assembly tools, and modular in nature so that new contributions can be easily inserted into an existing assembly pipeline. This modular design will foster the development of new assembly algorithms and allow the AMOS project to continually grow and improve in hopes of eventually becoming a widely accepted and deployed assembly infrastructure. In this sense, AMOS is both a design philosophy and a software system.

Please cite: Michael C. Schatz, Adam M. Phillippy, Daniel D. Sommer, Arthur L. Delcher, Daniela Puiu, Giuseppe Narzisi, Steven L. Salzberg and Mihai Pop: Hawkeye and AMOS: visualizing and assessing the quality of genome assemblies. (PubMed,eprint) Briefings in Bioinformatics (2011)
Registry entries: Bio.tools  SciCrunch 
apollo
genome annotation viewer and editor
Versions of package apollo
ReleaseVersionArchitectures
VCS2.3.1-1all
Versions and Archs
License: Artistic
Debian package not available
Git
Version: 2.3.1-1

Apollo is a genome annotation viewer and editor. It was developed as a collaboration between the Berkeley Drosophila Genome Project (part of the FlyBase consortium) and The Sanger Institute in Cambridge, UK. Apollo allows researchers to explore genomic annotations at many levels of detail, and to perform expert annotation curation, all in a graphical environment. It was used by the FlyBase biologists to construct the Release 3 annotations on the finished Drosophila melanogaster genome, and is also a primary vehicle for sharing these annotations with the community. The Generic Model Organism Database (GMOD) project, which aims to provide a complete ready-to-use toolkit for analyzing whole genomes, has adopted Apollo as its annotation workbench.

Please cite: Susanna E. Lewis, Steve M. J. Searle, Naomi Harris, M. Gibson, V Lyer, J. Richter, C. Wiel, L. Bayraktaroglir, Ewan Birney, M. A. Crosby, J. S. Kaminker, B. B. Matthews, S. E. Prochnik, C. D. Smithy, J. L. Tupy, G. M. Rubin, S. Misra, Chris J. Mungall and Michelle E. Clamp: Apollo: a sequence annotation editor. (PubMed,eprint) Genome Biology 3(12):research0082-0082.14 (2002)
Registry entries: Bio.tools  SciCrunch 
arvados
managing and analyzing biomedical big data
Versions of package arvados
ReleaseVersionArchitectures
VCS2.0.3-1all
Versions and Archs
License: Apache-2.0 #FIXME
Debian package not available
Git
Version: 2.0.3-1

Arvados is an open source platform for managing, processing, and sharing genomic and other large scientific and biomedical data. With Arvados, bioinformaticians run and scale compute-intensive workflows, developers create biomedical applications, and IT administrators manage large compute and storage resources.

axparafit
optimized statistical analysis of host-parasite coevolution
Versions of package axparafit
ReleaseVersionArchitectures
VCS1.0-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 1.0-1

AxParafit is a highly optimized version of Pierre Legendre's Parafit program for statistical analysis of host-parasite coevolution. AxParafit has been parallelized with MPI (Message Passing Interface) for compute clusters and was used to carry out the largest co-evolutionary analysis to date for the paper describing the software.

axpcoords
highly optimized and parallelized porting of pcoords
Versions of package axpcoords
ReleaseVersionArchitectures
VCS1.0-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 1.0-1

AxPcoords is an highly optimized versions of Pierre Legendre's DistPCoA program for statistical analysis of host-parasite coevolution.

AxPcoords is a fast, LAPACK-based implementation of DistPCoA (see http://www.bio.umontreal.ca/Casgrain/en/labo/distpcoa.html) which is another program by Pierre Legendre, it conducts a principal coordinates analysis. This program is required for the pipeline that conducts a full host-parasite co-phylogenetic analysis in combination with AxParafit.

bagpipe
genomewide LD mapping
Versions of package bagpipe
ReleaseVersionArchitectures
VCS2012.02.15-1all
Versions and Archs
License: GPL3+
Debian package not available
Git
Version: 2012.02.15-1

Bagpipe is a program for performing genomewide linkage disequilibrium mapping of quantitative trait loci in populations whose genome structure can be accommodated in the HAPPY framework [Mott00]. This includes most diploid crosses where the founders of the individuals have known genotypes.

  • Bagpipe is a simplified and streamlined version of Bagphenotype that does not currently include resample model averaging (RMA) capabilities.
  • Bagpipe can help fit single locus regression models (with or without random effects) to marker intervals whose genetic ancestry is inferred using the HAPPY software.
  • Bagpipe cannot help you decide what is a sensible model to fit.
  • Bagpipe does not currently accommodate populations with significant population structure, except through the specification of simple random intercepts based on unpatterned covariance matrices.
  • Bagpipe is named after the Scottish wind instrument "the bagpipes" and after Bagphenotype, which in turn was a PIPEline for BAGging-based multiple QTL analysis of phenoTYPEs. Bagphenotype was in turn based on software written by Richard Mott and William Valdar to analyze heterogeneous stock mice in [Valdar06].
  • Bagpipe is experimental software, is provided free of charge subject to copyleft restrictions, and comes with no guarantees whatsoever.
Please cite: Richard Mott, Christopher J. Talbot, Maria G. Turri, Allan C. Collins and Jonathan Flint: A method for fine mapping quantitative trait loci in outbred animal stocks. (PubMed) Proc Natl Acad Sci U S A. 97(23):12649-54 (200)
bax2bam
Convert legacy PacBio Bax.H5, Bas.H5, and Ccs.H5 files to the new PacBio BAM format
Versions of package bax2bam
ReleaseVersionArchitectures
VCS0.0.9-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 0.0.9-1

The program bax2bam converts the legacy PacBio basecall format (bax.h5) into the BAM basecall format.

biceps
error-tolerant peptide identification
Versions of package biceps
ReleaseVersionArchitectures
VCS0.0.201401-1all
Versions and Archs
License: BSDlike
Debian package not available
Git
Version: 0.0.201401-1

BICEPS is tool for the error-tolerant identification of peptides based on a statistical regularization scheme. It balances possible improvements in peptide-spectrum-matches by allowing substitutions against the increased risk of false positives. BICEPS can identify peptides containing two or more substitutions as occuring e.g. in cross-species searches.

Please cite: Bernhard Y. Renard‡and Buote Xu, Marc Kirchner, Franziska Zickmann‡and Dominic Winter, Simone Korten‡and Norbert W. Brattig‡and Amit Tzur, Fred A. Hamprecht and Hanno Steen: Overcoming Species Boundaries in Peptide Identification with Bayesian Information Criterion-driven Error-tolerant Peptide Search (BICEPS). (PubMed,eprint) Mol Cell Proteomics ;11(7):M111.014167 (2012)
Remark of Debian Med team: Mentioned at http://www.renard.it/, developed in RKI
bigsdb
Bacterial Isolate Genome Sequence Database
Versions of package bigsdb
ReleaseVersionArchitectures
VCS1.18.1-1all
Versions and Archs
License: GPL2+
Debian package not available
Git
Version: 1.18.1-1

The Bacterial Isolate Genome Sequence Database (BIGSdb) is a scalable, web-accessible database system designed to store and analyse linked phenotypic and genotypic information in a computationally efficient manner. Sequence data can range from single sequence reads to multiple contigs generated by whole genome sequencing technologies. The system incorporates the capacity to define and identify any number of loci and genetic variants at those loci within the stored nucleotide sequences. These loci can be further organised into schemes for isolate characterisation or for evolutionary or functional analyses.

Please cite: Keith A. Jolley and Martin C.J. Maiden: BIGSdb: Scalable analysis of bacterial genome variation at the population level. (PubMed,eprint) BMC Bioinformatics 11:595 (2010)
bismark
bisulfite read mapper and methylation caller
Versions of package bismark
ReleaseVersionArchitectures
VCS0.22.3-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 0.22.3-1

Bismark is a program to map bisulfite treated sequencing reads to a genome of interest and perform methylation calls in a single step. The output can be easily imported into a genome viewer, such as SeqMonk, and enables a researcher to analyse the methylation levels of their samples straight away. It's main features are:

  • Bisulfite mapping and methylation calling in one single step
  • Supports single-end and paired-end read alignments
  • Supports ungapped and gapped alignments
  • Alignment seed length, number of mismatches etc. are adjustable
  • Output discriminates between cytosine methylation in CpG, CHG and CHH context
Please cite: Felix Krueger and Simon R. Andrews: Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. (PubMed,eprint) Bioinformatics 27(11):1571-1572 (2011)
Registry entries: Bio.tools  SciCrunch  Bioconda 
blat
BLAST-Like Alignment Tool
Versions of package blat
ReleaseVersionArchitectures
VCS35-1all
Versions and Archs
License: FreeForScientificUse
Debian package not available
Git
Version: 35-1

BLAT on DNA is designed to quickly find sequences of 95% and greater similarity of length 25 bases or more. It may miss more divergent or shorter sequence alignments. It will find perfect sequence matches of 25 bases, and sometimes find them down to 20 bases. BLAT on proteins finds sequences of 80% and greater similarity of length 20 amino acids or more. In practice DNA BLAT works well on primates, and protein blat on land vertebrates.

BLAT is not BLAST. DNA BLAT works by keeping an index of the entire genome in memory. The index consists of all non-overlapping 11-mers except for those heavily involved in repeats. The index takes up a bit less than a gigabyte of RAM. The genome itself is not kept in memory, allowing BLAT to deliver high performance on a reasonably priced Linux box. The index is used to find areas of probable homology, which are then loaded into memory for a detailed alignment. Protein BLAT works in a similar manner, except with 4-mers rather than 11-mers. The protein index takes a little more than 2 gigabytes.

Please cite: W. Jim Kent: BLAT--the BLAST-like alignment tool. (PubMed,eprint) Genome Research 12(4):656-64 (2002)
Registry entries: Bio.tools  SciCrunch 
blobology
tool set for the visualisation of genome assemblies
Versions of package blobology
ReleaseVersionArchitectures
VCS0.0+20151216-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 0.0+20151216-1

Tools for making blobplots or Taxon-Annotated-GC-Coverage plots (TAGC plots) to visualise the contents of genome assembly data sets as a QC step.

blobtools consist of a series of tools that can be used to

  • collate information associated with an assembly file, such as:
    • sequence ID
    • sequence length
    • GC-content
    • coverage information
    • taxonomy information (sequence similarity search hits)
    • user-defined categories
  • visualise information using blobplots, covplots and/or readcovplots.
  • extract information into human- and computer-readable files
  • produce paper-ready figures
Please cite: Sujai Kumar, Martin Jones, Georgios Koutsovoulos, Michael Clarke and Mark Blaxter: Blobology: exploring raw genome data for contaminants, symbionts, and parasites using taxon-annotated GC-coverage plots. (PubMed,eprint) frontiers in Genetics 4:237 (2013)
braker
annotating protein coding genes in genomes.
Versions of package braker
ReleaseVersionArchitectures
VCS2.1.2+dfsg-1all
Versions and Archs
License: Artistic-1.0
Debian package not available
Git
Version: 2.1.2+dfsg-1

Genomic DNA controls the behaviour of biological cells. Understanding it, and its variations, facilitates the molecular pathology of diseases. braker.pl can either run with a genome sequence, only; or with additional alignments for short transcriptome reads against the genome; or with additional protein sequences of closely related species; or with evidence from the alignment of protein sequences of distantly related species. The package provides the means to interpret genomic sequences in FASTA format from fungi, plants and animals.

Please cite: Katharina J. Hoff, Simone Lange, Alexandre Lomsadze, Mark Borodovsky and Mario Stanke: BRAKER1: Unsupervised RNA-Seq-Based Genome Annotation with GeneMark-ET and AUGUSTUS.. (PubMed,eprint) Bioinformatics. 32(5):767-769 (2016)
Registry entries: Bio.tools 
card-rgi
analysis of genome sequences using the Resistance Gene Identifier
Versions of package card-rgi
ReleaseVersionArchitectures
VCS4.2.2-1all
Versions and Archs
License: non-free
Debian package not available
Git
Version: 4.2.2-1

The Comprehensive Antibiotic Resistance Database ("CARD") provides data, models, and algorithms relating to the molecular basis of antimicrobial resistance. The CARD provides curated reference sequences and SNPs organized via the Antibiotic Resistance Ontology ("ARO"). These data can be browsed on the website or downloaded in a number of formats. These data are additionally associated with detection models, in the form of curated homology cut-offs and SNP maps, for prediction of resistome from molecular sequences. These models can be downloaded or can be used for analysis of genome sequences using the Resistance Gene Identifier ("RGI"), either online or as a stand-alone tool.

Please cite: Baofeng Jia, Amogelang R. Raphenya, Brian Alcock, Nicholas Waglechner, Peiyao Guo, Kara K. Tsang, Briony A. Lago, Biren M. Dave, Sheldon Pereira, Arjun N. Sharma, Sachin Doshi, Mélanie Courtot, Raymond Lo, Laura E. Williams, Jonathan G. Frye, Tariq Elsayegh, Daim Sardar, Erin L. Westman, Andrew C. Pawlowski, Timothy A. Johnson, Fiona S.L. Brinkman, Gerard D. Wright and Andrew G. McArthur: CARD 2017: expansion and model-centric curation of the comprehensive antibiotic resistance database. (PubMed,eprint) Nucleic Acids Research 45(D1):D566-D573 (2017)
cellprofiler
quantitatively measure phenotypes from images automatically
Versions of package cellprofiler
ReleaseVersionArchitectures
VCS3.0.0-1all
Versions and Archs
License: GPL-2
Debian package not available
Git
Version: 3.0.0-1

CellProfiler is cell image analysis software designed to enable biologists without training in computer vision or programming to quantitatively measure phenotypes from thousands of images automatically.

cinema
multi-sequence alignment editor and viewer
Versions of package cinema
ReleaseVersionArchitectures
VCS3.0.23-1all
Versions and Archs
License: LGPL
Debian package not available
Git
Version: 3.0.23-1

It has been designed to be as extensible as possible. Notes of this extensibility can be found in "EXTENDING_CINEMA", and the "cinema-module" sub-directory.

Cinema currently has limited support for various sequence formats, although its easy to add new ones. A large number of alignments in the appropriate format can be found as part of the align compendium at

condetri
straight-forward trimming of FASTQ sequences
Versions of package condetri
ReleaseVersionArchitectures
VCS2.3-1all
Versions and Archs
License: <license>
Debian package not available
Git
Version: 2.3-1

This package is a simplistic contribution to the wealth of tools for trimming of sequences of current Next-Generation-Sequencing data. It was developed in the context of de novo whole-genome assembly.

The tool reads from the 3'-end and extract reads (or read pairs) of good quality. If the reads are paired, the filtering is done pairwise, and if one read in a pair has low quality, the remaining read is saved as single end.

Please cite: Linnéa Smeds and Axel Künstner: ConDeTri - A Concent Dependent Read Trimmer for Illumina Data. (PubMed,eprint) PLoS ONE 6(10):e26314 (2011)
Registry entries: Bio.tools 
contrafold
CONditional TRAining for RNA Secondary Structure Prediction
Versions of package contrafold
ReleaseVersionArchitectures
VCS2.02-1all
Versions and Archs
License: BSD-3-Clause
Debian package not available
Git
Version: 2.02-1

For several decades, free energy minimization methods have been the dominant strategy for single sequence RNA secondary structure prediction. More recently, stochastic context-free grammars (SCFGs) have emerged as an alternative probabilistic methodology for modeling RNA structure. Unlike physics-based methods, which rely on thousands of experimentally-measured thermodynamic parameters, SCFGs use fully-automated statistical learning algorithms to derive model parameters. Despite this advantage, however, probabilistic methods have not replaced free energy minimization methods as the tool of choice for secondarystructure prediction, as the accuracies of the best current SCFGs have yet to match those of the best physics-based models.

CONTRAfold is a novel secondary structure prediction method based on conditional log-linear models (CLLMs), a flexible class of probabilistic models which generalize upon SCFGs by using discriminative training and feature-rich scoring. By incorporating most of the features found in typical thermodynamic models, CONTRAfold achieves the highest single sequence prediction accuracies to date, outperforming currently available probabilistic and physics-based techniques. Our result thus closes the gap between probabilistic and thermodynamic models, demonstrating that statistical learning procedures provide an effective alternative to empirical measurement of thermodynamic parameters for RNA secondary structure prediction.

Please cite: Chuong B. Do, Daniel A. Woods1 and Serafim Batzoglou: CONTRAfold: RNA secondary structure prediction without physics-based models. (PubMed,eprint) Bioinformatics 22(14):e90-e98 (2006)
covpipe
pipeline to generate consensus sequences from NGS reads
Versions of package covpipe
ReleaseVersionArchitectures
VCS3.0.6-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 3.0.6-1

CovPipe is a pipeline to generate consensus sequences from NGS reads based on a reference sequence. The pipeline is tailored to be used for SARS-CoV-2 data, but may be used for other viruses.

Genomic variants of your NGS data in comparison to a reference will be determined. These variants will be included into the reference and form the consensus sequences. See below for further details on the determined set of consensus sequences.

crossbow
Genotyping from short reads using cloud computing
Versions of package crossbow
ReleaseVersionArchitectures
VCS1.2.0-1all
Versions and Archs
License: Artistic
Debian package not available
Git
Version: 1.2.0-1

Crossbow is a scalable software pipeline for whole genome resequencing analysis. It combines Bowtie, an ultrafast and memory efficient short read aligner, and SoapSNP, an accurate genotyper, within Hadoop to distribute and accelerate the computation with many nodes. The pipeline can accurately analyze over 35x coverage of a human genome in one day on a 10-node local cluster, or in 3 hours for about $100 using a 40-node, 320-core cluster rented from Amazon's EC2 utility computing service.

Please cite: Ben Langmead, Michael C Schatz, Jimmy Lin, Mihai Pop and Steven L Salzberg: Searching for SNPs with cloud computing. (PubMed,eprint) Genome Biology 10:R134 (2009)
Registry entries: Bio.tools  SciCrunch 
crux-toolkit
toolkit for tandem mass spectrometry analysis
Versions of package crux-toolkit
ReleaseVersionArchitectures
VCS3.1-1all
Versions and Archs
License: Apache-2.0
Debian package not available
Git
Version: 3.1-1

The Crux mass spectrometry analysis toolkit is an open source project that aims to provide users with a cross-platform suite of analysis tools for interpreting protein mass spectrometry data. The toolkit includes several search engines for both standard and cross-linked database search, as well as a variety of pre- and post-processing engines for assigning high-resolution precursor masses to spectra, assigning statistical confidence estimates to spectra, peptides and proteins, and performing label free quantification.

Please cite: Sean McIlwain, Kaipo Tamura, Attila Kertesz-Farkas, Charles E. Grant, Benjamin Diament, Barbara Frewen, J. Jeffry Howbert, Michael R. Hoopmann, Lukas Käll, Jimmy K. Eng, Michael J. MacCoss and William Stafford Noble: Crux: rapid open source protein tandem mass spectrometry analysis. (PubMed) 2014 13(10):4488-4491 (Journal of Proteome Research)
Registry entries: Bio.tools  SciCrunch 
cytoscape
visualizing molecular interaction networks
Versions of package cytoscape
ReleaseVersionArchitectures
VCS3.1.0-1all
Versions and Archs
License: LGPL-2.1
Debian package not available
Git
Version: 3.1.0-1

Cytoscape is an open source bioinformatics software platform for visualizing molecular interaction networks and biological pathways and integrating these networks with annotations, gene expression profiles and other state data. Although Cytoscape was originally designed for biological research, now it is a general platform for complex network analysis and visualization. Cytoscape core distribution provides a basic set of features for data integration and visualization.

dazzle
Java-based DAS server
Versions of package dazzle
ReleaseVersionArchitectures
VCS1.01r3643-1all
Versions and Archs
License: LGP-2+
Debian package not available
Git
Version: 1.01r3643-1

Dazzle is a general purpose server for the Distributed Annotation System (DAS) protocol. It is implemented as a Java servlet, using the BioJava APIs. Dazzle is a modular system which uses small "datasource" plugins to provide access to a range of databases. Several general-purpose plugins are included in the package, and it it straightforward to develop new plugins to connect to your own databases.

Information on DAS is available from http://www.biodas.org/

deepbinner
demultiplexing barcoded Oxford Nanopore sequencing reads
Versions of package deepbinner
ReleaseVersionArchitectures
VCS0.2.0-1all
Versions and Archs
License: GPL-3
Debian package not available
Git
Version: 0.2.0-1

Deepbinner is a tool for demultiplexing barcoded Oxford Nanopore sequencing reads. It does this with a deep convolutional neural network classifier, using many of the architectural advances that have proven successful in image classification. Unlike other demultiplexers (e.g. Albacore and Porechop), Deepbinner identifies barcodes from the raw signal (a.k.a. squiggle) which gives it greater sensitivity and fewer unclassified reads.

Reasons to use Deepbinner:

  • To minimise the number of unclassified reads (use Deepbinner by itself).
  • To minimise the number of misclassified reads (use Deepbinner in conjunction with Albacore demultiplexing).
  • You plan on running signal-level downstream analyses, like Nanopolish. Deepbinner can demultiplex the fast5 files which makes this easier. Reasons to not use Deepbinner:
  • You only have basecalled reads not the raw fast5 files (which Deepbinner requires).
  • You have a small/slow computer. Deepbinner is more computationally intensive than Porechop.
  • You used a sequencing/barcoding kit other than the ones Deepbinner was trained on.
Please cite: Ryan R Wick, Louise M Judd and Kathryn E Holt: Deepbinner: Demultiplexing barcoded Oxford Nanopore reads with deep convolutional neural networks. (PubMed,eprint) bioRxiv 14(11):e1006583 (2018)
Registry entries: Bioconda 
dendroscope
analyzing and visualizing rooted phylogenetic trees and networks
Versions of package dendroscope
ReleaseVersionArchitectures
VCS3.0+git20190219.a00d9b9+dfsg-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 3.0+git20190219.a00d9b9+dfsg-1

Dendroscope 3 is a new program for working with rooted phylogenetic trees and networks. It provides a number of methods for drawing and comparing rooted phylogenetic networks, and for computing them from rooted trees. The program can be used interactively or in command-line mode.

Please cite: Daniel H. Huson and Celine Scornavacca: Dendroscope 3: An Interactive Tool for Rooted Phylogenetic Trees and Networks. (PubMed,eprint) Systematic Biology 61(6):1061–1067 (2012)
diann
data-independent acquisition (DIA) proteomics data processing
Versions of package diann
ReleaseVersionArchitectures
VCS1.8+dfsg-1all
Versions and Archs
License: AS-IS
Debian package not available
Git
Version: 1.8+dfsg-1

DIA-NN - a universal software for data-independent acquisition (DIA) proteomics data processing by Demichev, Ralser and Lilley labs. In 2018, DIA-NN opened a new chapter in proteomics, introducing a number of algorithms which enabled reliable, robust and quantitatively accurate large-scale experiments using high-throughput methods.

Please cite: Vadim Demichev, Christoph B. Messner, Spyros I. Vernardis, Kathryn S. Lilley and Markus Ralser: DIA-NN: neural networks and interference correction enable deep proteome coverage in high throughput. (PubMed) Nature Methods 17(1):41-44 (2019)
ecell
Concept and environment for constructing virtual cells on computers
Versions of package ecell
ReleaseVersionArchitectures
VCS3.2.2-1all
Versions and Archs
License: GPL
Debian package not available
Git
Version: 3.2.2-1

The E-Cell Project is an international research project aiming at developing necessary theoretical supports, technologies and software platforms to allow precise whole cell simulation.

The E-Cell System is an object-oriented software suite for modeling, simulation, and analysis of large scale complex systems such as biological cells, architected by Kouichi Takahashi and written by a team of developers.

The core part of the system, E-Cell Simulation Environment version 3, allows many components driven by multiple algorithms with different timescales to coexist.

E-Cell System consists of the following three major parts:

  • E-Cell Simulation Environment (or E-Cell SE)
  • E-Cell Modeling Environment (or E-Cell ME)
  • E-Cell Analysis Toolkit

This package contains all these parts, only the documentation is distributed separately.

ensembl
basic Ensembl genome browser
Versions of package ensembl
ReleaseVersionArchitectures
VCS98+git20190619.e98e194-1all
Versions and Archs
License: free
Git
Version: 98+git20190619.e98e194-1

Ensembl is a joint project of the Sanger Center and the European Bioinformatics Institute, an outstation of the European Molecular Biology Laboratory, (EMBL-EBI) that are sharing a campus in Hinxton near Cambridge, UK. It presents the sequence data for the yet available complete genomes of many vertebrates and is helped by many sister-projects to cover also plants, invertebrates and bacteria.

This package provides a basic installation of Ensembl. It comprises a full copy of the public Ensembl website, minus Blast and SSAHA, and minus BioMart. It uses UniSearch instead of the engine used on the public site for searching by keyword. It connects directly to the public databases hosted by the EBI/Sanger.

This is meant as an easy way to get a basic Ensembl installation working on Debian. It can then be customised to local requirements.

Note that Ensembl has two odd dependencies: bioperl1.2.3 and libparallel-useragent-perl. Those are not required for routine browsing, but the bioperl1.2.3 library performs the parsing of BLAST outputs. Version 1.2.3 is in conflict with any other existing bioperl installation and forces you to effectively downgrade.

libwww-perl5.808 will conflict with the latest libwww-perl installation and thus force a downgrade to 5.808, which will disable many other tools on your system. Therefore it is advisable NOT to install this package in parallel with any other software, and/or use a virtual machine or dedicated machine.

WARNING: Requires internet connection both to install and to run, as it connects to the Sanger/EBI database servers during both installation and at runtime.

Remark of Debian Med team: Ensembl was removed from Debian due #645487

Ensembl used to be in Debian experimental branch but was removed for formal reasons which are explained in http://bugs.debian.org/645487

ensembl-vep
Variant Effect Predictor predicting the functional effects of genomic variants
Versions of package ensembl-vep
ReleaseVersionArchitectures
VCS100.2-1all
Versions and Archs
License: Apache-2.0
Debian package not available
Git
Version: 100.2-1

The Ensembl Variant Effect Predictor predicts the functional effects of genomic variants. It has three components:

  • VEP (Variant Effect Predictor) predicts the functional effects of genomic variants.
  • Haplosaurus uses phased genotype data to predict whole-transcript haplotype sequences.
  • Variant Recoder translates between different variant encodings.
Please cite: William McLaren, Laurent Gil, Sarah E. Hunt, Harpreet Singh Riat, Graham R. S. Ritchie, Anja Thormann, Paul Flicek and Fiona Cunningham: The Ensembl Variant Effect Predictor. (PubMed,eprint) Genome Biology 17(1):122 (2016)
Registry entries: Bioconda 
euler-sr
correcting errors in short gene sequence reads and assembling them
Versions of package euler-sr
ReleaseVersionArchitectures
VCS1.1.2-1all
Versions and Archs
License: non_profit
Debian package not available
Git
Version: 1.1.2-1

The EULER-SR assembly package contains a suite of programs for correcting errors in short reads and assembling them. Our assembler may take as input classical Sanger reads, 454 sequences, and Illumina reads.

Please cite: Mark J. Chaisson and Pavel A. Pevzner: Short read fragment assembly of bacterial genomes. (PubMed,eprint) Genome Research 18(2):324-30 (2008)
Registry entries: SciCrunch 
euler2
de novo repeat classification and fragment assembly
Versions of package euler2
ReleaseVersionArchitectures
VCS2.0-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 2.0-1

Repetitive sequences make up a significant fraction of almost any genome and an important and still open question in bioinformatics is how to represent all repeats in DNA sequences. We propose a radically new approach to repeat classification that is motivated by the fundamental topological notion of quotient spaces. A torus or Klein bottle are examples of quotient spaces that can be obtained from a square by gluing some points. Our new repeat classification algorithm is based on the observation that the alignment-induced quotient space of a DNA sequence compactly represents all sequence repeats. This observation leads to a simple and efficient solution of the repeat classification problem as well as new approaches to fragment assembly and multiple alignment.

Please cite: Pavel A. Pevzner, Haixu Tang and Glenn Tesler: De novo repeat classification and fragment assembly. RECOMB '04 Proceedings of the eighth annual international conference on Research in computational molecular biology :213-222 (2004)
exabayes
bayesian phylogenetic tree inference for large-scale analyses
Versions of package exabayes
ReleaseVersionArchitectures
VCS1.5+dfsg-1all
Versions and Archs
License: <license>
Debian package not available
Git
Version: 1.5+dfsg-1

ExaBayes is a tool for Bayesian phylogenetic analyses. It implements a Markov chain Monte Carlo sampling approach that allows to determine the posterior probability of a tree (resp., topology) and various evolutionary model parameters, for instance, branch lengths or substitution rates. Similar approaches are implemented in beast-mcmc or mrbayes. ExaBayes has heavily drawn inspiration specifically from the latter one.

ExaBayes comes with the most commonly used evolutionary models, such as the generalized time reversible model (GTR) of character substitution, the discretized Gamma-model of among site rate heterogeneity and estimates trees with unconstrained branch lengths. For clocked tree models or less parameter-rich substitution models, we refer you to the established tools.

The distinguishing feature of ExaBayes is its capability to handle enormous datasets efficiently. ExaBayes provides an implementation of data parallelism using the Message Passing Interface (MPI). This means, that if you conduct your analysis on a computing cluster composed of several machines (a.k.a. nodes), the memory needed to evaluate the likelihood of trees and parameters given a large alignment can be spread out across multiple computing nodes. In conclusion, the size of the concatenated alignment ExaBayes can handle is only limited by the combined main memory of your entire computing cluster.

Please cite: Andre J. Aberer, Kassian Kobert and Alexandros Stamatakis: ExaBayes: Massively Parallel Bayesian Tree Inference for the Whole-Genome Era. (PubMed,eprint) Molecular Biology and Evolution 31(10):2553-2556 (2014)
ffp
Feature Frequency Profile Phylogeny
Versions of package ffp
ReleaseVersionArchitectures
VCS3.19-1all
Versions and Archs
License: non-free
Debian package not available
Git
Version: 3.19-1

FFP (Feature frequency profile) is an alignment free comparison tool for phylogenetic analysis and text comparison. It can be applied to nucleotide sequences, complete genomes, proteomes and even used for text comparison.

Please cite: Gregory E. Sims and Sung-Hou Kim: Whole-genome phylogeny of Escherichia coli/Shigella group by feature frequency profiles (FFPs). (PubMed,eprint) Proc Natl Acad Sci U S A. 108(20):8329-34 (2011)
fieldbioinformatics
pipeline with virus identification with Nanopore sequencer
Versions of package fieldbioinformatics
ReleaseVersionArchitectures
VCS1.1.3-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 1.1.3-1

This is the ARTIC bioinformatics pipeline for working with virus sequencing data, sequenced with nanopore. It implements a complete bioinformatics protocol to take the output from the Nanopore sequencer and determine consensus genome sequences. Includes basecalling, de-multiplexing, mapping, polishing and consensus generation.

An outbreak of SARS-CoV-2, Ebola, ... something unknown? This software is field-proven.

Registry entries: Bio.tools  Bioconda 
flappie
flip-flop basecaller for Oxford Nanopore reads
Versions of package flappie
ReleaseVersionArchitectures
VCS2.1.3+ds-1all
Versions and Archs
License: Oxford-Nanopore-PL-1.0
Debian package not available
Git
Version: 2.1.3+ds-1

Basecall Fast5 reads using flip-flop basecalling.

Features

  • Flip-flop basecalling for the MinION platform

  • R9.4.1 (Native or PCR libraries)

  • R10C (PCR libraries only)
  • Basecalling of 5mC in CpG context for R9.4.1, PromethION platform
forester
Graphical vizualiation tool Archaeopteryx
Versions of package forester
ReleaseVersionArchitectures
VCS0.0+20180205-1all
Versions and Archs
License: LGPL 2.1+
Git
Version: 0.0+20180205-1

Archaeopteryx is a software tool for the visualization, analysis, and editing of potentially large and highly annotated phylogenetic trees. It can be used both as applet (ArchaeopteryxA and ArchaeopteryxE) and as a standalone application.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html

BioLinux was following the upstream name change to archaeopteryx and thus the package is called bio-linux-archaeopteryx there.

The binary package is full of JARs without source.

galaxy
scientific workflow and data integration platform for computational biology
Versions of package galaxy
ReleaseVersionArchitectures
VCS16.10-1all
Versions and Archs
License: TODO
Debian package not available
Git
Version: 16.10-1

Galaxy is a scientific workflow, data integration, and data and analysis persistence and publishing platform that aims to make computational biology accessible to research scientists that do not have computer programming or systems administration experience. Although it was initially developed for genomics research, it is largely domain agnostic and is now used as a general bioinformatics workflow management system.

Please cite: Marcel Martin: Cutadapt removes adapter sequences from high-throughput sequencing reads. (eprint) EMBnet.journal 17(1):10-12 (2015)
gatk
The Genome Analysis Toolkit
Versions of package gatk
ReleaseVersionArchitectures
VCS4.2.0.0+dfsg-1all
Versions and Archs
License: Apache-2.0
Debian package not available
Git
Version: 4.2.0.0+dfsg-1

The Genome Analysis Toolkit or GATK is a software package developed at the Broad Institute to analyze high-throughput sequencing data. The toolkit offers a wide variety of tools, with a primary focus on variant discovery and genotyping as well as strong emphasis on data quality assurance. Its robust architecture, powerful processing engine and high-performance computing features make it capable of taking on projects of any size.

Please cite: Aaron McKenna, Matthew Hanna, Eric Banks, Andrey Sivachenko, Kristian Cibulskis, Andrew Kernytsky, Kiran Garimella, David Altshuler, Stacey Gabriel, Mark Daly and Mark A. DePristo: The Genome Analysis Toolkit: A MapReduce framework for analyzing next-generation DNA sequencing data. (PubMed,eprint) Genome Research 20(9):1297-303 (2010)
Registry entries: Bioconda 
gerp++
identifies constrained elements in multiple alignments
Versions of package gerp++
ReleaseVersionArchitectures
VCS2.1-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 2.1-1

GERP is a package for analyzing evolutionary rates and finding constrained elements in a multiple alignment. It uses the notion of "rejected substitutions" (RS) in order to quantify constraint at individual positions as well as over elements spanning multiple positions.

GERP consists of two main components: gerpcol, which analyzes multiple alignments and computes RS scores for all positions, and gerpelem, which finds constrained elements given the RS scores produced by gerpcol.

Please cite: Eugene V. Davydov, David L. Goode, Marina Sirota, Gregory M. Cooper, Arend Sidow and Serafim Batzoglou: Identifying a High Fraction of the Human Genome to be under Selective Constraint Using GERP++. (PubMed,eprint) PLOS Computational Biology 6(12):1-13 (2010)
gramalign
multiple alignment of biological sequences
Versions of package gramalign
ReleaseVersionArchitectures
VCS3.0-1all
Versions and Archs
License: Free-for-adacemia
Debian package not available
Git
Version: 3.0-1

GramAlign is a time-efficient progressive Multiple Sequence Alignment (MSA) algorithm. The novelty of GramAlign comes from the sequence distance estimation step, whereby distances are determined by the natural grammar present in nucleotide and amino acid sequences.

Please cite: D. J. Russell, H. H. Otu and K. Sayood: Grammar-based distance in progressive multiple sequence alignment. (eprint) BMC Bioinformatics 9:306 (2008)
graphbin
refined binning of metagenomic contigs using assembly graphs
Versions of package graphbin
ReleaseVersionArchitectures
VCS1.1-1all
Versions and Archs
License: GPL-2.0+
Debian package not available
Git
Version: 1.1-1

GraphBin is a NGS data-based metagenomic contig bin refinment tool that makes use of the contig connectivity information from the assembly graph to bin contigs. It utilizes the binning result of an existing binning tool and a label propagation algorithm to correct mis-binned contigs and predict the labels of contigs which are discarded due to short length.

Please cite: Vijini Mallawaarachchi, Anuradha Wickramarachchi and Yu Lin: GraphBin: refined binning of metagenomic contigs using assembly graphs. (PubMed) Bioinformatics 36:3307-3313 (2020)
graphmap2
highly sensitive and accurate mapper for long, error-prone reads
Versions of package graphmap2
ReleaseVersionArchitectures
VCS0.6.4-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 0.6.4-1

GraphMap2 is a highly sensitive and accurate mapper for long, error- prone reads. The mapping algorithm is designed to analyse nanopore sequencing reads, which progressively refines candidate alignments to robustly handle potentially high-error rates and a fast graph traversal to align long reads with speed and high precision (>95%). Evaluation on MinION sequencing data sets against short- and long-read mappers indicates that GraphMap increases mapping sensitivity by 10–80% and maps

95% of bases. GraphMap alignments enabled single-nucleotide variant calling on the human genome with increased sensitivity (15%) over the next best mapper, precise detection of structural variants from length 100 bp to 4 kbp, and species and strain-specific identification of pathogens using MinION reads.

Please cite: Ivan Sović, Mile Šikić, Andreas Wilm, Shannon Nicole Fenlon, Swaine Chen and Niranjan Nagarajan: Fast and sensitive mapping of nanopore sequencing reads with GraphMap. (PubMed,eprint) Nature Communications 7(11307) (2016)
Registry entries: Bioconda 
haploview
Analysis and visualization of LD and haplotype maps
Versions of package haploview
ReleaseVersionArchitectures
VCS4.1-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 4.1-1

This tools assists in the analysis of the nucleotide variation in a population. Such investigations are performed to determine genes and genetic pathways that are associated with diseases. This is an early stage in the quest for new drugs.

Please cite: Jeffrey C. Barrett: Haploview: Visualization and analysis of SNP genotype data. (PubMed,eprint) Cold Spring Harb Protoc. 2009(10):pdb.ip71 (2009)
Registry entries: Bio.tools  SciCrunch 
hawkeye
Interactive Visual Analytics Tool for Genome Assemblies
Versions of package hawkeye
ReleaseVersionArchitectures
VCS3.1.0-1all
Versions and Archs
License: Artistic
Debian package not available
Git
Version: 3.1.0-1

Genome assembly remains an inexact science. Even when accomplished with the best software available, the assembly of a genome often contains numerous errors, both small and large. Hawkeye is a visual analytics tool for genome assembly analysis and validation, designed to aid in identifying and correcting assembly errors. Hawkeye blends the best practices from information and scientific visualization to facilitate inspection of large-scale assembly data while minimizing the time needed to detect mis-assemblies and make accurate judgments of assembly quality.

All levels of the assembly data hierarchy are made accessible to users, along with summary statistics and common assembly metrics. A ranking component guides investigation towards likely mis-assemblies or interesting features to support the task at hand. Wherever possible, high-level overviews, dynamic filtering, and automated clustering are leveraged to focus attention and highlight anomalies in the data. Hawkeyes effectiveness has been proven on several genome projects, where it has been used both to improve quality and to validate the correctness of complex genomes.

Hawkeye is compatible with most widely used assemblers, including Phrap, ARACHNE, Celera Assembler, Newbler, AMOS, and assemblies deposited in the NCBI Assembly Archive.

Please cite: Michael C. Schatz, Adam M. Phillippy, Daniel D. Sommer, Arthur L. Delcher, Daniela Puiu, Giuseppe Narzisi, Steven L. Salzberg and Mihai Pop: Hawkeye and AMOS: visualizing and assessing the quality of genome assemblies. (PubMed,eprint) Briefings in Bioinformatics (2011)
Registry entries: Bio.tools  SciCrunch 
htqc
Quality control and filtration for illumina sequencing data
Versions of package htqc
ReleaseVersionArchitectures
VCS1.92.3-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 1.92.3-1

HTQC is a toolkit including statistics tool for illumina high-throughput sequencing data, and filtration tools for sequence quality, length, tail quality, etc..

Please cite: Xi Yang, Di Liu, Fei Liu, Jun Wu, Jing Zou, Xue Xiao, Fangqing Zhao and Baoli Zhu: HTQC: a fast quality control toolkit for Illumina sequencing data. (PubMed,eprint) BMC Bioinformatics 14:33 (2013)
Registry entries: SciCrunch 
idefix
index checking for improved demultiplexing of NGS data
Versions of package idefix
ReleaseVersionArchitectures
VCS1.3-1all
Versions and Archs
License: LGPL-3+
Debian package not available
Git
Version: 1.3-1

IDeFIX is a tool for demultiplexing Illumina NGS data.

It reports inconsistencies between the raw data and the Sample Sheet, checks for duplicates of indices/ index combinations in the latter and removes unwanted characters from it. Apart from messages printed on the terminal, IDeFIX creates an IDeFIX_Report.csv containing the indices/ index combinations from the raw data and their abundance as well as their count in the Sample Sheet and the corresponding Index ID(s). This file is stored in the project folder.

inspect
mass-spectrometry database search tool
Versions of package inspect
ReleaseVersionArchitectures
VCS0.0.20120109-1all
Versions and Archs
License: non-profit
Debian package not available
Git
Version: 0.0.20120109-1

Inspect is a MS/MS database search tool specifically designed to address two crucial needs of the proteomics comminuty: post-translational modification identification and search speed. The program is available as a free download or online in the ProteoSAFe webserver. The online interface is coordinated with other proteomics software developed in the lab, like PepNovo

Typical database searches do not deal well with the dynamic nature of the proteome. Post-translational modifications, alternative splicing, and laboratory chemisty all affect protein behavior and make spectrum interpretation more challenging. The primary challenge is that the "virtual database" of all modified peptides undergoes a combinatorial explosion when a broad range of modifications is allowed. This affects search running time. A secondary challenge is that in this richer database, there are many more close "relatives" for each peptide. This affects scoring accuracy, since differentiating between correct and incorrect identifications is more difficult.

InsPecT addresses several algorithmic problems in order to identify modified proteins.

InsPecT uses peptide sequence tags (PSTs) to filter the database. InsPecT has an internal tag generator, but can accept tags generated by other tools (e.g. Pepnovo, GutenTAG). Because de novo is imperfect, multiple tags are produced for each spectrum, to ensure that (at least) one tag is corrrect. These PSTs are extremely efficient filters, even in the context of up to a dozen possible modifications. Tag-based filtering can also be combined with the "two-pass" filtering pioneered by X!Tandem, where from one search provides a list of proteins (a mini- database) for a more detailed search.

Unanticipated modifications are common in proteomics. InsPecT implements the MS-Alignment algorithm for "blind" spectral search, with no bias toward anticipated modification types. This search has been applied to annotate heavily-modified proteins such as crystallins.

Please cite: Stephen Tanner, Hongjun Shu, Ari Frank, Ling-Chi Wang, Ebrahim Zandi, Marc Mumby, Pavel A. Pevzner and Vineet Bafna: InsPecT: Fast and accurate identification of post-translationally modified peptides from tandem mass spectra. (PubMed) Anal Chem. 77(14):4626-39 (2005)
Registry entries: Bio.tools 
jbrowse
genome browser with an AJAX-based interface
Versions of package jbrowse
ReleaseVersionArchitectures
VCS1.2.3-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 1.2.3-1

JBrowse is a genome browser with an AJAX-based interface. JBrowse renders most tracks using client side JavaScript and JSON as its data transfer format. JBrowse is the official successor to GBrowse.

kempbasu
significance tests for comparing digital gene expression profiles
Versions of package kempbasu
ReleaseVersionArchitectures
VCS0.9.1-1all
Versions and Archs
License: GPL-3
Debian package not available
Git
Version: 0.9.1-1

This package implements the significance tests for comparing digital gene profiles described in the article:

Varuzza et al. "Significance tests for comparing digital gene expression profiles"

They provide two programs: kemp for the frequentist test and basu for the Bayesian test, and some auxiliary scripts.

mach-haplotyper
Markov Chain based SNP haplotyper
Versions of package mach-haplotyper
ReleaseVersionArchitectures
VCS1.0.18-1all
Versions and Archs
License: non-free
Debian package not available
Git
Version: 1.0.18-1

Recent advancements in chip-based DNA genotyping allow to infer DNA variants that are not part of the chip but known to be associated with a combination of SNPs that are measured.

Please cite: Yun Li, Cristen J. Willer, Jun Ding, Paul Scheet and Gonçalo R. Abecasis: MaCH: using sequence and genotype data to estimate haplotypes and unobserved genotypes. (PubMed) Genetic Epidemiology 34(8):816-34 (2010)
Registry entries: Bio.tools  SciCrunch 
mage2tab
MAGE-MLv1 converter and visualiser
Versions of package mage2tab
ReleaseVersionArchitectures
VCS0.9-1all
Versions and Archs
License: CBIL-1.0
Debian package not available
Git
Version: 0.9-1

This tool-kit is part of MR_T, a framework for import or export various of MAGE (MicroArray Gene Expression) documents (MAGE-MLv1, MAGE-TAB, SOFT, MINiML) from or into databases like GUS (the Genomics Unified Schema, www.gusdb.org).

This package provides the following programs:

 mage2tab     — MAGE-MLv1 to MAGE-TAB converter
 mage2graph   — GraphViz-based mage data visualisation tool
 mage-checker — Validation tool
manta
structural variant and indel caller for mapped sequencing data
Versions of package manta
ReleaseVersionArchitectures
VCS1.6.0+dfsg-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 1.6.0+dfsg-1

Manta calls structural variants (SVs) and indels from mapped paired-end sequencing reads. It is optimized for analysis of germline variation in small sets of individuals and somatic variation in tumor/normal sample pairs. Manta discovers, assembles and scores large-scale SVs, medium- sized indels and large insertions within a single efficient workflow. The method is designed for rapid analysis on standard compute hardware: NA12878 at 50x genomic coverage is analyzed in less than 20 minutes on a 20 core server, and most WGS tumor/normal analyses can be completed within 2 hours. Manta combines paired and split-read evidence during SV discovery and scoring to improve accuracy, but does not require split- reads or successful breakpoint assemblies to report a variant in cases where there is strong evidence otherwise. It provides scoring models for germline variants in small sets of diploid samples and somatic variants in matched tumor/normal sample pairs. There is experimental support for analysis of unmatched tumor samples as well. Manta accepts input read mappings from BAM or CRAM files and reports all SV and indel inferences in VCF 4.1 format.

Please cite: Xiaoyu Chen, Ole Schulz-Trieglaff, Richard Shaw, Bret Barnes, Felix Schlesinger, Morten Källberg, Anthony J. Cox, Semyon Kruglyak and Christopher T. Saunders: Manta: rapid detection of structural variants and indels for germline and cancer sequencing applications. (PubMed,eprint) Bioinformatics 32(8):1220-1222 (2015)
Registry entries: Bio.tools  Bioconda 
marginphase
simultaneous haplotyping and genotyping
Versions of package marginphase
ReleaseVersionArchitectures
VCS0.0+git20181109.cdf139e-1all
Versions and Archs
License: Expat
Debian package not available
Git
Version: 0.0+git20181109.cdf139e-1

MarginPhase is a program for simultaneous haplotyping and genotyping. It is an experimental, open source implementation written in C and developed to work primarily with nanopore data. The MarginPhase workflow includes an alignment summation step. This differentiates it from WhatsHap, which performs a local realignment around analyzed sites. MarginPhase can also phase genotypic variants simultaneously after filtering out the sites that are likely homozygous. MarginPhase’s output includes a BAM which encodes the phasing of each read, including which phase set it is in, which haplotype it belongs to, and what of the aligned portion falls into each phase set. Reads which span a phase set boundary have information for both encoded in them.

Please cite: Jana Ebler, Marina Haukness, Trevor Pesout, Tobias Marschall and Benedict Paten: Haplotype-aware diplotyping from noisy long reads. (PubMed,eprint) Genome Biol 20(1):116 (2019)
martj
distributed data integration system for biological data
Versions of package martj
ReleaseVersionArchitectures
VCS0.9+dfsg-1all
Versions and Archs
License: LGPL-2+
Debian package not available
Git
Version: 0.9+dfsg-1

BioMart is a simple, distributed data integration system with powerful query capabilities. The BioMart data model has been applied to the following data sources: UniProt Proteomes, Macromolecular Structure Database (MSD), Ensembl, Vega, and dbSNP.

It has been designed to provide researchers with an easy and interactive access to both the wealth of data available on the Internet and for in house data integration. BioMart is a successor to the generic query system originally developed for the Ensembl genome database (EnsMart). Building on its success, BioMart, has now been applied to other biological databases.

medaka
sequence correction provided by ONT Research
Versions of package medaka
ReleaseVersionArchitectures
VCS1.0.3+dfsg-1all
Versions and Archs
License: MPL-2.0
Debian package not available
Git
Version: 1.0.3+dfsg-1

Medaka is a tool to create a consensus sequence from nanopore sequencing data. This task is performed using neural networks applied from a pileup of individual sequencing reads against a draft assembly. It outperforms graph-based methods operating on basecalled data, and can be competitive with state-of-the-art signal-based methods, whilst being much faster.

Features

  • Requires only basecalled data. (.fasta or .fastq)
  • Improved accurary over graph-based methods (e.g. Racon).
  • 50X faster than Nanopolish (and can run on GPUs).
  • Methylation aggregation from Guppy .fast5 files.
  • Benchmarks are provided here.
  • Includes extras for implementing and training bespoke correction networks.
Registry entries: Bioconda 
meme
search for common motifs in DNA or protein sequences
Versions of package meme
ReleaseVersionArchitectures
VCS5.5.5-1all
Versions and Archs
License: non-free
Debian package not available
Git
Version: 5.5.5-1

MEME (Multiple EM for Motif Elicitation) is a tool for discovering motifs in a group of related DNA or protein sequences. A motif is a sequence pattern that occurs repeatedly in a group of related protein or DNA sequences. MEME represents motifs as position-dependent letter-probability matrices which describe the probability of each possible letter at each position in the pattern. Individual MEME motifs do not contain gaps. Patterns with variable-length gaps are split by MEME into two or more separate motifs.

MEME takes as input a group of DNA or protein sequences (the training set) and outputs as many motifs as requested. MEME uses statistical modeling techniques to automatically choose the best width, number of occurrences, and description for each motif.

Please cite: Timothy L. Bailey, Nadya Williams, Chris Misleh and Wilfred W. Li: MEME: discovering and analyzing DNA and protein sequence motifs. (PubMed,eprint) Nucleic Acids Research 34(Web Server issue):W369–W373 (2006)
Registry entries: Bio.tools  SciCrunch  Bioconda 
mesquite
modular system for evolutionary analysis
Versions of package mesquite
ReleaseVersionArchitectures
VCS3.04+dfsg.1-1all
Versions and Archs
License: <license>
Debian package not available
Git
Version: 3.04+dfsg.1-1

Mesquite is modular, extendible software for evolutionary biology, designed to help biologists organize and analyze comparative data about organisms. Its emphasis is on phylogenetic analysis, but some of its modules concern population genetics, while others do non-phylogenetic multivariate analysis. Because it is modular, the analyses available depend on the modules installed.

Mesquite also has many features for managing and processing data, including processing of chromatograms, sequence alignment, editing of morphometric data, and others.

metabit
analysing microbial profiles from high-throughput sequencing shotgun data
Versions of package metabit
ReleaseVersionArchitectures
VCS0.0+git20170725.24cb3ee+dfsg-1all
Versions and Archs
License: expat
Debian package not available
Git
Version: 0.0+git20170725.24cb3ee+dfsg-1

MetaBIT is an integrative and automated metagenomic pipeline for analysing microbial profiles from high-throughput sequencing shotgun data.

The metaBIT pipeline proposes tools for visualising microbial profiles (barplots, heatmaps) and performing a range of statistical analyses (diversity indices, hierarchical clustering and principal coordinate analysis). It uses as input fastq files containing trimmed reads from shotgun high through-put sequencing.

Please cite: Guillaume Louvel, Clio Der Sarkissian, Kristian Hanghøj and Ludovic Orlando: metaBIT, an integrative and automated metagenomic pipeline for analysing microbial profiles from high-throughput sequencing shotgun data. (PubMed) Molecular Ecology Resources (2016)
modeller
Protein structure modeling by satisfaction of spatial restraints
Versions of package modeller
ReleaseVersionArchitectures
VCS9.19-1all
Versions and Archs
License: non-free_academic
Git
Version: 9.19-1

MODELLER is used for homology or comparative modeling of protein three-dimensional structures (1). The user provides an alignment of a sequence to be modeled with known related structures and MODELLER automatically calculates a model containing all non-hydrogen atoms. MODELLER implements comparative protein structure modeling by satisfaction of spatial restraints (2, 3), and can perform many additional tasks, including de novo modeling of loops in protein structures, optimization of various models of protein structure with respect to a flexibly defined objective function, multiple alignment of protein sequences and/or structures, clustering, searching of sequence databases, comparison of protein structures, etc.

Please cite: M.A. Marti-Renom, A. Stuart, A. Fiser, R. Sánchez and F. Melo, A. Sali.: Comparative protein structure modeling of genes and genomes. (PubMed) Annu Rev Biophys Biomol Struct. 29:291-325 (2000)
Remark of Debian Med team: The package is created independently from Debian Med or Debian Science.

The source code is not generally available. Hence, most users are limited to the compiled versions of MODELLER. The program is distributed as a single install file that contains scripts, libraries, examples, documentation (in PDF and HTML formats) and executables for the supported platforms and operating systems. Please refer to the relevant section below for your platform:

The program comes as closed source, only free for academia, see http://salilab.org/modeller/registration.html.

molekel
Advanced Interactive 3D-Graphics for Molecular Sciences
Versions of package molekel
ReleaseVersionArchitectures
VCS5.4-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 5.4-1

Molekel is an open-source multi-platform molecular visualization program.

Some of the features are:

  • Different methods to speed-up rendering of molecules with support for billboards and view-dependent level of detail techniques
  • Programmable shaders; standard shaders to enhance rendering quality, outline contours and perform sketch-like renderings are provided
  • Visualization of residues (ribbon or schematic)
  • Complete control over the generation of molecular surfaces (bounding box and resolution)
  • Visualization of the following surfaces:
  • Orbitals
  • Iso-surface from density matrix
  • Iso-surface from Gaussian cube grid data
  • SAS
  • SES
  • Van der Waals
  • Animation of molecular surfaces
  • Animation of vibrational modes
  • Export high resolution images for 300+ DPI printing
  • Export to PostScript and PDF
  • Export animation
  • Plane widget to visualize a scalar field: the plane can be freely moved in 3d space and the points on the plane surface will be colored according to the value of the scalar field: a cursor can be moved on the plane surface to show the exact value of the field at a specific point in space.
mosaik-aligner
reference-guided aligner for next-generation sequencing
Versions of package mosaik-aligner
ReleaseVersionArchitectures
VCS2.2.30+20140627-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 2.2.30+20140627-1

MosaikBuild converts various sequence formats into Mosaik’s native read format. MosaikAligner pairwise aligns each read to a specified series of reference sequences. MosaikSort resolves paired-end reads and sorts the alignments by the reference sequence coordinates. Finally, MosaikText converts alignments to different text-based formats.

At this time, the workflow consists of supplying sequences in FASTA, FASTQ, Illumina Bustard & Gerald, or SRF file formats and producing results in the BLAT axt, the BAM/SAM, the UCSC Genome Browser bed, or the Illumina ELAND formats.

mpsqed
alignment editor and multiplex pyrosequencing assay designer
Versions of package mpsqed
ReleaseVersionArchitectures
VCS0.9.3-1all
Versions and Archs
License: LGPL-2+
Debian package not available
Git
Version: 0.9.3-1

Molecular-based diagnostic assays are the gold standard for infectious diseases today, since they allow a rapid and sensitive identification and typing of various pathogens. While PCR can be designed to be specific for a certain pathogen, a subsequent sequence analysis is frequently required for confirmation or typing. The design of appropriate PCR-based assays is a complex task, especially when conserved discriminating polymorphisms are rare or if the number of types which need to be differentiated is high. One extremely useful but underused method for this purpose is the multiplex pyrosequencing technique. mPSQed is a program developed at the Robert Koch Institute and targeted at facilitating the creation of such assays.

Please cite: Piotr Wojtek Dabrowski and Andreas Nitsche: mPSQed: A Software for the Design of Multiplex Pyrosequencing Assays. (PubMed,eprint) PLoS One 7(6):e38140 (2012)
mugsy
multiple whole genome alignment tool
Versions of package mugsy
ReleaseVersionArchitectures
VCS1r2.3+dfsg-1all
Versions and Archs
License: Artistic-2.0
Debian package not available
Git
Version: 1r2.3+dfsg-1

Mugsy is a multiple whole genome aligner. Mugsy uses Nucmer for pairwise alignment, a custom graph based segmentation procedure for identifying collinear regions, and the segment-based progressive multiple alignment strategy from Seqan::TCoffee. Mugsy accepts draft genomes in the form of multi-FASTA files and does not require a reference genome.

Please cite: Samuel V. Angiuoli and Steven L. Salzberg: Mugsy: fast multiple alignment of closely related whole genomes. (PubMed,eprint) Bioinformatics 27(3):334-342 (2011)
Registry entries: SciCrunch  Bioconda 
mview
biological sequence alignment conversion
Versions of package mview
ReleaseVersionArchitectures
VCS1.67+dfsg1-1all
Versions and Archs
License: GPL-2.0+
Debian package not available
Git
Version: 1.67+dfsg1-1

mview is a command line utility that extracts and reformats the results of a sequence database search or a multiple alignment, optionally adding HTML markup for web page layout. It can also be used as a filter to extract and convert searches or alignments to common formats.

Inputs:

  • Sequence database search: BLAST, FASTA suites.
  • Multiple sequence alignment: CLUSTAL, HSSP, MSF, FASTA, PIR, MAF Outputs:

  • HTML, FASTA, CLUSTAL, MSF, PIR, RDB (tab-separated).

The redundancy of that source tree with existing JS packages needs to be evaluated. In the interim, the package shall remain in experimental.

Please cite: Nigel P. Brown, C. Leroy and Christian Sander: MView: A Web compatible database search or multiple alignment viewer. (PubMed,eprint) Bioinformatics 14(4):380-381 (1998)
nano-snakemake
detection of structural variants in genome sequencing data
Versions of package nano-snakemake
ReleaseVersionArchitectures
VCS1.0+git20200224.ff11b35-1all
Versions and Archs
License: Expat
Debian package not available
Git
Version: 1.0+git20200224.ff11b35-1

To "have a genetic variation" may mean many different things. Technically most straight forward to investigate are changes to single positions in the long DNA chains - every chromosome is a single polymer of nucleic acids. This is also what we have most data from for many diseases.

But sometimes, DNA that looks completely the same when looking at short reads at the time (and not feeling lucky), the position looked at may be inverted on the chromosome. Or it may be a copy of the original site and not a "real" single-nucleotide polymorphism (SNP). Or it may have translocated to another chromosome.

These are examples for structural changes to the DNA. Individuals may never notice them. Or there may be a higher chances to develop a disease or it may affect fertility. Technologies like the Nanopore have emerged that can read longer segments of the DNA, so one can see multiple copies of the same gene in the same read or at least can assemble the DNA fragments read in a way to then align the reads non-ambiguously and support the analysis of such copy-number variations (CNVs).

This snakemake pipeline on nanopore whole genome sequencing data provides a complete structural variant analysis. Steps implemented and tools wrapped comprise:

  • fast: minimap2 alignment with Sniffles and SVIM SV calling
  • precise: ngmlr alignment with Sniffles SV calling
  • minimap2: minimap2 alignment with Sniffles, SVIM, NanoSV and npInv SV calling
  • minimap2_pbsv: minimap2 alignment with pbsv-specific parameters with pbsv, SVIM, NanoSV and npInv SV calling
  • ngmlr: ngmlr with Sniffles, NanoSV, SVIM and npInv SV calling
  • last-prepare: create a LAST index and train aligner parameters using last-train
  • last: LAST alignment with tandem-genotypes STR calling
Please cite: Wouter De Coster, Peter De Rijk, Arne De Roeck, Tim De Pooter, Svenn D'Hert, Mocja Strazisar, Sleegers Kristel and Christine Van Broeckhoven: Structural variants identified by Oxford Nanopore PromethION sequencing of the human genome. Genome Res. (2019.0)
nanocall
Basecaller for Oxford Nanopore Sequencing Data
Versions of package nanocall
ReleaseVersionArchitectures
VCS0.7.4-1all
Versions and Archs
License: expat
Debian package not available
Git
Version: 0.7.4-1

The highly portable Oxford Nanopore MinION sequencer has enabled new applications of genome sequencing directly in the field. However, the MinION currently relies on a cloud computing platform, Metrichor (metrichor.com), for translating locally generated sequencing data into basecalls.

Nanocall allows offline and private analysis of MinION data. Nanocall is the first freely-available, open-source basecaller for Oxford Nanopore sequencing data and does not require an internet connection. Using R7.3 chemistry, on two E.coli and two human samples, with natural as well as PCR-amplified DNA, Nanocall reads have ~68% identity, directly comparable to Metrichor "1D" data. Further, Nanocall is efficient, processing ~2500Kbp of sequence per core hour using the fastest settings, and fully parallelized. Using a 4 core desktop computer, Nanocall could basecall a MinION sequencing run in real time. Metrichor provides the ability to integrate the "1D" sequencing of template and complement strands of a single DNA molecule, and create a "2D" read. Nanocall does not currently integrate this technology, and addition of this capability will be an important future development. In summary, Nanocall is the first open-source, freely available, off-line basecaller for Oxford Nanopore sequencing data.

Please cite: Matei David, Lewis Jonathan Dursi, Delia Yao, Paul C Boutros and Jared T Simpson: Nanocall: An Open Source Basecaller for Oxford Nanopore Sequencing Data. (PubMed,eprint) Bioinformatics (2016)
Registry entries: Bioconda 
nanocomp
compare multiple runs of long biological sequences
Versions of package nanocomp
ReleaseVersionArchitectures
VCS1.12.0-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 1.12.0-1

NanoClmp compares multiple runs of long read sequencing data and alignments. It creates violin plots or box plots of length, quality and percent identity and creates dynamic, overlaying read length histograms and a cumulative yield plot.

This package installs the 'NanoCalc' executable.

Please cite: Wouter De Coster, Svenn D’Hert, Darrin T Schultz, Marc Cruts and Christine Van Broeckhoven: NanoPack: visualizing and processing long-read sequencing data. (PubMed,eprint) Bioinformatics 34(15):2666–2669 (2018)
Registry entries: Bioconda 
nanoplot
plotting scripts for long read sequencing data
Versions of package nanoplot
ReleaseVersionArchitectures
VCS1.36.2-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 1.36.2-1

NanoPlot provides plotting scripts for long read sequencing data.

These scripts perform data extraction from Oxford Nanopore sequencing data in the following formats:

  • fastq files (optionally compressed)
  • fastq files generated by albacore, guppy or MinKNOW containing additional information (optionally compressed)
  • sorted bam files
  • sequencing_summary.txt output table generated by albacore, guppy or MinKnow basecalling (optionally compressed)
  • fasta files (optionally compressed)
  • multiple files of the same type can be offered simultaneously
Please cite: Wouter De Coster, Svenn D'Hert, Darrin T Schultz, Marc Cruts and Christine Van Broeckhoven: NanoPack: visualizing and processing long-read sequencing data. (PubMed,eprint) Bioinformatics 34(15):2666-2669 (2018)
Registry entries: Bioconda 
ncbi-magicblast
RNA-seq mapping tool
Versions of package ncbi-magicblast
ReleaseVersionArchitectures
VCS1.5.0+ds-1all
Versions and Archs
License: PD
Debian package not available
Git
Version: 1.5.0+ds-1

Magic-BLAST is a tool for mapping large next-generation RNA or DNA sequencing runs against a whole genome or transcriptome. Each alignment optimizes a composite score, taking into account simultaneously the two reads of a pair, and in case of RNA-seq, locating the candidate introns and adding up the score of all exons. This is very different from other versions of BLAST, where each exon is scored as a separate hit and read- pairing is ignored.

Please cite: Grzegorz M. Boratyn, Jean Thierry-Mieg, Danielle Thierry-Mieg, Ben Busby and Thomas L. Madden: Magic-BLAST, an accurate RNA-seq aligner for long and short reads. (PubMed,eprint) BMC Bioinformatics 20(1):405 (2019)
Registry entries: Bioconda 
nextsv
automated structural variation detection for long-read sequencing
Versions of package nextsv
ReleaseVersionArchitectures
VCS0.4.0-1all
Versions and Archs
License: GB-nonfree
Debian package not available
Git
Version: 0.4.0-1

NextSV is an computational pipeline that allows structural variant (SV) calling from PacBio sequencing data using PBhoney and Sniffles. NextSV takes FASTA or FASTQ files as input. Once the SV caller is selected by user, NextSV automatically chooses the compatible aligner and performs mapping. The alignments will be automatically sorted and then presented to the SV caller. Users can change the parameters by modifying its configuration file. When the analysis is finished, NextSV will examine the FASTA/FASTQ, BAM, and result files and generate a report showing various statistics. If more than both callers are selected, NextSV will format the raw result files (.tails, .spots, or .vcf files) into bed files and generate the intersection or union call set for the purpose of higher accuracy or sensitivity.

Please cite: Li Fang, Jiang Hu, Depeng Wang and Kai Wang: Evaluation on Detection of Structural Variants by Low-Coverage Long-Read Sequencing. bioRxiv (2016)
Registry entries: Bio.tools 
ngila
global pairwise alignments with logarithmic and affine gap costs
Versions of package ngila
ReleaseVersionArchitectures
VCS1.3-1all
Versions and Archs
License: GPLv3
Debian package not available
Git
Version: 1.3-1

Ngila is an application that will find the best alignment of a pair of sequences using log-affine gap costs, which are the most biologically realistic gap costs.

Ngila implements the Miller and Myers (1988) algorithm in order to find a least costly global alignment of two sequences given homology costs and a gap cost. Two versions of the algorithm are included: holistic and divide-and-conquer. The former is faster but the latter utilizes less memory. Ngila starts with the divide-and-conquer method but switches to the holistic method for subsequences smaller than a user-established threshold. This improves its speed without substantially increasing memory requirements. Ngila also allows users to assign costs to end gaps that are smaller than costs for internal gaps. This is important for aligning using the free-end-gap method.

Please cite: Reed A. Cartwright: Ngila: global pairwise alignments with logarithmic and affine gap costs. (PubMed,eprint) Bioinformatics 23(11):1427-1428 (2007)
ngsqctoolkit
toolkit for the quality control of next generation sequencing data
Versions of package ngsqctoolkit
ReleaseVersionArchitectures
VCS2.3.3-1all
Versions and Archs
License: to_be_clarified
Debian package not available
Git
Version: 2.3.3-1

NGS QC Toolkit: A toolkit for the quality control (QC) of next generation sequencing (NGS) data. The toolkit comprises of user-friendly stand alone tools for quality control of the sequence data generated using Illumina and Roche 454 platforms with detailed results in the form of tables and graphs, and filtering of high-quality sequence data. It also includes few other tools, which are helpful in NGS data quality control and analysis.

Please cite: Ravi K. Patel and Mukesh Jain: NGS QC Toolkit: A Toolkit for Quality Control of Next Generation Sequencing Data. (PubMed,eprint) PLoS One 7(2):e30619 (2012)
nw-align
global protein sequence alignment
Versions of package nw-align
ReleaseVersionArchitectures
VCS0.20100803-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 0.20100803-1

NWalign is simple and robust alignment program for protein sequence-to-sequence alignments based on the standard Needleman-Wunsch dynamic programming algorithm. The implementation is performed in FORTRAN.

This program was tested at 2014-02-01 by Daniel Barker at the Debian Med sprint and was not functional according to his test.

oases
de novo transcriptome assembler for very short reads
Versions of package oases
ReleaseVersionArchitectures
VCS0.2.09-1all
Versions and Archs
License: GPL-3
Debian package not available
Git
Version: 0.2.09-1

Oases is a de novo transcriptome assembler designed to produce transcripts from short read sequencing technologies, such as Illumina, SOLiD, or 454 in the absence of any genomic assembly. Oases uploads a preliminary assembly produced by Velvet, and clusters the contigs into small groups, called loci. It then exploits the paired-end read and long read information, when available, to construct transcript isoforms.

Please cite: Marcel H. Schulz, Daniel R. Zerbino, Martin Vingron and Ewan Birney: Oases: Robust de novo RNA-seq assembly across the dynamic range of expression levels. (PubMed,eprint) Bioinformatics 28(8):1086-1092 (2012)
Registry entries: Bio.tools  SciCrunch 
omegamap
describing selection and recombination in sequences
Versions of package omegamap
ReleaseVersionArchitectures
VCS0.5-1all
Versions and Archs
License: GPL-3
Debian package not available
Git
Version: 0.5-1

OmegaMap is a program for detecting natural selection and recombination in DNA or RNA sequences. It is based on a model of population genetics and molecular evolution. The signature of natural selection is determined by the relative excess of non-synonymous to synonymous polymorphisms. The signature of recombination is detected from the patterns of linkage disequilibrium.

Please cite: Daniel J. Wilson and G. McVean: Estimating diversifying selection and functional constraint in the presence of recombination.. (PubMed,eprint) Genetics 172(3):1411-1425 (2006)
Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
oncofuse
predicting oncogenic potential of gene fusions
Versions of package oncofuse
ReleaseVersionArchitectures
VCS1.1.1-1all
Versions and Archs
License: Apache-2.0
Debian package not available
Git
Version: 1.1.1-1

Oncofuse is a framework designed to estimate the oncogenic potential of de-novo discovered gene fusions. It uses several hallmark features and employs a bayesian classifier to provide the probability of a given gene fusion being a driver mutation.

Please cite: Mikhail Shugay, Iñigo Ortiz de Mendíbil, José L. Vizmanos and Francisco J. Novo: Oncofuse: a computational framework for the prediction of the oncogenic potential of gene fusions. (PubMed,eprint) Bioinformatics 29(20):2539–2546 (2013)
Registry entries: SciCrunch 
optitype
precision HLA typing from next-generation sequencing data
Versions of package optitype
ReleaseVersionArchitectures
VCS1.3.2-1all
Versions and Archs
License: <license>
Debian package not available
Git
Version: 1.3.2-1

OptiType is a novel HLA genotyping algorithm based on integer linear programming, capable of producing accurate 4-digit HLA genotyping predictions from NGS data by simultaneously selecting all major and minor HLA Class I alleles.

Please cite: András Szolek, Benjamin Schubert, Christopher Mohr, Marc Sturm, Magdalena Feldhahn and Oliver Kohlbacher: OptiType: precision HLA typing from next-generation sequencing data. (PubMed,eprint) Bioinformatics 30(23):3310–3316 (2014)
paipline
Pipeline for the Automatic Identification of Pathogens
Versions of package paipline
ReleaseVersionArchitectures
VCS0.0+git20180416.062bce7-1all
Versions and Archs
License: GPL_3+
Debian package not available
Git
Version: 0.0+git20180416.062bce7-1

This program is designed to search for pathogen nucleic acid sequences in NGS datasets. It needs databases in the format provided by the database- updater found under https://gitlab.com/andreas.andrusch/database-updater.

Please cite: Andreas Andrusch, Piotr W. Dabrowski, Jeanette Klenner, Simon H. Tausch, Claudia Kohl, Abdalla A. Osman, Bernhard Y. Renard and Andreas Nitsche: PAIPline: pathogen identification in metagenomic and clinical next generation sequencing samples. (eprint) Bioinformatics 34(17):i715-i721 (2018)
pangolin
Phylogenetic Assignment of Named Global Outbreak LINeages
Versions of package pangolin
ReleaseVersionArchitectures
VCS4.3.1-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 4.3.1-1

Pangolin runs a multinomial logistic regression model trained against lineage assignments based on GISAID data.

Legacy pangolin runs using a guide tree and alignment hosted at cov-lineages/lineages. Some of this data is sourced from GISAID, but anonymised and encrypted to fit with guidelines. Appropriate permissions have been given and acknowledgements for the teams that have worked to provide the original SARS-CoV-2 genome sequences to GISAID are also hosted here.

Registry entries: Bioconda 
partitionfinder
choses partitioning schemes and models of molecular evolution for sequence data
Responsible: Kevin Murray (Andreas Tille)
Versions of package partitionfinder
ReleaseVersionArchitectures
VCS2.1.1+dfsg-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 2.1.1+dfsg-1

PartitionFinder and PartitionFinderProtein are Python programs for simultaneously choosing partitioning schemes and models of molecular evolution for sequence data. You can use them before running a phylogenetic analysis, in order to decide how to divide up your sequence data into separate blocks before analysis, and to simultaneously perform model selection on each of those blocks.

patristic
Calculate patristic distances and comparing the components of genetic change
Versions of package patristic
ReleaseVersionArchitectures
VCS0.0.20100817-2all
Versions and Archs
License: free
Debian package not available
Git
Version: 0.0.20100817-2

Patristic overcomes some logistic barriers to analysing signals in sequences. In additional to calculating patristic distances, it provides plots for any combination of matrices, calculates commonly used statistics, allows data such as isolation dates to be entered and reorders matrices with matching species or gene labels. It will be used to analyse rates of mutation and substitutional saturation and the evolution of viruses.

Please cite: Mathieu Fourment and Mark J Gibbs: PATRISTIC: a program for calculating patristic distances and graphically comparing the components of genetic change. (PubMed,eprint) BMC Evolutionary Biology 6:1 (2006)
pcma
fast and accurate multiple sequence alignment based on profile consistency
Versions of package pcma
ReleaseVersionArchitectures
VCS2.0+20040626-1all
Versions and Archs
License: non-free for commercial
Debian package not available
Git
Version: 2.0+20040626-1

PCMA (profile consistency multiple sequence alignment) is a progressive multiple sequence alignment program that combines two different alignment strategies. Highly similar sequences are aligned in a fast way as in ClustalW, forming pre-aligned groups. The T-Coffee strategy is applied to align the relatively divergent groups based on profile–profile comparison and consistency. The scoring function for local alignments of pre-aligned groups is based on a novel profile–profile comparison method that is a generalization of the PSI-BLAST approach to profile–sequence comparison. PCMA balances speed and accuracy in a flexible way and is suitable for aligning large numbers of sequences.

Please cite: Jimin Pei, Ruslan Sadreyev and Nick V. Grishin: PCMA: fast and accurate multiple sequence alignment based on profile consistency. (PubMed,eprint) Bioinformatics 19(3):427-428 (2003)
Remark of Debian Med team: Precondition for T-Coffee

see http://wiki.debian.org/DebianMed/TCoffee

Check with authors about licensing, they adopted code from clustalw which is now free. Thus a change might be possible

phylophlan
microbial Tree of Life using 400 universal proteins
Versions of package phylophlan
ReleaseVersionArchitectures
VCS1.1.0-1all
Versions and Archs
License: expat
Debian package not available
Git
Version: 1.1.0-1

PhyloPhlAn is a computational pipeline for reconstructing highly accurate and resolved phylogenetic trees based on whole-genome sequence information. The pipeline is scalable to thousands of genomes and uses the most conserved 400 proteins for extracting the phylogenetic signal. PhyloPhlAn also implements taxonomic curation, estimation, and insertion operations.

The main features of PhyloPhlAn are:

  • completely automatic, as the user needs only to provide the (unannotated) protein sequences of the input genomes (as multifasta files of peptides - not nucleotides)
  • very high topological accuracy and resolution because of the use of up to 400 previously identified most conserved proteins
  • the possibility of integrating new genomes in the already reconstructed most comprehensive tree of life (3,171 microbial genomes)
  • taxonomy estimation for the newly inserted genomes
  • taxonomic curation for the produced phylogenetic trees
Please cite: Nicola Segata, Daniela Börnigen, Xochitl C. Morgan and Curtis Huttenhower: PhyloPhlAn is a new method for improved phylogenetic and taxonomic placement of microbes. (PubMed,eprint) Nature Communications 4:2304 (2013)
Remark of Debian Med team: usearch can not be replaced since vsearch does not work with proteins

See https://lists.debian.org/debian-med/2016/05/msg00091.html

phyloviz-core
phylogenetic inference and data visualization for sequence based typing methods
Versions of package phyloviz-core
ReleaseVersionArchitectures
VCS0.0.20111121-1all
Versions and Archs
License: GPL-3
Debian package not available
Git
Version: 0.0.20111121-1

Phyloviz allows the analysis of sequence-based typing methods that generate allelic profiles and their associated epidemiological data.

For representing the possible evolutionary relationships between strains identified by allelic profiles it uses the goeBURST algorithm, a refinement of eBURST algorithm proposed by Feil et al., and its expansion to generate a complete minimum spanning tree (MST).

Phyloviz is being developed in a modular way to allow its expansion with novel data analysis algorithms and new visualization modules.

Capabilities

  • Modularity allows the creation of plugins to analyse different types of data
  • Allows the visualization of data overlaid onto goeBURST and MST results
  • Confidence assessment of each link in the graph
  • Query the data and see the query results directly onto the graphs
  • Search your data set using regular expressions to select what to display
  • Export the results as images in various formats: eps, png, gif, pdf, etc
Please cite: Alexandre P Francisco, Cátia Vaz, Pedro T Monteiro, José Melo-Cristino, Mário Ramirez and João A Carriço: PHYLOViZ: phylogenetic inference and data visualization for sequence based typing methods. (PubMed,eprint) BMC Bioinformatics 13(1):87 (2012)
Remark of Debian Med team: There are several plugins to package

The download page http://www.phyloviz.net/wiki/plugins/ lists several plugins that should be packaged (single or as bundle) as well.

pigx-scrnaseq
pipeline for checkpointed and distributed scRNA-seq analyses
Versions of package pigx-scrnaseq
ReleaseVersionArchitectures
VCS1.1.7+ds-1all
Versions and Archs
License: <special license>
Debian package not available
Git
Version: 1.1.7+ds-1

This package provides a automated workflow for the automated analysis of single-cell RNA-seq experiments. A series of well-accecpted tools are connected in Python scripts and controlled via snakemake. This supports the parallel execution of these workflows and provides checkpointing, such that interrupted workflows can take up their work again.

pipasic
Protein Abundance Correction in Metaproteomic Data
Versions of package pipasic
ReleaseVersionArchitectures
VCS0.0.r15-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 0.0.r15-1

Metaproteomic analysis allows studying the interplay of organisms or functional groups and has become increasingly popular also for diagnostic purposes. However, difficulties arise due to the high sequence similarity between related organisms. Further, the state of conservation of proteins between species can be correlated with their expression level which can lead to significant bias in results and interpretation. These challenges are similar but not identical to the challenges arising in the analysis of metagenomic samples and require specific solutions.

pipasic (peptide intensity-weighted proteome abundance similarity correction) is a tool which corrects identification and spectral counting based quantification results using peptide similarity estimation and expression level weighting within a non-negative lasso framework. pipasic has distinct advantages over approaches only regarding unique peptides or aggregating results to the lowest common ancestor.

Please cite: Anke Penzlin, Martin S. Lindner, Joerg Doellinger, Piotr Wojtek Dabrowski, Andreas Nitsche and Bernhard Y. Renard: Pipasic: similarity and expression correction for strain-level identification and quantification in metaproteomics. (PubMed,eprint) Bioinformatics 30(12):i149–i156 (2014)
plato
Analysis, translation, and organization of large-scale genetic data
Versions of package plato
ReleaseVersionArchitectures
VCS2.0.0-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 2.0.0-1

PLATO is an acronym for "PLatform for the Analysis, Translation, and Organization of large-scale data". Recent technological advances enable the study of hundreds of thousands of human single-nucleotide polymorphisms at the population level. Because strategies for analyzing these data have not kept pace with the laboratory methods that generate the data, it is unlikely that these advances will immediately lead to an improved understanding of the genetic contribution to common human disease and drug response. Currently, no single analytical method allows us to extract all available information from a whole-genome association study. In fact, no single method can be optimal for all datasets, especially when the genetic architecture for diseases can vary substantially, as is certainly the case. Therefore, an integrative platform is needed to accommodate multiple analytical methods for analysis as we learn more about genetic architecture. As a result, we are developing a system for the analysis of genome-wide association data that will incorporate several analytical approaches as filters to allow a scientist to choose whatever analytical methods they wish to apply. PLATO (PLatform for the Analysis, Translation, and Organization of large-scale data) will incorporate a number of filters to select the important SNPs in a genome-wide association study.

Whole-genome Association Study Pipeline (WASP) has recently been absorbed into PLATO. WASP was designed to aid in retrieving, evaluating, formatting, and analyzing genotypic and clinical data from the latest large-scale genotyping studies. WASP implements a battery of quality control procedures to assess the data. Among the currently available procedures are the examination of marker and sample genotyping efficiency, allele frequency calculations, checks of Mendelian error (if applicable) and gender discrepancies (based on available chromosome X and Y genotypes), and tests of Hardy-Weinberg Equilibrium. Additionally, WASP can retrieve and format data for other software programs such as the Graphical Representation of Relationships (GRR) program, or STRUCTURE, and depending on the nature of the samples and the depth of examination the user desires to pursue. Beyond the quality control aspect of this application, WASP can perform standard tests of association using the Transmission Disequilibrium Test TDT for family-based datasets and the chi-square test of association for case-control datasets.

Please cite: Benjamin J. Grady, Eric Torstenson, Scott M. Dudek, Justin Giles, David Sexton and Marylyn D. Ritchie: Finding unique filter sets in PLATO: a precursor to efficient interaction analysis in GWAS data. (PubMed,eprint) Proceedings of the Pacific Symposium :315-26 (2010)
pomoxis
analysis components from Oxford Nanopore Research
Versions of package pomoxis
ReleaseVersionArchitectures
VCS0.3.4-1all
Versions and Archs
License: MPL-2.0
Debian package not available
Git
Version: 0.3.4-1

Pomoxis comprises a set of basic bioinformatic tools tailored to nanopore sequencing. Notably tools are included for generating and analysing draft assemblies. Many of these tools are used by the research data analysis group at Oxford Nanopore Technologies.

Features

  • Wraps third party tools with known good default parameters and methods of use.
  • Creates an isolated environment with all third-party tools.
  • Streamlines common short analysis chains.
  • Integrates into katuali for performing more complex analysis pipelines.
Registry entries: Bioconda 
profit - wnpp
Protein structure alignment
Versions of package profit
ReleaseVersionArchitectures
VCS3.1-1all
Versions and Archs
License: non-distributable
Debian package not available
Git
Version: 3.1-1

ProFit is designed to be the ultimate protein least squares fitting program. It has many features including flexible specification of fitting zones and atoms, calculation of RMS over different zones or atoms, RMS-by-residue calculation, on-line help facility, etc.

A symbolic link is provided to have the binary name back to how it is historically correct.

Remark of Debian Med team: The authors need to change the license, still.
psipred
protein secondary structure prediction
Versions of package psipred
ReleaseVersionArchitectures
VCS4.01-1all
Versions and Archs
License: custom
Debian package not available
Git
Version: 4.01-1

PSIPRED is a simple and accurate secondary structure prediction method, incorporating two feed-forward neural networks which perform an analysis on output obtained from PSI-BLAST (Position Specific Iterated - BLAST). Using a very stringent cross validation method to evaluate the method's performance, PSIPRED 2.6 achieves an average Q3 score of 80.7%.

Please cite: David T. Jones: Protein secondary structure prediction based on position-specific scoring matrices. (PubMed) Journal of Molecular Biology 292(2):195-202 (1999)
pssh2
set of scripts for mapping protein sequence to structure
Versions of package pssh2
ReleaseVersionArchitectures
VCS0.6all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 0.6

pssh2 creates sequence-to-structure alignments based on hhblits profiles built for the query sequence. pssh2 consists of scripts to run the hhblits queries and parse the output. You also need the pdb_full database downloaded from rostlab.org: ftp://rostlab.org/pssh2/pdb_full/

This package provides the script files needed to run within PredictProtein. They are all called in the correct order in pp_pssh2. It also contains scripts to run independent of PredictProtein. It assumes you have a mysql database to store information. The configuration information is kept in pssh2.conf

pufferfish
Efficient index for the colored, compacted, de Bruijn graph
Versions of package pufferfish
ReleaseVersionArchitectures
VCS1.8.0+dfsg-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 1.8.0+dfsg-1

Pufferfish is a new time and memory-efficient data structure for indexing a compacted, colored de Bruijn graph (ccdBG).

Though the de Bruijn Graph (dBG) has enjoyed tremendous popularity as an assembly and sequence comparison data structure, it has only relatively recently begun to see use as an index of the reference sequences (e.g. deBGA, kallisto). Particularly, these tools index the compacted dBG (cdBG), in which all non-branching paths are collapsed into individual nodes and labeled with the string they spell out. This data structure is particularly well-suited for representing repetitive reference sequences, since a single contig in the cdBG represents all occurrences of the repeated sequence. The original positions in the reference can be recovered with the help of an auxiliary "contig table" that maps each contig to the reference sequence, position, and orientation where it appears as a substring. The deBGA paper has a nice description how this kind of index looks (they call it a unipath index, because the contigs we index are unitigs in the cdBG), and how all the pieces fit together to be able to resolve the queries we care about. Moreover, the cdBG can be built on multiple reference sequences (transcripts, chromosomes, genomes), where each reference is given a distinct color (or colour, if you're of the British persuasion). The resulting structure, which also encodes the relationships between the cdBGs of the underlying reference sequences, is called the compacted, colored de Bruijn graph (ccdBG). This is not, of course, the only variant of the dBG that has proven useful from an indexing perspective. The (pruned) dBG has also proven useful as a graph upon which to build a path index of arbitrary variation / sequence graphs, which has enabled very interesting and clever indexing schemes like that adopted in GCSA2. Also, thinking about sequence search in terms of the dBG has led to interesting representations for variation-aware sequence search backed by indexes like the vBWT (implemented in the excellent gramtools package).

purple
Picking Unique Relevant Peptides for viraL Experiments
Versions of package purple
ReleaseVersionArchitectures
VCS0.4.1-1all
Versions and Archs
License: LGPL-3+
Debian package not available
Git
Version: 0.4.1-1

Emerging virus diseases present a global threat to public health. To detect viral pathogens in time-critical scenarios, accurate and fast diagnostic assays are required. Such assays can now be established using mass spectrometry-based targeted proteomics, by which viral proteins can be rapidly detected from complex samples down to the strain level with high sensitivity and reproducibility. Developing such targeted assays involves tedious steps of peptide candidate selection, peptide synthesis, and assay optimization. Peptide selection requires extensive preprocessing by comparing candidate peptides against a large search space of background proteins. Purple (Picking Unique Relevant Peptides for viraL Experiments) is a software tool for selecting target-specific peptide candidates directly from given proteome sequence data.

Purple enables peptide candidate selection across various taxonomic levels and filtering against backgrounds of varying complexity. Its functionality is demonstrated using data from different virus species and strains. Purple enables building taxon-specific targeted assays and paves the way to time-efficient and robust viral diagnostics using targeted proteomics.

This is the command line version of purple.

Please cite: Johanna Lechner, Felix Hartkopf, Pauline Hiort, Andreas Nitsche Marica Grossegesse, Joerg Doellinger, Bernhard Y. Renard and Thilo Muth: Purple: A Computational Workflow for Strategic Selection of Peptides for Viral Diagnostics Using MS-Based Targeted Proteomics. (PubMed,eprint) Viruses 11(6):536 (2019)
q2-composition
QIIME2 plugin for Compositional statistics
Versions of package q2-composition
ReleaseVersionArchitectures
VCS2021.8.0+ds-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 2021.8.0+ds-1

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-deblur
QIIME2 plugin to wrap the Deblur software for sequence quality control
Versions of package q2-deblur
ReleaseVersionArchitectures
VCS2023.9.0-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 2023.9.0-1

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Amnon Amir, Daniel McDonald, Jose A. Navas-Molina, Evguenia Kopylova, James T. Morton, Zhenjiang Zech Xu, Eric P. Kightley, Luke R. Thompson, Embriette R. Hyde, Antonio Gonzalez and Rob Knight: Deblur Rapidly Resolves Single-Nucleotide Community Sequence Patterns. (PubMed,eprint) mSystems 2 (2017)
q2-diversity
QIIME2 plugin for core diversity analysis
Versions of package q2-diversity
ReleaseVersionArchitectures
VCS2021.8.0-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 2021.8.0-1

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. Functionality is made available through QIIME 2 plugins.

This plugin provides the means to statistically assess the diversity of microbiota. This has direct clinical interest, since with whatever we eat or have antibiotics applied, the survival of different groups of bacteria/yeasts will be affected. From these relative abundances of strains that constribute the microbiome, most prominently, comparisons within a group of samples (or an individual) determines the alpha diversity and between (groups of) samples the beta diversity is inspected.

This package is key to most workflows in qiime.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-gneiss
QIIME2 plugin for Compositional Data Analysis and Visualization
Versions of package q2-gneiss
ReleaseVersionArchitectures
VCS2020.11.1-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 2020.11.1-1

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-longitudinal
QIIME2 plugin for longitudinal studies and paired comparisons
Versions of package q2-longitudinal
ReleaseVersionArchitectures
VCS2023.9.1+ds-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 2023.9.1+ds-1

QIIME 2 is a powerful, extensible, and decentralized microbiome analysis package with a focus on data and analysis transparency. QIIME 2 enables researchers to start an analysis with raw DNA sequence data and finish with publication-quality figures and statistical results. Key features:

  • Integrated and automatic tracking of data provenance
  • Semantic type system
  • Plugin system for extending microbiome analysis functionality
  • Support for multiple types of user interfaces (e.g. API, command line, graphical)

QIIME 2 is a complete redesign and rewrite of the QIIME 1 microbiome analysis pipeline. QIIME 2 will address many of the limitations of QIIME 1, while retaining the features that makes QIIME 1 a powerful and widely-used analysis pipeline.

QIIME 2 currently supports an initial end-to-end microbiome analysis pipeline. New functionality will regularly become available through QIIME 2 plugins. You can view a list of plugins that are currently available on the QIIME 2 plugin availability page. The future plugins page lists plugins that are being developed.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (eprint) Nature Biotechnology 37 (2019)
q2-vsearch
QIIME 2 plugin for clustering and dereplicating with vsearch
Versions of package q2-vsearch
ReleaseVersionArchitectures
VCS2023.9.0-1all
Versions and Archs
License: BSD-3-clause
Debian package not available
Git
Version: 2023.9.0-1

A QIIME 2 plugin that wraps the vsearch application, and provides methods for clustering and dereplicating features and sequences.

Please cite: Torbjørn Rognes, Tomáš Flouri, Ben Nichols, Christopher Quince and Frédéric Mahé: VSEARCH: a versatile open source tool for metagenomics. PeerJ 4 (2016)
qtlreaper
QTL analysis for expression data
Versions of package qtlreaper
ReleaseVersionArchitectures
VCS1.1.1-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 1.1.1-1

QTL Reaper is software, written in C and compiled as a Python module, for rapidly scanning microarray expression data for QTLs. It is essentially the batch-oriented version of WebQTL. It requires, as input, expression data from members of a set of recombinant inbred lines and genotype information for the same lines. It searches for an association between each expression trait and all genotypes and evaluates that association by a permutation test. For the permutation test, it performs only as many permutations as are necessary to define the empirical P-value to a reasonable precision. It also performs bootstrap resampling to estimate the confidence region for the location of a putative QTL.

The reaper module is used underneath the http://genenetwork.org site.

qualimap
evaluating next generation sequencing alignment data
Versions of package qualimap
ReleaseVersionArchitectures
VCS2.2.1+dfsg-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 2.2.1+dfsg-1

Qualimap 2 provides both a Graphical User Interface (GUI) and a command-line interface to facilitate the quality control of alignment sequencing data and its derivatives like feature counts.

Supported types of experiments include:

  • Whole-genome sequencing
  • Whole-exome sequencing
  • RNA-seq (speical mode available)
  • ChIP-seq

Qualimap examines sequencing alignment data in SAM/BAM files according to the features of the mapped reads and provides an overall view of the data that helps to the detect biases in the sequencing and/or mapping of the data and eases decision-making for further analysis.

Qualimap provides multi-sample comparison of alignment and counts data.

  • Fast analysis accross the reference of genome coverage and nucleotide distribution;
  • Easy to interpret summary of the main properties of the alignment data;
  • Analysis of the reads mapped inside/outside of the regions provided in GFF format;
  • Computation and analysis of read counts obtained from intersectition of read alignments with genomic features;
  • Analysis of the adequasy of the sequencing depth in RNA-seq experiments;
  • Multi-sample comparison of alignment and counts data;
  • Clustering of epigenomic profiles.
Please cite: Fernando García-Alcalde, Konstantin Okonechnikov, José Carbonell, Luis M. Cruz, Stefan Götz, Sonia Tarazona, Joaquín Dopazo, Thomas F. Meyer and Ana Conesa: Qualimap: evaluating next-generation sequencing alignment data. (PubMed,eprint) Bioinformatics 28(20):2678-2679 (2012)
Registry entries: Bio.tools  SciCrunch  Bioconda 
quast
Quality Assessment Tool for Genome Assemblies
Versions of package quast
ReleaseVersionArchitectures
VCS5.0.2+dfsg-1all
Versions and Archs
License: GPL-2
Debian package not available
Git
Version: 5.0.2+dfsg-1

QUAST evaluates genome assemblies. For metagenomes, please see MetaQUAST project. It works both with and without a given reference genome. The tool accepts multiple assemblies, thus it allows for comparisons.

Please cite: Alla Mikheenko, Andrey Prjibelski, Vladislav Saveliev, Dmitry Antipov and Alexey Gurevich: Versatile genome assembly evaluation with QUAST-LG. Bioinformatics 34(13):i142-i150 (2018)
Registry entries: Bio.tools  Bioconda 
r-bioc-mofa2
Multi-Omics Factor Analysis v2
Versions of package r-bioc-mofa2
ReleaseVersionArchitectures
VCS1.2.2+ds-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 1.2.2+ds-1

The MOFA2 package contains a collection of tools for training and analysing multi-omic factor analysis (MOFA). MOFA is a probabilistic factor model that aims to identify principal axes of variation from data sets that can comprise multiple omic layers and/or groups of samples. Additional time or space information on the samples can be incorporated using the MEFISTO framework, which is part of MOFA2. Downstream analysis functions to inspect molecular features underlying each factor, vizualisation, imputation etc are available.

Registry entries: Bio.tools  Bioconda 
r-bioc-org.mm.eg.db
genome wide annotation for Mouse
Versions of package r-bioc-org.mm.eg.db
ReleaseVersionArchitectures
VCS3.11.4-1all
Versions and Archs
License: Artistic-2.0
Debian package not available
Git
Version: 3.11.4-1

Genome wide annotation for Mouse, primarily based on mapping using Entrez Gene identifiers.

r-cran-drinsight
drug repurposing on transcriptome sequencing data
Versions of package r-cran-drinsight
ReleaseVersionArchitectures
VCS0.1.1-1all
Versions and Archs
License: GPL-2
Debian package not available
Git
Version: 0.1.1-1

The package's name is an acronym for "Drug Repurposing Integration and Systematic Investigation of Genomic High Throughput Data", which pretty much describes it: This is a connectivity mapping-based drug repurposing tool that identifies drugs that can potentially reverse query disease phenotype or have similar functions with query drugs.

Please cite: Jinyan Chan, Xuan Wang, Jacob A Turner, Nicole E Baldwin and Jinghua Gu: Breaking the paradigm: Dr Insight empowers signature-free, enhanced drug repurposing. (PubMed,eprint) Bioinformatics 35(16):2818–2826 (2019)
r-other-apmswapp
GNU R Pre- and Postprocessing For Affinity Purification Mass Spectrometry
Versions of package r-other-apmswapp
ReleaseVersionArchitectures
VCS1.0-1all
Versions and Archs
License: <license>
Debian package not available
Git
Version: 1.0-1

The reliable detection of protein-protein-interactions by affinity purification mass spectrometry (AP-MS) is a crucial stepping stone for the understanding of biological processes. The main challenge in a typical AP-MS experiment is to separate true interaction proteins from contaminants by contrasting counts of proteins binding to specific baits with counts of negative controls.

Please cite: Martina Fischer, Susann Zilkenat, Roman G. Gerlach, Samuel Wagner and Bernhard Y. Renard: Pre- and post-processing workflow for affinity purification mass spectrometry data. (PubMed) Journal of Proteome Research 13(5):2239-49 (2014)
r-other-fastbaps
A fast genetic clustering algorithm that approximates a Dirichlet Process Mixture model
Versions of package r-other-fastbaps
ReleaseVersionArchitectures
VCS1.0.4-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 1.0.4-1

Takes a multiple sequence alignment as input and clusters according to the 'no-admixture' model. It combines ideas from the Bayesian Hierarchical Clustering algorithm of Heller et al. and hierBAPS to produce a rapid and accurate clustering algorithm.

Please cite: Gerry Tonkin-Hill, John A Lees, Stephen D Bentley, Simon D W Frost and Jukka Corander: Fast hierarchical Bayesian analysis of population structure. (PubMed,eprint) Nucleic Acids Research 47(11):5539–5549 (2019)
Registry entries: Bioconda 
raxml-ng
phylogenetic tree inference tool which uses maximum-likelihood
Versions of package raxml-ng
ReleaseVersionArchitectures
VCS1.0.1-1all
Versions and Archs
License: AFFERO-3
Debian package not available
Git
Version: 1.0.1-1

RAxML Next Generation: faster, easier-to-use and more flexible

RAxML-NG is a phylogenetic tree inference tool which uses maximum-likelihood (ML) optimality criterion. Its search heuristic is based on iteratively performing a series of Subtree Pruning and Regrafting (SPR) moves, which allows to quickly navigate to the best-known ML tree. RAxML-NG is a successor of RAxML (Stamatakis 2014) and leverages the highly optimized likelihood computation implemented in libpll (Flouri et al. 2014).

RAxML-NG offers improvements in speed, flexibility and user-friendliness over the previous RAxML versions. It also implements some of the features previously available in ExaML (Kozlov et al. 2015), including checkpointing and efficient load balancing for partitioned alignments.

repeatmasker
screen DNA sequences for interspersed repeats
Versions of package repeatmasker
ReleaseVersionArchitectures
VCS4.0.7-1all
Versions and Archs
License: OpenSoftwareLicense-2.1
Debian package not available
Git
Version: 4.0.7-1

RepeatMasker is a program that screens DNA sequences for interspersed repeats and low complexity DNA sequences. The output of the program is a detailed annotation of the repeats that are present in the query sequence as well as a modified version of the query sequence in which all the annotated repeats have been masked (default: replaced by Ns). Sequence comparisons in RepeatMasker are performed by the program cross_match, an efficient implementation of the Smith-Waterman-Gotoh algorithm developed by Phil Green, or by WU-Blast developed by Warren Gish.

Please cite: Sébastien Tempel: Using and Understanding RepeatMasker. (PubMed) Methods Mol. Biol. 859:29-51 (2012)
Registry entries: Bio.tools  SciCrunch 
roadtrips
case-control association testing with unknown population and pedigree structure
Versions of package roadtrips
ReleaseVersionArchitectures
VCS2.0+dfsg-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 2.0+dfsg-1

ROADTRIPS performs single-SNP, case-control association testing in samples with partially or completely unknown population and pedigree structure. ROADTRIPS uses an empirical covariance matrix calculated from genomewide SNP data to correct for unknown population and pedigree structure, while maintaining high power by taking advantage of known pedigree information when it is available. The program is applicable to association studies with completely general combinations of related and unrelated individuals. Analysis can be performed genomewide (currently just for autosomes).

ROADTRIPS is suitable for applications such as:

  • correcting for possible population structure and/or misspecified relationships in the context of case-control association testing in samples of unrelated individuals and/or related individuals with well- characterized pedigrees
  • case-control association testing in samples from isolated populations for which pedigree information is limited or unavailable
Please cite: Timothy Thornton and Mary Sara McPeek: ROADTRIPS: Case-Control Association Testing with Partially or Completely Unknown Population and Pedigree Structure. (PubMed) American Journal of Human Genetics 86(2):172–184 (2010)
rosa
Removal of Spurious Antisense in biological RNA sequences
Versions of package rosa
ReleaseVersionArchitectures
VCS1.0-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 1.0-1

In stranded RNA-Seq experiments it is possible to detect and measure antisense transcription, important since antisense transcripts impact gene transcription in several different ways. Stranded RNA-Seq determines the strand from which an RNA fragment originates, and so can be used to identify where antisense transcription may be implicated in gene regulation.

However, spurious antisense reads are often present in experiments, and can manifest at levels greater than 1% of sense transcript levels. This is enough to disrupt analyses by causing false antisense counts to dominate the set of genes with high antisense transcription levels.

The RoSA (Removal of Spurious Antisense) tool detects the presence of high levels of spurious antisense transcripts, by:

  • analysing ERCC spike-in data to find the ratio of antisense:sense transcripts in the spike-ins; or
  • using antisense and sense counts around splice sites to provide a set of gene-specific estimates; or
  • both.

Once RoSA has an estimate of the spurious antisense, expressed as a ratio of antisense:sense counts, RoSA will calculate a correction to the antisense counts based on the ratio. Where a gene-specific estimate is available for a gene, it will be used in preference to the global estimate obtained from either spike-ins or spliced reads.

This package provides the library for the statistics suite R.

rsat
Regulatory Sequence Analysis Tools
Versions of package rsat
ReleaseVersionArchitectures
VCS2016-03-14+dfsg-1all
Versions and Archs
License: <license>
Debian package not available
Git
Version: 2016-03-14+dfsg-1

RSAT is a series of modular computer programs specifically designed for the detection of regulatory signals in non-coding sequences.

RSAT servers have been up and running since 1997. The project was initiated by Jacques van Helden, and is now pursued by the RSAT team.

Please cite: Alejandra Medina-Rivera, Matthieu Defrance, Olivier Sand, Carl Herrmann, Jaime A. Castro-Mondrago, Jeremy Delerce, Sébastien Jaeger, Christophe Blanchet, Pierre Vincens, Christophe Caron, Daniel M. Staines, Bruno Contreras-Moreira, Marie Artufel, Lucie Charbonnier-Khamvongsa, Céline Hernandez, Denis Thieffry, Morgane Thomas-Chollier and Jacques van Helden: RSAT 2015: Regulatory Sequence Analysis Tools. (PubMed,eprint) Nucleic Acids Res. 43(W1):W50-W56 (2015)
Registry entries: Bio.tools  SciCrunch 
sailfish
RNA-seq expression estimation
Versions of package sailfish
ReleaseVersionArchitectures
VCS0.10.1+dfsg-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 0.10.1+dfsg-1

RNA-seq is a technology to read at least parts of individual RNA sequences of a tissue sample. After assigning these reads to genes that are likely responsible to have coded for them (mapping), this gives an insight (estimate) about how much these genes have been active (expressed) in that sample. The trickier bits in that process to address is the similarity of genes and the genes being capable to variably but deterministically skip parts of their sequence to be read (introns). A single variantly spliced gene may then yield different sequences (isoforms) and the RNA-seq evaluation better informs about this. It may be relevant for a disease.

Sailfish is particularly good (efficient) in this process. It tricks the complexity by introducing an intermediate level of artificial very short reads to which the alternative splicing is of no concern. That can then be addressed by "telephone-book"-like hashing techniques that are easy and lightning fast. The final presentation is then found to be competitive with established mappers like eXpress and Cufflinks.

Please cite: Rob Patro, Stephen M Mount and Carl Kingsford: Sailfish enables alignment-free isoform quantification from RNA-seq reads using lightweight algorithms. (PubMed) Nature Biotechnology 32(5):462-464 (2014)
Registry entries: Bio.tools 
sap
Pairwise protein structure alignment via double dynamic programming
Versions of package sap
ReleaseVersionArchitectures
VCS1.1.3-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 1.1.3-1

In contrast to DNA, proteins exhibit an apparently unlimited variety of structure. This is a necessary requirement of the vast array of differing functions that they perform in the maintainance of life, again, in contrast to the relatively static archival function of DNA. Not only do we observe a bewildering variety of form but even within a common structure, there is variation in the lengths and orientation substructures. Such variation is both a reflection on the very long time periods over which some structures have diverged and also a consequence of the fact that proteins cannot be completely rigid bodies but must have flexibility to accommodate the structural changes that are almost always necessary for them to perform their functions. These aspects make comparing structure and finding structural similarity over long divergence times very difficult. Indeed, computationally, the problem of recognizing similarity is one of three-dimensional pattern recognition, which is a notoriously difficult problem for computers to perform. In this chapter, guidance is provided on the use of a flexible structure comparison method that overcomes many of the problems of comparing protein structures that may exhibit only weak similarity.

Please cite: William R. Taylor: Protein Structure Comparison Using SAP. (PubMed) 143:19-32 (2000)
Remark of Debian Med team: Precondition for T-Coffee

see http://wiki.debian.org/DebianMed/TCoffee

seq-seq-pan
workflow for the SEQuential alignment of SEQuences
Versions of package seq-seq-pan
ReleaseVersionArchitectures
VCS1.0.1-1all
Versions and Archs
License: BSD-2-clause
Debian package not available
Git
Version: 1.0.1-1

Seq-seq-pan is a framework that provides methods for adding or removing new genomes from a set of aligned genomes and uses these to construct a whole genome alignment. Throughout the sequential workflow the alignment is optimized for generating a representative linear presentation of the aligned set of genomes, that enables its usage for annotation and in downstream analyses.

Please cite: Christine Jandrasits, Piotr W. Dabrowski, Stephan Fuchs and Bernhard Y. Renard: seq-seq-pan: building a computational pan-genome data structure on whole genome alignment. (PubMed,eprint) BMC Genomics 19(1):47 (2018)
Remark of Debian Med team: Needs blat which is not re-distributable
seqwish
alignment to variation graph inducer
Versions of package seqwish
ReleaseVersionArchitectures
VCS0.7.1-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 0.7.1-1

Seqwish implements a lossless conversion from pairwise alignments between sequences to a variation graph encoding the sequences and their alignments. As input we typically take all-versus-all alignments, but the exact structure of the alignment set may be defined in an application specific way. This algorithm uses a series of disk-backed sorts and passes over the alignment and sequence inputs to allow the graph to be constructed from very large inputs that are commonly encountered when working with large numbers of noisy input sequences. Memory usage during construction and traversal is limited by the use of sorted disk-backed arrays and succinct rank/select dictionaries to record a queryable version of the graph.

Registry entries: Bioconda 
signalalign
HMM-HDP models for MinION signal alignments
Versions of package signalalign
ReleaseVersionArchitectures
VCS0.0+git20170131.3293fad+dfsg-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 0.0+git20170131.3293fad+dfsg-1

MinION signal-level alignment and methylation detection using hidden Markov Models with hierarchical Dirichlet process kmer learning.

Nanopore sequencing is based on the principal of isolating a nanopore in a membrane separating buffered salt solutions, then applying a voltage across the membrane and monitoring the ionic current through the nanopore. The Oxford Nanopore Technologies (ONT) MinION sequences DNA by recording the ionic current as DNA strands are enzymatically guided through the nanopore. SignalAlign will align the ionic current from the MinION to a reference sequence using a trainable hidden Markov model (HMM). The emissions model for the HMM can either be the table of parametric normal distributions provided by ONT or a hierarchical Dirichlet process (HDP) mixture of normal distributions. The HDP models enable mapping of methylated bases to your reference sequence.

Registry entries: Bio.tools 
sina
reference based multiple sequence alignment
Versions of package sina
ReleaseVersionArchitectures
VCS1.6.1-1all
Versions and Archs
License: <license>
Debian package not available
Git
Version: 1.6.1-1

SINA is a tool to add sequences to an existing multiple sequence alignment. It needs about 1 second on a single core to add one 16S full length sequence (about 100k/h on a 32-core workstation). It was developed to create the multi-million sequence alignment that is the core of the SILVA SSU and LSU rRNA databases.

Please cite: Elmar Pruesse, Jörg Peplies and Frank Oliver Glöckner: SINA: Accurate high-throughput multiple sequence alignment of ribosomal RNA genes. (PubMed,eprint) Bioinformatics 28(14):1823–1829 (2012)
Registry entries: Bio.tools  Bioconda 
sistr
Salmonella In Silico Typing Resource (SISTR)
Versions of package sistr
ReleaseVersionArchitectures
VCS1.0.2-1all
Versions and Archs
License: Apache-2.0
Debian package not available
Git
Version: 1.0.2-1

The Salmonella In Silico Typing Resource (SISTR) commandline tool allows serovar predictions from whole-genome sequence assemblies by determination of antigen gene and cgMLST gene alleles using BLAST. Mash MinHash can also be used for serovar prediction.

Please cite: Catherine E. Yoshida, Peter Kruczkiewicz, Chad R. Laing, Erika J. Lingohr, Victor P. J. Gannon, John H. E. Nash and Eduardo N. Taboada: The Salmonella In Silico Typing Resource (SISTR): An Open Web-Accessible Tool for Rapidly Typing and Subtyping Draft Salmonella Genome Assemblies. (PubMed,eprint) PLoS One 11(1):e0147101 (2016)
situs
Modeling of atomic resolution structures into low-resolution density maps
Versions of package situs
ReleaseVersionArchitectures
VCS2.7.2-1all
Versions and Archs
License: GPL.
Debian package not available
Git
Version: 2.7.2-1

Situs is an award-winning program package for the modeling of atomic resolution structures into low-resolution density maps e.g. from electron microscopy, tomography, or small angle X-ray scattering. The software supports both rigid-body and flexible docking using a variety of fitting strategies. Situs is developed by Willy Wriggers and collaborators: biomachina.org.

sparta
automated reference-based bacterial RNA-seq Transcriptome Analysis
Versions of package sparta
ReleaseVersionArchitectures
VCS1.01+dfsg-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 1.01+dfsg-1

SPARTA is a workflow aimed at analyzing single-end Illumina RNA-seq data. The workflow combines several tools: Trimmomatic (read trimming/adapter removal), FastQC (read quality analysis), Bowtie (mapping reads to the reference genome), HTSeq (transcript/gene feature abundance counting), and edgeR (differential gene expression analysis). Within the differential gene expression analysis step, batch effects can be detected and the user is warned of the potential, unintended additional variable. The analysis procedure is outlined below.

Please cite: Benjamin K. Johnson, Matthew B. Scholz, Tracy K. Teal and Robert B. Abramovitch: SPARTA: Simple Program for Automated reference-based bacterial RNA-seq Transcriptome Analysis. (PubMed,eprint) BMC Bioinformatics 17:66 (2016)
Registry entries: Bio.tools 
ssaha
Sequence Search and Alignment by Hashing Algorithm
Versions of package ssaha
ReleaseVersionArchitectures
VCS3.1c-1all
Versions and Archs
License: GPL-2+
Debian package not available
Git
Version: 3.1c-1

SSAHA is a software tool for very fast matching and alignment of DNA sequences. It achieves its fast search speed by converting sequence information into a `hash table' data structure, which can then be searched very rapidly for matches.

SSAHA is the only free software of its category (fast search of nearly indentical sequences). The popular alternative, BLAT, is restricted to non-commercial use.

Please cite: Zemin Ning, Anthony J. Cox and James C. Mullikin: SSAHA: A Fast Search Method for Large DNA Databases. (PubMed,eprint) Genome Research 11(10):1725–1729 (2001)
Remark of Debian Med team: Successor for ssaha2 available: smalt

The program smalt is from the same author is according to its author faster and more precise than ssaha2 (except for sequences > 2000bp)

strap
Comfortable and intuitive protein alignment editor / viewer
Versions of package strap
ReleaseVersionArchitectures
VCS1.1.3-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 1.1.3-1

Strap is started from the menu "Science" in the "Applications" menu or with the shell command strap_protein_alignment. Alignments can be manually edited or computed automatically using sequence and/or structure based methods. Information can be attached to proteins and residue selections such as free text notes, balloon messages, cross-references as well as 3D and PDF display styles. Alignments can be exported in several formats: Multiple-Fasta, ClustalW, MSF, HSSP, Jalview. Decorated alignments with residue annotations and secondary structure cartoons can be exported to PDF, HTML and Word-processors to create figures in publication quality - see http://3d-alignment.eu/ for details. Strap is an integrated environment for Bioinformatics tools and resources like DAS sequence features, 3D-visualization, structure prediction and Blast search. It is scriptable and extendable and can be used by other programs to display sequence alignments and 3D-superpositions.

Registry entries: Bio.tools 
strap-base
essential files for the interactive alignment viewer and editor Strap
Versions of package strap-base
ReleaseVersionArchitectures
VCS1.1.3-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 1.1.3-1

Most users should install the package strap which in addition installs required Debian packages for alignment computation and 3D visualization. Strap-base provides utilities for protein and alignment file format conversion: strap_to_clustal, strap_to_msf, strap_to_fasta, strap_to_multiple_fasta. It also provides interactive alignment visualization and HTML export for other bioinformatics software. The command strap_base with the option

 -script=file or -script=named_pipe opens a new interactive alignment
view. Named pipes are the basis for interprocess communication. The

command strap_to_html is a command line tool to produce decorated and annotated alignments suitable for web-browsers with script commands as explained in http://www.bioinformatics.org/strap/alignment-to-html.html.

strelka
strelka2 germline and somatic small variant caller
Versions of package strelka
ReleaseVersionArchitectures
VCS2.9.10+dfsg-1all
Versions and Archs
License: GPL-3+
Debian package not available
Git
Version: 2.9.10+dfsg-1

Strelka2 is a fast and accurate small variant caller optimized for analysis of germline variation in small cohorts and somatic variation in tumor/normal sample pairs. The germline caller employs an efficient tiered haplotype model to improve accuracy and provide read-backed phasing, adaptively selecting between assembly and a faster alignment- based haplotyping approach at each variant locus. The germline caller also analyzes input sequencing data using a mixture-model indel error estimation method to improve robustness to indel noise. The somatic calling model improves on the original Strelka method for liquid and late- stage tumor analysis by accounting for possible tumor cell contamination in the normal sample. A final empirical variant re-scoring step using random forest models trained on various call quality features has been added to both callers to further improve precision.

Please cite: Sangtae Kim, Konrad Scheffler, Aaron L. Halpern, Mitchell A. Bekritsky, Eunho Noh, Morten Källberg, Xiaoyu Chen, Yeonbin Kim, Doruk Beyter, Peter Krusche and Christopher T. Saunders: Strelka2: fast and accurate calling of germline and somatic variants. (PubMed) Nature Methods 15(8):591–594 (2018)
Registry entries: Bioconda 
tab2mage
submitting large microarray experiment datasets to public repository database
Versions of package tab2mage
ReleaseVersionArchitectures
VCS20080626-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 20080626-1

Tab2MAGE is a software package written and supported by the ArrayExpress curation team, which aims to ease the process of submitting large microarray experiment datasets to our public repository database. To this end, Tab2MAGE currently includes two tools, the tab2mage.pl script itself, and a data file checking script, expt_check.pl. With these scripts it is possible to perform an initial data file validation against an array design (e.g., in the form of an "Array Description File" or ADF), and then to generate MAGE-ML using these data files alongside a separate spreadsheet providing MIAME-compliant sample annotation.

tacg
command line program for finding patterns in nucleic acids
Versions of package tacg
ReleaseVersionArchitectures
VCS4.1-1all
Versions and Archs
License: GPL+additions
Debian package not available
Git
Version: 4.1-1

tacg is a character-based, command line tool for unix-like operating systems for pattern-matching in nucleic acids and performing some of the basic protein manipulations. It was originally designed for restriction enzyme analysis of DNA, but has been extended to other types of matching. It now handles degenerate sequence input in a variety of matching approaches, as well as patterns with errors, regular expressions and TRANSFAC-formatted matrices.

It was designed to be a grep for DNA and like the original grep, its capabilities have grown so that now the author has to keep calling up the help page to figure out which flags (now ~50) mean what. tacg is NOT a GUI application in any sense. However, it's existance as a strictly command-line tool lends itself well to Webification and wrapping by various GUI tools and it is now distributed with a web interface form and a Perl CGI handler. Additionally, it can easily be integrated into editors that support shell commands such as nedit.

Please cite: Harry J Mangalam: tacg - a grep for DNA. (PubMed,eprint) BMC Bioinformatics 3:8 (2002)
tandem-genotypes
compare lengths of duplications in DNA sequences
Versions of package tandem-genotypes
ReleaseVersionArchitectures
VCS1.8.3-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 1.8.3-1

Only a fraction of the DNA in the human genome (and that of other species that are not optimised for the speed of their replication like viruses) are coding for genes. Other parts may be binding to transcription factors or direct the expression of genes in other ways - these other bits may not be fully understood, and parts may indeed be "junk", but this is only until user finds a clinical feature to be statistically associated with something statistically noteworthy in the DNA sequences.

Features that somehow seem informative when looking at the DNA are whatever does not look like random. This tool looks at a special case of repeats - short regions that are duplicated, i.e. they appear as a tandem. When these repeats are longer, then these would be referred as microsatellites.

When interested in structural variations, within a family/population or to compare cancer tissue with benign samples, you may also want to look at these repeats. This software determines the lengths (and changes to the lengths) across samples and knows how to present this graphically.

Registry entries: Bioconda 
tide
SEQUEST Searching for Peptide Identification from Tandem Mass Spectra
Versions of package tide
ReleaseVersionArchitectures
VCS0.0.r15918-1all
Versions and Archs
License: Apache-2.0
Debian package not available
Git
Version: 0.0.r15918-1

Tide implements the SEQUEST algorithm for peptide identification and that achieves a dramatic speedup over Crux and SEQUEST. The optimization strategies detailed here employ a combination of algorithmic and software engineering techniques to achieve speeds up to 170 times faster than a recent version of SEQUEST that uses indexing. For example, on a single Xeon CPU, Tide searches 10,000 spectra against a tryptic database of 27,499 C.\ elegans proteins at a rate of 1,550 spectra per second, which compares favorably with a rate of 8.8 spectra per second for a recent version of SEQUEST with index running on the same hardware.

Please cite: Benjamin J. Diament and William Stafford Noble: Faster SEQUEST Searching for Peptide Identification from Tandem Mass Spectra. (PubMed) Journal of Proteome Research 10(9):3871–3879 (2011)
tigr-glimmer-mg
finding genes in environmental shotgun DNA sequences
Versions of package tigr-glimmer-mg
ReleaseVersionArchitectures
VCS0.3.2-1all
Versions and Archs
License: free
Debian package not available
Git
Version: 0.3.2-1

Glimmer-MG is a system for finding genes in environmental shotgun DNA sequences. Glimmer-MG (Gene Locator and Interpolated Markov ModelER - MetaGenomics) uses interpolated Markov models (IMMs) to identify the coding regions and distinguish them from noncoding DNA.

Please cite: David R. Kelley, Bo Liu, Arthur L. Delcher, Mihai Pop and Steven L. Salzberg: Gene prediction with Glimmer for metagenomic sequences augmented by classification and clustering. (PubMed) Nucleic Acids Research 40(1):e9 (2012)
tn-seqexplorer
explore and analyze Tn-seq data for prokaryotic genomes
Versions of package tn-seqexplorer
ReleaseVersionArchitectures
VCS1.5+dfsg-1all
Versions and Archs
License: GPL
Debian package not available
Git
Version: 1.5+dfsg-1

Tn-seq Explorer allows users to explore and analyze Tn-seq data for prokaryotic (bacterial or archaeal) genomes. It implements two alternative methods for identification of essential genes and provides additional tools to investigate the Tn-seq data. The primary goal of the data analysis is to study fitness by identifying genes that are essentia

Please cite: Sina Solaimanpour, Felipe Sarmiento and Jan Mrázek: Tn-Seq Explorer: A Tool for Analysis of High-Throughput Sequencing Data of Transposon Mutant Libraries. (PubMed,eprint) PLoS ONE 10(5):e0126070 (2015)
ufasta
utility to manipulate fasta files
Versions of package ufasta
ReleaseVersionArchitectures
VCS0.0.3+git20190131.85d60d1-1all
Versions and Archs
License: to_be_clarified
Debian package not available
Git
Version: 0.0.3+git20190131.85d60d1-1

Description of ufasta subcommands:

  • one: remove the new lines in the data section. Hence, all the sequences are written on one line. In some sense, it is the opposite of the format subcommand.
  • format: reformat the data sections. The data is written in lines of the same length, it can changes the content in upper/lower case.
  • sizes: print the amount of sequence in each section
  • head: like UNIX head. Display the first 10 sequences
  • tail: like UNIX tail. Display the last 10 sequences
  • rc: reverse complement every sequence
  • n50, stats: display stats about the sequences: N50, E size, total size, etc.
  • extract: extract a sequence whose header match given names
  • hsort, sort: sort file based on header content
  • dsort: sort the data sections
  • hgreap: output sequences whose header match the regular expression
  • dgresp: output sequences whose sequence match the regular expression
  • split: split a fasta file into many files
umap
quantify genome and methylome mappability
Versions of package umap
ReleaseVersionArchitectures
VCS1.0.0-1all
Versions and Archs
License: GPL-3.0
Debian package not available
Git
Version: 1.0.0-1

Umap identifies uniquely mappable regions of any genome. Its Bismap extension identifies mappability of the bisulfite converted genome (methylome).

Please cite: Mehran Karimzadeh, Carl Ernst, Anshul Kundaje and Michael M. Hoffman: Umap and Bismap: quantifying genome and methylome mappability. (PubMed,eprint) Nucleic Acids Res. 46(20):e120 (2018)
Registry entries: Bioconda 
unc-fish
Fast Identification of Segmental Homology
Versions of package unc-fish
ReleaseVersionArchitectures
VCS1.0+dfsg-1all
Versions and Archs
License: LicenseAgreementFISH
Debian package not available
Git
Version: 1.0+dfsg-1

FISH is software for identifying regions of common ancestry between genome maps. Fast identification and statistical evaluation of segmental homologies in comparative maps.

Development and maintenance of FISH is supported by funding from the National Science Foundation (Plant Genome Research Program Grants DBI-0110069 and DBI-0227314 to TJV and DMS-0102008 to PPC).

Please cite: Peter P. Calabrese, Sugata Chakravarty and Todd J. Vision: Fast identification and statistical evaluation of segmental homologies in comparative maps. (PubMed,eprint) Bioinformatics 19(Suppl 1):i74-i80 (2003)
varmatch
robust matching of small genomic variant datasets
Versions of package varmatch
ReleaseVersionArchitectures
VCS0+git20180126.5c6fed5+dfsg-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 0+git20180126.5c6fed5+dfsg-1

Small variant calling is an important component of many analyses, and, in many instances, it is important to determine the set of variants which appear in multiple callsets. Variant matching is complicated by variants that have multiple equivalent representations. Normalization and decomposition algorithms have been proposed, but are not robust to different representation of complex variants. The VarMatch algorithm is robust to different representation of complex variants and is particularly effective in low complexity regions or those dense in variants. VarMatch also provides summary statistics, annotations, and visualizations that are useful for understanding callers' performance.

Please cite: Chen Sun and Paul Medvedev: VarMatch: robust matching of small variant datasets using flexible scoring schemes. (PubMed) Bioinformatics 33(9):1301-1308 (2017)
vmd
presentation of traces of molecular dynamics runs
Versions of package vmd
ReleaseVersionArchitectures
VCS1.9.1-3all
Versions and Archs
License: University_of_Illinois_non-free
Debian package not available
Git
Version: 1.9.1-3

VMD stands for Visual Molecular Dynamics. While text books and even structure databases because of technical problems only present static pictures of proteins or DNA, for the understanding of the properties of those molecules their vibration or their movement in general is important.

The movements itself are calculated by molecular dynamics programs, such as NAMD (by the same group), Rosetta, BALLView or GROMACS. The latter two are already in the distribution, we have package build instructions for Rosetta.

VMD has a series of nice features, from displaying through animation to analysing. It can be scripted, clustered, and runs on all common OS. Its license does not allow to redistribute a Debian package. But to share these build instructions for such a package is just fine.

Please cite: W. Humphrey, A. Dalke and K. Schulten: VMD: visual molecular dynamics. (PubMed,eprint) Journal of Molecular Graphics 14(1):33-38 (1996)
zodiac-zeden
ZODIAC - Zeden's Organise DIsplay And Compute
Versions of package zodiac-zeden
ReleaseVersionArchitectures
VCS0.6.5-1all
Versions and Archs
License: GPL-3.0+
Debian package not available
Git
Version: 0.6.5-1

Zodiac is a molecular modelling suite for computation, analysis and display of molecular data. It features state-of-the-art tools for managing molecular databases, run molecular docking experiments, compute raytraced images and much more.

Unofficial packages built by somebody else

big-blast
Helper tool to run blast on large sequences
License: not specified

This script will chop up a large sequence, run blast on each bit and then write out an EMBL feature table and a MSPcrunch -d file containing the hits.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
estferret
processes, clusters and annotates EST data
License: to be clarified

ESTFerret processes, clusters and annotates EST data. It is user-configurable. Results are currently stored in a series of text tables. Annotation consists of searches against use r-defined blast databases, prosite, GO and allocation of EC numbers where possible.

EST-ferret is a user-configurable, automated pipeline for the convenient analysis of EST sequence data that includes all of the necessary steps for cleanup and trimming, submission to external sequence repositories, clustering, identification by BLAST homology searches and by searches of protein domain databases, annotation with computer-addressable terms and production of outputs for direct entry into microarray analysis packages. It is composed of several widely used, open-source algorithms, including PHRED, CAP3, BLAST, and a range of sequence and annotation databases, including Gene Ontology and Conserved Domain Database to deliver a putative identity and a detailed annotation of each clone. It can be run either step-by-step to track the outputs, or as a single batch process. Users can easily edit the configuration file to define parameter settings.

This package has five major components: (1) ESTs coding system; (2) sequence processing; (3) sequence clustering; (4) sequence annotating and (5) storage and reporting of results. DNA trace files are renamed and converted into FASTA format, cleaned and submitted to dbEST(Boguski, et al, 1993). Sequence assembly uses two rounds of CAP3 to assemble the ESTs into groups corresponding to separate gene families and unique genes. Sequence identification and annotation is provided by a series of BLAST homology searches (Parallel_BLAST and Priority_BLAST) against user-defined sequence databases implemented with the NCBI BLASTALL algorithm. The BLAST results are parsed and annotation terms that reflect functional attributes are captured from Gene Ontology (The Gene Ontology Consortium, 2000), KEGG and Enzyme Commission (EC) databases and applied to each of the clones. CDD (and InterPro) searches are performed for seeking protein domains in the sequences. Other options are provided to run PatSearch, RepeatMasker and BLAT to find UTRs, repeats and EST candidates in genomes. Finally, the package generates analysis reports in a variety of flat file formats, sources of which can be serve as inputs for some gene annotation and gene expression profiling tools, and also as a MySQL database or web-browsable search tool.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
maxd
data warehouse and visualisation environment for genomic expression data
License: Artistic

Maxd is a data warehouse and visualisation environment for genomic expression data. It is being developed in the University of Manchester by the Microarray Bioinformatics Group.

Software components:

 maxdLoad2 - standards-compliant, highly customisable transcriptomics
             database
 maxdView  - modular and easily extensible data visualisation and
             analysis environment
 maxdSetup - installation management utility
Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
migrate
estimation of population sizes and gene flow using the coalescent
License: to be clarified

Migrate estimates effective population sizes and past migration rates between n population assuming a migration matrix model with asymmetric migration rates and different subpopulation sizes. Migrate uses maximum likelihood or Bayesian inference to jointly estimate all parameters. It can use the followind data types: sequence data using Felsenstein's 84 model with or without site rate variation, single nucleotide polymorphism data, microsatellite data using a stepwise mutation model or a brownian motion mutation model, and electrophoretic data using an 'infinite' allele model. The output can contain: Estimates of all migration rates and all population sizes, assuming constant mutation rates among loci or a gamma distributed mutation rate among loci. Profile likelihood tables, Percentiles, Likelihood-ratio tests, and simple plots of the log-likelihood surfaces for all populations and all loci.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
msatfinder
identification and characterization of microsatellites in a comparative genomic context
License: GPL

Msatfinder is a Perl script designed to allow the identification and characterization of microsatellites in a comparative genomic context. There is also an online manual, a discussion forum and an online interface where users can do searches in any number of DNA or protein sequences (as long as the maximum size of all sequences does not exceed 10MB). Nucleotide and amino acid sequences in GenBank, FASTA, EMBL and Swissprot formats are supported.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
oligoarrayaux
Prediction of Melting Profiles for Nucleic Acids
License: non-free (fre academical use)

OligoArrayAux is a subset of the UNAFold package for use with OligoArray (http://berry.engin.umich.edu/oligoarray2_1/). OligoArray is a free software that computes gene specific oligonucleotides for genome-scale oligonucleotide microarray construction. (It is not really specified what they mean with "free software". You can download the source code after registration: "registration is the only way for me to keep trace of OligoArray users and be able to send you a bug fix or a new release".)

The original UNAFold server is available at http://dinamelt.bioinfo.rpi.edu/download.php and you should probably read http://dinamelt.bioinfo.rpi.edu/ if you want to know more about "Prediction of Melting Profiles for Nucleic Acids".

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html

Finally it is hard to find some documentation what OligoArrayAux is really doing because it is only specified into relation to OligoArray (as precondition) and UNAFold (as subset of this) but BioLinux distribution http://envgen.nox.ac.uk/biolinux.html decided to package this and so it might make soem sense to list it here - further investigation is needed.

partigene
generating partial gemomes
License: GPL

PartiGene is part of the Edinburgh-EGTDC developed EST-software pipeline at the moment consisting of trace2dbEST, PartiGene, wwwPartiGene, port4EST and annot8r. PartiGene is a menu-driven, multi-step software tool which takes sequences (usually ESTs) and creates a dataabase of a non-redundant set of sequence objects (putative genes) which we term a partial genome.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
pfaat
Protein Family Alignment Annotation Tool
Responsible: BioLinux - Dan Swan
License: GPL

Pfaat is a Java application that allows one to edit, analyze, and annotate multiple sequence alignments. The annotation features are a key component as they provide a framework to for further sequence, structure and statistical analysis.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
prot4est
EST protein translation suite
License: GPL

prot4EST is a perl script that takes expressed sequence tags (ESTs) and translates them optimally to produce putative peptides. prot4EST intergrates a number of programs to overcome problems inherent with translating ESTs.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
python3-orange
Data mining framework
Responsible: Mitar
License: GPLv3

Orange is a component-based data mining software. It includes a range of data visualization, exploration, preprocessing and modeling techniques. It can be used through a nice and intuitive user interface or, for more advanced users, as a module for Python programming language.

qtlcart
map quantitative traits using a map of molecular markers
Responsible: BioLinux - Dan Swan
License: GPL

QTL Cartographer is a suite of programs to map quantitative traits using a map of molecular markers. It contains a set of programs that will aid in locating the genes that control quantitative traits using a molecular map of markers. It includes some programs to allow simulation studies of experiments.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
rbs-finder
find ribosome binding sites(RBS)
License: not specified

The program implements an algorithm to find ribosome binding sites(RBS) in the upstream regions of the genes annotated by Glimmer2, GeneMark, or other prokaryotic gene finders. If there is no RBS-like patterns in this region, program searches for a start codon having a RBS-like pattern ,in the same reading frame upstream or downstream and relocates start codon accordingly.

You can find more detailed information at http://nbc11.biologie.uni-kl.de/docbook/doc_userguide_bioinformatics_server/chunk/ch01s06.html

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
roche454ace2caf
convert GS20 or FLX assemblies into CAF format
License: not specified

Some tools to convert GS20 or FLX assemblies (454Contigs.ace) into CAF format so that these are correct viewable/editable/... whithin the staden package (gap4). You have then access to "hidden data", exact aligned trace and there positions, base values etc and whith staden-1-7-0 you have graphical access to the associated flowgramm traces (SFF format).

Description, Goals - please take a look at http://genome.imb-jena.de/software/roche454ace2caf/Poster_UserMeeting_GS20_Munich_070328.pdf

Remark of Debian Med team: The BioLinux distribution http://envgen.nox.ac.uk/biolinux.html

maintains a package called bio-linux-assembly-conversion-tools which contains caftools and roche2gap in one package with the following description:

Conversion tools for handling 454 assemblies.

This package contains code from different authors that allow sequence assemblies to be converted into formats such as CAF (Common Assembly Format) or GAP4. This package includes tools to convert assemblies from Newbler's ace format for loading into a gap4 assembly.

splitstree
Analyzing and Visualizing Evolutionary Data
License: to be clarified

Evolutionary data is most often presented as a phylogentic tree, the underlying assumption being that evolution is a branching process. However, real data is never ideal and thus doesn't always support a unique tree, but often supports more than one possible tree. Hence, it makes sense to consider tree reconstruction methods that produce a tree, if the given data heavily favors one tree over all others, but otherwise produces a more general graph that indicates different possible phylogenies. One such method is the Split Decomposition introduced by Hans-Juergen Bandelt and Andreas Dress (1992) and its variations. Another example is Spectral Analysis developed by Hendy, Penny and others.

These and other methods are implemented in the program SplitsTree, that I wrote with contributions from Dave Bryant, Mike Hendy, Holger Paschke, Dave Penny and Udo Toenges. It is based on the Nexus format.

Note: There is a new version 4.0 written from scratch at http://www.splitstree.org/ which requires a license key - so this is probably non-free. Version 3.2 which is linked above has some downloadable source code without any license or copyright statement - so it has to be clarified whether we are able to distribute this code or not.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
taverna
designing and executing myGrid workflows for bioinformatics
License: LGPL

The Taverna workbench is a free software tool for designing and executing workflows, created by the myGrid project, and funded through OMII-UK. Taverna allows users to integrate many different software tools, including web services, such as those provided by the National Center for Biotechnology Information, The European Bioinformatics Institute, the DNA Databank of Japan (DDBJ), SoapLab, BioMOBY and EMBOSS.

The Taverna Workbench provides a desktop authoring environment and enactment engine for scientific workflows expressed in Scufl (Simple Conceptual Unified Flow language). The Taverna enactment engine is also available separately, and other Scufl enactors are available including Moteur. The myExperiment social web site supports finding and sharing of workflows and has special support for Scufl workflows. The Taverna workbench, myExperiment and associated components are developed and maintained by the myGrid team, in collaboration with the open source community.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
taxinspector
browser for entries in the NCBI taxonomy
Responsible: BioLinux - Tim Booth
License: Artistic + other free licenses

TaxInspector is a browser for entries in the NCBI taxonomy. It is designed to run as a plugin to annotation software such as maxdLoad2 and Pedro, but also has a standalone mode.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html
tetra
tetranucleotide frequency calculator
License: free academic

The TETRA program can be used to calculate how well tetranucleotide usage patterns in DNA sequences correlate. Such correlations can provide valuable hints on the relatedne ss of DNA sequences, and are particularly useful for metagenomic sequences.

Remark of Debian Med team: This package ships with BioLinux http://envgen.nox.ac.uk/biolinux.html

No known packages available but some record of interest (WNPP bug)

btk-core - wnpp
biomolecule Toolkit C++ library
Responsible: Morten Kjeldgaard
License: GPL
Debian package not available

The Biomolecule Toolkit is a library for modeling biological macromolecules such as proteins, DNA and RNA. It provides a C++ interface for common tasks in structural biology to facilitate the development of molecular modeling, design and analysis tools.

mirbase - wnpp
The microRNA sequence database
Responsible: Charles Plessy
License: Public Domain
Debian package not available

The miRBase Sequence Database provides a searchable repository for published microRNA sequences and associated annotation, functionality previously provided by the microRNA Registry. miRBase also contains predicted miRNA target genes in miRBase Targets, and provides a gene naming and nomenclature function in the miRBase Registry.

Release 9.1 of the database contains 4449 entries representing hairpin precursor miRNAs, expressing 4274 mature miRNA products, in primates, rodents, birds, fish, worms, flies, plants and viruses.

This package will install the miRBase database for mySQL, EMBOSS, and/or ncbi-blast if you have the corresponding packages installed.

It is possible that mirbase will not be a package from the main archive, but will be autogenerated as part of a larger data packaging effort.

phylowin - wnpp
Graphical interface for molecular phylogenetic inference
License: unknown
Debian package not available

Phylo_win is a graphical colour interface for molecular phylogenetic inference. It performs neighbor-joining, parsimony and maximum likelihood methods and bootstrap with any of them. Many distances can be used including Jukes & Cantor, Kimura, Tajima & Nei, HKY, Galtier & Gouy (1995), LogDet for nucleotidic sequences, Poisson correction for protein sequences, Ka and Ks for codon sequences. Species and sites to include in the analysis are selected by mouse. Reconstructed trees can be drawn, edited, printed, stored and evaluated according to numerous criteria.

This program uses sources files from the Phylip program, which forbids its use for profit. Therfore, Phylo_win will unfortunately have to be distributed in contrib or non-free.

Remark of Debian Med team: Issuer of previous ITP said:

Because I could never figure out the license of Phylo_win, and because the upstream authors released SeaView 4, which provides similar functionalities, I will not package Phylo_win.

Probably it makes sense to remove this project from the prospective packages list.

No known packages available

amoscmp
comparative genome assembly package
License: Artistic
Debian package not available

A comparative assembler is a program that can assemble a set of shotgun reads from an organism by mapping them to the finished sequence of a related organism. Thus, a comparative assembler transforms the traditional overlap-layout-consensus approach to alignment-layout-consensus. The AMOScmp package uses the MUMmer program to perform a mapping of the reads to the reference genome, then processes the alignment results with a sophisticated layout program designed to take into account polymorphisms between the two genomes. For a detailed description of the algorithms involved please refer to the paper listed in the References section.

AMOScmp uses as AMOS messages as both the inputs and the outputs (see documentation). Two utilities are provided to process these files: tarchive2amos - a versatile converter from trace archive .seq, .qual, and .xml information into AMOS formatted data; amos2ace - a converter from AMOS formatted data to the .ACE assembly format. In addition, the AMOS::AmosLib Perl module is provided as a tool for users who prefer to write their own conversion utilities. Please see the documentation included with the distribution for more information.

AMOScmp is part of the AMOS package (see http://amos.sourceforge.net/)- a collaborative effort to develop a modular open-source framework for assembly development.

Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
annovar
annotate genetic variants detected from diverse genomes
License: Open Source for non-profit
Debian package not available

ANNOVAR is an efficient software tool to utilize update-to-date information to functionally annotate genetic variants detected from diverse genomes (including human genome hg18, hg19, as well as mouse, worm, fly, yeast and many others). Given a list of variants with chromosome, start position, end position, reference nucleotide and observed nucleotides, ANNOVAR can perform:

 1. Gene-based annotation: identify whether SNPs or CNVs cause protein coding
    changes and the amino acids that are affected. Users can flexibly use RefSeq
    genes, UCSC genes, ENSEMBL genes, GENCODE genes, or many other gene definition
    systems.
 2. Region-based annotations: identify variants in specific genomic regions,
    for example, conserved regions among 44 species, predicted transcription
    factor binding sites, segmental duplication regions, GWAS hits, database
    of genomic variants, DNAse I hypersensitivity sites, ENCODE
    H3K4Me1/H3K4Me3/H3K27Ac/CTCF sites, ChIP-Seq peaks, RNA-Seq peaks, or many
    other annotations on genomic intervals.
 3. Filter-based annotation: identify variants that are reported in dbSNP,
    or identify the subset of common SNPs (MAF>1%) in the 1000 Genome Project,
    or identify subset of non-synonymous SNPs with SIFT score>0.05, or many
    other annotations on specific mutations.
 4. Other functionalities: Retrieve the nucleotide sequence in any
    user-specific genomic positions in batch, identify a candidate gene list
    for Mendelian diseases from exome data, identify a list of SNPs from
    1000 Genomes that are in strong LD with a GWAS hit, and many other
    creative utilities.

In a modern desktop computer (3GHz Intel Xeon CPU, 8Gb memory), for 4.7 million variants, ANNOVAR requires ~4 minutes to perform gene-based functional annotation, or ~15 minutes to perform stepwise "variants reduction" procedure, making it practical to handle hundreds of human genomes in a day.

arachne
toolkit for Whole Genome Shotgun Assembly
License: free
Debian package not available

Arachne is a toolkit developed for Whole Genome Shotgun Assembly. Arachne consists of a comprehensive set of modules, including a central pipeline (Assemblez) that can be run on almost any genome to produce a draft assembly. Arachne's mandate explicitly includes accommodating difficult genomes with complications such as extreme size, repeats, and high polymorphism rates. In order to construct a reasonably well-connected assembly from such tricky genomes, Arachne provides further tools that can be used after the main module pipeline.

The Arachne code package has been under continuous development since 2000. It began with the classic "overlap-layout-consensus" paradigm and has since developed into a vast collection of tools, implemented in numerous modules, to analyze, visualize and manipulate assemblies. New and improved algorithms are becoming available on a regular basis.

asap
organize the data associated with a genome
Responsible: Andreas Tille
License: GPL
Debian package not available

Developments in genome-wide approaches to biological research have yielded greatly increased quantities of data, necessitating the cooperation of communities of scientists focusing on shared sets of data. ASAP leverages the internet and database technologies to meet these needs. ASAP is designed to organize the data associated with a genome from the early stages of sequence annotation through genetic and biochemical characterization, providing a vehicle for ongoing updates of the annotation and a repository for genome-scale experimental data. Development was motivated by the need to more directly involve a greater community of researchers, with their collective expertise, in keeping the genome annotation current and to provide a synergistic link between up-to-date annotation and functional genomic data. The system is continually under development at the Genome Evolution Lab with the stable, in-use, publicly available University of Wisconsin installation updated regularly.

Software development on ASAP began in early 2002, and ASAP has been continually improved up until the present day. A longstanding goal of the ASAP project was to make the source code of ASAP available so that other installations of ASAP could be implemented. As future ASAP installations come to pass, ASAP will be further extended to be inter-operable between sites.

bambus
hierarchical approach to building contig scaffolds
License: Artistic
Debian package not available

BAMBUS is the first publicly available scaffolding program. It orders and orients contigs into scaffolds based on various types of linking information. Additionally, BAMBUS allows the users to build scaffolds in a hierarchical fashion by prioritizing the order in which links are used. For more information please check out the online documentation.

Note that currently Bambus is undergoing a transition in order to be integrated with the AMOS package (see http://amos.sourceforge.net/)

Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
cactus
License: GPL
Debian package not available

Cactus is an open source problem solving environment designed for scientists and engineers. Its modular structure easily enables parallel computation across different architectures and collaborative code development between different groups.

Cactus provides easy access to many cutting edge software technologies being developed in the academic research community, including the Globus Metacomputing Toolkit, HDF5 parallel file I/O, the PETSc scientific library, adaptive mesh refinement, web interfaces, and advanced visualization tools.

cdna-db
quality-control checking of finished cDNA clone sequences
License: Artistic
Debian package not available

cdna_db is a software system designed for quality-control checking of finished cDNA clone sequences, and their computational analysis. The combination of a relational db (MySQL) schema, and an object-orientated perl API make it easy to implement high-level analyses of these transcript sequences.

The cdna_db can store cDNA clone sequences, and ESTs and consensus/contig sequences also derived from these clones. These are then used by the system to check cDNA clone sequence identity etc (see deneral_doc.txt). For each clone multiple DNA sequence versions can be stored, if for instance, the finished DNA sequence is revised as part of the sequencing process.

A blast pipeline is implemented together with a job control system (with LSF underlying) so that multiple CPUs can be used in parallel to carry out the blasts of large datasets. The searches can be made incremental, so as more cDNA sequences are added to the databank, just the new clones are blasted.

Utility scripts are provided to delete previous search results, and dump cDNA clones sequences (such as those that passed the QC checking) from the cdna_db.

cmap
view comparisons of genetic and physical maps
License: Not specified
Debian package not available

CMap is a web-based tool that allows users to view comparisons of genetic and physical maps. The package also includes tools for curating map data.

contralign
parameter learning framework for protein pairwise sequence alignment
License: Public Domain
Debian package not available

CONTRAlign is an extensible and fully automatic parameter learning framework for protein pairwise sequence alignment based on pair conditional random fields. The CONTRAlign framework enables the development of feature-rich alignment models which generalize well to previously unseen sequences and avoid overfitting by controlling model complexity through regularization.

copycat
fast access to cophylogenetic analyses
License: Use of the program is free for academic purposes at an academic institute. For all other uses, please contact the authors.
Debian package not available

CopyCat provides an easy and fast access to cophylogenetic analyses. It incorporates a wrapper for the program ParaFit, which conducts a statistical test for the presence of congruence between host and parasite phylogenies. CopyCat offers various features, such as the creation of customized host-parasite association data and the computation of phylogenetic host/parasite trees based on the NCBI taxonomy.

e-hive
distributed processing system based on 'autonomous agents'
License: Not specified
Debian package not available

This is a distributed processing system based on 'autonomous agents' and Hive behavioural structure of Honey Bees . It implements all functionality of both data-flow graphs and block-branch diagrams which should allow it to codify any program, algorithm, or parallel processing job control system. It is not bound to any processing 'farm' system and can be adapted to any GRID.

exalt
phylogenetic generalized hidden Markov model for predicting alternatively spliced exons
License: Artistic
Debian package not available

ExAlt is a software program designed to predict alternatively spliced overlapping exons in genomic sequence. The program works in several ways depending on the available input. ExAlt can use information of existing gene structure as well as sequence conservation to improve the precision of it's predictions. ExAlt can also make predictions when only a single genomic sequence is available. ExAlt has been extensively tested on Drosophila melanogaster, but can be adapted to run on other species.

Remark of Debian Med team: Computational Gene Finding (http://www.cbcb.umd.edu/software/)
excavator
gene expression data clustering
License: GPL
Debian package not available
Language: Java

Excavator is a program for gene expression data clustering. It uses a set of unique clustering algorithms developed by the Computational Systems Biology Lab (CSBL) at the University of Georgia. Excavator represents data internally as a minimum spanning tree and outputs results to the user through the use of a micro-array data window, graphs, and a dendrogram viewer.

Features

  • partitioning gene expressions profiles using multiple methods of clustering and definitions of distance between profiles.
  • automatic selection of the most plausible number of clusters in a data set
  • three different ways of viewing data: Micro-array, Gene Expression, and Dendrogram. As well as graphing individual genes from each cluster independently.
  • identification of genes with expression profiles similar to specified seed genes
  • cluster identification from a noisy background
  • numerical comparison between different clustering results of the same data set
  • runnable on command line as well as through a Java GUI
figaro
novel vector trimming software
License: Artistic
Debian package not available

Figaro is a software tool for identifying and removing the vector from raw DNA sequence data without prior knowledge of the vector sequence. By statistically modeling short oligonucleotide frequencies within a set of reads, Figaro is able to determine which DNA words are most likely associated with vector sequence. For a description of Figaro's algorithms please see our paper. Figaro is part of the AMOS suite.

Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
forge
genome assembler for mixed read types
License: Apache 2.0
Debian package not available

Forge Genome Assembler is a parallel, MPI based genome assembler for mixed read types.

Forge is a classic "Overlap layout consensus" genome assembler written by Darren Platt and Dirk Evers. Implemented in C++ and using the parallel MPI library, it runs on one or more machines in a network and can scale to very large numbers of reads provided there is enough collective memory on the machines used. It generates a full consensus alignment of all reads, can handle mixtures of sanger, 454 and illumina reads. There is some support for solid color space and it includes built in tools for vector trimming and contamination screening.

Forge and was originally developed at Exelixis and they have kindly agreed to place the software which underwent much subsequent development outside Exelixis, into the public domain. Forge works with most of the common MPI implementations.

Remark of Debian Med team: Competitor to MIRA2 and wgs-assembler

This package was requested by William Spooner whs@eaglegenomics.com as a competitor to MIRA2 and wgs-assembler.

gbrowse-syn
Generic Synteny Browser
License: Not specified
Debian package not available

GBrowse_syn, or the Generic Synteny Browser, is a GBrowse-based synteny browser designed to display multiple genomes, with a central reference species compared to two or more additional species. It can be used to view multiple sequence alignment data, synteny or co-linearity data from other sources against genome annotations provided by GBrowse. GBrowse_syn is included with the standard GBrowse package (version 1.69 and later). Working examples can be seen at TAIR and WormBase.

genemark
family of gene prediction programs
License: Academic License Agreement
Debian package not available

A family of gene prediction programs developed at Georgia Institute of Technology, Atlanta, Georgia, USA.

genesplicer
computational method for splice site prediction
License: Artistic
Debian package not available

A fast, flexible system for detecting splice sites in the genomic DNA of various eukaryotes. The system has been trained and tested successfully on Plasmodium falciparum (malaria), Arabidopsis thaliana, human, Drosophila, and rice . Training data sets for human and Arabidopsis thaliana are included. Use the GeneSplicer Web Interface to run GeneSplicer directly, or see below for instructions on downloading the complete system including source code.

There is no independent program to train GeneSplicer, but there is a way to obtain the necessary files by using the training procedure of GlimmerHMM.

Remark of Debian Med team: Computational Gene Finding (http://www.cbcb.umd.edu/software/)
genetrack
genomic data storage and visualization framework
Responsible: Charles Plessy
License: MIT
Debian package not available

GeneTrack is a high performance bioinformatics data storage and analysis system designed to store genome wide information. It is currently used to analyze data obtained via high-throughput rapid sequencing platforms such as the 454 and Solexa as well as tiling array data based on various platforms.

genezilla
eukaryotic gene finder
License: Artistic
Debian package not available
Language: C++

GeneZilla is a state-of-the-art program for computational prediction of protein-coding genes in eukaryotic DNA, and is based on the Generalized Hidden Markov Model (GHMM) framework, similar to GENSCAN and GENIE. It is highly reconfigurable and includes software for retraining by the end-user. It is written in highly optimized C++ and runs under most UNIX/Linux platforms. The run time and memory requirements are linear in the sequence length, and are in general much better than those of competing systems, due to GeneZilla's novel decoding algorithm. Graph-theoretic representations of the high scoring open reading frames are provided, allowing for exploration of sub-optimal gene models. It utilizes Interpolated Markov Models (IMMs), Maximal Dependence Decomposition (MDD), and includes states for signal peptides, branch points, TATA boxes, CAP sites, and will soon model CpG islands as well.

GeneZilla is an open-source project hosted at bioinformatics.org and currently consists of ~20,000 lines of code. GeneZilla evolved out of the ab initio eukaryotic gene finder TIGRscan, which was developed at The Institute for Genomic Research over a 3-year period under NIH grants R01-LM06845 and R01-LM007938, and which served as the basis for the comparative gene finder TWAIN.

Remark of Debian Med team: Computational Gene Finding (http://www.cbcb.umd.edu/software/)
genographer
read data and reconstruct them into a gel image
License: GPL
Debian package not available

This program will read in data from an ABI 3700, 3100, 377 or 373, CEQ 2000 or SCF and reconstruct them into a gel image which is straightened and sized. Bins can be defined easily and viewed as thumbnails, which allows for a fairly quick and easy way of scoring a gel.

The program is written in Java and uses the Java 1.3 API. Therefore, it should run on any machine that can run java.

glimmerhmm
Eukaryotic Gene-Finding System
License: Artistic
Debian package not available

GlimmerHMM is a new gene finder based on a Generalized Hidden Markov Model (GHMM). Although the gene finder conforms to the overall mathematical framework of a GHMM, additionally it incorporates splice site models adapted from the GeneSplicer program and a decision tree adapted from GlimmerM. It also utilizes Interpolated Markov Models for the coding and noncoding models . Currently, GlimmerHMM's GHMM structure includes introns of each phase, intergenic regions, and four types of exons (initial, internal, final, and single). A basic user manual can be consulted here.

Remark of Debian Med team: Computational Gene Finding (http://www.cbcb.umd.edu/software/)
gmv
comparative genome browser for Murasaki
License: GPL
Debian package not available

GMV is a comparative genome browser for Murasaki. GMV visualizes anchors from Murasaki, annotation data from GenBank files, and expression / prediction score from GFF files.

jigsaw
gene prediction using multiple sources of evidence
License: Artistic
Debian package not available

JIGSAW is a program designed to use the output from gene finders, splice site prediction programs and sequence alignments to predict gene models. The program provides an automated way to take advantage of the many succsessful methods for computational gene prediction and can provide substantial improvements in accuracy over an individual gene prediction program.

JIGSAW is available for all species. It is tested on Human, Rice (Oryza sativa), Arabidopsis thaliana , Brugia malayi, Cryptococcus neoformans, Entamoeba histolytica, Theileria parva, Aspergillus fumigatus, Plasmodium falciparum and Plasmodium yoelii.

The linear combiner option is now available in the current JIGSAW software distribution. This allows JIGSAW to be run without the use of training data. A weight is assigned to each evidence source, and gene predictions are based on a weighted voting scheme, yielding the best 'consensus' predictions.

Predictions are now available for the ENCODE regions in Human and viewable as custom tracks in the UCSC Human Genome Browser. Predictions available for the Human genome and viewable as custom tracks in the UCSC Human Genome Browser

Remark of Debian Med team: Computational Gene Finding (http://www.cbcb.umd.edu/software/)
maker2
annotate genomes and create genome databases
License: GPL / Artistic
Debian package not available

MAKER is a portable and easily configurable genome annotation pipeline. It's purpose is to allow smaller eukaryotic and prokaryotic genome projects to independently annotate their genomes and to create genome databases. MAKER identifies repeats, aligns ESTs and proteins to a genome, produces ab-initio gene predictions and automatically synthesizes these data into gene annotations having evidence-based quality values. MAKER is also easily trainable: outputs of preliminary runs can be used to automatically retrain its gene prediction algorithm, producing higher quality gene-models on seusequent runs. MAKER's inputs are minimal and its ouputs can be directly loaded into a GMOD database. They can also be viewed in the Apollo genome browser; this feature of MAKER provides an easy means to annotate, view and edit individual contigs and BACs without the overhead of a database. MAKER should prove especially useful for emerging model organism projects with minimal bioinformatics expertise and computer resources

metarep
JCVI Metagenomics Reports
License: MIT
Debian package not available

JCVI Metagenomics Reports (METAREP) is a new open source tool for high-performance comparative metagenomics. It provides a suite of web based tools to help scientists to view, query, browse and compare metagenomics annotation data derived from ORFs called on metagenomics reads.

METAREP supports browsing of functional and taxonomic assignments. Users can either specify fields, or logical combinations of fields to flexibly filter datasets on the fly. Users can compare multiple datasets at various functional and taxonomic levels applying statistical tests as well as hierarchical clustering, multidimensional scaling and heatmaps.

minimus
AMOS lightweight assembler
License: Artistic
Debian package not available

minimus is an assembly pipeline designed specifically for small data-sets, such as the set of reads covering a specific gene. Note that the code will work for larger assemblies (we have used it to assemble bacterial genomes), however, due to its stringency, the resulting assembly will be highly fragmented. For large and/or complex assemblies the execution of Minimus should be followed by additional processing steps, such as scaffolding.

minimus follows the Overlap-Layout-Consensus paradigm and consists of three main modules:

  • overlapper - computes the overlaps between the reads using a modified version of the Smith-Waterman local alignment algorithm
  • tigger - uses the read overlaps to generate the layouts of reads representing individual contigs
  • make-consensus - refines the layouts produced by the tigger to generate accurate multiple alignments within the reads

minimus uses as AMOS messages as both the inputs and the outputs (see documentation). Two utilities are provided to process these files: tarchive2amos - a versatile converter from trace archive .seq, .qual, and .xml information into AMOS formatted data; amos2ace - a converter from AMOS formatted data to the .ACE assembly format. In addition, the AMOS::AmosLib Perl module is provided as a tool for users who prefer to write their own conversion utilities. Please see the documentation included with the distribution for more information.

minimus is part of the AMOS package - a collaborative effort to develop a modular open-source framework for assembly development.

Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
mummergpu
High-throughput sequence alignment using Graphics Processing Units
License: Artistic
Debian package not available

The recent availability of new, less expensive high-throughput DNA sequencing technologies has yielded a dramatic increase in the volume of sequence data that must be analyzed. These data are being generated for several purposes, including genotyping, genome resequencing, metagenomics, and de novo genome assembly projects. Sequence alignment programs such as MUMmer have proven essential for analysis of these data, but researchers will need ever faster, high-throughput alignment tools running on inexpensive hardware to keep up with new sequence technologies.

MUMmerGPU is a low cost, ultra-fast sequence alignment program designed to handle the increasing volume of data produced by new, high-throughput sequencing technologies. MUMmerGPU is a GPGPU drop-in replacement for MUMmer, using the GPUs in common workstations to simultaneously align multiple query sequences against a single reference sequence stored as a suffix tree. By processing the queries in parallel on the highly parallel graphics card, MUMmerGPU achieves more than a 10-fold speedup over a serial CPU version of the sequence alignment kernel, and outperforms MUMmer on a high end CPU by 3.5-fold in total application time when aligning reads from recent sequencing projects using Solexa/Illumina, 454, and Sanger sequencing technologies.

Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
obo-edit
editor for biological ontologies
License: Artistic
Debian package not available

(Open Biological Ontologies) Obo-Edit supports the formal representation of biological entities and the specification of is-a (specialisation) and part-of relations. Amongst the databases cureated by this tool is the GeneOntology.

operondb
detect and analyze conserved gene pairs
License: to be clarified
Debian package not available

Comparison of complete microbial genomes reveals a large number of conserved gene clusters - sets of genes that have the same order in two or more different genomes. Such gene clusters often, but not always represent a co-transcribed unit, or operon. A method was developed to detect and analyze conserved gene pairs - pairs of genes that are located close on the same DNA strand in two or more bacterial genomes. For each conserved gene pair, an estimate of probability is calculated that the genes belong to the same operon. The algorithm takes into account several alternative possibilities. One is that functionally unrelated genes may have the same order due simply because they were adjacent in a common ancestor. Other possibilities are that genes may be adjacent in two genomes by chance alone, or due to horizontal transfer of the gene pair.

The method is modified from the one described in: Maria D. Ermolaeva, Owen White and Steven L. Salzberg. Prediction of Operons in Microbial Genomes. Nucleic Acids Research, 29, 1216-1221, (2001)

OperonDB was supported by the NIH under grant R01-LM007938 and by the NSF under grant DBI-0234704.

Remark of Debian Med team: Other sequence analysis tools (http://www.cbcb.umd.edu/software/);

no info about license or downloadable code found, but tried to contact authors.

phagefinder
heuristic computer program to identify prophage regions within bacterial genomes
License: GPL
Debian package not available
Language: Perl

It uses tab-delimited results from NCBI BLASTALL or WU BLASTP 2.0 searches against a collection of bacteriophage protein sequences and results from HMMSEARCH analysis of 441 phage-specific HMMs to locate prophage regions. By using FASTA33, MUMMER or BLASTN, it can find potential attachment (att) sites of the phage region(s). Data from tRNAscan-SE and Aragorn are used to determine whether a tRNA or tmRNA served as the putative target for integration. Additionally, by looking for the presence or absence of specific proteins using specific HMM models, Phage_Finder can predict whether the region is most likely prophage and which type (Mu, P2, or retron R73), an integrated element, a plasmid, or a degenerate phage region.

The goal of this project is to provide an open-sourced, standardized and automated system to identify and classify prophages within prokaryotic genomes. It is hoped that this package will facilitate future studies on the biology and evolution of these prophages by providing a level of microbial genome annotation that was previously void.

phpphylotree
draw phylogenetic trees
License: GPL
Debian package not available

PhpPhylotree is a web application that is able to draw phylogenetic trees. It produces an SVG (Scalable Vector Graphic) file from phylip/newick tree files.

phylographer
Graph Visualization Tool
License: GPL
Debian package not available
Language: Tcl/Tk

PhyloGrapher is a program designed to visualize and study evolutionary relationships within families of homologous genes or proteins (elements). PhyloGrapher is a drawing tool that generates custom graphs for a given set of elements. In general, it is possible to use PhyloGrapher to visualize any type of relations between elements. Used in conjunction with tcl_blast_parser, PhyloGrapher can represent the results of a BLAST search as a graph.

PhyloGrapher and tcl_blast_parser are useful tools to analyse BLAST biological sequence alignment reports (BLAST is provided by Debian's blast2 package).

Remark of Debian Med team: Outdated upstream, better alternatives available

The former packaging effort of this package was dropped. It seems that http://cytoscape.org/ is a reasonable replacement.

pyrophosphate-tools
for assembling and searching pyrophosphate sequence data
License: not specified
Debian package not available

Simple tools for assembling and searching high-density picolitre pyrophosphate sequence data.

rose
Region-Of-Synteny Extractor
License: Open Source
Debian package not available

ROSE is a program which identifies regions between two genomes which are likely to contain orthologous genes. The two genomes are given as two multi fasta files of DNA sequences. The PROmer program from the MUMmer package needs to be run first between the two genomes, and the resulting delta file is then input to ROSE. If a previous annotation is available for one or both genomes, then the coordinates of the annotated genes from a genome can be optionally given as input in a gff file. The gene coordinates will be used to guide the length of the regions produced by ROSE. By default, when finding a region of consistent alignments, ROSE will add a user-defined margin (1000 bp by default) on either side of that region. When a predicted gene overlaps an alignment we use the gene prediction to extend the boundaries of the output region.

Remark of Debian Med team: Computational Gene Finding (http://www.cbcb.umd.edu/software/)
treebuilder3d
viewer of SAGE and other types of gene expression data
License: GPL
Debian package not available
Language: Java

TreeBuilder3D is an interactive viewer that allows organization of SAGE and other types of gene expression data such as microarrays into hierarchical dendrograms, or phenetic networks (the term 'phenetic' used as the analysis relies on principals, used in phylogenetic analysis by system biology). Might be used as a visual aid when analyzing differences in expression profiles of SAGE libraries, serves as an alternative to Venn diagrams.

tripal
collection of Drupal modules for genomic research
License: GPL ( as Drupal a derivative )
Debian package not available

Tripal is a collection of open-source freely available Drupal modules under development at CUGI and a member of the GMOD family of tools. Tripal serve as a web interface for the GMOD Chado database. Tripal intially started as a web front-end for the Marine Genomics Project (MG.org). Work on the interface is currently ongoing for the MG.org project as well as the Fagaceae Genomics Web, and other CUGI projects. Tripal is currently being implemented for the new Cacao Genome Database, and Citrus Genome Database and will be used for the Genome Database for Rosaceae. These latter three databases are projects of the Main Bioinformatics Laboratory at Washington State University

twain
syntenic genefinder employing a Generalized Pair Hidden Markov Model
License: Open Source
Debian package not available

TWAIN is a new syntenic genefinder which employs a Generalized Pair Hidden Markov Model (GPHMM) to predict genes in two closely related eukaryotic genomes simultaneously. It utilizes the MUMmer package to perform approximate alignment before applying a GPHMM based on an enhanced version of the TigrScan gene finder. TWAIN was written by Bill Majoros and Mihaela Pertea while at The Institute for Genomic Research (TIGR).

TWAIN consists of two components: (1) ROSE, the Region Of Synteny Extractor, which identifies contiguous regions likely to contain one or more syntenic genes, and (2) OASIS, a generalized pair hidden Markov model (GPHMM) for predicting genes in the regions identified by ROSE. The system utilizes approximate alignments constructed by the PROmer and NUCmer programs in the MUMmer package to assess approximate alignment scores efficiently. More detailed information on the architecture of this system will be made available soon. Slides from a talk at Computational Genomics 2004 are now available.

Remark of Debian Med team: Computational Gene Finding (http://www.cbcb.umd.edu/software/)
uniprime
workflow-based platform for universal primer design
Responsible: Charles Plessy
License: GPL-3+
Debian package not available

UniPrime automatically designs large sets of universal primers by simply inputting a GeneID reference. It automatically retrieves and aligns orthologous sequences from GenBank, identifies regions of conservation within the alignment and generates suitable primers that can amplify variable genomic regions. UniPrime differs from previous automatic primer design programs in that all steps of primer design are automated, saved and are phylogenetically limited. We have experimentally verified the efficiency and success of this program. UniPrime is an experimentally validated, fully automated program that generates successful cross-species primers that take into account the biological aspects of the PCR.

x-tandem-pipeline
peptide/protein identification from MS/MS mass spectra
License: GPL
Debian package not available
Language: Java

X!Tandem is an open-source software performing peptide/protein identification from MS/MS mass spectra. X!Tandem is fast and accurate, but the Global Proteome Machine (GPM) is relatively limited regarding the processing of identification results. X!Tandem pipeline is an alternative to the installation of the GPM on local servers. X!Tandem pipeline performs database searching and matching on a list of MS/MS runs in one shot, using a list of easily user selected paramaters and databases. X!Tandem pipeline also performs filtering of data according to statistical values at peptide and protein levels. The results are stored into TSV (Tab Separated Values) files. Moreover, redundancy of protein databases are fully filtered as follows :

  • proteins identified without specific peptides compared to others are eliminated;
  • proteins identified with the same pool of peptides are assembled;
  • proteins are grouped by function (identified with at least one common peptide), and the specific peptides for each sub-group of proteins are indicated.
*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 248069