Debian Med Project
Help us to see Debian used by medical practitioners and biomedical researchers! Join us on the Salsa page.
Summary
Next generation sequencing
Debian Med bioinformatics applications usable in Next Generation Sequencing

It aims at gettting packages which specialize in the processing or interpretation of data generated with next- (and later-) generation high-thoughput sequencing technologies.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Med to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Med mailing list

Links to other tasks

Debian Med Next generation sequencing packages

Official Debian packages with high relevance

Bcftools
identificazione di varianti genomiche e manipolazione di file VCF/BCF
Versions of package bcftools
ReleaseVersionArchitectures
sid1.9-1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
bullseye1.9-1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
stretch1.3.1-1amd64,arm64,armel,mips64el,mipsel,ppc64el
buster1.9-1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
Popcon: 9 users (19 upd.)*
Versions and Archs
License: DFSG free
Git

BCFtools è un insieme di utilità che manipolano identificazioni di varianti nel formato Variant Call Format (VCF) e nella sua controparte binaria BCF. Tutti i comandi funzionano in modo trasparente sia con VCF sia con BCF, compressi con BGZF e non.

Please cite: Petr Danecek and Shane A. McCarthy: BCFtools/csq: Haplotype-aware variant consequences. (2016)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Bedtools
suite di utilità per confrontare tratti genomici
Versions of package bedtools
ReleaseVersionArchitectures
buster2.27.1+dfsg-4amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
stretch2.26.0+dfsg-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
jessie2.21.0-1amd64,armhf,i386
wheezy2.16.1-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
sid2.28.0+dfsg-3amd64,arm64,mips64el,ppc64el
sid2.27.1+dfsg-4armel,armhf,mipsel
bullseye2.27.1+dfsg-4amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
Debtags of package bedtools:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, filtering
works-withbiological-sequence
Popcon: 47 users (24 upd.)*
Versions and Archs
License: DFSG free
Git

Le utilità BEDTools permettono di affrontare compiti comuni negli studi genomici, come trovare i tratti che si sovrappongono e calcolare la copertura. Le utilità sono largamente basate su quattro formati di file di largo uso: BED, GFF/GTF, VCF e SAM/BAM. Usando BEDTools si possono sviluppare pipe sofisticate che rispondono a domande di ricerca complesse mediante l'uso di svariati BEDTools in un flusso comune.

L'utilità groupBy è distribuita nel pacchetto filo.

Please cite: Aaron R. Quinlan and Ira M. Hall: BEDTools: a flexible suite of utilities for comparing genomic features. (PubMed,eprint) Bioinformatics 26(6):841-842 (2010)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Blasr
mappatura di letture di sequenziamento di singole molecole
Versions of package blasr
ReleaseVersionArchitectures
sid5.3.3+dfsg-1amd64,arm64,mips64el,ppc64el
buster5.3.2+dfsg-1.1amd64,arm64,mips64el,ppc64el
stretch5.3+0-1amd64,arm64,mips64el,ppc64el
bullseye5.3.3+dfsg-1amd64,arm64,mips64el,ppc64el
Popcon: 1 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Basic Local Alignment with Successive Refinement (BLASR) è un metodo per mappare letture di sequenziamento di singole molecole contro un genoma di riferimento. Tali letture sono lunghe migliaia di basi con divergenze tra esse e il genoma dominate da errori di inserzione e delezione.

Registry entries: Bio.Tools  SciCrunch  OMICtools 
Bowtie
allineatore di letture brevi ultraveloce ed efficiente in termini di memoria
Versions of package bowtie
ReleaseVersionArchitectures
sid1.2.3+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
buster1.2.2+dfsg-4amd64,arm64,mips64el,ppc64el,s390x
stretch1.1.2-6amd64,arm64,mips64el,ppc64el,s390x
jessie1.1.1-2amd64
wheezy0.12.7-3amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,powerpc,s390,s390x,sparc
bullseye1.2.3+dfsg-1amd64,arm64,mips64el,ppc64el,s390x
Debtags of package bowtie:
biologynuceleic-acids
fieldbiology:bioinformatics
interfacecommandline
roleprogram
sciencecalculation
scopeutility
useanalysing, comparing
works-withbiological-sequence
Popcon: 21 users (20 upd.)*
Versions and Archs
License: DFSG free
Git

Questo pacchetto affronta il problema di interpretare i risultati delle più recenti (2010) tecnologie di sequenziamento del DNA. Esse restituiscono pezzi piuttosto corti che non possono essere interpretate direttamente. La sfida per gli strumenti come Bowtie è quella di fornire una posizione nei cromosomi per i brevi frammenti di DNA sequenziati in ogni corsa.

Bowtie allinea sequenze (letture) brevi di DNA al genoma umano a una velocità di oltre 25 milioni di 35 bp all'ora. Bowtie indicizza il genoma con un indice Burrows-Wheeler per mantenere piccola la propria impronta di memoria: tipicamente circa 2,2 GB per il genoma umano (2,9 GB per le estremità accoppiate).

The package is enhanced by the following packages: bowtie-examples
Please cite: Ben Langmead, Cole Trapnell, Mihai Pop and Steven L Salzberg: Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. (eprint) Genome Biology 10:R25 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Topics: Genomics
Bwa
Burrows-Wheeler Aligner
Versions of package bwa
ReleaseVersionArchitectures
wheezy0.6.2-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie0.7.10-1amd64
stretch0.7.15-2+deb9u1amd64
buster0.7.17-3amd64
bullseye0.7.17-3amd64
sid0.7.17-3amd64
squeeze0.5.8c-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
Debtags of package bwa:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
useanalysing, comparing
Popcon: 34 users (21 upd.)*
Versions and Archs
License: DFSG free
Git

BWA è un pacchetto software per mappare sequenze con bassa divergenza rispetto a vasti genomi di riferimento, come il genoma umano. Consiste di tre algoritmi: BWA-backtrack, BWA-SW e BWA-MEM. Il primo è progettato per sequenze Illumina fino a 100pb, mentre gli altri due per sequenze più lunghe da 70pb a 1Mpb. BWA-MEM e BWA-SH condividono funzionalità simili, come gestione per lunghe sequenze e allineamenti spezzati, ma BWA-MEM, che è il più recente, è generalmente quello raccomandato per interrogazioni di alta qualità perché più veloce e più accurato. BWA-MEM ha prestazioni migliori anche rispetto a BWA-backtrack per sequenze Illumina 70-100pb.

Please cite: Heng Li and Richard Durbin: Fast and accurate short read alignment with Burrows-Wheeler transform. (PubMed,eprint) Bioinformatics 25(14):1754-1760 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Daligner
rilevazione di allineamenti locali tra letture lunghe di sequenze nucleotidiche
Versions of package daligner
ReleaseVersionArchitectures
bullseye1.0+git20180524.fd21879-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0+20161119-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0+git20180524.fd21879-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0+git20180524.fd21879-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.0+git20190721.efb48c3
Popcon: 2 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Questi strumenti permettono di trovare tutti gli allineamenti locali significativi tra letture codificate in un database Dazzler. Si assume che le letture provengano da un sequenziatore di letture lunghe Pacific Biosciences RS II, cioè che le letture siano lunghe e con rumore, fino in media al 15%.

Please cite: Gene Myers: Efficient Local Alignment Discovery amongst Noisy Long Reads. 8701:52-67 (2014)
Registry entries: SciCrunch  OMICtools 
Fastx-toolkit
strumenti FASTQ/A per la pre-elaborazione di sequenze corte di nucleotidi
Versions of package fastx-toolkit
ReleaseVersionArchitectures
buster0.0.14-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy0.0.13.2-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
stretch0.0.14-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.0.14-1amd64,armel,armhf,i386
sid0.0.14-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.0.14-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package fastx-toolkit:
roleprogram
Popcon: 9 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Il FASTX-Toolkit è una raccolta di strumenti a riga di comando per la pre-elaborazione di sequenze corte di nucleotidi nei formati FASTA e FASTQ, solitamente prodotte da macchine per il sequenziamento di prossima generazione. L'elaborazione principale di tali file FASTA/FASTQ è la mappatura (allineamento) delle sequenze con genomi di riferimento o altri database, usando programmi specializzati come BWA, Bowtie e molti altri. Tuttavia è a volte più produttivo pre-elaborare i file FASTA/FASTQ prima di mappare le sequenze ai genomi, manipolandole per produrre risultati di mappatura migliori. Gli strumenti FASTX-Toolkit effettuano alcuni di questi compiti di pre-elaborazione.

Registry entries: Bio.Tools  SciCrunch  OMICtools 
Topics: Sequencing
Last-align
confronto di sequenze biologiche su scala genomica
Versions of package last-align
ReleaseVersionArchitectures
stretch830-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid983-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye983-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster963-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie490-1amd64,armel,armhf,i386
wheezy199-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
squeeze128-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
upstream984
Debtags of package last-align:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
Popcon: 7 users (10 upd.)*
Newer upstream!
License: DFSG free
Git

LAST è un software per confrontare ed allineare sequenze, tipicamente DNA o sequenze proteiche. LAST è simile a BLAST, ma gestisce meglio quantità molto grandi di dati di sequenza. Ci sono due cose che LAST fa molto bene:

  • confrontare grandi genomi (ad esempio di mammiferi);
  • mappare molte etichette di sequenza su un genoma.

La principale innovazione tecnica è che LAST trova le corrispondenze iniziali in base alla loro molteplicità, invece di usare una dimensione fissa (BLAST ad esempio usa 10-meri). Ciò permette di mappare etichette su genomi senza fare la mascheratura delle ripetizioni e senza essere sopraffatti dalle corrispondenze ripetitive. Per trovare queste corrispondenze di dimensione variabile usa un array di suffissi (ispirato a Vmatch). Per ottenere un'alta sensibilità usa un array di suffissi non contigui, analogo a seed non consecutivi.

Please cite: Martin C. Frith, Raymond Wan and Paul Horton: Incorporating sequence quality data into alignment improves DNA read mapping. (PubMed,eprint) Nucl. Acids Res. 38(7):e100 (2010)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Libvcflib-tools
C++ library for parsing and manipulating VCF files (tools)
Versions of package libvcflib-tools
ReleaseVersionArchitectures
bullseye1.0.0~rc2+dfsg-4amd64
buster1.0.0~rc2+dfsg-2amd64
sid1.0.0~rc2+dfsg-4amd64
stretch1.0.0~rc1+dfsg1-3amd64
upstream1.0.0~rc3
Popcon: 4 users (11 upd.)*
Newer upstream!
License: DFSG free
Git

The Variant Call Format (VCF) is a flat-file, tab-delimited textual format intended to concisely describe reference-indexed variations between individuals. VCF provides a common interchange format for the description of variation in individuals and populations of samples, and has become the defacto standard reporting format for a wide array of genomic variant detectors.

vcflib provides methods to manipulate and interpret sequence variation as it can be described by VCF. It is both:

  • an API for parsing and operating on records of genomic variation as it can be described by the VCF format,
  • and a collection of command-line utilities for executing complex manipulations on VCF files.

This package contains several tools using the library.

Registry entries: Bio.Tools  SciCrunch  OMICtools 
Maq
mappatura di corte sequenze di lunghezza fissa di DNA polimorfo su sequenze di riferimento
Versions of package maq
ReleaseVersionArchitectures
stretch0.7.1-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.7.1-5amd64,armel,armhf,i386
wheezy0.7.1-5amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
squeeze0.7.1-3amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
sid0.7.1-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.7.1-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.7.1-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package maq:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 17 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

Maq (abbreviazione di Mappatura e Assemblaggio con Qualità) costruisce assemblaggi per mappatura a partire da corte letture generate dalle apparecchiature di sequenziamento di seconda generazione. È pensato principalmente per l'analizzatore Illumina-Solexa 1G Genetic Analyzer ed ha una preliminare capacità di gestire dati ABI SOLiD. Maq si chiamava prima mapass2.

Lo sviluppo di Maq si è fermato nel 2008. I suoi successori sono BWA e SAMtools.

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Mhap
hash con sensibilità locale per rilevare sovrapposizioni di letture lunghe
Versions of package mhap
ReleaseVersionArchitectures
buster2.1.3+dfsg-2all
bullseye2.1.3+dfsg-2all
stretch2.1.1+dfsg-1all
sid2.1.3+dfsg-2all
Popcon: 1 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

MinHash Alignment Process (MHAP, pronunciato MAP) è un'implementazione di riferimento di un algoritmo probabilistico per la sovrapposizione di sequenze. È progettato per rilevare in maniera efficiente tutte le sovrapposizioni tra letture lunghe in dati di sequenze con rumore. Stima in maniera efficiente la similarità di Jaccard comprimendo le sequenze nelle loro impronte digitali rappresentative composte su min-meri (minimi k-meri).

Please cite: Konstantin Berlin, Sergey Koren, Chen-Shan Chin, James P Drake, Jane M Landolin and Adam M Phillippy: Assembling large genomes with single-molecule sequencing and locality-sensitive hashing. (PubMed) Nature Biotechnology 33(6):623–630 (2015)
Registry entries: OMICtools 
Picard-tools
strumenti a riga di comando per manipolare file SAM e BAM
Versions of package picard-tools
ReleaseVersionArchitectures
stretch2.8.1+dfsg-1all
bullseye2.18.25+dfsg-2amd64
buster2.18.25+dfsg-2amd64
sid2.18.25+dfsg-2amd64
jessie1.113-1all
wheezy1.46-1all
squeeze1.27-1all
upstream2.20.6
Popcon: 19 users (10 upd.)*
Newer upstream!
License: DFSG free
Git

Il formato SAM (Sequence Alignment/Map, allineamento/mappa di sequenza) è un formato generico per memorizzare grandi allineamenti di sequenze nucleotidiche. In Picard Tools sono incluse le seguenti utilità per manipolare file SAM e BAM:

 AddCommentsToBam                  FifoBuffer
 AddOrReplaceReadGroups            FilterSamReads
 BaitDesigner                      FilterVcf
 BamIndexStats                     FixMateInformation
 BamToBfq                          GatherBamFiles
 BedToIntervalList                 GatherVcfs
 BuildBamIndex                     GenotypeConcordance
 CalculateHsMetrics                IlluminaBasecallsToFastq
 CalculateReadGroupChecksum        IlluminaBasecallsToSam
 CheckIlluminaDirectory            LiftOverIntervalList
 CheckTerminatorBlock              LiftoverVcf
 CleanSam                          MakeSitesOnlyVcf
 CollectAlignmentSummaryMetrics    MarkDuplicates
 CollectBaseDistributionByCycle    MarkDuplicatesWithMateCigar
 CollectGcBiasMetrics              MarkIlluminaAdapters
 CollectHiSeqXPfFailMetrics        MeanQualityByCycle
 CollectIlluminaBasecallingMetrics MergeBamAlignment
 CollectIlluminaLaneMetrics        MergeSamFiles
 CollectInsertSizeMetrics          MergeVcfs
 CollectJumpingLibraryMetrics      NormalizeFasta
 CollectMultipleMetrics            PositionBasedDownsampleSam
 CollectOxoGMetrics                QualityScoreDistribution
 CollectQualityYieldMetrics        RenameSampleInVcf
 CollectRawWgsMetrics              ReorderSam
 CollectRnaSeqMetrics              ReplaceSamHeader
 CollectRrbsMetrics                RevertOriginalBaseQualitiesAndAddMateCigar
 CollectSequencingArtifactMetrics  RevertSam
 CollectTargetedPcrMetrics         SamFormatConverter
 CollectVariantCallingMetrics      SamToFastq
 CollectWgsMetrics                 ScatterIntervalsByNs
 CompareMetrics                    SortSam
 CompareSAMs                       SortVcf
 ConvertSequencingArtifactToOxoG   SplitSamByLibrary
 CreateSequenceDictionary          SplitVcfs
 DownsampleSam                     UpdateVcfSequenceDictionary
 EstimateLibraryComplexity         ValidateSamFile
 ExtractIlluminaBarcodes           VcfFormatConverter
 ExtractSequences                  VcfToIntervalList
 FastqToSam                        ViewSam
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Topics: Sequencing; Document, record and content management
R-bioc-hilbertvis
pacchetto GNU R per visualizzare dati vettoriali lunghi
Versions of package r-bioc-hilbertvis
ReleaseVersionArchitectures
squeeze1.5.0-2amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
wheezy1.14.0-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie1.24.0-1amd64,armel,armhf,i386
stretch1.32.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.40.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.42.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.42.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package r-bioc-hilbertvis:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
useanalysing
Popcon: 9 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Questo strumento permette la visualizzazione di vettori di dati molto lunghi in una maniera efficiente dal punto di vista dello spazio occupato, organizzandoli su una curva di Hilbert in due dimensioni. In seguito l'utente può giudicare visivamente la struttura e la distribuzione generali delle caratteristiche contemporaneamente alla forma e intensità approssimate delle singole caratteristiche.

In bioinformatica un caso d'uso tipico è ChIP-Chip e ChIP-Seq o praticamente tutti i generi di dati genomici, che sono convenzionalmente visualizzati come tracciato quantitativo ("wiggle data") in navigatori per genoma come quelli forniti da Ensembl o UCSC.

Please cite: Simon Anders: Visualization of genomic data with the Hilbert curve. (PubMed,eprint) Bioinformatics 25(10):1231-1235 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Rna-star
allineatore universale e ultraveloce di sequenziamento di RNA
Versions of package rna-star
ReleaseVersionArchitectures
bullseye2.7.1a+dfsg-2amd64,arm64,mips64el,ppc64el
stretch2.5.2b+dfsg-1amd64,arm64,mips64el,ppc64el
buster2.7.0a+dfsg-1amd64,arm64,mips64el,ppc64el
sid2.7.1a+dfsg-2amd64,arm64,mips64el,ppc64el
upstream2.7.2a
Popcon: 8 users (8 upd.)*
Newer upstream!
License: DFSG free
Git

Software STAR (Spliced Transcripts Alignment to a Reference) basato su un algoritmo di allineamento per RNA-seq mai descritto prima, che usa la ricerca di seed mappabili sequenziali massimi in array di suffissi non compressi seguita da raggruppamento in cluster dei seed e procedure di cucitura. STAR supera in prestazioni altri strumenti di allineamento di un fattore maggiore di 50 in velocità di mappatura, facendo l'allineamento con il genoma umano di 550 milioni di letture a terminali accoppiati 2 x 76 pb all'ora su un modesto server con 12 core, al contempo migliorando la sensibilità e la precisione dell'allineamento. In aggiunta a rilevazioni de novo senza bias di giunzioni canoniche, STAR può anche scoprire trascritti chimerici (fusione) e splice non canonici, ed è anche in grado di mappare sequenze di RNA a sequenza intera. Usando il sequenziamento Roche 454 di ampliconi PCR di trascrizione inversa, gli autori hanno validato sperimentalmente 1960 nuove giunzioni di splice intergeniche con un tasso di successo dell'80-90%, confermando l'elevata precisione della strategia di mappatura di STAR.

Please cite: Alexander Dobin, Carrie A. Davis, Felix Schlesinger, Jorg Drenkow, Chris Zaleski, Sonali Jha, Philippe Batut, Mark Chaisson and Thomas R. Gingeras: STAR: ultrafast universal RNA-seq aligner. (PubMed,eprint) Bioinformatics 29(1):15-21 (2012)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Topics: Sequence analysis
Samtools
elaborazioni di allineamenti di sequenze nei formati SAM, BAM e CRAM
Versions of package samtools
ReleaseVersionArchitectures
squeeze0.1.8-1amd64,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390
buster1.9-4amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
wheezy0.1.18-1amd64,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390
stretch1.3.1-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
jessie0.1.19-1amd64,armhf,i386
sid1.9-5amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
bullseye1.9-5amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
Debtags of package samtools:
fieldbiology
interfacecommandline
networkclient
roleprogram
scopeutility
uitoolkitncurses
useanalysing, calculating, filtering
works-withbiological-sequence
Popcon: 63 users (224 upd.)*
Versions and Archs
License: DFSG free
Git

Samtools è un insieme di utilità che manipolano allineamenti di sequenze di nucleotidi nel formato binario BAM. Importa ed esporta nei formati SAM (Sequence Alignment/Map - allineamento/mappa di sequenze) e CRAM ASCII, effettua ordinamenti, unioni e indicizzazioni e permette di rintracciare letture in qualsiasi regione in modo veloce. È stato progettato per funzionare su flussi di dati ed è in grado di aprire un file BAM o CRAM (non SAM) su un server FTP o HTTP remoto.

The package is enhanced by the following packages: libbio-samtools-perl
Please cite: Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan, Nils Homer, Gabor Marth, Goncalo Abecasis, Richard Durbin and 1000 Genome Project Data Processing Subgroup: The Sequence Alignment/Map (SAM) Format and SAMtools. (PubMed,eprint) Bioinformatics 25(16):2078-2079 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Screenshots of package samtools
Sra-toolkit
utilità per Sequence Read Archive di NCBI
Versions of package sra-toolkit
ReleaseVersionArchitectures
buster2.9.3+dfsg-1amd64
wheezy2.1.7a-1amd64,i386,kfreebsd-amd64,kfreebsd-i386
jessie2.3.5-2+dfsg-1amd64,i386
stretch2.8.1-2+dfsg-2amd64,i386
bullseye2.9.3+dfsg-1amd64
sid2.9.3+dfsg-1amd64
upstream2.10.0
Popcon: 11 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

Strumenti per leggere l'archivio SRA, generalmente convertendo singole corse in alcuni formati comunemente usati come fastq.

In questo rilascio sono forniti gli strumenti per dump testuali "sra-dump" e "vbd-dump", per aiutare nell'ispezione a vista. È probabile che l'effettiva formattazione del loro output venga in futuro modificata in una rappresentazione più stringente e formalizzata. NON FARE AFFIDAMENTO SUL FORMATO DI OUTPUT VISTO IN QUESTO RILASCIO.

Le informazioni dell'"Aiuto" verranno migliorate nei prossimi rilasci e le opzioni per gli strumenti verranno standardizzate tra gli insiemi. Ulteriore documentazione verrà anche fornita sul sito web dell'NCBI.

Nel prossimo rilascio le opzioni per gli strumenti potrebbero essere modificate. La versione 1 delle opzioni per gli strumenti continuerà ad essere gestita ovunque sia possibile, per preservare il funzionamento degli script esistenti.

Please cite: Rasko Leinonen, Ruth Akhtar, Ewan Birney, James Bonfield, Lawrence Bower, Matt Corbett, Ying Cheng, Fehmi Demiralp, Nadeem Faruque, Neil Goodgame, Richard Gibson, Gemma Hoad, Christopher Hunter, Mikyung Jang, Steven Leonard, Quan Lin, Rodrigo Lopez, Michael Maguire, Hamish McWilliam, Sheila Plaister, Rajesh Radhakrishnan, Siamak Sobhany, Guy Slater, Petra Ten Hoopen, Franck Valentin, Robert Vaughan, Vadim Zalunin, Daniel Zerbino and Guy Cochrane: Improvements to services at the European Nucleotide Archive. (PubMed,eprint) Nucleic Acids Research 38(Database issue):D39-45 (2010)
Registry entries: Bio.Tools  OMICtools 
Ssake
applicazione genomica per assemblare milioni di cortissime sequenze di DNA
Versions of package ssake
ReleaseVersionArchitectures
squeeze3.5-1all
sid4.0-2all
bullseye4.0-2all
buster4.0-2all
stretch3.8.4-1all
jessie3.8.2-1all
wheezy3.8-2all
Debtags of package ssake:
biologynuceleic-acids
fieldbiology
interfaceshell
roleprogram
scopeutility
useanalysing
Popcon: 5 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

SSAKE (Short Sequence Assembly by K-mer search and 3′ read Extension, assemblaggio di sequenze corte con ricerca di K-meri ed estensione per lettura 3') è un'applicazione genomica per assemblare in modo aggressivo milioni di corte sequenze di nucleotidi cercando progressivamente k-meri all'estremità 3' perfetti usando un albero di prefissi di DNA. SSAKE è progettato per aiutare a sfruttare le informazioni provenienti dalla lettura di corte sequenze riunendole in maniera stringente in frammenti continui che possono essere usati per caratterizzare innovativi target di sequenziamento.

Please cite: Rene L. Warren, Granger G. Sutton, Steven J. M. Jones and Robert A. Holt: Assembling millions of short DNA sequences using SSAKE. (PubMed,eprint) Bioinformatics 23(4):500-501 (2007)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Topics: Sequence assembly
Tabix
indicizzatore generico per file di posizioni del genoma delimitate da TAB
Versions of package tabix
ReleaseVersionArchitectures
buster1.9-11amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
jessie1.1-1amd64,armel,i386
sid1.9-11amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
wheezy0.2.6-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
bullseye1.9-11amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
jessie0.2.6-2armhf
stretch1.3.2-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
Debtags of package tabix:
roleprogram
works-with-formathtml
Popcon: 24 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

Tabix indicizza i file in cui alcune colonne indicano coordinate di sequenze: nome (solitamente un cromosoma), inizio e fine. Il file di dati di input deve essere ordinato in base alla posizione e compresso con bgzip (fornito in questo pacchetto), che ha un'interfaccia simile a gzip. Dopo l'indicizzazione, tabix è in grado di recuperare velocemente righe di dati in base alle coordinate cromosomiche. Il veloce recupero dei dati funziona anche via rete se viene fornito un URI come nome di file.

Questa versione di tabix è compilata a partire dai sorgenti HTSlib.

Please cite: Heng Li: Tabix: fast retrieval of sequence features from generic TAB-delimited files. (PubMed,eprint) Bioinformatics 27(5):718-719 (2011)
Registry entries: OMICtools 
Screenshots of package tabix
Tophat
veloce mappatore di giunzioni di splice per letture RNA-Seq
Versions of package tophat
ReleaseVersionArchitectures
buster2.1.1+dfsg1-2amd64,arm64,mips64el,ppc64el,s390x
jessie2.0.13+dfsg-1amd64
sid2.1.1+dfsg1-2amd64,arm64,mips64el,ppc64el,s390x
bullseye2.1.1+dfsg1-2amd64,arm64,mips64el,ppc64el,s390x
stretch2.1.1+dfsg-2amd64
Popcon: 6 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

TopHat allinea sequenze RNA-Seq in genomi della dimensione di quelli dei mammiferi, usando l'allineatore di letture corte per grandissime quantità di dati Bowtie, e successivamente analizza i risultati della mappatura per identificare giunzioni di splice tra gli esoni. TopHat è uno sforzo collaborativo tra il Center for Bioinformatics and Computational Biology dell'Università del Maryland e i Departments of Mathematics and Molecular and Cell Biology dell'Università della California, Berkeley.

The package is enhanced by the following packages: cufflinks
Please cite: Cole Trapnell, Lior Pachter and Steven L. Salzberg: TopHat: discovering splice junctions with RNA-Seq. (PubMed,eprint) Bioinformatics 25(9):1105-1111 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Vcftools
raccolta di strumenti per lavorare con file VCF
Versions of package vcftools
ReleaseVersionArchitectures
sid0.1.16-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.1.16-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.16-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0.1.14+dfsg-4+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie-security0.1.12+dfsg-1+deb8u1amd64,armel,armhf,i386
jessie0.1.12+dfsg-1amd64,armel,armhf,i386
wheezy0.1.9-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
Debtags of package vcftools:
roleprogram
Popcon: 22 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

VCFtools è un pacchetto di programmi progettato per lavorare con file VCF, come quelli generati dal 1000 Genomes Project. Lo scopo di VCFtools è quello di fornire metodi per lavorare con file VCF: validare, unire, confrontare e calcolare alcune statistiche di base di genetica di popolazione.

Please cite: Petr Danecek, Adam Auton, Goncalo Abecasis, Cornelis A. Albers, Eric Banks, Mark A. DePristo, Robert E. Handsaker, Gerton Lunter, Gabor T. Marth, Stephen T. Sherry, Gilean McVean and Richard Durbin: The variant call format and VCFtools. (PubMed,eprint) Bioinformatics 27(15):2156-8 (2011)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Velvet
assemblatore di sequenze di acidi nucleici da sequenze molto corte
Versions of package velvet
ReleaseVersionArchitectures
jessie1.2.10+dfsg1-1amd64,armel,armhf,i386
buster1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
wheezy1.2.03~nozlibcopy-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
squeeze1.0.02~nozlibcopy-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
Debtags of package velvet:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 7 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet è un assemblatore genomico de novo progettato specificatamente per le tecnologie di sequenziamento basate su sequenze corte, come Solexa o 454, sviluppato da Daniel Zerbino e Ewan Birney all'European Bioinformatics Institute (EMBL-EBI), vicino a Cambridge, in Gran Bretagna.

Velvet attualmente accetta sequenze molto corte, rimuove errori e poi produce frammenti contigui unici di alta qualità. Poi usa informazioni sulle paired-read, se disponibili, per recuperare le aree ripetute tra i vari frammenti contigui.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Wham-align
Wisconsin's High-Throughput Alignment Method
Maintainer: Steffen Moeller
Versions of package wham-align
ReleaseVersionArchitectures
sid0.1.5-1amd64,i386
bullseye0.1.5-1amd64,i386
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides functionality analogous to BWA or bowtie in aligning reads from next-generation DNA sequencing machines against a reference genome.

Please cite: Yinan Li, Allie Terrell and Jignesh M. Patel: WHAM: A High-throughput Sequence Alignment Method (eprint) Proceedings of the ACM SIGMOD International Conference on Management of Data, SIGMOD 2011, Athens, Greece (2011)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 196119