Debian Med Project
Help us to see Debian used by medical practitioners and biomedical researchers! Join us on the Salsa page.
Summary
Next generation sequencing
Debian Med bioinformatics applications usable in Next Generation Sequencing

It aims at gettting packages which specialize in the processing or interpretation of data generated with next- (and later-) generation high-thoughput sequencing technologies.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Med to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Med mailing list

Links to other tasks

Debian Med Next generation sequencing packages

Official Debian packages with high relevance

Bcftools
appel de variantes génomiques et manipulation de fichiers VCF et BCF
Versions of package bcftools
ReleaseVersionArchitectures
stretch1.3.1-1amd64,arm64,armel,mips64el,mipsel,ppc64el
sid1.9-1amd64,arm64,armel,armhf,kfreebsd-amd64,mips64el,mipsel,ppc64el
buster1.9-1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
Popcon: 10 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

BCFtools est un ensemble d'outils qui manipulent des appels de variation dans le format « Variant Call Format » (VCF) et son équivalent binaire BCF. Toutes les commandes fonctionnent de façon transparente avec VCF et BCF, qu'ils soient compressés avec BGZF ou non.

Registry entries: Bio.Tools  SciCrunch  OMICtools 
Bedtools
suite d'utilitaires pour la comparaison des caractéristiques de génomes
Versions of package bedtools
ReleaseVersionArchitectures
sid2.26.0+dfsg-5hurd-i386,kfreebsd-amd64,kfreebsd-i386
stretch2.26.0+dfsg-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
wheezy2.16.1-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie2.21.0-1amd64,armhf,i386
sid2.27.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
buster2.27.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
upstream2.28.0
Debtags of package bedtools:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, filtering
works-withbiological-sequence
Popcon: 46 users (26 upd.)*
Newer upstream!
License: DFSG free
Git

Les utilitaires BEDTools permettent de traiter les tâches génomiques ordinaires telles que trouver les chevauchements de caractéristiques et informatiser les données. Les utilitaires sont en grande partie basés sur quatre formats de fichier très utilisés : BED, GFF/GTF, VCF et SAM/BAM. En utilisant BEDTools, il est possible de développer des enchainements sophistiqués qui répondent à des questions de recherche en utilisant plusieurs outils séquentiellement.

L'outil groupBy est fourni par le paquet filo.

Please cite: Aaron R. Quinlan and Ira M. Hall: BEDTools: a flexible suite of utilities for comparing genomic features. (PubMed,eprint) Bioinformatics 26(6):841-842 (2010)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Blasr
correspondance de lectures de séquençage de molécules simples
Versions of package blasr
ReleaseVersionArchitectures
buster5.3.2+dfsg-1.1amd64,arm64,mips64el,ppc64el
sid0~20151014+git8e668be-1hurd-i386
stretch5.3+0-1amd64,arm64,mips64el,ppc64el
sid5.3.2+dfsg-1.1amd64,arm64,mips64el,ppc64el
upstream5.3.3
Popcon: 4 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

BLASR (« Basic local alignment with successive refinement ») est une méthode pour mettre en correspondance des lectures de séquençage de molécules simples avec un génome de référence. De telles lectures sont longues de plusieurs milliers de bases et les divergences entre elles et le génome sont dominées par les erreurs d'insertion et de suppression.

Registry entries: Bio.Tools  SciCrunch  OMICtools 
Bowtie
aligneur ultra-rapide de lectures courtes avec une faible empreinte mémoire
Versions of package bowtie
ReleaseVersionArchitectures
sid1.2.2+dfsg-4amd64,arm64,mips64el,ppc64el,s390x
buster1.2.2+dfsg-4amd64,arm64,mips64el,ppc64el,s390x
sid1.1.2-6kfreebsd-amd64
stretch1.1.2-6amd64,arm64,mips64el,ppc64el,s390x
jessie1.1.1-2amd64
wheezy0.12.7-3amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,powerpc,s390,s390x,sparc
Debtags of package bowtie:
biologynuceleic-acids
fieldbiology:bioinformatics
interfacecommandline
roleprogram
sciencecalculation
scopeutility
useanalysing, comparing
works-withbiological-sequence
Popcon: 22 users (15 upd.)*
Versions and Archs
License: DFSG free
Git

Ce paquet aborde le problème de l'interprétation des résultats des dernières technologies (2010) de séquençage de l'ADN. Celles-ci produiront des étirements assez courts et qui ne peuvent pas directement être interprétés. C'est le défi d'outils comme Bowtie de donner un emplacement chromosomique aux courts étirements de l'ADN séquencé à chaque exécution.

Bowtie aligne des (lectures de) séquences d'ADN du génome humain à un débit de 25 millions de lectures de paires de bases 35 par heure. Le paquet Bowtie indexe le génome humain avec un indice de Burrows-Wheeler pour garder une faible empreinte mémoire : typiquement environ 2,2 Go pour le génome humain (2,9 Go pour le séquençage à partir des deux extrémités).

The package is enhanced by the following packages: bowtie-examples
Please cite: Ben Langmead, Cole Trapnell, Mihai Pop and Steven L Salzberg: Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. (eprint) Genome Biology 10:R25 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Topics: Genomics
Bwa
dispositif d'alignement Burrows-Wheeler
Versions of package bwa
ReleaseVersionArchitectures
stretch0.7.15-2amd64
squeeze0.5.8c-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
wheezy0.6.2-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie0.7.10-1amd64
stretch-proposed-updates0.7.15-2+deb9u1amd64
buster0.7.17-3amd64
sid0.7.17-3amd64,kfreebsd-amd64
Debtags of package bwa:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
useanalysing, comparing
Popcon: 24 users (49 upd.)*
Versions and Archs
License: DFSG free
Git

BWA est un paquet logiciel pour mettre en correspondance des séquences à faible divergence avec un grand génome de référence tel que le génome humain. Il est constitué de trois algorithmes : BWA-backtrack, BWA-SW et BWA-MEM. Le premier algorithme est conçu pour les lectures de séquences Illumina jusqu'à 100 paires de bases, alors que les deux autres sont conçus pour des lectures de séquences allant de 70 à 1 000 paires de bases. BWA-MEM et BWA-SW partagent des fonctionnalités communes telles que la prise en charge des lectures longues et des alignements de découpages (« split alignment »), mais BWA-MEM, plus récent, est généralement recommandé pour les requêtes de haute qualité, car il est plus rapide et plus précis. BWA-MEM a également de meilleures performances que BWA-backtrack pour les lectures Illumina de 70 à 100 paires de bases.

Please cite: Heng Li and Richard Durbin: Fast and accurate short read alignment with Burrows-Wheeler transform. (PubMed,eprint) Bioinformatics 25(14):1754-1760 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Daligner
alignements locaux parmi des lectures longues de séquençages de nucléotide
Versions of package daligner
ReleaseVersionArchitectures
stretch1.0+20161119-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0+git20180524.fd21879-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0+git20180524.fd21879-1amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Ces outils permettent de trouver tous les alignements locaux significatifs parmi des lectures encodées dans une base de données Dazzler. L’hypothèse est que les lectures sont originaires d’un séquenceur à lectures longues RS II de Pacific Biosciences. C'est-à-dire que les lectures sont longues et bruitées, jusqu’à 15 % en moyenne.

Please cite: Gene Myers: Efficient Local Alignment Discovery amongst Noisy Long Reads. 8701:52-67 (2014)
Registry entries: SciCrunch  OMICtools 
Fastx-toolkit
outils de prétraitement des lectures de nucléotides courts aux formats FASTQ/A
Versions of package fastx-toolkit
ReleaseVersionArchitectures
wheezy0.0.13.2-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
buster0.0.14-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.0.14-6amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0.0.14-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.0.14-1amd64,armel,armhf,i386
Debtags of package fastx-toolkit:
roleprogram
Popcon: 10 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Le kit FASTX est une collection d'outils en ligne de commande pour le prétraitement des lectures de nucléotides courts dans les formats FASTA et FASTQ, habituellement produits par les machines de séquençage. Le principal traitement de ces fichiers FASTA/FASTQ est la cartographie (alignement) des séquences sur des génomes de référence ou autres bases de données à l'aide de programmes spécialisés tels que BWA, Bowtie et de nombreux autres. Cependant, il est parfois plus productif de prétraiter les fichiers FASTA/FASTQ avant d'aligner les séquences avec les génomes de référence ou de manipuler les séquences afin de produire de meilleurs résultats. Le kit FASTX réalise quelques-unes de ces tâches de prétraitement.

Registry entries: Bio.Tools  SciCrunch  OMICtools 
Topics: Sequencing
Last-align
comparaison de séquences biologiques à l'échelle du génome
Versions of package last-align
ReleaseVersionArchitectures
jessie490-1amd64,armel,armhf,i386
stretch830-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster963-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid963-2amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy199-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
squeeze128-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
upstream979
Debtags of package last-align:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
Popcon: 5 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

LAST est un logiciel permettant de comparer et aligner des séquences, typiquement des séquences d'ADN ou de protéines. LAST est similaire à BLAST, mais il s'en sort mieux avec les grandes quantités de données de séquences. Voici deux choses pour lesquelles LAST est bon :

  • la comparaison de grands génomes (ceux de mammifères par exemple) ;
  • la mise en correspondance de nombreuses étiquettes de séquences avec un génome.

La principale innovation technique vient du fait que LAST trouve les correspondances initiales en se basant sur leur multiplicité au lieu d'utiliser une taille fixe (par exemple, BLAST utilise des 10-mers). Cela permet de faire correspondre des étiquettes aux génomes sans masques répétitifs, sans être débordé par les correspondances répétitives. Pour trouver ces correspondances de tailles variables, il utilise un tableau de suffixes inspiré de Vmatch. Afin d'avoir une grande sensibilité, LAST utilise a tableau de suffixes non contigu, similaires aux seeds espacées.

Please cite: Martin C. Frith, Raymond Wan and Paul Horton: Incorporating sequence quality data into alignment improves DNA read mapping. (PubMed,eprint) Nucl. Acids Res. 38(7):e100 (2010)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Libvcflib-tools
C++ library for parsing and manipulating VCF files (tools)
Versions of package libvcflib-tools
ReleaseVersionArchitectures
buster1.0.0~rc2+dfsg-2amd64
stretch1.0.0~rc1+dfsg1-3amd64
sid1.0.0~rc2+dfsg-2amd64,kfreebsd-amd64
Popcon: 2 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The Variant Call Format (VCF) is a flat-file, tab-delimited textual format intended to concisely describe reference-indexed variations between individuals. VCF provides a common interchange format for the description of variation in individuals and populations of samples, and has become the defacto standard reporting format for a wide array of genomic variant detectors.

vcflib provides methods to manipulate and interpret sequence variation as it can be described by VCF. It is both:

  • an API for parsing and operating on records of genomic variation as it can be described by the VCF format,
  • and a collection of command-line utilities for executing complex manipulations on VCF files.

This package contains several tools using the library.

Registry entries: Bio.Tools  SciCrunch  OMICtools 
Maq
correspondance de lectures de séquences d'ADN polymorphique de longueur courte à des séquences de référence
Versions of package maq
ReleaseVersionArchitectures
jessie0.7.1-5amd64,armel,armhf,i386
sid0.7.1-8amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.7.1-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
squeeze0.7.1-3amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
stretch0.7.1-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy0.7.1-5amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
Debtags of package maq:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 12 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Maq (« Mapping and Assembly with Quality » − correspondance et assemblage de qualité) construit des associations de correspondance de lectures courtes générées par des machines de séquençage de nouvelles générations. Le logiciel a été particulièrement conçu pour l'analyseur de génome Solexa à 1 milliard de bases par exécution, par l'entreprise Illumina, et dispose d'une fonctionnalité préliminaire pour manipuler des données ABI SOLiD. Le logiciel Maq est déjà connu sous le nom de mapass2.

Le développement du logiciel Maq s'est arrêté en 2008. Ses successeurs sont BWA (« Burrows-Wheeler Aligner ») et SAMtools (« Sequence Alignment/Map tools »).

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Mhap
locality-sensitive hashing to detect long-read overlaps
Versions of package mhap
ReleaseVersionArchitectures
buster2.1.3+dfsg-2all
sid2.1.3+dfsg-2all
stretch2.1.1+dfsg-1all
Popcon: 3 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

The MinHash Alignment Process (MHAP--pronounced MAP) is a reference implementation of a probabilistic sequence overlapping algorithm. Designed to efficiently detect all overlaps between noisy long-read sequence data. It efficiently estimates Jaccard similarity by compressing sequences to their representative fingerprints composed on min-mers (minimum k-mer).

Please cite: Konstantin Berlin, Sergey Koren, Chen-Shan Chin, James P Drake, Jane M Landolin and Adam M Phillippy: Assembling large genomes with single-molecule sequencing and locality-sensitive hashing. (PubMed) Nature Biotechnology 33(6):623–630 (2015)
Registry entries: OMICtools 
Picard-tools
outils en ligne de commande pour manipuler les fichiers SAM et BAM
Versions of package picard-tools
ReleaseVersionArchitectures
sid2.18.25+dfsg-2amd64
squeeze1.27-1all
wheezy1.46-1all
jessie1.113-1all
stretch2.8.1+dfsg-1all
buster2.18.25+dfsg-2amd64
upstream2.19.0
Popcon: 13 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Le format «⋅Sequence Alignment/Map⋅» (SAM) est un format générique pour le stockage d'alignements de grandes séquences de nucléotides. Le logiciel Picard Tools inclut ces utilitaires pour manipuler les fichiers SAM et BAM (Binary Alignment/Map)⋅:

 AddCommentsToBam                  FifoBuffer
 AddOrReplaceReadGroups            FilterSamReads
 BaitDesigner                      FilterVcf
 BamIndexStats                     FixMateInformation
 BamToBfq                          GatherBamFiles
 BedToIntervalList                 GatherVcfs
 BuildBamIndex                     GenotypeConcordance
 CalculateHsMetrics                IlluminaBasecallsToFastq
 CalculateReadGroupChecksum        IlluminaBasecallsToSam
 CheckIlluminaDirectory            LiftOverIntervalList
 CheckTerminatorBlock              LiftoverVcf
 CleanSam                          MakeSitesOnlyVcf
 CollectAlignmentSummaryMetrics    MarkDuplicates
 CollectBaseDistributionByCycle    MarkDuplicatesWithMateCigar
 CollectGcBiasMetrics              MarkIlluminaAdapters
 CollectHiSeqXPfFailMetrics        MeanQualityByCycle
 CollectIlluminaBasecallingMetrics MergeBamAlignment
 CollectIlluminaLaneMetrics        MergeSamFiles
 CollectInsertSizeMetrics          MergeVcfs
 CollectJumpingLibraryMetrics      NormalizeFasta
 CollectMultipleMetrics            PositionBasedDownsampleSam
 CollectOxoGMetrics                QualityScoreDistribution
 CollectQualityYieldMetrics        RenameSampleInVcf
 CollectRawWgsMetrics              ReorderSam
 CollectRnaSeqMetrics              ReplaceSamHeader
 CollectRrbsMetrics                RevertOriginalBaseQualitiesAndAddMateCigar
 CollectSequencingArtifactMetrics  RevertSam
 CollectTargetedPcrMetrics         SamFormatConverter
 CollectVariantCallingMetrics      SamToFastq
 CollectWgsMetrics                 ScatterIntervalsByNs
 CompareMetrics                    SortSam
 CompareSAMs                       SortVcf
 ConvertSequencingArtifactToOxoG   SplitSamByLibrary
 CreateSequenceDictionary          SplitVcfs
 DownsampleSam                     UpdateVcfSequenceDictionary
 EstimateLibraryComplexity         ValidateSamFile
 ExtractIlluminaBarcodes           VcfFormatConverter
 ExtractSequences                  VcfToIntervalList
 FastqToSam                        ViewSam
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Topics: Sequencing; Document, record and content management
R-bioc-hilbertvis
GNU R package to visualise long vector data
Versions of package r-bioc-hilbertvis
ReleaseVersionArchitectures
sid1.40.0-1amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,mips,mips64el,mipsel,ppc64el,s390x
stretch1.32.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
squeeze1.5.0-2amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
jessie1.24.0-1amd64,armel,armhf,i386
wheezy1.14.0-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
sid1.38.0-2kfreebsd-i386
buster1.40.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package r-bioc-hilbertvis:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
useanalysing
Popcon: 15 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

This tool allows one to display very long data vectors in a space-efficient manner, by organising it along a 2D Hilbert curve. The user can then visually judge the large scale structure and distribution of features simultaenously with the rough shape and intensity of individual features.

In bioinformatics, a typical use case is ChIP-Chip and ChIP-Seq, or basically all the kinds of genomic data, that are conventionally displayed as quantitative track ("wiggle data") in genome browsers such as those provided by Ensembl or UCSC.

Please cite: Simon Anders: Visualization of genomic data with the Hilbert curve. (PubMed,eprint) Bioinformatics 25(10):1231-1235 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Rna-star
ultrafast universal RNA-seq aligner
Versions of package rna-star
ReleaseVersionArchitectures
sid2.7.0a+dfsg-1amd64,arm64,mips64el,ppc64el
stretch2.5.2b+dfsg-1amd64,arm64,mips64el,ppc64el
buster2.7.0a+dfsg-1amd64,arm64,mips64el,ppc64el
upstream2.7.0f
Popcon: 8 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

Spliced Transcripts Alignment to a Reference (STAR) software based on a previously undescribed RNA-seq alignment algorithm that uses sequential maximum mappable seed search in uncompressed suffix arrays followed by seed clustering and stitching procedure. STAR outperforms other aligners by a factor of >50 in mapping speed, aligning to the human genome 550 million 2 × 76 bp paired-end reads per hour on a modest 12-core server, while at the same time improving alignment sensitivity and precision. In addition to unbiased de novo detection of canonical junctions, STAR can discover non-canonical splices and chimeric (fusion) transcripts, and is also capable of mapping full-length RNA sequences. Using Roche 454 sequencing of reverse transcription polymerase chain reaction amplicons, the authors experimentally validated 1960 novel intergenic splice junctions with an 80-90% success rate, corroborating the high precision of the STAR mapping strategy.

Please cite: Alexander Dobin, Carrie A. Davis, Felix Schlesinger, Jorg Drenkow, Chris Zaleski, Sonali Jha, Philippe Batut, Mark Chaisson and Thomas R. Gingeras: STAR: ultrafast universal RNA-seq aligner. (PubMed,eprint) Bioinformatics 29(1):15-21 (2012)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Topics: Sequence analysis
Samtools
traitement d'alignements de séquence pour les formats SAM et BAM et CRAM
Versions of package samtools
ReleaseVersionArchitectures
sid1.9-4amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.9-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy0.1.18-1amd64,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390
squeeze0.1.8-1amd64,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390
jessie0.1.19-1amd64,armhf,i386
stretch1.3.1-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
Debtags of package samtools:
fieldbiology
interfacecommandline
networkclient
roleprogram
scopeutility
uitoolkitncurses
useanalysing, calculating, filtering
works-withbiological-sequence
Popcon: 65 users (42 upd.)*
Versions and Archs
License: DFSG free
Git

Samtools est un ensemble d'utilitaires qui manipulent les alignements de séquence de nucléotides dans le format binaire BAM. Il est capable d'importer et d'exporter à partir des formats ASCII SAM (Sequence Alignment/Map) et CRAM, de trier, de fusionner, d'indexer et de récupérer des enregistrements dans n'importe quelle région facilement. Il est conçu pour travailler sur un flux de données et est capable d'ouvrir un fichier BAM ou CRAM (mais pas SAM) sur un serveur HTTP ou FTP distant.

The package is enhanced by the following packages: libbio-samtools-perl
Please cite: Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan, Nils Homer, Gabor Marth, Goncalo Abecasis, Richard Durbin and 1000 Genome Project Data Processing Subgroup: The Sequence Alignment/Map (SAM) Format and SAMtools. (PubMed,eprint) Bioinformatics 25(16):2078-2079 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Screenshots of package samtools
Sra-toolkit
utilities for the NCBI Sequence Read Archive
Versions of package sra-toolkit
ReleaseVersionArchitectures
stretch2.8.1-2+dfsg-2amd64,i386
buster2.9.3+dfsg-1amd64
wheezy2.1.7a-1amd64,i386,kfreebsd-amd64,kfreebsd-i386
jessie2.3.5-2+dfsg-1amd64,i386
sid2.9.3+dfsg-1amd64
upstream2.9.6
Popcon: 10 users (8 upd.)*
Newer upstream!
License: DFSG free
Git

Tools for reading the SRA archive, generally by converting individual runs into some commonly used format such as fastq.

The textual dumpers "sra-dump" and "vdb-dump" are provided in this release as an aid in visual inspection. It is likely that their actual output formatting will be changed in the near future to a stricter, more formalized representation[s]. PLEASE DO NOT RELY UPON THE OUTPUT FORMAT SEEN IN THIS RELEASE.

The "help" information will be improved in near future releases, and the tool options will become standardized across the set. More documentation will also be provided documentation on the NCBI web site.

Tool options may change in the next release. Version 1 tool options will remain supported wherever possible in order to preserve operation of any existing scripts.

Please cite: Rasko Leinonen, Ruth Akhtar, Ewan Birney, James Bonfield, Lawrence Bower, Matt Corbett, Ying Cheng, Fehmi Demiralp, Nadeem Faruque, Neil Goodgame, Richard Gibson, Gemma Hoad, Christopher Hunter, Mikyung Jang, Steven Leonard, Quan Lin, Rodrigo Lopez, Michael Maguire, Hamish McWilliam, Sheila Plaister, Rajesh Radhakrishnan, Siamak Sobhany, Guy Slater, Petra Ten Hoopen, Franck Valentin, Robert Vaughan, Vadim Zalunin, Daniel Zerbino and Guy Cochrane: Improvements to services at the European Nucleotide Archive. (PubMed,eprint) Nucleic Acids Research 38(Database issue):D39-45 (2010)
Registry entries: Bio.Tools  OMICtools 
Ssake
application de génomique pour assembler des millions de séquences très courtes d’ADN
Versions of package ssake
ReleaseVersionArchitectures
buster4.0-2all
jessie3.8.2-1all
wheezy3.8-2all
squeeze3.5-1all
sid4.0-2all
stretch3.8.4-1all
Debtags of package ssake:
biologynuceleic-acids
fieldbiology
interfaceshell
roleprogram
scopeutility
useanalysing
Popcon: 4 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Short Sequence Assembly par recherche de K-mer et l’extension de troisième lecture (SSAKE) est une application de génomique pour assembler énergiquement des millions de séquences courtes de nucléotides en recherchant progressivement les « 3′-most k-mers » en utilisant un arbre de préfixes d’ADN. SSAKE est conçu pour aider à exploiter les informations de lectures de courtes séquences en les regroupant rigoureusement dans des contigs pouvant être utilisés pour caractériser les cibles de séquençage nouvelles.

Please cite: Rene L. Warren, Granger G. Sutton, Steven J. M. Jones and Robert A. Holt: Assembling millions of short DNA sequences using SSAKE. (PubMed,eprint) Bioinformatics 23(4):500-501 (2007)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Topics: Sequence assembly
Tabix
indexeur générique pour fichiers de positions de génome, délimités par des tabulations
Versions of package tabix
ReleaseVersionArchitectures
buster1.9-10amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy0.2.6-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie0.2.6-2armhf
stretch1.3.2-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
jessie1.1-1amd64,armel,i386
sid1.9-10amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package tabix:
roleprogram
works-with-formathtml
Popcon: 20 users (15 upd.)*
Versions and Archs
License: DFSG free
Git

Tabix indexe des fichiers où certaines colonnes indiquent les coordonnées de séquence : nom (habituellement un chromosome), départ et fin. Le fichier de données d'entrée doit être trié en fonction du positionnement et compressé par bgzip (fourni dans ce paquet), qui a une interface similaire à celle de gzip. Après indexation, tabix est en mesure de récupérer rapidement les lignes de données par coordonnées chromosomiques. La récupération rapide des données fonctionne aussi sur le réseau si une URI est donnée comme nom de fichier.

Cette version de Tabix a été compilée à partir du code source de HTSlib.

Please cite: Heng Li: Tabix: fast retrieval of sequence features from generic TAB-delimited files. (PubMed,eprint) Bioinformatics 27(5):718-719 (2011)
Registry entries: OMICtools 
Screenshots of package tabix
Tophat
fast splice junction mapper for RNA-Seq reads
Versions of package tophat
ReleaseVersionArchitectures
sid2.1.1+dfsg1-2amd64,arm64,kfreebsd-amd64,mips64el,ppc64el,s390x
jessie2.0.13+dfsg-1amd64
stretch2.1.1+dfsg-2amd64
buster2.1.1+dfsg1-2amd64,arm64,mips64el,ppc64el,s390x
Popcon: 7 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

TopHat aligns RNA-Seq reads to mammalian-sized genomes using the ultra high-throughput short read aligner Bowtie, and then analyzes the mapping results to identify splice junctions between exons. TopHat is a collaborative effort between the University of Maryland Center for Bioinformatics and Computational Biology and the University of California, Berkeley Departments of Mathematics and Molecular and Cell Biology.

The package is enhanced by the following packages: cufflinks
Please cite: Cole Trapnell, Lior Pachter and Steven L. Salzberg: TopHat: discovering splice junctions with RNA-Seq. (PubMed,eprint) Bioinformatics 25(9):1105-1111 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Vcftools
ensemble d'outils pour travailler avec les fichiers VCF
Versions of package vcftools
ReleaseVersionArchitectures
jessie0.1.12+dfsg-1amd64,armel,armhf,i386
sid0.1.16-1amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy0.1.9-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
buster0.1.16-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch-proposed-updates0.1.14+dfsg-4+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0.1.14+dfsg-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package vcftools:
roleprogram
Popcon: 17 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

VCFtools est un paquet conçu pour travailler avec les fichiers au format VCF, tels que ceux générés par le projet « 1000 Genomes ». L'objectif de VCFtools est de fournir des méthodes pour travailler avec les fichiers au format VCF : valider, fusionner, comparer et calculer certaines statistiques génétiques de la population représentative.

Please cite: Petr Danecek, Adam Auton, Goncalo Abecasis, Cornelis A. Albers, Eric Banks, Mark A. DePristo, Robert E. Handsaker, Gerton Lunter, Gabor T. Marth, Stephen T. Sherry, Gilean McVean and Richard Durbin: The variant call format and VCFtools. (PubMed,eprint) Bioinformatics 27(15):2156-8 (2011)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Velvet
assembleur de séquences d'acides nucléiques pour de très courtes lectures
Versions of package velvet
ReleaseVersionArchitectures
sid1.2.10+dfsg1-5amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
squeeze1.0.02~nozlibcopy-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.2.10+dfsg1-1amd64,armel,armhf,i386
wheezy1.2.03~nozlibcopy-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
buster1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package velvet:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 7 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet est un assembleur génomique de type de novo (assemblage de lectures courtes pour créer des séquences de pleine longueur) spécialement conçu pour les technologies de séquençage à lecture courte, telles que Solexa de l'entreprise Illumina ou 454 de l'entreprise Roche, développées par Daniel Zerbino et Ewan Birney au centre de recherche European Bioinformatics Institute (EBI) qui fait partie du European Molecular Biology Laboratory (EMBL), proche de Cambridge, au Royaume-Uni .

Le logiciel Velvet prend actuellement des séquences de lectures courtes, enlève les erreurs puis produit des contigs uniques de haute qualité. Il utilise alors les informations de lecture des paires, si elles sont disponibles, pour extraire les zones répétées entre les contigs.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 200178