Summary
Next generation sequencing
Debian Med bioinformatics applications usable in Next Generation Sequencing
It aims at gettting packages which specialize in the processing or interpretation of
data generated with next- (and later-) generation high-thoughput sequencing technologies.
Description
For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:
If you discover a project which looks like a good candidate for Debian Med
to you, or if you have prepared an unofficial Debian package, please do not hesitate to
send a description of that project to the Debian Med mailing list
Links to other tasks
|
Debian Med Next generation sequencing packages
Official Debian packages with high relevance
Bcftools
appel de variantes génomiques et manipulation de fichiers VCF et BCF
|
Versions of package bcftools |
Release | Version | Architectures |
buster | 1.9-1 | amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el |
sid | 1.9-1 | amd64,arm64,armel,armhf,kfreebsd-amd64,mips64el,mipsel,ppc64el |
stretch | 1.3.1-1 | amd64,arm64,armel,mips64el,mipsel,ppc64el |
|
License: DFSG free
|
BCFtools est un ensemble d'outils qui manipulent des appels de variation
dans le format « Variant Call Format » (VCF) et son équivalent binaire BCF.
Toutes les commandes fonctionnent de façon transparente avec VCF et BCF,
qu'ils soient compressés avec BGZF ou non.
|
|
Bedtools
suite d'utilitaires pour la comparaison des caractéristiques de génomes
|
Versions of package bedtools |
Release | Version | Architectures |
buster | 2.26.0+dfsg-5 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
sid | 2.27.1+dfsg-4 | amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el |
sid | 2.26.0+dfsg-5 | hurd-i386,kfreebsd-amd64,kfreebsd-i386,mips,s390x |
stretch | 2.26.0+dfsg-3 | amd64,arm64,armel,i386,mips64el,mipsel,ppc64el |
jessie | 2.21.0-1 | amd64,arm64,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x |
wheezy | 2.16.1-1 | amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc |
Debtags of package bedtools: |
field | biology, biology:bioinformatics |
interface | commandline |
role | program |
scope | suite |
use | analysing, comparing, converting, filtering |
works-with | biological-sequence |
|
License: DFSG free
|
Les utilitaires BEDTools permettent de traiter les tâches génomiques ordinaires
telles que trouver les chevauchements de caractéristiques et informatiser les
données. Les utilitaires sont en grande partie basés sur quatre formats de
fichier très utilisés : BED, GFF/GTF, VCF et SAM/BAM. En utilisant BEDTools, il
est possible de développer des enchainements sophistiqués qui répondent à des
questions de recherche en utilisant plusieurs outils séquentiellement.
L'outil groupBy est fourni par le paquet filo.
|
|
Blasr
correspondance de lectures de séquençage de molécules simples
|
Versions of package blasr |
Release | Version | Architectures |
stretch | 5.3+0-1 | amd64,arm64,mips64el,ppc64el |
sid | 0~20151014+git8e668be-1 | hurd-i386 |
buster | 5.3.2+dfsg-1.1 | amd64,arm64,mips64el,ppc64el |
sid | 5.3.2+dfsg-1.1 | amd64,arm64,mips64el,ppc64el |
|
License: DFSG free
|
BLASR (« Basic local alignment with successive refinement ») est une
méthode pour mettre en correspondance des lectures de séquençage de
molécules simples avec un génome de référence. De telles lectures sont
longues de plusieurs milliers de bases et les divergences entre elles et le
génome sont dominées par les erreurs d'insertion et de suppression.
|
|
Bowtie
aligneur ultra-rapide de lectures courtes avec une faible empreinte mémoire
|
Versions of package bowtie |
Release | Version | Architectures |
stretch | 1.1.2-6 | amd64,arm64,mips64el,ppc64el,s390x |
wheezy | 0.12.7-3 | amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,powerpc,s390,s390x,sparc |
sid | 1.2.2+dfsg-4 | amd64,arm64,mips64el,ppc64el,s390x |
buster | 1.2.2+dfsg-4 | amd64,arm64,mips64el,ppc64el,s390x |
sid | 1.1.2-6 | kfreebsd-amd64 |
jessie | 1.1.1-2 | amd64 |
Debtags of package bowtie: |
biology | nuceleic-acids |
field | biology:bioinformatics |
interface | commandline |
role | program |
science | calculation |
scope | utility |
use | analysing, comparing |
works-with | biological-sequence |
|
License: DFSG free
|
Ce paquet aborde le problème de l'interprétation des résultats des
dernières technologies (2010) de séquençage de l'ADN.
Celles-ci produiront des étirements assez courts et qui ne peuvent pas
directement être interprétés. C'est le défi d'outils comme Bowtie de donner
un emplacement chromosomique aux courts étirements de l'ADN séquencé à
chaque exécution.
Bowtie aligne des (lectures de) séquences d'ADN du génome humain à un débit
de 25 millions de lectures de paires de bases 35 par heure. Le paquet
Bowtie indexe le génome humain avec un indice de Burrows-Wheeler pour
garder une faible empreinte mémoire : typiquement environ 2,2 Go
pour le génome humain (2,9 Go pour le séquençage à partir des deux
extrémités).
|
|
Bwa
dispositif d'alignement Burrows-Wheeler
|
Versions of package bwa |
Release | Version | Architectures |
buster | 0.7.17-2 | amd64 |
squeeze | 0.5.8c-1 | amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc |
wheezy | 0.6.2-1 | amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc |
jessie | 0.7.10-1 | amd64 |
stretch | 0.7.15-2 | amd64 |
sid | 0.7.17-2 | amd64,kfreebsd-amd64 |
Debtags of package bwa: |
biology | nuceleic-acids, peptidic |
field | biology, biology:bioinformatics |
interface | commandline, text-mode |
role | program |
use | analysing, comparing |
|
License: DFSG free
|
BWA est un paquet logiciel pour mettre en correspondance des séquences à
faible divergence avec un grand génome de référence tel que le génome
humain. Il est constitué de trois algorithmes : BWA-backtrack, BWA-SW et
BWA-MEM. Le premier algorithme est conçu pour les lectures de séquences
Illumina jusqu'à 100 paires de bases, alors que les deux autres sont conçus
pour des lectures de séquences allant de 70 à 1 000 paires de bases.
BWA-MEM et BWA-SW partagent des fonctionnalités communes telles que la
prise en charge des lectures longues et des alignements de découpages
(« split alignment »), mais BWA-MEM, plus récent, est généralement
recommandé pour les requêtes de haute qualité, car il est plus rapide et
plus précis. BWA-MEM a également de meilleures performances que
BWA-backtrack pour les lectures Illumina de 70 à 100 paires de bases.
|
|
Daligner
alignements locaux parmi des lectures longues de séquençages de nucléotide
|
Versions of package daligner |
Release | Version | Architectures |
buster | 1.0+git20180524.fd21879-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
sid | 1.0+git20180524.fd21879-1 | amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x |
stretch | 1.0+20161119-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
|
License: DFSG free
|
Ces outils permettent de trouver tous les alignements locaux significatifs
parmi des lectures encodées dans une base de données Dazzler. L’hypothèse
est que les lectures sont originaires d’un séquenceur à lectures longues
RS II de Pacific Biosciences. C'est-à-dire que les lectures sont longues et
bruitées, jusqu’à 15 % en moyenne.
|
|
Fastx-toolkit
outils de prétraitement des lectures de nucléotides courts aux formats FASTQ/A
|
Versions of package fastx-toolkit |
Release | Version | Architectures |
stretch | 0.0.14-3 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
sid | 0.0.14-6 | amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x |
buster | 0.0.14-6 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
wheezy | 0.0.13.2-1 | amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc |
jessie | 0.0.14-1 | amd64,arm64,armel,armhf,i386,mips,mipsel,ppc64el,s390x |
Debtags of package fastx-toolkit: |
role | program |
|
License: DFSG free
|
Le kit FASTX est une collection d'outils en ligne de commande pour le
prétraitement des lectures de nucléotides courts dans les formats FASTA et
FASTQ, habituellement produits par les machines de séquençage. Le principal
traitement de ces fichiers FASTA/FASTQ
est la cartographie (alignement) des séquences sur des génomes de référence
ou autres bases de données à l'aide de programmes spécialisés tels que BWA,
Bowtie et de nombreux autres.
Cependant, il est parfois plus productif de prétraiter les fichiers
FASTA/FASTQ avant d'aligner les séquences avec les
génomes de référence ou de manipuler les séquences afin de produire de
meilleurs résultats.
Le kit FASTX réalise quelques-unes de ces tâches de prétraitement.
|
|
Last-align
comparaison de séquences biologiques à l'échelle du génome
|
Versions of package last-align |
Release | Version | Architectures |
squeeze | 128-1 | amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc |
sid | 963-2 | amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x |
jessie | 490-1 | amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x |
wheezy | 199-1 | amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc |
stretch | 830-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
buster | 963-2 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
Debtags of package last-align: |
biology | nuceleic-acids |
field | biology, biology:bioinformatics |
role | program |
|
License: DFSG free
|
LAST est un logiciel permettant de comparer et aligner des séquences,
typiquement des séquences d'ADN ou de protéines. LAST est similaire à
BLAST, mais il s'en sort mieux avec les grandes quantités de données de
séquences. Voici deux choses pour lesquelles LAST est bon :
- la comparaison de grands génomes (ceux de mammifères par exemple) ;
- la mise en correspondance de nombreuses étiquettes de séquences avec un
génome.
La principale innovation technique vient du fait que LAST trouve les
correspondances initiales en se basant sur leur multiplicité au lieu
d'utiliser une taille fixe (par exemple, BLAST utilise des 10-mers). Cela
permet de faire correspondre des étiquettes aux génomes sans masques
répétitifs, sans être débordé par les correspondances répétitives. Pour
trouver ces correspondances de tailles variables, il utilise un tableau de
suffixes inspiré de Vmatch. Afin d'avoir une grande sensibilité, LAST
utilise a tableau de suffixes non contigu, similaires aux seeds espacées.
|
|
Libvcflib-tools
C++ library for parsing and manipulating VCF files (tools)
|
Versions of package libvcflib-tools |
Release | Version | Architectures |
sid | 1.0.0~rc2+dfsg-2 | amd64,kfreebsd-amd64 |
stretch | 1.0.0~rc1+dfsg1-3 | amd64 |
buster | 1.0.0~rc2+dfsg-2 | amd64 |
|
License: DFSG free
|
The Variant Call Format (VCF) is a flat-file, tab-delimited textual format
intended to concisely describe reference-indexed variations between
individuals. VCF provides a common interchange format for the description of
variation in individuals and populations of samples, and has become the defacto
standard reporting format for a wide array of genomic variant detectors.
vcflib provides methods to manipulate and interpret sequence variation as it
can be described by VCF. It is both:
- an API for parsing and operating on records of genomic variation as it can
be described by the VCF format,
- and a collection of command-line utilities for executing complex
manipulations on VCF files.
This package contains several tools using the library.
|
|
Maq
correspondance de lectures de séquences d'ADN polymorphique de longueur courte à des séquences de référence
|
Versions of package maq |
Release | Version | Architectures |
jessie | 0.7.1-5 | amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x |
sid | 0.7.1-8 | amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x |
wheezy | 0.7.1-5 | amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc |
squeeze | 0.7.1-3 | amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc |
buster | 0.7.1-8 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
stretch | 0.7.1-7 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
Debtags of package maq: |
biology | nuceleic-acids |
field | biology, biology:bioinformatics |
interface | commandline |
role | program |
scope | utility |
use | analysing, comparing, searching |
works-with-format | plaintext |
|
License: DFSG free
|
Maq (« Mapping and Assembly with Quality » − correspondance et assemblage
de qualité) construit des associations de
correspondance de lectures courtes générées par des machines de séquençage
de nouvelles générations. Le logiciel a été particulièrement conçu pour
l'analyseur de génome Solexa à 1 milliard de bases par
exécution, par l'entreprise Illumina, et dispose d'une fonctionnalité
préliminaire pour manipuler des données ABI SOLiD. Le logiciel Maq est déjà
connu sous le nom de mapass2.
Le développement du logiciel Maq s'est arrêté en 2008. Ses successeurs sont
BWA (« Burrows-Wheeler Aligner ») et SAMtools (« Sequence Alignment/Map
tools »).
|
|
Mhap
locality-sensitive hashing to detect long-read overlaps
|
Versions of package mhap |
Release | Version | Architectures |
stretch | 2.1.1+dfsg-1 | all |
sid | 2.1.3+dfsg-2 | all |
buster | 2.1.3+dfsg-2 | all |
|
License: DFSG free
|
The MinHash Alignment Process (MHAP--pronounced MAP) is a
reference implementation of a probabilistic sequence overlapping
algorithm. Designed to efficiently detect all overlaps between noisy
long-read sequence data. It efficiently estimates Jaccard similarity
by compressing sequences to their representative fingerprints
composed on min-mers (minimum k-mer).
|
|
Picard-tools
outils en ligne de commande pour manipuler les fichiers SAM et BAM
|
Versions of package picard-tools |
Release | Version | Architectures |
wheezy | 1.46-1 | all |
sid | 2.18.25+dfsg-2 | amd64 |
buster | 2.18.25+dfsg-2 | amd64 |
stretch | 2.8.1+dfsg-1 | all |
jessie | 1.113-1 | all |
squeeze | 1.27-1 | all |
upstream | 2.18.27 |
|
License: DFSG free
|
Le format «⋅Sequence Alignment/Map⋅» (SAM) est un format générique pour le
stockage d'alignements de grandes séquences de nucléotides. Le logiciel
Picard Tools inclut ces utilitaires pour manipuler les fichiers SAM et BAM
(Binary Alignment/Map)⋅:
AddCommentsToBam FifoBuffer
AddOrReplaceReadGroups FilterSamReads
BaitDesigner FilterVcf
BamIndexStats FixMateInformation
BamToBfq GatherBamFiles
BedToIntervalList GatherVcfs
BuildBamIndex GenotypeConcordance
CalculateHsMetrics IlluminaBasecallsToFastq
CalculateReadGroupChecksum IlluminaBasecallsToSam
CheckIlluminaDirectory LiftOverIntervalList
CheckTerminatorBlock LiftoverVcf
CleanSam MakeSitesOnlyVcf
CollectAlignmentSummaryMetrics MarkDuplicates
CollectBaseDistributionByCycle MarkDuplicatesWithMateCigar
CollectGcBiasMetrics MarkIlluminaAdapters
CollectHiSeqXPfFailMetrics MeanQualityByCycle
CollectIlluminaBasecallingMetrics MergeBamAlignment
CollectIlluminaLaneMetrics MergeSamFiles
CollectInsertSizeMetrics MergeVcfs
CollectJumpingLibraryMetrics NormalizeFasta
CollectMultipleMetrics PositionBasedDownsampleSam
CollectOxoGMetrics QualityScoreDistribution
CollectQualityYieldMetrics RenameSampleInVcf
CollectRawWgsMetrics ReorderSam
CollectRnaSeqMetrics ReplaceSamHeader
CollectRrbsMetrics RevertOriginalBaseQualitiesAndAddMateCigar
CollectSequencingArtifactMetrics RevertSam
CollectTargetedPcrMetrics SamFormatConverter
CollectVariantCallingMetrics SamToFastq
CollectWgsMetrics ScatterIntervalsByNs
CompareMetrics SortSam
CompareSAMs SortVcf
ConvertSequencingArtifactToOxoG SplitSamByLibrary
CreateSequenceDictionary SplitVcfs
DownsampleSam UpdateVcfSequenceDictionary
EstimateLibraryComplexity ValidateSamFile
ExtractIlluminaBarcodes VcfFormatConverter
ExtractSequences VcfToIntervalList
FastqToSam ViewSam
|
|
R-bioc-hilbertvis
GNU R package to visualise long vector data
|
Versions of package r-bioc-hilbertvis |
Release | Version | Architectures |
wheezy | 1.14.0-1 | amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc |
jessie | 1.24.0-1 | amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x |
sid | 1.40.0-1 | amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,mips,mips64el,mipsel,ppc64el,s390x |
stretch | 1.32.0-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
sid | 1.38.0-2 | kfreebsd-i386 |
squeeze | 1.5.0-2 | amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc |
buster | 1.40.0-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
Debtags of package r-bioc-hilbertvis: |
biology | nuceleic-acids |
field | biology, biology:bioinformatics |
use | analysing |
|
License: DFSG free
|
This tool allows one to display very long data vectors in a space-efficient
manner, by organising it along a 2D Hilbert curve. The user can then
visually judge the large scale structure and distribution of features
simultaenously with the rough shape and intensity of individual features.
In bioinformatics, a typical use case is ChIP-Chip and ChIP-Seq,
or basically all the kinds of genomic data, that are conventionally
displayed as quantitative track ("wiggle data") in genome browsers such
as those provided by Ensembl or UCSC.
|
|
Rna-star
ultrafast universal RNA-seq aligner
|
Versions of package rna-star |
Release | Version | Architectures |
stretch | 2.5.2b+dfsg-1 | amd64,arm64,mips64el,ppc64el |
buster | 2.7.0a+dfsg-1 | amd64,arm64,mips64el,ppc64el |
sid | 2.7.0a+dfsg-1 | amd64,arm64,mips64el,ppc64el |
upstream | 2.7.0c |
|
License: DFSG free
|
Spliced Transcripts Alignment to a Reference (STAR) software based on a
previously undescribed RNA-seq alignment algorithm that uses sequential
maximum mappable seed search in uncompressed suffix arrays followed by
seed clustering and stitching procedure. STAR outperforms other aligners
by a factor of >50 in mapping speed, aligning to the human genome 550
million 2 × 76 bp paired-end reads per hour on a modest 12-core server,
while at the same time improving alignment sensitivity and precision. In
addition to unbiased de novo detection of canonical junctions, STAR can
discover non-canonical splices and chimeric (fusion) transcripts, and is
also capable of mapping full-length RNA sequences. Using Roche 454
sequencing of reverse transcription polymerase chain reaction amplicons,
the authors experimentally validated 1960 novel intergenic splice
junctions with an 80-90% success rate, corroborating the high precision
of the STAR mapping strategy.
|
|
Samtools
traitement d'alignements de séquence pour les formats SAM et BAM et CRAM
|
Versions of package samtools |
Release | Version | Architectures |
jessie | 0.1.19-1 | amd64,arm64,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x |
sid | 1.9-3 | amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x |
buster | 1.9-3 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
wheezy | 0.1.18-1 | amd64,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390 |
squeeze | 0.1.8-1 | amd64,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390 |
stretch | 1.3.1-3 | amd64,arm64,armel,i386,mips64el,mipsel,ppc64el |
Debtags of package samtools: |
field | biology |
interface | commandline |
network | client |
role | program |
scope | utility |
uitoolkit | ncurses |
use | analysing, calculating, filtering |
works-with | biological-sequence |
|
License: DFSG free
|
Samtools est un ensemble d'utilitaires qui manipulent les alignements de
séquence de nucléotides dans le format binaire BAM. Il est capable
d'importer et d'exporter à partir des formats ASCII SAM (Sequence
Alignment/Map) et CRAM, de trier, de fusionner, d'indexer et de récupérer
des enregistrements dans n'importe quelle région facilement. Il est conçu
pour travailler sur un flux de données et est capable d'ouvrir un fichier
BAM ou CRAM (mais pas SAM) sur un serveur HTTP ou FTP distant.
|
|
Sra-toolkit
utilities for the NCBI Sequence Read Archive
|
Versions of package sra-toolkit |
Release | Version | Architectures |
stretch | 2.8.1-2+dfsg-2 | amd64,i386 |
buster | 2.9.3+dfsg-1 | amd64 |
sid | 2.9.3+dfsg-1 | amd64 |
wheezy | 2.1.7a-1 | amd64,i386,kfreebsd-amd64,kfreebsd-i386 |
jessie | 2.3.5-2+dfsg-1 | amd64,i386 |
upstream | 2.9.4 |
|
License: DFSG free
|
Tools for reading the SRA archive, generally by converting individual runs
into some commonly used format such as fastq.
The textual dumpers "sra-dump" and "vdb-dump" are provided in this
release as an aid in visual inspection. It is likely that their
actual output formatting will be changed in the near future to a
stricter, more formalized representation[s]. PLEASE DO NOT RELY UPON
THE OUTPUT FORMAT SEEN IN THIS RELEASE.
The "help" information will be improved in near future releases, and
the tool options will become standardized across the set. More documentation
will also be provided documentation on the NCBI web site.
Tool options may change in the next release. Version 1 tool options
will remain supported wherever possible in order to preserve
operation of any existing scripts.
Please cite:
Rasko Leinonen, Ruth Akhtar, Ewan Birney, James Bonfield, Lawrence Bower, Matt Corbett, Ying Cheng, Fehmi Demiralp, Nadeem Faruque, Neil Goodgame, Richard Gibson, Gemma Hoad, Christopher Hunter, Mikyung Jang, Steven Leonard, Quan Lin, Rodrigo Lopez, Michael Maguire, Hamish McWilliam, Sheila Plaister, Rajesh Radhakrishnan, Siamak Sobhany, Guy Slater, Petra Ten Hoopen, Franck Valentin, Robert Vaughan, Vadim Zalunin, Daniel Zerbino and Guy Cochrane:
Improvements to services at the European Nucleotide Archive.
(PubMed,eprint)
Nucleic Acids Research
38(Database issue):D39-45
(2010)
|
|
Ssake
genomics application for assembling millions of very short DNA sequences
|
Versions of package ssake |
Release | Version | Architectures |
squeeze | 3.5-1 | all |
wheezy | 3.8-2 | all |
jessie | 3.8.2-1 | all |
stretch | 3.8.4-1 | all |
sid | 4.0-2 | all |
buster | 4.0-2 | all |
Debtags of package ssake: |
biology | nuceleic-acids |
field | biology |
interface | shell |
role | program |
scope | utility |
use | analysing |
|
License: DFSG free
|
The Short Sequence Assembly by K-mer search and 3′ read Extension
(SSAKE) is a genomics application for aggressively assembling
millions of short nucleotide sequences by progressively searching for
perfect 3′-most k-mers using a DNA prefix tree. SSAKE is designed to
help leverage the information from short sequences reads by
stringently clustering them into contigs that can be used to
characterize novel sequencing targets.
|
|
Tabix
indexeur générique pour fichiers de positions de génome, délimités par des tabulations
|
Versions of package tabix |
Release | Version | Architectures |
jessie | 0.2.6-2 | armhf,mips,powerpc,s390x |
sid | 1.9-10 | amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x |
buster | 1.9-8 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
jessie | 1.1-1 | amd64,arm64,armel,i386,mipsel,ppc64el |
wheezy | 0.2.6-1 | amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc |
stretch | 1.3.2-2 | amd64,arm64,armel,i386,mips64el,mipsel,ppc64el |
Debtags of package tabix: |
role | program |
works-with-format | html |
|
License: DFSG free
|
Tabix indexe des fichiers où certaines colonnes indiquent les coordonnées de
séquence : nom (habituellement un chromosome), départ et fin. Le
fichier de données d'entrée doit être trié en fonction du positionnement et
compressé par bgzip (fourni dans ce paquet), qui a une interface similaire
à celle de gzip. Après indexation, tabix est en mesure de récupérer
rapidement les lignes de données par coordonnées chromosomiques. La
récupération rapide des données fonctionne aussi sur le réseau si une URI
est donnée comme nom de fichier.
Cette version de Tabix a été compilée à partir du code source de HTSlib.
|
|
Tophat
fast splice junction mapper for RNA-Seq reads
|
Versions of package tophat |
Release | Version | Architectures |
jessie | 2.0.13+dfsg-1 | amd64 |
stretch | 2.1.1+dfsg-2 | amd64 |
buster | 2.1.1+dfsg1-2 | amd64,arm64,mips64el,ppc64el,s390x |
sid | 2.1.1+dfsg1-2 | amd64,arm64,kfreebsd-amd64,mips64el,ppc64el,s390x |
|
License: DFSG free
|
TopHat aligns RNA-Seq reads to mammalian-sized genomes using the ultra
high-throughput short read aligner Bowtie, and then analyzes the
mapping results to identify splice junctions between exons.
TopHat is a collaborative effort between the University of Maryland
Center for Bioinformatics and Computational Biology and the
University of California, Berkeley Departments of Mathematics and
Molecular and Cell Biology.
The package is enhanced by the following packages:
cufflinks
|
|
Vcftools
ensemble d'outils pour travailler avec les fichiers VCF
|
Versions of package vcftools |
Release | Version | Architectures |
jessie | 0.1.12+dfsg-1 | amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x |
stretch | 0.1.14+dfsg-4 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
sid | 0.1.16-1 | amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x |
wheezy | 0.1.9-1 | amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc |
buster | 0.1.16-1 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
Debtags of package vcftools: |
role | program |
|
License: DFSG free
|
VCFtools est un paquet conçu pour travailler avec les fichiers au format
VCF, tels que ceux générés par le projet « 1000 Genomes ». L'objectif de
VCFtools est de fournir des
méthodes pour travailler avec les fichiers au format VCF : valider, fusionner,
comparer et calculer certaines statistiques génétiques de la population
représentative.
Please cite:
Petr Danecek, Adam Auton, Goncalo Abecasis, Cornelis A. Albers, Eric Banks, Mark A. DePristo, Robert E. Handsaker, Gerton Lunter, Gabor T. Marth, Stephen T. Sherry, Gilean McVean and Richard Durbin:
The variant call format and VCFtools.
(PubMed,eprint)
Bioinformatics
27(15):2156-8
(2011)
|
|
Velvet
assembleur de séquences d'acides nucléiques pour de très courtes lectures
|
Versions of package velvet |
Release | Version | Architectures |
squeeze | 1.0.02~nozlibcopy-1 | amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc |
wheezy | 1.2.03~nozlibcopy-1 | amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc |
buster | 1.2.10+dfsg1-5 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
stretch | 1.2.10+dfsg1-3 | amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x |
jessie | 1.2.10+dfsg1-1 | amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x |
sid | 1.2.10+dfsg1-5 | amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x |
Debtags of package velvet: |
biology | nuceleic-acids |
field | biology, biology:bioinformatics |
interface | commandline |
role | program |
use | analysing |
|
License: DFSG free
|
Velvet est un assembleur génomique de type de novo (assemblage de
lectures courtes pour créer des séquences de pleine longueur) spécialement
conçu pour les technologies de séquençage à lecture courte, telles que
Solexa de l'entreprise Illumina ou 454 de l'entreprise Roche, développées
par Daniel Zerbino et Ewan Birney au centre de recherche European
Bioinformatics Institute (EBI) qui fait partie du European Molecular
Biology Laboratory (EMBL), proche de Cambridge, au Royaume-Uni .
Le logiciel Velvet prend actuellement des séquences de lectures courtes,
enlève les erreurs puis produit des contigs uniques de haute qualité. Il
utilise alors les informations de lecture des paires, si elles sont
disponibles, pour
extraire les zones répétées entre les contigs.
|
|
|