Debian Med Project
Help us to see Debian used by medical practitioners and biomedical researchers! Join us on the Salsa page.
Summary
Next generation sequencing
Debian Med bioinformatics applications usable in Next Generation Sequencing

It aims at gettting packages which specialize in the processing or interpretation of data generated with next- (and later-) generation high-thoughput sequencing technologies.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Med to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Med mailing list

Links to other tasks

Debian Med Next generation sequencing packages

Official Debian packages with high relevance

Bcftools
Genomisk variantkald og manipulering af VCF/BCF-filer
Versions of package bcftools
ReleaseVersionArchitectures
buster1.9-1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
sid1.9-1amd64,arm64,armel,armhf,kfreebsd-amd64,mips64el,mipsel,ppc64el
stretch1.3.1-1amd64,arm64,armel,mips64el,mipsel,ppc64el
Popcon: 11 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

BCFtools er et sæt af redskaber, som manipulerer variantkald i Variant Call Format (VCF) og dets binære modpart BCF. Alle kommandoer fungerer gennemsigtigt med både VCF'er og BCF'er, både uden komprimering og komprimeret med BGZF.

Registry entries: Bio.Tools  SciCrunch  OMICtools 
Bedtools
Programpakke med redskaber for sammenligning af arvemassefunktioner
Versions of package bedtools
ReleaseVersionArchitectures
buster2.26.0+dfsg-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.27.1+dfsg-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid2.26.0+dfsg-5hurd-i386,kfreebsd-amd64,kfreebsd-i386,mips,s390x
stretch2.26.0+dfsg-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
jessie2.21.0-1amd64,arm64,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
wheezy2.16.1-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
Debtags of package bedtools:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, filtering
works-withbiological-sequence
Popcon: 38 users (24 upd.)*
Versions and Archs
License: DFSG free
Git

BEDTools-redskaber giver mulighed for at adressere gængse arvemasseopgaver såsom at finde funktionsoverlap og beregne dækning. Redskaberne er hovedsagelig baseret på fire meget udbredte filformater: BED, GFF/GTF, VCF og SAM/BAM. Med brug af BEDTools kan du udvikle sofistikerede datakanaler, som besvarer komplicerede forskningsspørgsmål ved at udsende flere BEDTools sammen.

Redskabet groupBy er distribueret i pakken filo.

Please cite: Aaron R. Quinlan and Ira M. Hall: BEDTools: a flexible suite of utilities for comparing genomic features. (PubMed,eprint) Bioinformatics 26(6):841-842 (2010)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Blasr
Kortlægning af enkelte molekylesekventeringslæsninger
Versions of package blasr
ReleaseVersionArchitectures
stretch5.3+0-1amd64,arm64,mips64el,ppc64el
sid0~20151014+git8e668be-1hurd-i386
buster5.3.2+dfsg-1.1amd64,arm64,mips64el,ppc64el
sid5.3.2+dfsg-1.1amd64,arm64,mips64el,ppc64el
Popcon: 1 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Grundlæggende lokal opsætning med successiv raffinement (BLASR) er en metode til kortlægning af enkelte molekylesekventeringslæsninger mod et referencegenom. En sådan læsning er tusindvis af baser lang, med divergens mellem dem og genomet bliver domineret af indsættelses- og slettefejl.

Registry entries: Bio.Tools  SciCrunch  OMICtools 
Bowtie
Ultrahurtig og hukommelseseffektiv short read-sammenligner
Versions of package bowtie
ReleaseVersionArchitectures
stretch1.1.2-6amd64,arm64,mips64el,ppc64el,s390x
wheezy0.12.7-3amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,powerpc,s390,s390x,sparc
sid1.2.2+dfsg-4amd64,arm64,mips64el,ppc64el,s390x
buster1.2.2+dfsg-4amd64,arm64,mips64el,ppc64el,s390x
sid1.1.2-6kfreebsd-amd64
jessie1.1.1-2amd64
Debtags of package bowtie:
biologynuceleic-acids
fieldbiology:bioinformatics
interfacecommandline
roleprogram
sciencecalculation
scopeutility
useanalysing, comparing
works-withbiological-sequence
Popcon: 20 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

Denne pakke adresserer problemet med at fortolke resultaterne fra de seneste (2010) DNA-sekvensteknologier. Disse vil resultere i ret så korte stræk og disse kan ikke fortolkes direkte. Det er udfordringen for værktøjer såsom Bowtie at give en kromosonplacering til korte stræk af DNA sekventeret per kørsel.

Bowtie sammenligner korte DNA-sekvenser (læsninger) for den menneskelige arvemasse med en hastighed på mere end 25 millioner 35-bp læsninger per time. Bowtie indekserer arvemassen med et Burrows-Wheeler-indeks for at holde hukommelsesaftrykket lavt: Typisk omkring 2,2 GB for den menneskelige arvemasse (2,9 GB for paired-end).

The package is enhanced by the following packages: bowtie-examples
Please cite: Ben Langmead, Cole Trapnell, Mihai Pop and Steven L Salzberg: Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. (eprint) Genome Biology 10:R25 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Bwa
Burrows-Wheeler Aligner (sekvenssammenligner)
Versions of package bwa
ReleaseVersionArchitectures
buster0.7.17-2amd64
squeeze0.5.8c-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
wheezy0.6.2-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie0.7.10-1amd64
stretch0.7.15-2amd64
sid0.7.17-2amd64,kfreebsd-amd64
Debtags of package bwa:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
useanalysing, comparing
Popcon: 29 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Burrows-Wheeler Aligner (BWA) er en programpakke, for oversættelse af lavafvigende sekvenser mod en stor referencearvemasse, såsom den menneskelige arvemasse. Den består af tre algoritmer: BWA-backtrack, BWA-SW og BWA-MEM. Den første algoritme er designet for Illunina-sekvenslæsninger op til 100 bp, mens de sidste to er for længere sekvenser fra 70 bp til 1 Mbp. BWA-MEM og BWA-SW deler funktioner såsom understøttelse af long-read og opdelingssammenligning, men BWA-MEM, som er den seneste, anbefales generelt for højkvalitets forespørgsler, da den er hurtigere og mere præcis. BWA-MEM har også bedre ydelse end BWA-backtrack for 70-100 bp Illumina-læsninger.

Please cite: Heng Li and Richard Durbin: Fast and accurate short read alignment with Burrows-Wheeler transform. (PubMed,eprint) Bioinformatics 25(14):1754-1760 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Daligner
Lokal tilpasningsregistrering mellem lange nukleotidsekventeringslæsninger
Versions of package daligner
ReleaseVersionArchitectures
buster1.0+git20180524.fd21879-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0+git20180524.fd21879-1amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.0+20161119-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Disse værktøjer gør det muligt at finde alle signifikante lokale tilpasninger mellem læsninger kodet i en Dazzler-database. Antagelsen er at læsningerne er fra en »Pacific Biosciences RS II long read sequencer«. Det vil sige, at læsningerne er lange og usikre, op til 15 % i gennemsnit.

Please cite: Gene Myers: Efficient Local Alignment Discovery amongst Noisy Long Reads. 8701:52-67 (2014)
Registry entries: SciCrunch  OMICtools 
Fastx-toolkit
forbehandlingsværktøjer til læsning af korte FASTQ/A-nukleotider
Versions of package fastx-toolkit
ReleaseVersionArchitectures
stretch0.0.14-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.0.14-6amd64,arm64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.0.14-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy0.0.13.2-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie0.0.14-1amd64,arm64,armel,armhf,i386,mips,mipsel,ppc64el,s390x
Debtags of package fastx-toolkit:
roleprogram
Popcon: 13 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

FASTX-Toolkit er en samling af kommandolinjeværktøjer for forbehandling af korte nukleotidlæsninger i FASTA- og FASTQ-formater, normalt udarbejdet af Next-Generation sekvensmaskiner. Hovedbehandlingen af sådanne FASTA/FASTQ-filer er oversættelse (justering) af sekvenserne til referencegenomer eller andre databaser der bruger specialiserede programmer såsom BWA, Bowtie og mange andre. Det er dog undertiden mere produktivt at forbehandle FASTA/FASTQ-filerne, forud for oversættelse af sekvenserne til genom-manipulering, for at fremstille bedre oversættelsesresultater. FASTX-Toolkit-værktøjer udfører nogle af disse forbehandlingsopgaver.

Registry entries: Bio.Tools  SciCrunch  OMICtools 
Last-align
sammenligning af biologisk sekvenser på genom-skala
Versions of package last-align
ReleaseVersionArchitectures
squeeze128-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
sid963-2amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
jessie490-1amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
wheezy199-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
stretch830-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster963-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package last-align:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
Popcon: 4 users (21 upd.)*
Versions and Archs
License: DFSG free
Git

LAST er programmel til sammenligning og justering af sekvenser, typisk DNA- eller protein-sekvenser. LAST ligner BLAST, men det er bedre til at håndtere meget store mængder af sekvensdata. Her er to ting som LAST er god til:

  • Sammenligning af store (eksempelvis pattedyrs) genomer.
  • Kortlægge masser af sekvens-mærker oven på et genom.

Den primære, tekniske innovation er at LAST finder indledende samstemmende forekomster, baseret på deres mangfoldighed, i stedet for at benytte en fast størrelse (BLAST bruger eksempelvis 10-mers). Dette gør, at man kan kortlægge mærker til genomer, uden gentagelsesmaskering (eng. »repeat- masking«), uden at blive overvældet af gentagne forekomster. For at finde disse forekomster som har forskellige størrelser, så bruger den en suffiks- række (inspireret af Vmatch). For at opnå høj følsomhed, så bruger den en usammenhængende suffiks-række, der er en analog til frø som placeres med mellemrum.

Please cite: Martin C. Frith, Raymond Wan and Paul Horton: Incorporating sequence quality data into alignment improves DNA read mapping. (PubMed,eprint) Nucl. Acids Res. 38(7):e100 (2010)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Libvcflib-tools
C++ library for parsing and manipulating VCF files (tools)
Versions of package libvcflib-tools
ReleaseVersionArchitectures
sid1.0.0~rc2+dfsg-2amd64,kfreebsd-amd64
stretch1.0.0~rc1+dfsg1-3amd64
buster1.0.0~rc2+dfsg-2amd64
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

The Variant Call Format (VCF) is a flat-file, tab-delimited textual format intended to concisely describe reference-indexed variations between individuals. VCF provides a common interchange format for the description of variation in individuals and populations of samples, and has become the defacto standard reporting format for a wide array of genomic variant detectors.

vcflib provides methods to manipulate and interpret sequence variation as it can be described by VCF. It is both:

  • an API for parsing and operating on records of genomic variation as it can be described by the VCF format,
  • and a collection of command-line utilities for executing complex manipulations on VCF files.

This package contains several tools using the library.

Registry entries: Bio.Tools  SciCrunch  OMICtools 
Maq
kortlægger korte, fast-længde, polymorfiske DNA-sekvenslæsninger til reference-sekvenser
Versions of package maq
ReleaseVersionArchitectures
jessie0.7.1-5amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid0.7.1-8amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy0.7.1-5amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
squeeze0.7.1-3amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
buster0.7.1-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0.7.1-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package maq:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 19 users (12 upd.)*
Versions and Archs
License: DFSG free
Git

Maq (forkortelse af »Mapping and Assembly with Quality«) bygger kortlagte montager fra korte læsninger genereret af næste generation inden for maskiner til sekvensering. Det blev særligt designet til »Illumina-Solexa 1G Genetic Analyzer«, og har indledende funktionalitet til at håndtere ABI SOLid-data. Maq var tidligere kendt som mapass2.

Udvikling af Maq stoppede i 2008. Dets efterfølger er BWA og SAMtools.

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Mhap
locality-sensitive hashing to detect long-read overlaps
Versions of package mhap
ReleaseVersionArchitectures
stretch2.1.1+dfsg-1all
sid2.1.3+dfsg-2all
buster2.1.3+dfsg-2all
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The MinHash Alignment Process (MHAP--pronounced MAP) is a reference implementation of a probabilistic sequence overlapping algorithm. Designed to efficiently detect all overlaps between noisy long-read sequence data. It efficiently estimates Jaccard similarity by compressing sequences to their representative fingerprints composed on min-mers (minimum k-mer).

Please cite: Konstantin Berlin, Sergey Koren, Chen-Shan Chin, James P Drake, Jane M Landolin and Adam M Phillippy: Assembling large genomes with single-molecule sequencing and locality-sensitive hashing. (PubMed) Nature Biotechnology 33(6):623–630 (2015)
Registry entries: OMICtools 
Picard-tools
Command line tools to manipulate SAM and BAM files
Versions of package picard-tools
ReleaseVersionArchitectures
wheezy1.46-1all
sid2.18.25+dfsg-2amd64
buster2.18.25+dfsg-2amd64
stretch2.8.1+dfsg-1all
jessie1.113-1all
squeeze1.27-1all
upstream2.18.27
Popcon: 9 users (31 upd.)*
Newer upstream!
License: DFSG free
Git

SAM (Sequence Alignment/Map) format is a generic format for storing large nucleotide sequence alignments. Picard Tools includes these utilities to manipulate SAM and BAM files:

 AddCommentsToBam                  FifoBuffer
 AddOrReplaceReadGroups            FilterSamReads
 BaitDesigner                      FilterVcf
 BamIndexStats                     FixMateInformation
 BamToBfq                          GatherBamFiles
 BedToIntervalList                 GatherVcfs
 BuildBamIndex                     GenotypeConcordance
 CalculateHsMetrics                IlluminaBasecallsToFastq
 CalculateReadGroupChecksum        IlluminaBasecallsToSam
 CheckIlluminaDirectory            LiftOverIntervalList
 CheckTerminatorBlock              LiftoverVcf
 CleanSam                          MakeSitesOnlyVcf
 CollectAlignmentSummaryMetrics    MarkDuplicates
 CollectBaseDistributionByCycle    MarkDuplicatesWithMateCigar
 CollectGcBiasMetrics              MarkIlluminaAdapters
 CollectHiSeqXPfFailMetrics        MeanQualityByCycle
 CollectIlluminaBasecallingMetrics MergeBamAlignment
 CollectIlluminaLaneMetrics        MergeSamFiles
 CollectInsertSizeMetrics          MergeVcfs
 CollectJumpingLibraryMetrics      NormalizeFasta
 CollectMultipleMetrics            PositionBasedDownsampleSam
 CollectOxoGMetrics                QualityScoreDistribution
 CollectQualityYieldMetrics        RenameSampleInVcf
 CollectRawWgsMetrics              ReorderSam
 CollectRnaSeqMetrics              ReplaceSamHeader
 CollectRrbsMetrics                RevertOriginalBaseQualitiesAndAddMateCigar
 CollectSequencingArtifactMetrics  RevertSam
 CollectTargetedPcrMetrics         SamFormatConverter
 CollectVariantCallingMetrics      SamToFastq
 CollectWgsMetrics                 ScatterIntervalsByNs
 CompareMetrics                    SortSam
 CompareSAMs                       SortVcf
 ConvertSequencingArtifactToOxoG   SplitSamByLibrary
 CreateSequenceDictionary          SplitVcfs
 DownsampleSam                     UpdateVcfSequenceDictionary
 EstimateLibraryComplexity         ValidateSamFile
 ExtractIlluminaBarcodes           VcfFormatConverter
 ExtractSequences                  VcfToIntervalList
 FastqToSam                        ViewSam
Registry entries: Bio.Tools  SciCrunch  OMICtools 
R-bioc-hilbertvis
GNU R-pakke til at visualisere lange vektordata
Versions of package r-bioc-hilbertvis
ReleaseVersionArchitectures
wheezy1.14.0-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie1.24.0-1amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid1.40.0-1amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,mips,mips64el,mipsel,ppc64el,s390x
stretch1.32.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.38.0-2kfreebsd-i386
squeeze1.5.0-2amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
buster1.40.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package r-bioc-hilbertvis:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
useanalysing
Popcon: 15 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Dette værktøj giver dig mulighed for at vise meget lange datavektorer på en pladseffektiv måde, ved at organisere dataene via en 2D-Hilbertkurve. Brugeren kan så visuelt bedømme den store skalastruktur og distribution af funktioner på samme tid via den rå form og intensiteten for individuelle funktioner.

I bioinformatics er et typisk brugstilfælde ChIP-Chip og ChIP-Seq, eller grundlæggende alle slags genomdata, som passende vises som kvantitative spor (»wiggle data«) i genombrowsere såsom dem tilbudt af Ensembl eller UCSC.

Please cite: Simon Anders: Visualization of genomic data with the Hilbert curve. (PubMed,eprint) Bioinformatics 25(10):1231-1235 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Rna-star
Ultrahurtig univerel RNA-seq-sammenligningsprogram
Versions of package rna-star
ReleaseVersionArchitectures
stretch2.5.2b+dfsg-1amd64,arm64,mips64el,ppc64el
buster2.7.0a+dfsg-1amd64,arm64,mips64el,ppc64el
sid2.7.0a+dfsg-1amd64,arm64,mips64el,ppc64el
upstream2.7.0c
Popcon: 5 users (17 upd.)*
Newer upstream!
License: DFSG free
Git

Programmet Spliced Transcripts Alignment to a Reference (STAR) baseret på en tidligere ubeskrevet RNA-seq-sammenligningsalgoritme, som bruger sekventiel maksimal kortlægningsparat seed-søgning i suffikstabeller uden komprimering efterfulgt af seed-klyngeopbygning og syning. STAR er bedre end andre sammenligningsprogrammer med en faktor >50 i kortlægningshastighed, sammenligning med menneskets genom 550 million 2 × 76 bp parret-slut læsninger per time på en moderat server med 12-kerner, mens der på samme tid er en forbedring af sammenligningssensitivitet og præcision. Udover fordomsfri de novo-registrering af kanoniske bindinger kan STAR registrere ikkekanoniske dele og chimeric (fusion) transkriptioner, og kan også oversætte RNA-sekvenser i fuld længde. Via Rocke 454-sekvensering af »reverse transcription polymerase chain reaction amplicons« validerede forfatterne eksperimentelt 1960 novel mellemgenom delbindinger med 80-90 % succes, underbyggende den høje præcision i START-kortlægningsstrategien.

Please cite: Alexander Dobin, Carrie A. Davis, Felix Schlesinger, Jorg Drenkow, Chris Zaleski, Sonali Jha, Philippe Batut, Mark Chaisson and Thomas R. Gingeras: STAR: ultrafast universal RNA-seq aligner. (PubMed,eprint) Bioinformatics 29(1):15-21 (2012)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Samtools
Forarbejdning af sekvensopstillinger i SAM-, BAM- og CRAM-formater
Versions of package samtools
ReleaseVersionArchitectures
jessie0.1.19-1amd64,arm64,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid1.9-3amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.9-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy0.1.18-1amd64,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390
squeeze0.1.8-1amd64,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390
stretch1.3.1-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
Debtags of package samtools:
fieldbiology
interfacecommandline
networkclient
roleprogram
scopeutility
uitoolkitncurses
useanalysing, calculating, filtering
works-withbiological-sequence
Popcon: 65 users (63 upd.)*
Versions and Archs
License: DFSG free
Git

Samtools er et sæt af værktøjer, der manipulerer sammenligninger af nukleotidsekvenser i det binære BAM-format. Værktøjet importerer fra og eksporterer til ascii SAM-formatet (Sequence Alignment/Map) og CRAM-formater, udfører sortering, sammenlægning og indeksering, og gør det muligt at hente læsninger i alle områder hurtigt. Det er designet til at arbejde på en strøm, og er i stand til at åbne en BAM- eller CRAM-fil (ikke SAM) på en ekstern FTP- eller HTTP-server.

The package is enhanced by the following packages: libbio-samtools-perl
Please cite: Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan, Nils Homer, Gabor Marth, Goncalo Abecasis, Richard Durbin and 1000 Genome Project Data Processing Subgroup: The Sequence Alignment/Map (SAM) Format and SAMtools. (PubMed,eprint) Bioinformatics 25(16):2078-2079 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Screenshots of package samtools
Sra-toolkit
Redskaber for NCBI Sequence Read Archive
Versions of package sra-toolkit
ReleaseVersionArchitectures
stretch2.8.1-2+dfsg-2amd64,i386
buster2.9.3+dfsg-1amd64
sid2.9.3+dfsg-1amd64
wheezy2.1.7a-1amd64,i386,kfreebsd-amd64,kfreebsd-i386
jessie2.3.5-2+dfsg-1amd64,i386
upstream2.9.4
Popcon: 10 users (7 upd.)*
Newer upstream!
License: DFSG free
Git

Værktøjer til at læse SRA-arkivet, generelt ved at konvertere individuelle kørsler til et ofte anvendt format såsom fastq.

De tekstmæssige dumpere »sra-dump« og »vdb-dump« tilbydes i denne udgivelse som en hjælp til visuel inspektion. Det er sandsynligt, at den faktiske uddataformatering vil blive ændret i den nære fremtid for en mere stringent, mere formaliseret repræsentation. AFHÆNG IKKE AF UDDATAFORMATET I DENNE UDGIVELSE.

Informationen »Help« vil blive forbedret i fremtidige udgivelser og værktøjsindstillingerne vil blive standardiseret på tværs af sættet. Yderligere dokumentation vil også blive lagt på NCBI-hjemmesiden.

Værktøjsindstillinger kan ændre sig i den næste udgivelse. Version 1- værktøjsindstillinger vil forblive understøttet hvor muligt for at bevare funktionaliteten på eksisterende skripter.

Please cite: Rasko Leinonen, Ruth Akhtar, Ewan Birney, James Bonfield, Lawrence Bower, Matt Corbett, Ying Cheng, Fehmi Demiralp, Nadeem Faruque, Neil Goodgame, Richard Gibson, Gemma Hoad, Christopher Hunter, Mikyung Jang, Steven Leonard, Quan Lin, Rodrigo Lopez, Michael Maguire, Hamish McWilliam, Sheila Plaister, Rajesh Radhakrishnan, Siamak Sobhany, Guy Slater, Petra Ten Hoopen, Franck Valentin, Robert Vaughan, Vadim Zalunin, Daniel Zerbino and Guy Cochrane: Improvements to services at the European Nucleotide Archive. (PubMed,eprint) Nucleic Acids Research 38(Database issue):D39-45 (2010)
Registry entries: Bio.Tools  OMICtools 
Ssake
Genomprogram for samling af millioner af meget korte DNA-sekvenser
Versions of package ssake
ReleaseVersionArchitectures
squeeze3.5-1all
wheezy3.8-2all
jessie3.8.2-1all
stretch3.8.4-1all
sid4.0-2all
buster4.0-2all
Debtags of package ssake:
biologynuceleic-acids
fieldbiology
interfaceshell
roleprogram
scopeutility
useanalysing
Popcon: 6 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Short Sequence Assembly af K-mer search and 3′ read Extension (SSAKE) er et genomprogram for aggressiv samling af millioner af korte nukleotidsekvenser ved gradvis at søge efter perfekte 3'-meste k-merer ved hjælp af et DNA-præfikstræ. SSAKE er designet til at hjælpe med at udnytte oplysningerne fra korte sekvenser læst ved stringent klyngeopbygning i contig'er, der kan bruges til at karakterisere nye sekventeringsmål.

Please cite: Rene L. Warren, Granger G. Sutton, Steven J. M. Jones and Robert A. Holt: Assembling millions of short DNA sequences using SSAKE. (PubMed,eprint) Bioinformatics 23(4):500-501 (2007)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Tabix
Generisk indeksprogram for TAB-afgrænsede arvemassepositionsfiler
Versions of package tabix
ReleaseVersionArchitectures
jessie0.2.6-2armhf,mips,powerpc,s390x
sid1.9-10amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.9-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.1-1amd64,arm64,armel,i386,mipsel,ppc64el
wheezy0.2.6-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
stretch1.3.2-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
Debtags of package tabix:
roleprogram
works-with-formathtml
Popcon: 18 users (29 upd.)*
Versions and Archs
License: DFSG free
Git

Tabix indekserer filer hvor nogle kolonner indikerer sekvenskoordinater: navn (normalt et kromosom), start og stop. Inddatafilen skal være positionssorteret og komprimeret af bgzip (tilbudt i denne pakke), som har en grænseflade der ligner gzip. Efter indeksering er tabix i stand til hurtigt at hente datalinjer efter kromosomkoordinater. Hurtig dataindhentelse fungerer også over netværk hvis en URI angives som et filnavn.

Denne version af tabix er bygget fra HTSlib-kilden.

Please cite: Heng Li: Tabix: fast retrieval of sequence features from generic TAB-delimited files. (PubMed,eprint) Bioinformatics 27(5):718-719 (2011)
Registry entries: OMICtools 
Screenshots of package tabix
Tophat
Hurtig splejsningsforbindelsesoversætter for RNA-sekvenslæsninger
Versions of package tophat
ReleaseVersionArchitectures
jessie2.0.13+dfsg-1amd64
stretch2.1.1+dfsg-2amd64
buster2.1.1+dfsg1-2amd64,arm64,mips64el,ppc64el,s390x
sid2.1.1+dfsg1-2amd64,arm64,kfreebsd-amd64,mips64el,ppc64el,s390x
Popcon: 12 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

TopHat sammenligner RNA-sekvenslæsninger med genomer i mammalian-størrelse via ultra høj-gennemløb kortlæsningsssammenligneren Bowtie, og analyserer så resultaterne for at identificere splejsningsforbindelser mellem exoner. TopHat er et samarbejde mellem University of Maryland Center for Bioinformatics og Computational Biology og University of California, Berkeley Departments for matematisk og molekylær- og cellebiologi.

The package is enhanced by the following packages: cufflinks
Please cite: Cole Trapnell, Lior Pachter and Steven L. Salzberg: TopHat: discovering splice junctions with RNA-Seq. (PubMed,eprint) Bioinformatics 25(9):1105-1111 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Vcftools
Samling af værktøjer til arbejdet med VCF-filer
Versions of package vcftools
ReleaseVersionArchitectures
jessie0.1.12+dfsg-1amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
stretch0.1.14+dfsg-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.1.16-1amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy0.1.9-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
buster0.1.16-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package vcftools:
roleprogram
Popcon: 18 users (15 upd.)*
Versions and Archs
License: DFSG free
Git

VCFtools er en programpakke designet for arbejde med VCF-filer, såsom dem oprettet af 1000 Genomes Project. Formålet med VCFtools er at tilbyde metoder for arbejde med VCF-filer: validering, sammenføjning, sammenligning og beregning af noget grundlæggende statistik om befolkningsgenetik.

Please cite: Petr Danecek, Adam Auton, Goncalo Abecasis, Cornelis A. Albers, Eric Banks, Mark A. DePristo, Robert E. Handsaker, Gerton Lunter, Gabor T. Marth, Stephen T. Sherry, Gilean McVean and Richard Durbin: The variant call format and VCFtools. (PubMed,eprint) Bioinformatics 27(15):2156-8 (2011)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Velvet
Sekvens-assembler for nukleinsyre til meget korte læsninger
Versions of package velvet
ReleaseVersionArchitectures
squeeze1.0.02~nozlibcopy-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
wheezy1.2.03~nozlibcopy-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
buster1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.2.10+dfsg1-1amd64,arm64,armel,armhf,i386,mips,mipsel,powerpc,ppc64el,s390x
sid1.2.10+dfsg1-5amd64,arm64,armel,armhf,hurd-i386,i386,kfreebsd-amd64,kfreebsd-i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package velvet:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 8 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet er en »de novo«-genomisk assembler som er specielt designet for teknologier til kort læsning, såsom Solexa eller 454, udviklet af Daniel Zerbino og Ewan Birney ved European Bioinformatics Institue (EMBL-EBI), nær Cambridge, i Storbritannien.

Velvet kan i øjeblikket tage korte læsesekvenser, fjerner fejl og fremstiller dernæst unikke »contig'er« i høj kvalitet. Det anvender derefter parvis læseinformation, hvis tilgængelig, til at indhente de gentagne områder mellem contig'erne.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 200201