Debian Med Project
Help us to see Debian used by medical practitioners and biomedical researchers! Join us on the Salsa page.
Summary
Next generation sequencing
Debian Med bioinformatics applications usable in Next Generation Sequencing

It aims at gettting packages which specialize in the processing or interpretation of data generated with next- (and later-) generation high-thoughput sequencing technologies.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Med to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Med mailing list

Links to other tasks

Debian Med Next generation sequencing packages

Official Debian packages with high relevance

Anfo
Short Read Aligner/Mapper fra MPG
Versions of package anfo
ReleaseVersionArchitectures
sid0.98-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie0.98-4amd64,armel,armhf,i386
stretch0.98-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.98-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.98-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 6 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Anfo er en mapper i stil med Soap/Maq/Bowtie, men dets implementering har arvet mere fra BLAST/BLAT. Det er mest nyttig for sammenligning af sekvenslæsninger hvor DNA-sekvensen er ændret en smule (tænk ældre DNA eller bisulfit behandling) og/eller der er større forskel mellem prøve og reference end hvad hurtige mappere vil håndtere pænt (lad os sige at referencearvemassen mangler og en tæt forbundet art bruges i stedet for).

Registry entries: SciCrunch  OMICtools 
Topics: Sequencing
Arden
Specificitetskontrol for læse sammenligninger ved anvendelse af en kunstig reference
Versions of package arden
ReleaseVersionArchitectures
buster1.0-4all
stretch1.0-3all
sid1.0-5all
bullseye1.0-5all
jessie1.0-1amd64,armel,armhf,i386
Popcon: 7 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

ARDEN (Artificial Reference Driven Estimation of false positives in NGS data) er en begyndende sammenligning (benchmark), der estimerer fejlprocenter baseret på virkelige eksperimentelle læsninger og en yderligere genereret kunstig referencearvemasse. Det giver mulighed for beregning af fejlprocenter specifikke for et datasæt og konstruktion af en ROC-kurve. Derved kan det bruges til at optimere parametre for læste kortlæggere, til at vælge læsningsoversættere for et specifikt problem eller også til at filtrere sammenligninger baseret på kvalitetsskøn.

Please cite: Sven H. Giese, Franziska Zickmann and Bernhard Y. Renard: Specificity control for read alignments using an artificial reference genome-guided false discovery rate. (PubMed,eprint) Bioinformatics 30(1):9-16 (2013)
Registry entries: SciCrunch  OMICtools 
Topics: Sequencing
Art-nextgen-simulation-tools
Simuleringsværktøjer til at oprette syntetiske næstegenerationssekventeringslæsninger
Versions of package art-nextgen-simulation-tools
ReleaseVersionArchitectures
stretch20160605+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid20160605+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye20160605+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster20160605+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

ART er et sæt af simuleringsværktøjer til at oprette syntetiske næstegenerationssekventeringslæsninger. ART simulerer sekventeringslæsninger ved at efterligne virkelige sekventeringsprocesser med empiriske fejlmodeller eller kvalitetsprofiler opsummeret fra store justerede sekventeringsdata. ART kan også simulere læsninger via en brugerejet læsefejlmodel eller kvalitetsprofiler. ART understøtter simulering af single-end, parret ende/mate-pair-læsninger fra tre store kommercielle næstegenerationssekventeringsplatforme: Illuminas Solexa, Roches 454 og Applied Biosystems SOLID. ART kan bruges til at teste eller sammenligne en række metoder eller værktøjer til næstegenerationssekventeringsdataanalyse, herunder læsejustering, de novo-samling, SNP- og variationsstrukturregistrering. ART blev brugt som et primært værktøj til simuleringsundersøgelse af de 1.000 genomer projekt. ART er implementeret i C ++ med optimerede algoritmer og er yderst effektiv i læsningssimulering. ART udsender læsninger i FASTQ-format, og sammenligninger i ALN-format. ART kan også oprette linjeføringer i SAM-sammenligning eller UCSC BED-filformatet. Teknikken, kan anvendes sammen med genomvariantsimulatorer (f.eks. VarSim) til evaluering af variantkaldværktøjer eller -metoder.

Please cite: Weichun Huang, Leping Li, Jason R. Myers and Gabor T. Marth: ART: a next-generation sequencing read simulator. (PubMed,eprint) Bioinformatics 28(4):593-594 (2012)
Registry entries: SciCrunch  OMICtools  bioconda 
Artfastqgenerator
Viser kunstige FASTQ-filer afledt fra et referencegenom
Versions of package artfastqgenerator
ReleaseVersionArchitectures
buster0.0.20150519-3all
sid0.0.20150519-3all
bullseye0.0.20150519-3all
stretch0.0.20150519-2all
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

ArtificialFastqGenerator anvender referencegenomet (i FASTA-format) som inddata og fremstiller kunstige FASTQ-filer i formatet Sanger. Programmet kan acceptere Phred base-kvalitetsbedømmelser fra eksisterende FASTQ-filer og bruge dem til at simulere sekvensfejl. Da de kunstige FASTQ'er er afledt fra referencegenomet, tilbyder referencegenomet en guldstandard for kald af varianter (Single Nucleotide Polymorphisms (SNP'er) og indsættelser og sletninger (indels)). Dette aktiverer evaluering af en Next Generation Sequencing-analysekanal (NGS) som sammenligner læsninger med referencegenomet og så kalder varianterne.

Please cite: Matthew Frampton and Richard Houlston: Generation of Artificial FASTQ Files to Evaluate the Performance of Next-Generation Sequencing Pipelines. (PubMed,eprint) PLOSone 7(11):e49110 (2012)
Registry entries: OMICtools 
Bamtools
Værktøjssæt for manipulering af BAM-filer - sammenligning af arvemasser
Versions of package bamtools
ReleaseVersionArchitectures
jessie2.3.0+dfsg-2amd64,armel,armhf,i386
sid2.5.1+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.5.1+dfsg-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.5.1+dfsg-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch2.4.1+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 10 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

BamTools faciliterer forskningsanalyse og datahåndtering med brug af BAM-filer. Værktøjet håndterer de enorme datamængder lavet af nuværende sekvensteknologier, som typisk lagres i komprimerede, binære formater, som ikke nemt håndteres af tekstbaserede fortolkere ofte brugt i forskning indenfor bioinformatik.

BamTools tilbyder både en C++-API for BAM-filunderstøttelse samt et værktøjssæt for kommandolinjen.

Dette er værktøjssættet til kommandolinjen for bamtools.

Tilgængelige kommandoer for bamtools:

 convert  Konverterer mellem BAM og et antal andre formater
 count    Udskriver antallet af sammenligninger i BAM-filer
 coverage Udskriver dækningsstatistik fra inddata-BAM-filen
 filter   Filtrerer BAM-filer efter kriterier angivet af brugeren
 header   Udskriver BAM-teksthovedinformation
 index    Opretter indeks for BAM-fil
 merge    Sammenføj flere BAM-filer til en enkel fil
 random   Vælg vilkårlige sammenligninger fra eksisterende BAM-filer,
          lavet mere som et testværktøj.
 resolve  Slår parret ende-læsninger op (markerer IsProperPair-flaget
          efter behov)
 revert   Fjerner duplikerede mærker og gendanner originale
          basiskvaliteter
 sort     Sorterer BAM-filen jævnfør nogle kriterier
 split    Deler en BAM-fil på brugerangivne egenskab, opretter en ny
          BAM-uddatafil for hver fundet værdi
 stats    Udskriver lidt grundlæggende statistik fra inddata-BAM-filer
Please cite: Derek W. Barnett, Erik K. Garrison, Aaron R. Quinlan, Michael P. Stromberg and Gabor T. Marth: BamTools: a C++ API and toolkit for analyzing and managing BAM files. (PubMed,eprint) Bioinformatics 27(12):1691-2 (2011)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Bcftools
Genomisk variantkald og manipulering af VCF/BCF-filer
Versions of package bcftools
ReleaseVersionArchitectures
bullseye1.9-1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
stretch1.3.1-1amd64,arm64,armel,mips64el,mipsel,ppc64el
buster1.9-1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
sid1.9-1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
Popcon: 12 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

BCFtools er et sæt af redskaber, som manipulerer variantkald i Variant Call Format (VCF) og dets binære modpart BCF. Alle kommandoer fungerer gennemsigtigt med både VCF'er og BCF'er, både uden komprimering og komprimeret med BGZF.

Please cite: Petr Danecek and Shane A. McCarthy: BCFtools/csq: Haplotype-aware variant consequences. (2016)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Bedtools
Programpakke med redskaber for sammenligning af arvemassefunktioner
Versions of package bedtools
ReleaseVersionArchitectures
buster2.27.1+dfsg-4amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
stretch2.26.0+dfsg-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
jessie2.21.0-1amd64,armhf,i386
wheezy2.16.1-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
bullseye2.27.1+dfsg-4amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el
sid2.27.1+dfsg-4armel,armhf,mipsel
sid2.29.0+dfsg-1amd64,arm64,mips64el,ppc64el
Debtags of package bedtools:
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopesuite
useanalysing, comparing, converting, filtering
works-withbiological-sequence
Popcon: 46 users (33 upd.)*
Versions and Archs
License: DFSG free
Git

BEDTools-redskaber giver mulighed for at adressere gængse arvemasseopgaver såsom at finde funktionsoverlap og beregne dækning. Redskaberne er hovedsagelig baseret på fire meget udbredte filformater: BED, GFF/GTF, VCF og SAM/BAM. Med brug af BEDTools kan du udvikle sofistikerede datakanaler, som besvarer komplicerede forskningsspørgsmål ved at udsende flere BEDTools sammen.

Redskabet groupBy er distribueret i pakken filo.

Please cite: Aaron R. Quinlan and Ira M. Hall: BEDTools: a flexible suite of utilities for comparing genomic features. (PubMed,eprint) Bioinformatics 26(6):841-842 (2010)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Berkeley-express
Strømkvantificering til sekventering med høj gennemløb
Versions of package berkeley-express
ReleaseVersionArchitectures
buster1.5.2+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.5.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.5.2+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.5.1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

EXpress er et strømværktøj til kvantificering af mængderne af et sæt målrettet sekvenser fra stikprøveundersekvenser. Eksempler på programmer omfatter transkript-plan RNA-Seq-kvantificering, allele-specifik/haplotype udtryksanalyse (fra RNA-Seq), transskriptionsfaktorbindende kvantificering chip-Seq, og analyse af metagenomisk data. Det er baseret på en net-EM algoritme, der resulterer i rumkrav (hukommelse) proportionale med den samlede størrelse af målsekvenser og tidskrav, der er proportionale med antallet af stikprøvefragmenter. I programmer såsom RNA-Seq kan eXpress udtryk nøjagtigt kvantificere meget større prøver end andre aktuelt tilgængelige værktøjer, hvilket reducerer beregningskrav til infrastruktur. EXpress kan bruges til at opbygge lette sekventerende behandlingsdatakanaler med høj gennemløb, når kombineret med en strømudjævner (såsom Bowtie), da uddata kan ledes direkte ind i eXpress, hvilket effektivt fjerner behovet for at gemme læsningstilpasninger i hukommelsen eller på disken.

I en analyse af resultaterne af Express til RNA-Seq data, var det observeret, at denne effektivitet ikke kommer på en bekostning af præcision. EXpress er mere præcis end andre tilgængelige værktøjer, selv når begrænset til mindre datasæt, der ikke kræver en sådan effektivitet. Desuden, ligesom Cufflinks-programmet, kan udtrykket bruges til at estimere udskriftsmængderne i multi-isoform-gener. EXpress er også i stand til at løse flerkortlægninger af læsninger på tværs af genfamilier, og kræver ikke en henvisning til genomet således at det kan anvendes i forbindelse med de novo-montører såsom Trinity, Oaser eller Trans-afgrunden. Den underliggende model er baseret på tidligere beskrevne sandsynlighedsmodeller udviklet for RNA-Seq men kan anvendes til andre miljøer, hvor stikprøvemålsekvenserne, og indeholder parametre for længdefragmentdistributioner, fejl i læsninger, og sekvens-specifik fragmentbias.

EXpress kan bruges til at løse tvetydige tilknytninger i andre sekventeringsbaserede programmer med høj gennemløb. Det eneste, der kræves af inddata er at udtrykke et sæt af målsekvenser og et sæt af sekventerede fragmenter multiply-aligned for dem. Mens disse målsekvenser ofte vil være gen-isoformer, behøver de ikke at være det. Haplotyper kan anvendes som referencepriser for allele-specifik udtryksanalyse, bindende regioner for Chip-Seq, eller målgenomer i metagenomet-eksperimenter. EXpress er anvendelige i analyser, hvor der læses multi-kort til sekvenser, der afviger i stor grad.

Please cite: Adam Roberts and Lior Pachter: Streaming fragment assignment for real-time analysis of sequencing experiments. (PubMed) Nature Methods 10(1):71–73 (2013)
Registry entries: SciCrunch  OMICtools  bioconda 
Bio-rainbow
Klyngeopsætning og samling af korte læsninger for bioinformatik
Versions of package bio-rainbow
ReleaseVersionArchitectures
sid2.0.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.0.4+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch2.0.4-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.0.4+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Effektivt værktøj for klyngeopsætning og samling af korte læsninger, specielt for RAD.

Rainbow er udviklet for at tilbyde en ultra hurtig og hukommelseseffektiv løsning til klyngeopbygning og samling af korte læsninger fremstillet af RAD-seq. Først læser Rainbowklynger via en »spaced seed«-metode. Derefter implementerer Rainbow en heterozygot kaldelignende strategi til at opdele potentielle grupper i haplotyper i en op-nedad metode. Langs et guidet træ sammenføjes interaktivt underblade i en bund-op metode, hvis de har nok lighed.

Her er ligheden defineret ved at sammenligne den 2. læsning af et RAD-segment. Denne fremgangsmåde forsøger at samle heterozygot, mens gentagende sekvenser diskrimineres. Til sidste bruger Rainbow en grådig algoritme til lokalt at samle sammenføjede læsninger i contig'er. Rainbow viser ikke kun den optimale men også mindre optimale samlingsresultater. Baseret på simulering og reelle guppy RAD-seq-data, er det vist at Rainbow er mere kompetent end andre værktøjer i håndteringen af RAD-seq-data.

Please cite: Zechen Chong, Jue Ruan and Chung-I. Wu: Rainbow: an integrated tool for efficient clustering and assembling RAD-seq reads.. (PubMed) Bioinformatics 28(21):2732-2737 (2012)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Blasr
Kortlægning af enkelte molekylesekventeringslæsninger
Versions of package blasr
ReleaseVersionArchitectures
sid5.3.3+dfsg-2amd64,arm64,mips64el,ppc64el
bullseye5.3.3+dfsg-2amd64,arm64,mips64el,ppc64el
buster5.3.2+dfsg-1.1amd64,arm64,mips64el,ppc64el
stretch5.3+0-1amd64,arm64,mips64el,ppc64el
Popcon: 4 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Grundlæggende lokal opsætning med successiv raffinement (BLASR) er en metode til kortlægning af enkelte molekylesekventeringslæsninger mod et referencegenom. En sådan læsning er tusindvis af baser lang, med divergens mellem dem og genomet bliver domineret af indsættelses- og slettefejl.

Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Bowtie
Ultrahurtig og hukommelseseffektiv short read-sammenligner
Versions of package bowtie
ReleaseVersionArchitectures
jessie1.1.1-2amd64
buster1.2.2+dfsg-4amd64,arm64,mips64el,ppc64el,s390x
sid1.2.3+dfsg-2amd64,arm64,mips64el,ppc64el,s390x
bullseye1.2.3+dfsg-2amd64,arm64,mips64el,ppc64el,s390x
wheezy0.12.7-3amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,powerpc,s390,s390x,sparc
stretch1.1.2-6amd64,arm64,mips64el,ppc64el,s390x
Debtags of package bowtie:
biologynuceleic-acids
fieldbiology:bioinformatics
interfacecommandline
roleprogram
sciencecalculation
scopeutility
useanalysing, comparing
works-withbiological-sequence
Popcon: 21 users (36 upd.)*
Versions and Archs
License: DFSG free
Git

Denne pakke adresserer problemet med at fortolke resultaterne fra de seneste (2010) DNA-sekvensteknologier. Disse vil resultere i ret så korte stræk og disse kan ikke fortolkes direkte. Det er udfordringen for værktøjer såsom Bowtie at give en kromosonplacering til korte stræk af DNA sekventeret per kørsel.

Bowtie sammenligner korte DNA-sekvenser (læsninger) for den menneskelige arvemasse med en hastighed på mere end 25 millioner 35-bp læsninger per time. Bowtie indekserer arvemassen med et Burrows-Wheeler-indeks for at holde hukommelsesaftrykket lavt: Typisk omkring 2,2 GB for den menneskelige arvemasse (2,9 GB for paired-end).

The package is enhanced by the following packages: bowtie-examples
Please cite: Ben Langmead, Cole Trapnell, Mihai Pop and Steven L Salzberg: Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. (eprint) Genome Biology 10:R25 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Topics: Genomics
Bowtie2
Ultrahurtig og hukommelseseffektiv short read-sammenligner
Versions of package bowtie2
ReleaseVersionArchitectures
stretch2.3.0-2amd64
buster2.3.4.3-1amd64
bullseye2.3.5.1-1amd64
wheezy2.0.0-beta6-3amd64,i386,kfreebsd-amd64,kfreebsd-i386
jessie2.2.4-1amd64
sid2.3.5.1-1amd64
Popcon: 27 users (16 upd.)*
Versions and Archs
License: DFSG free
Git

Bowtie 2 er et ultrahurtigt og hukommelseseffektivt værktøj til sammenligning af sekventeringslæsninger til lange referencesekvenser. Det er især velegnet til at justere læsninger fra omkring 50'erne op til 100'erne eller tusindvis af tegn, og særligt velegnet til at tilpasse til relativt lange (f.eks pattedyrs) arvemasser.

Bowtie 2 indekserer arvemassen med et FM-indeks til at holde sin hukommelsesaftryk lavt: for den menneskelige arvemasse er dets hukommelsesaftryk typisk omkring 3,2 GB. Bowtie 2 understøtter tilpasningstilstande for gapped, lokale og parret ende (paired-end).

The package is enhanced by the following packages: bowtie2-examples
Please cite: Ben Langmead and Steven L Salzberg: Fast gapped-read alignment with Bowtie 2. (PubMed) Nature Methods 9:357–359 (2012)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Topics: Genomics
Bwa
Burrows-Wheeler Aligner (sekvenssammenligner)
Versions of package bwa
ReleaseVersionArchitectures
wheezy0.6.2-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
sid0.7.17-3amd64
bullseye0.7.17-3amd64
buster0.7.17-3amd64
stretch0.7.15-2+deb9u1amd64
jessie0.7.10-1amd64
squeeze0.5.8c-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
Debtags of package bwa:
biologynuceleic-acids, peptidic
fieldbiology, biology:bioinformatics
interfacecommandline, text-mode
roleprogram
useanalysing, comparing
Popcon: 33 users (22 upd.)*
Versions and Archs
License: DFSG free
Git

Burrows-Wheeler Aligner (BWA) er en programpakke, for oversættelse af lavafvigende sekvenser mod en stor referencearvemasse, såsom den menneskelige arvemasse. Den består af tre algoritmer: BWA-backtrack, BWA-SW og BWA-MEM. Den første algoritme er designet for Illunina-sekvenslæsninger op til 100 bp, mens de sidste to er for længere sekvenser fra 70 bp til 1 Mbp. BWA-MEM og BWA-SW deler funktioner såsom understøttelse af long-read og opdelingssammenligning, men BWA-MEM, som er den seneste, anbefales generelt for højkvalitets forespørgsler, da den er hurtigere og mere præcis. BWA-MEM har også bedre ydelse end BWA-backtrack for 70-100 bp Illumina-læsninger.

Please cite: Heng Li and Richard Durbin: Fast and accurate short read alignment with Burrows-Wheeler transform. (PubMed,eprint) Bioinformatics 25(14):1754-1760 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Canu
Enkel molekyle sekvenssamler for genomer
Versions of package canu
ReleaseVersionArchitectures
sid1.9+dfsg-1amd64,ppc64el
buster1.8+dfsg-2amd64
bullseye1.8+dfsg-2amd64
Popcon: 3 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Canu er en forgrening af Celera Assembler, designet for høj-støj enkel molekyle sekvensopbygning (såsom PacBio RS II eller Oxford Nanopore MinION).

Canu er en hierarkisk samlelinje, som kører i fire trin:

  • Detekter overlap i sekvenser med høj støj med MHAP
  • Opret korrigeret sekvenskonsensus
  • Trim rettede sekvenser
  • Saml trimmede rettede sekvenser
Please cite: Sergey Koren, Brian P. Walenz, Konstantin Berlin, Jason R. Miller and Adam M. Phillippy: Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation. bioRxiv (2016)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Remark of Debian Med team: Genome assembly and large-scale genome alignment (http://www.cbcb.umd.edu/software/)
Changeo
Repertoire klonal assignment toolkit - Python 3
Versions of package changeo
ReleaseVersionArchitectures
sid0.4.6-1all
buster0.4.5-1all
bullseye0.4.5-1all
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Change-O er en samling af værktøjer til at behandle resultatet fra V(D)J-sammenligningsværktøjer, tildele klonale klynger til immunglobulin-sekvenser (Ig) og genkonstruktion til germline-sekvenser.

Dramatiske forbedringer i høj-gennemløb sekvensteknologier aktiverer nu karakterisering af Ig-repertoirer i stor skala, defineret som samlingen af trans-membran antigen-receptor proteiner placeret på overfladen af B-celler og T-celler. Change-O er en pakke af redskaber til at facilitere avanceret analyse af Ig- og TCR-sekvenser, der følger germline-segmentsammenligning. Change-O håndterer resultatet fra IMGT/HighV-QUEST og IgBLAST og tilbyder en bred vifte af klyngemetoder for tildeling af klonale grupper til Ig-sekvenser. Postsortering, gruppering og diverse databasemanipuleringsoperationer er også indeholdt.

Denne pakke installerer biblioteket for Python 3.

Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Link to publication (PubMed,eprint) Bioinformatics 31(20):3356-3358 (2015)
Registry entries: OMICtools  bioconda 
Crac
Integreret RNA-Seq-læsanalyse
Versions of package crac
ReleaseVersionArchitectures
stretch2.5.0+dfsg-1amd64
buster2.5.0+dfsg-3amd64,arm64,mips64el,ppc64el
bullseye2.5.2+dfsg-2amd64,arm64,mips64el,ppc64el
sid2.5.2+dfsg-2amd64,arm64,mips64el,ppc64el
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

CRAC er et værktøj til at analysere High Throughput Sequencing-data (HTS) sammenlignet med et referencegenom. Er lavet for transkriptomisk og genomisk sekvenslæsninger. Mere præcist, med transkriptomiske læsninger som inddata, så forudsiges punktmutationer, indel'er, delingspunkt og chimerisk RNA'er (dvs. ikke kolinære delingspunkter). CRAC kan også vise positioner og natur for sekvensfejl som detekteres i læsningerne. CRAC bruger et genomindeks. Dette indeks skal beregnes før kørsel af læseanalysen. Til dette formål bruges kommandoen »crac-index« på dine genmofiler. Du kan så behandle læsningerne via kommandoen crac. Se manualsiden for CRAC (hjælpefilen) ved at taste »man crac«. CRAC kræver en stor mængde hukommelse på din computer. For behandling mod menneskegenomer, f.eks. for 50 millioner læsninger med 100 nukleotider hver kræver CRAC omkring 40 gigabyte hovedhukommelse. Kontroller, om systemet for din beregningsserver er udstyret med tilstrækkelig mængde hukommelsen, før start af en analyse.

Please cite: Eliseos J. Mucaki, Natasha G. Caminsky, Ami M. Perri, Ruipeng Lu, Alain Laederach, Matthew Halvorsen, Joan H. M. Knoll and Peter K. Rogan: A unified analytic framework for prioritization of non-coding variants of uncertain significance in heritable breast and ovarian cancer. (PubMed) BMS Medical Genomics 9:19 (2016)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Cutadapt
Rens biologiske sekvenser fra sekvenslæsninger med høj gennemløb
Versions of package cutadapt
ReleaseVersionArchitectures
stretch1.12-2all
sid2.6-1all
sid2.4-2all
buster1.18-1all
bullseye2.4-2all
Popcon: 6 users (14 upd.)*
Versions and Archs
License: DFSG free
Git

Cutadapt hjælper med biologisk sekvensrensningsopgaver ved at finde adapter- eller primer-sekvenserne på en fejltolerant måde. Kan også ændre og filtrere læsninger på forskellige måder. Adaptersekvenser kan indeholde IUPAC-jokertegn. Også paired-end-læsninger og selv farverumsdata er understøttet. Hvis du ønsker det, så kan du også bare demultiplexe dine inddata, uden at fjerne adaptersekvenser overhovedet.

Denne pakke indeholder brugerfladen.

Please cite: Marcel Martin: Cutadapt removes adapter sequences from high-throughput sequencing reads. (eprint) EMBnet.journal 17(1):10-12 (2015)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Daligner
Lokal tilpasningsregistrering mellem lange nukleotidsekventeringslæsninger
Versions of package daligner
ReleaseVersionArchitectures
sid1.0+git20180524.fd21879-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0+20161119-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0+git20180524.fd21879-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0+git20180524.fd21879-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream1.0+git20191106.64757e3
Popcon: 5 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

Disse værktøjer gør det muligt at finde alle signifikante lokale tilpasninger mellem læsninger kodet i en Dazzler-database. Antagelsen er at læsningerne er fra en »Pacific Biosciences RS II long read sequencer«. Det vil sige, at læsningerne er lange og usikre, op til 15 % i gennemsnit.

Please cite: Gene Myers: Efficient Local Alignment Discovery amongst Noisy Long Reads. 8701:52-67 (2014)
Registry entries: SciCrunch  OMICtools  bioconda 
Deepnano
Alternativ basecaller for MinION-læsninger af genomsekvenser
Versions of package deepnano
ReleaseVersionArchitectures
sid0.0+git20170813.e8a621e-3.1amd64,arm64,armhf,i386,ppc64el,s390x
bullseye0.0+git20170813.e8a621e-3.1amd64,arm64,armhf,i386,ppc64el,s390x
buster0.0+git20170813.e8a621e-3amd64,arm64,i386,ppc64el,s390x
Popcon: 3 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

DeepNano er en alternativ basecaller for Oxford Naopore MinION-læsninger baseret på dybe tilbagevendende neurale netværk.

I øjeblikket fungerer den med SQK-MAP-006 og SQK-MAP-005 kemi og har en efterbrænder for Metrichor.

Please cite: Vladimír Boža, Broňa Brejová and Tomáš Vinař: DeepNano: Deep recurrent neural networks for base calling in MinION nanopore reads. PLOS one (2017)
Registry entries: OMICtools 
Dindel
Bestemmer indel-kald fra kort-læst data
Versions of package dindel
ReleaseVersionArchitectures
buster1.01-wu1-3+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.01-wu1-3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.01-wu1-3+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.01+dfsg-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Dindel er et program til at kalde små »indels« fra kort-læst sekvensdata (»næstegenerations sekvensdata«). Er i øjeblikket designet til kun at håndtere Illumina-data.

Dindel kræver en BAM-fil indeholdende læs-sammenligninger som inddata. Programmet udtrækker så kandidat-indels fra BAM-filen, og laver ny sammenligning af læsningerne for at kandidere haplotyper bestående af disse kandidat-indels. Hvis der er tilstrækkelig evidens for en alternativ haplotype til referencen, så vil programmet kalde en indel.

Det er muligt at teste indels registret med andre metoder via brug af Dindel, for eksempel længere indels indhentet via samlingsmetoder. Dindel vil så lave sammenligning for både oversatte og ej oversatte læsninger for at se om kandidat-indelen er understøttet af læsningerne.

Dindel viser både genotypesandsynligheder og inkluderer et skript til at konvertere disse til en VCF-fil med indel- og SNP-kald.

Der er grundlæggende understøttelse for visning af nye udredede BAM-filer for hvert udredningsvindue. Disse udredede BAM-filer kan bruges til at kalde SNP'er tæt på (kandidat) indels.

Please cite: Cornelis A. Albers, Gerton Lunter, Daniel G. MacArthur, Gilean McVean, Willem H. Ouwehand and Richard Durbin: Dindel: Accurate indel calls from short-read data. (PubMed,eprint) Genome Research 21(6):961-973 (2010)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Topics: DNA structural variation
Discosnp
Find enkel nukleotidpolymorfisme fra rå læsning af sæt
Versions of package discosnp
ReleaseVersionArchitectures
sid2.3.0-2amd64,arm64,i386,mips64el,ppc64el,s390x
stretch1.2.6-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.2.5-1amd64,armel,armhf,i386
buster2.3.0-2amd64,arm64,i386,mips64el,ppc64el,s390x
bullseye2.3.0-2amd64,arm64,i386,mips64el,ppc64el,s390x
Popcon: 7 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Software discoSnp er designet til at opdage Single Nukleotid Polymorfi (SNP) fra rå læsning af sæt indhentet med Next Generation Sequencers (NGS).

Bemærk at antallet af læsesæt ikke er begrænset, det kan være en, to, eller mere. Bemærk også, at ingen andre oplysninger som reference arvemasse eller anmærkninger er nødvendige.

Programmet består af to moduler. Første modul, kissnp2, detekterer SNP'er fra læst sæt. Et andet modul, kissreads, forbedrer kissnp2- resultater ved at beregne per læst sæt og for hvert fundet SNP:

 1) dets middel læsedækning
 2) (Phred) kvaliteten af læsninger oprettet af polymorfismen.

Dette program efterfølges af DiscoSnp++.

Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Dnaclust
Værktøj til klyngedannelse af korte DNA-sekvenser
Versions of package dnaclust
ReleaseVersionArchitectures
jessie3-2amd64,armel,armhf,i386
sid3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch3-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3-7amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 6 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Dnaclust er et værktøj til klyngedannelse af et stort antal korte DNA-sekvenser. Klyngerne oprettes på en måde så »radiussen« for hver klynge ikke er større end den angivne tærskel.

Inddatasekvenserne der skal indgå i klyngedannelsen skal være i formatet Fasta. Id'en for hver sekvens er baseret på det første ord i sekvensen i formatet Fasta. Det første ord er præfikset for teksthovedet til den første forekomst af mellemrum i teksthovedet.

Please cite: Mohammadreza Ghodsi, Bo Liu and Mihai Pop: DNACLUST: accurate and efficient clustering of phylogenetic marker genes. (PubMed,eprint) BMC Bioinformatics 12:271 (2011)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Dwgsim
Simulator til kort sekventeringslæsninger
Versions of package dwgsim
ReleaseVersionArchitectures
stretch0.1.11-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.1.12-2amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
bullseye0.1.12-2amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
buster0.1.12-2amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

DWGSIM simulerer kort sekventeringslæsninger fra moderne sekventeringsplatform. DWGSIM opretter basisfejlsatser via en parametrisk model, hvilket giver en mere realistisk fejlprofil. Programmet blev oprindelig udviklet til brug i evaluering af korte læsningsjusteringer.

Registry entries: SciCrunch  OMICtools  bioconda 
Ea-utils
Værktøjer til kommandolinjen for behandling af biologiske sekvensdata
Versions of package ea-utils
ReleaseVersionArchitectures
bullseye1.1.2+dfsg-5amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.1.2+dfsg-5amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.1.2+dfsg-5amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.1.2+dfsg-4amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream1.04.807
Popcon: 9 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

Ea-utils tilbyder et sæt af værktøjer til kommandolinjen for behandling af biologiske sekvensdata, stregkodedemultiplexing, adaptertrimming etc.

Primært skrevet for at understøtte en Ilumina-baseret datakanal - men bør fungere med enhver FASTQ.

De vigtigste værktøjer er:

  • fastq-mcf Skanner en sekvensfil for adaptere og baseret på en logskaleret tærskel bestemmes et sæt af klippende parametre og klipningen udføres. Udfører også detektering af skævvridning og kvalitetfiltrering.

  • fast-multx Demultiplexer en fastq. Kan automatisk bestemme stregjkode-id'er baseret på et mastersætfelt. Bevarer flere læsninger i synkronisering under demultiplexing. Kan også verificere at læsninger er synkrone og fejler hvis ikke.

  • fast-join Svarer til audy' stitch-program, men i C, mere effektivt og understøtter nogle automatiske sammenligninger og indstillingsforbedringer. Den bruger den samme »kvadreret afstand til forankrede tilpasning« som andre værktøjer.

  • varcall Tager en samling og beregner varianter på en mere parameteropbygget måde end andre værktøjer.

Please cite: Erik Aronesty: Comparison of Sequencing Utility Programs. (eprint) The Open Bioinformatics Journal 7:1-8 (2013)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Fastaq
Manipuleringsværktøjer til FASTA- og FASTQ-filer
Versions of package fastaq
ReleaseVersionArchitectures
sid3.17.0-2all
jessie1.5.0-1all
bullseye3.17.0-2all
buster3.17.0-2all
stretch3.14.0-1all
Popcon: 8 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Fastaq repræsenterer en alsidig samling af skripter, som udfører nyttige og gængse FASTA/FASTQ-manipuleringsopgaver, såsom filtrering, sammenføjning, opdeling, sortering, trimning, søg/erstat etc. Inddata- og uddatafiler kan gzippes (formatet detekteres normalt automatisk) og individuelle Fastaq-kommandoer kan kanaliseres sammen.

Registry entries: OMICtools 
Topics: Bioinformatics
Fastp
Ultrahurtig alt i en FASTQ-forbrænder
Versions of package fastp
ReleaseVersionArchitectures
bullseye0.20.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.19.6+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid0.20.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Alt i en FASTQ-forbrænder, fastp tilbyder funktioner inklusive kvalitetsprofilering, adaptertilpasning, læsefiltrering og basiskorrektion. Programmet understøtter både single-end og paired-end korte læsedata og tilbyder også en grundlæggende understøttelse for long-read data.

Please cite: Shifu Chen, Yanqing Zhou, Yaru Chen and Jia Gu: fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics 34(17):i884-i890 (2018)
Registry entries: OMICtools  bioconda 
Fastqc
Kvalitetskontrol for høj gennemløb af sekvensdata
Versions of package fastqc
ReleaseVersionArchitectures
bullseye0.11.8+dfsg-2all
buster0.11.8+dfsg-2all
jessie0.11.2+dfsg-3all
sid0.11.8+dfsg-2all
stretch0.11.5+dfsg-6all
Popcon: 19 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

FastQC forsøger at tilbyde en simpel måde at udføre lidt kvalitetskontrol på rå sekvensdata, der kommer fra sekvensdatakanaler med høj gennemløb. Programmet tilbyder et modulsæt af analyser, som du kan bruge til et hurtigt indtryk af om dine data har nogle problemer, som du skal være opmærksom på før du udfører yderligere analyse.

Hovedfunktionerne i FastQc er

  • Import af data fra BAM-, SAM- eller FastQ-filer (alle varianter)
  • Tilbyder et hurtigt overblik som fortæller dig i hvilke områder, der kan være problemer
  • Referatgrafer og tabeller til hurtigt at tilgå dine data
  • Eksport af resultater til en HTML-baseret permanent rapport
  • Operation uden internet til automatiseret oprettelse af rapporter uden at køre det interaktive program
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Topics: Sequencing
Fastx-toolkit
forbehandlingsværktøjer til læsning af korte FASTQ/A-nukleotider
Versions of package fastx-toolkit
ReleaseVersionArchitectures
sid0.0.14-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.0.14-6amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.0.14-6amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch0.0.14-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie0.0.14-1amd64,armel,armhf,i386
wheezy0.0.13.2-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
Debtags of package fastx-toolkit:
roleprogram
Popcon: 11 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

FASTX-Toolkit er en samling af kommandolinjeværktøjer for forbehandling af korte nukleotidlæsninger i FASTA- og FASTQ-formater, normalt udarbejdet af Next-Generation sekvensmaskiner. Hovedbehandlingen af sådanne FASTA/FASTQ-filer er oversættelse (justering) af sekvenserne til referencegenomer eller andre databaser der bruger specialiserede programmer såsom BWA, Bowtie og mange andre. Det er dog undertiden mere produktivt at forbehandle FASTA/FASTQ-filerne, forud for oversættelse af sekvenserne til genom-manipulering, for at fremstille bedre oversættelsesresultater. FASTX-Toolkit-værktøjer udfører nogle af disse forbehandlingsopgaver.

Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Topics: Sequencing
Flexbar
Fleksibel stregkode og adapterfjernelse for sekvensplatforme
Versions of package flexbar
ReleaseVersionArchitectures
stretch2.50-2amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el
sid3.5.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster3.4.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye3.5.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie2.50-1amd64,armhf,i386
Popcon: 8 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Flexbar forbehandler high-throughput sekventeringsdata effektivt. Programmet demultiplekser stregkodede kørsler og fjerner adaptersekvenser. Endvidere tilbydes trimnings- og filtreringsfunktioner. Flexbar øger oversættelseshastigheder og forbedrer arvemasse- og transskriptome-samlinger. Programmet understøtter næstegeneration sekventeringsdata i fasta/q- og csfasta/q-format fra Illumina, Roche 454 og SOLID-platformen.

Parameternavne ændret i FLEXBAR. Gennemse venligst skripter. De seneste måneder, standardindstillinger blev optimeret, blev flere fejl fastsat og forskellige forbedringer blev foretaget, f.eks blev grænsefladen for kommandolinjen moderniseret, nye trimningstilstande samt lavere tids- og hukommelseskrav.

Please cite: Matthias Dodt, Johannes T. Roehr, Rina Ahmed and Christoph Dieterich: FLEXBAR — Flexible Barcode and Adapter Processing for Next-Generation Sequencing Platforms. (eprint) Biology 1(3):895-905 (2012)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Fml-asm
Værktøj til at samle Illuminakorte læsninger i små områder
Versions of package fml-asm
ReleaseVersionArchitectures
bullseye0.1-5amd64
stretch0.1-2amd64
sid0.1-5amd64
buster0.1-5amd64
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Fml-asm er et kommandolinjeværktøj til at samle Illuminakorte læsninger i områder fra 100bp til 10 millioner bp i størrelse, baseret på biblioteket fermi-lite. Det er hovedsagelig en mindre version i hukommelsen af fermikit uden oprettelse af nogen mellemliggende filer. Værktøjet arver ydelsen, det relative lille hukommelsesaftryk og funktionerne fra fermikit. Fermi-lite er specielt god til at bevare heterozgous-hændelser og kan derfor bruges til at samle diploide områder for variantkald.

Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Fsm-lite
Frekvensbaseret strengminering - lite
Versions of package fsm-lite
ReleaseVersionArchitectures
stretch1.0-2amd64,arm64,mips64el,ppc64el,s390x
sid1.0-3amd64,arm64,mips64el,ppc64el,s390x
bullseye1.0-3amd64,arm64,mips64el,ppc64el,s390x
buster1.0-3amd64,arm64,mips64el,ppc64el,s390x
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

En implementering af frekvensbaseret understrengsminering for en kerne brugt i bioinformatik til at udtrække understrenge som diskriminerer to (eller flere) datasæt inden i sekvensdata med høj gennemløb.

Registry entries: SciCrunch  OMICtools  bioconda 
Giira
RNA-Seq-drevet gen-registrering der indarbejder tvetydige læsninger
Versions of package giira
ReleaseVersionArchitectures
sid0.0.20140625-2amd64
bullseye0.0.20140625-2amd64
buster0.0.20140625-2amd64
stretch0.0.20140625-1amd64
jessie0.0.20140210-2amd64
Popcon: 6 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

GIIRA er en gen-forudsigelsesmetode, der identificerer potentielle kodningsregioner udelukkende baseret på kortlægning af læsninger fra et RNA-Seq-eksperiment. Det blev hovedsagelig konstrueret til prokaryotisk gen-forudsigelse og er i stand til at vise gener inden i den viste region for et operon. Det kan også bruges til eukaryoter og forudsiger exon-intron- strukturer samt alternative isoformer.

Please cite: Franziska Zickmann, Martin S. Lindner and Bernhard Y. Renard: GIIRA—RNA-Seq driven gene finding incorporating ambiguous reads. (PubMed,eprint) Bioinformatics (2013)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Grinder
Alsidige omics shotgun og amplikon sekventeringslæsningssimulator
Versions of package grinder
ReleaseVersionArchitectures
sid0.5.4-5all
jessie0.5.3-3all
stretch0.5.4-1all
bullseye0.5.4-5all
buster0.5.4-5all
wheezy0.4.5-1all
Popcon: 5 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Grinder er et alsidigt program til at skabe tilfældige shotgun og amplikon sekvensbiblioteker baseret på DNA, RNA eller proteinreferencesekvenser tilvejebragt i en FASTA-fil.

Grinder kan producere genomisk, metagenomisk, transkriptom, metatranscriptomic, proteomiske, metaproteomic shotgun og amplicon datasæt fra nuværende sekventeringsteknologier som Sanger, 454, Illumina. Disse simulerede datasæt kan bruges til at teste nøjagtigheden af bioinformatiske værktøjer under specifik hypotese, f.eks med eller uden sekventeringsfejl eller med lav eller høj samfundsmangfoldighed. Grinder kan også bruges til at hjælpe vælge mellem alternative sekventeringsmetoder til et sekvensbaseret projekt, f.eks skal biblioteket paired-end eller ej, hvor mange læsninger skal sekventeres.

Please cite: Florent E. Angly, Dana Willner, Forest Rohwer, Philip Hugenholtz and Gene W. Tyson: Grinder: a versatile amplicon and shotgun sequence simulator. (PubMed,eprint) Nucleic Acids Research Epub ahead of print (2012)
Registry entries: SciCrunch  OMICtools 
Hilive
Realtid sammenligning af Illumina-læsninger
Versions of package hilive
ReleaseVersionArchitectures
buster1.1-2amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
stretch0.3-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
sid2.0a-1armel
sid1.1-3mipsel,ppc64el
sid2.0a-2amd64,arm64,armhf,mips64el,s390x
bullseye1.1-3amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

HiLive er et læs-oversættelsesværktøj som oversætter Illumina HiSeq (eller sammenlignelige) læsninger til et referencegenom lige i det øjeblik de fremstilles. Dette indebærer at læs-oversættelse er færdig lige så snart sequenceren er færdig med at oprette dataene.

Please cite: Martin S. Lindner, Benjamin Strauch, Jakob M. Schulze, Simon H. Tausch, Piotr W. Dabrowski, Andreas Nitsche and Bernhard Y. Renard: HiLive: real-time mapping of illumina reads while sequencing. (PubMed) Bioinformatics 33(6):917-919 (2017)
Registry entries: OMICtools 
Hinge
Assembler til læsning af lange genomer baseret på hinging
Versions of package hinge
ReleaseVersionArchitectures
sid0.5.0-4amd64,arm64,mips64el,ppc64el
bullseye0.5.0-4amd64,arm64,mips64el,ppc64el
buster0.5.0-4amd64,arm64,mips64el,ppc64el
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

HINGE er en genomassembler, som forsøger at opnå optimal gentagelsesopslag ved at skelne gentagelser, som kan slås op givet dataene fra disse som ikke kan. Dette opnås ved at tilføje »hinges« til læsninger for at konstruere en graf med overlap hvor kun gentagelser, der ikke kunne slås op, sammenføjes. Som resultat kombinerer HINGE fejltolerancen for overlap-baserede assemblere med gentag-opslags funktioner for de Bruijn-grafassemblere.

Please cite: Govinda M Kamath, Ilan Shomorony, Fei Xia, Thomas Courtade and David N Tse: HINGE: Long-read assembly achieves optimal repeat resolution. (PubMed,eprint) Genome Research (2017)
Registry entries: OMICtools 
Hisat2
Grafbaseret sammenligning af korte nukleoide læsninger for mange genomer
Versions of package hisat2
ReleaseVersionArchitectures
bullseye2.1.0-2amd64
stretch2.0.5-1amd64
buster2.1.0-2amd64
sid2.1.0-2amd64
Popcon: 9 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

HISAT2 er et hurtigt og sensitivt sammenligningsprogram for oversættelse af sekvenslæsning i næste generation (både DNA og RNA) til en population af genomer fra mennesker (samt mod et enkelt referencegenom). Baseret på en udvidelse af BWT for grafer blev et graf FM-indeks designet og implementeret. Udover at bruge et globalt GFM-indeks, som repræsenterer en population af genomer for mennesker, så bruger HISAT2 et stort sæt af små GFM-indeks, som kollektivt dækker hele genomet (hvert indeks repræsenterer et genomområde på 56 Kbp, med 55.000 indeks krævet for at dække menneskepopulationen). Disse små indeks (kaldt lokale indeks), kombineret med flere sammenligningsstrategier muliggør hurtig og præcis sammenligning af sekvenslæsninger. Dette nye indeksskema kaldes et Hierarchical Graph FM-indeks (HGFM).

Please cite: Daehwan Kim, Ben Langmead and Steven L Salzberg: HISAT: a fast spliced aligner with low memory requirements. Nature Methods 12(4):357-360 (2015)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Idba
Iterativ De Bruijn Graph De Novo-kortlæserassemblere
Versions of package idba
ReleaseVersionArchitectures
stretch1.1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.1.3-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.1.2-1amd64,armel,armhf,i386
sid1.1.3-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.3-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.1.3-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.1.2-1amd64,armel,armhf,i386
sid1.1.3-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.1.3-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 6 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

IDBA står for iterative de Bruijn-grafassembler. I beregningssekvensbiologi så løser en assembler puslespillet fra store sekvensmaskiner, som har mange gigabyte med korte læsninger fra et stort genom.

Denne pakke tilbyder flere varianter af IDBA-assembleren, da de alle deler det samme kildetræ men har forskellige formål og udvikler sig over tid.

IDBA er den grundlæggende iterativ de Bruijn-grafassembler for anden generations sekvenslæsninger. IDBA-UD, en udvidelse af IDBA, er designet til at udnytte parret-slut-læsninger til at samle regioner på lav dybde og bruge progressiv dybde på config'er til at reducere fejl i regioner med høj dybde. Det er en generisk formålsassembler og specielt god til enkel-celle og metagenomiske sekvensdata. IDBA-Hybrid er en anden opdateret version af IDBA-UD, som kan gør brug af et lignende referencegenmom til at forbedre assembly-resultat. IDBA-Tran er en iterativ de Bruijn-grafassembler for RNA-seq-data.

Please cite: Yu Peng, Henry C. M. Leung, S. M. Yiu and Francis Y. L. Chin: IDBA-UD: a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth. (PubMed,eprint) Bioinformatics 28(11):1420-1428 (2012)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Igdiscover
analyzes antibody repertoires to find new V genes
Versions of package igdiscover
ReleaseVersionArchitectures
sid0.11-3all
Popcon: users ( upd.)*
Versions and Archs
License: DFSG free
Git

IgDiscover analyzes antibody repertoires and discovers new V genes from high-throughput sequencing reads. Heavy chains, kappa and lambda light chains are supported (to discover VH, VK and VL genes).

Please cite: Martin M. Corcoran, Ganesh E. Phad, Néstor Vázquez Bernat, Christiane Stahl-Hennig, Noriyuki Sumida, Mats A.A. Persson and Marcel Martin & Gunilla B. Karlsson Hedestam: Production of individualized V gene databases reveals high levels of immunoglobulin genetic diversity.. (eprint) Nature Communications 7:13642 (2016)
Registry entries: Bio.Tools  OMICtools  bioconda 
Igor
Infers V(D)J-rekombinationsproces fra sekvensdata
Versions of package igor
ReleaseVersionArchitectures
sid1.3.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.3.0+dfsg-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.3.0+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

IGoR (Inference and Generation of Repertoires) er et alsidigt program til at analysere og modellere immunreceptoroprettelse, udvælgelse, mutation og alle andre processer.

Please cite: Quentin Marcou, Thierry Mora and Aleksandra M. Walczak: High-throughput immune repertoire analysis with IGoR. (PubMed) Nature Communications 9(1):561 (2018)
Registry entries: OMICtools  bioconda 
Iva
Iterativ virussekvensassembler
Versions of package iva
ReleaseVersionArchitectures
bullseye1.0.9+ds-6amd64,arm64,mips64el,ppc64el
sid1.0.9+ds-6amd64,arm64,mips64el,ppc64el
stretch1.0.8+ds-1amd64,arm64,mips64el,ppc64el
buster1.0.9+ds-6amd64,arm64,mips64el,ppc64el
Popcon: 5 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

IVA er en de novo-assembler designet til at samle virusgenomer, som ikke har gentagelsessekvenser, via Illuminalæste par sekventeret fra blandede populationer ved ekstrem høj dybde.

IVA's hovedalgoritme fungerer ved iterativt at udvide config'er via justerede læste par. Dets inddata kan bare være læste par, eller du kan derudover tilbyde et eksisterende sæt af contig'er til udvidelse. Alternativt kan programmet anvende læsninger sammen med en referencesekvens.

Please cite: M. Hunt, A. Gall, S. H. Ong, J. Brener, B. Ferns, P. Goulder, E. Nastouli, J. A. Keane, P. Kellam and T. D. Otto: IVA: accurate de novo assembly of RNA virus genomes. (PubMed) Bioinformatics 31(14):2374-2376 (2015)
Registry entries: Bio.Tools  OMICtools  bioconda 
Khmer
I-hukommelse DNA-sekvens kmer-optælling, filtrering og grafgennemløb
Versions of package khmer
ReleaseVersionArchitectures
buster2.1.2+dfsg-6amd64,arm64
stretch2.0+dfsg-10amd64,arm64,mips64el,ppc64el
bullseye2.1.2+dfsg-6amd64,arm64
sid2.1.2+dfsg-6amd64,arm64
Popcon: 5 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Khmer et et bibliotek og programpakke med værktøjer for kommandolinjen til arbejdet med DNA-sekvenser. Det er primært rettet mod kort-læs sekvensdata såsom dem lavet af Illuminaplatformen. Khmer bruger en k-mer-centrisk fremgangsmåde til sekvensanalyse, deraf navnet.

Please cite: Michael R. Crusoe, Hussien F. Alameldin, Sherine Awad, Elmar Bucher, Adam Caldwell, Reed Cartwright, Amanda Charbonneau, Bede Constantinides, Greg Edvenson, Scott Fay, Jacob Fenton, Thomas Fenzl, Jordan Fish, Leonor Garcia-Gutierrez, Phillip Garland, Jonathan Gluck, Iván González, Sarah Guermond, Jiarong Guo, Aditi Gupta, Joshua R. Herr, Adina Howe, Alex Hyer, Andreas Härpfer, Luiz Irber, Rhys Kidd, David Lin, Justin Lippi, Tamer Mansour, Pamela McA'Nulty, Eric McDonald, Jessica Mizzi, Kevin D. Murray, Joshua R. Nahum, Kaben Nanlohy, Alexander Johan Nederbragt, Humberto Ortiz-Zuazaga, Jeramia Ory, Jason Pell, Charles Pepe-Ranney, Zachary N Russ, Erich Schwarz, Camille Scott, Josiah Seaman, Scott Sievert, Jared Simpson, Connor T. Skennerton, James Spencer, Ramakrishnan Srinivasan, Daniel Standage, James A. Stapleton, Joe Stein, Susan R Steinman, Benjamin Taylor, Will Trimble, Heather L. Wiencko, Michael Wright, Brian Wyss, Qingpeng Zhang, en zyme and C. Titus Brown: The khmer software package: enabling efficient sequence analysis. (2015)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Kissplice
Detektion af diverse slags polymorfismer i RNA-sekvensdata
Versions of package kissplice
ReleaseVersionArchitectures
bullseye2.4.0-p1-5amd64,arm64,mips64el,ppc64el
stretch2.4.0-p1-1amd64,arm64,mips64el,ppc64el
jessie2.2.1-3amd64
sid2.4.0-p1-5amd64,arm64,mips64el,ppc64el
buster2.4.0-p1-4amd64,arm64,mips64el,ppc64el
Debtags of package kissplice:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
works-withbiological-sequence
Popcon: 7 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

KisSplice er et program, som gør det muligt at analysere RNA-sekvensdata med eller uden en referencearvemasse. Det er en præcis lokal transcriptome assembler hvor du kan identificere SNP'er, indels og alternative splicing-hændelser. Programmet kan håndtere et arbitrært antal biologiske betingelser og vil kvantificere hver variant i hver betingelse. Programmet er blevet testet på Illumina-datasæt på op til 1G-læsninger. Dets hukommelsesforbrug er omkring 5 Gb for 100 millioner læsninger.

Please cite: Gustavo AT Sacomoto, Janice Kielbassa, Rayan Chikhi, Raluca Uricaru, Pavlos Antoniou, Marie-France Sagot, Pierre Peterlongo and Vincent Lacroix: KISSPLICE: de-novo calling alternative splicing events from RNA-seq data. (PubMed,eprint) BMC Bioinformatics 13((Suppl 6)):S5 (2012)
Registry entries: SciCrunch  OMICtools  bioconda 
Topics: RNA-seq; RNA splicing; Gene structure
Kraken
Tildeling af taksonomiske etiketter til korte DNA-sekvenser
Versions of package kraken
ReleaseVersionArchitectures
sid1.1.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
buster1.1-3amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch0.10.5~beta-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.1.1-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
Popcon: 6 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Kraken er et system til tildeling af taksonomiske etiketter til korte DNA- sekvenser, normalt indhentet via metagenomiske studier. Tidligere forsøg fra andre bioinformatikprogrammer på at fuldføre denne opgave har ofte brugt sekvenssammenligning eller maskinindlæringsteknikker, som var ret så langsomme, hvilket førte til udviklingen af mindre sensitive men meget hurtigere programmer for overflodsestimering. Kraken forsøger at opnå høj sensitivitet og høj hastighed ved at udnytte præcise sammenligninger af k- mers og en ny klassifikationsalgoritme.

I sin hurtigste operationstilstand, for et simuleret metagenom for 100 bp- læsninger, behandlede Kraken over 4 millioner læsninger per minut på en enkel kerne, over 900 gange hurtigere end Megablast og over 11 gange hurtigere end overflodsestimeringsprogrammet MetaPhlAn. Krakens præcision er sammenlignelig med Megablast, med en smule mindre sensitivitet og meget høj præcision.

The package is enhanced by the following packages: jellyfish1
Please cite: Derrick E Wood and Steven L Salzberg: Kraken: ultrafast metagenomic sequence classification using exact alignments. (PubMed,eprint) Genome Biol. 15(3):R46 (2014)
Registry entries: Bio.Tools  OMICtools  bioconda 
Kraken2
taxonomic classification system using exact k-mer matches
Versions of package kraken2
ReleaseVersionArchitectures
sid2.0.8~beta-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye2.0.8~beta-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

Kraken 2 is the newest version of Kraken, a taxonomic classification system using exact k-mer matches to achieve high accuracy and fast classification speeds. This classifier matches each k-mer within a query sequence to the lowest common ancestor (LCA) of all genomes containing the given k-mer. The k-mer assignments inform the classification algorithm. [see: Kraken 1's Webpage for more details].

Kraken 2 provides significant improvements to Kraken 1, with faster database build times, smaller database sizes, and faster classification speeds. These improvements were achieved by the following updates to the Kraken classification program:

 1. Storage of Minimizers: Instead of storing/querying entire k-mers,
    Kraken 2 stores minimizers (l-mers) of each k-mer. The length of
    each l-mer must be ≤ the k-mer length. Each k-mer is treated by
    Kraken 2 as if its LCA is the same as its minimizer's LCA.
 2. Introduction of Spaced Seeds: Kraken 2 also uses spaced seeds to
    store and query minimizers to improve classification accuracy.
 3. Database Structure: While Kraken 1 saved an indexed and sorted list
    of k-mer/LCA pairs, Kraken 2 uses a compact hash table. This hash
    table is a probabilistic data structure that allows for faster
    queries and lower memory requirements. However, this data structure
    does have a <1% chance of returning the incorrect LCA or returning
    an LCA for a non-inserted minimizer. Users can compensate for this
    possibility by using Kraken's confidence scoring thresholds.
 4. Protein Databases: Kraken 2 allows for databases built from amino
    acid sequences. When queried, Kraken 2 performs a six-frame
    translated search of the query sequences against the database.
 5. 16S Databases: Kraken 2 also provides support for databases not
    based on NCBI's taxonomy. Currently, these include the 16S
    databases: Greengenes, SILVA, and RDP.
Please cite: Derrick E Wood and Steven L Salzberg: Kraken: ultrafast metagenomic sequence classification using exact alignments. (PubMed,eprint) Genome Biol. 15(3):R46 (2014)
Registry entries: Bio.Tools  OMICtools  bioconda 
Last-align
sammenligning af biologisk sekvenser på genom-skala
Versions of package last-align
ReleaseVersionArchitectures
sid984-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
squeeze128-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
wheezy199-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie490-1amd64,armel,armhf,i386
stretch830-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster963-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye984-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
upstream992
Debtags of package last-align:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
roleprogram
Popcon: 11 users (8 upd.)*
Newer upstream!
License: DFSG free
Git

LAST er programmel til sammenligning og justering af sekvenser, typisk DNA- eller protein-sekvenser. LAST ligner BLAST, men det er bedre til at håndtere meget store mængder af sekvensdata. Her er to ting som LAST er god til:

  • Sammenligning af store (eksempelvis pattedyrs) genomer.
  • Kortlægge masser af sekvens-mærker oven på et genom.

Den primære, tekniske innovation er at LAST finder indledende samstemmende forekomster, baseret på deres mangfoldighed, i stedet for at benytte en fast størrelse (BLAST bruger eksempelvis 10-mers). Dette gør, at man kan kortlægge mærker til genomer, uden gentagelsesmaskering (eng. »repeat- masking«), uden at blive overvældet af gentagne forekomster. For at finde disse forekomster som har forskellige størrelser, så bruger den en suffiks- række (inspireret af Vmatch). For at opnå høj følsomhed, så bruger den en usammenhængende suffiks-række, der er en analog til frø som placeres med mellemrum.

Please cite: Martin C. Frith, Raymond Wan and Paul Horton: Incorporating sequence quality data into alignment improves DNA read mapping. (PubMed,eprint) Nucl. Acids Res. 38(7):e100 (2010)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Libvcflib-tools
C++ library for parsing and manipulating VCF files (tools)
Versions of package libvcflib-tools
ReleaseVersionArchitectures
buster1.0.0~rc2+dfsg-2amd64
sid1.0.0+dfsg-2amd64,ppc64el
bullseye1.0.0+dfsg-2amd64
stretch1.0.0~rc1+dfsg1-3amd64
upstream1.0.1
Popcon: 5 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

The Variant Call Format (VCF) is a flat-file, tab-delimited textual format intended to concisely describe reference-indexed variations between individuals. VCF provides a common interchange format for the description of variation in individuals and populations of samples, and has become the defacto standard reporting format for a wide array of genomic variant detectors.

vcflib provides methods to manipulate and interpret sequence variation as it can be described by VCF. It is both:

  • an API for parsing and operating on records of genomic variation as it can be described by the VCF format,
  • and a collection of command-line utilities for executing complex manipulations on VCF files.

This package contains several tools using the library.

Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Macs
Modelbaseret analyse af ChIP-Seq på korte læsesekvenser
Versions of package macs
ReleaseVersionArchitectures
jessie2.0.9.1-1amd64,armel,armhf,i386
buster2.1.2.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.2.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.1.1.20160309-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream2.2.5
Popcon: 23 users (8 upd.)*
Newer upstream!
License: DFSG free
Git

MACS opbygger empirisk længden af de sekventerede ChIP-fragmenter, som tenderer til at være kortere end lydbehandling eller størrelsesestimater for bibliotekskonstruktion og bruger den til at forbedre den rumlige opløsning af forudsagte bindingssteder. MACS bruger også en dynamisk Poisson-fordeling til effektivt at fange lokale skævheder i arvemassesekvensen, hvilket giver mulighed for mere følsom og robust forudsigelse. MACS sammenligner positivt til eksisterende ChIP-Seq peak-finding-algoritmer, er offentligt tilgængelig åben kildekode og kan bruges til ChIP-Seq med eller uden kontrolprøver.

Please cite: Yong Zhang, Tao Liu, Clifford A Meyer, Jérôme Eeckhoute, David S. Johnson, Bradley E. Bernstein, Chad Nussbaum, Richard M. Myers, Myles Brown, Wei Li and X Shirley Liu: Model-based Analysis of ChIP-Seq (MACS). (PubMed,eprint) Genome Biol. 9(9):R137 (2008)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Mapdamage
tracking and quantifying damage patterns in ancient DNA sequences
Versions of package mapdamage
ReleaseVersionArchitectures
sid2.1.0+dfsg-1all
stretch2.0.6+dfsg-2all
buster2.0.9+dfsg-1all
bullseye2.1.0+dfsg-1all
upstream2.1.1
Popcon: 18 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

MapDamage is a computational framework written in Python and R, which tracks and quantifies DNA damage patterns among ancient DNA sequencing reads generated by Next-Generation Sequencing platforms.

MapDamage is developed at the Centre for GeoGenetics by the Orlando Group.

Please cite: Hákon Jónsson, Aurélien Ginolhac, Mikkel Schubert and Philip Johnson and Ludovic Orlando: mapDamage2.0: fast approximate Bayesian estimates of ancient DNA damage parameters. (PubMed,eprint) Bioinformatics 29(13):1682-4 (2013)
Registry entries: SciCrunch  OMICtools  bioconda 
Mapsembler2
bioinformatics targeted assembly software
Versions of package mapsembler2
ReleaseVersionArchitectures
stretch2.2.3+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
sid2.2.4+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
bullseye2.2.4+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
jessie2.1.6+dfsg-1amd64,armel,armhf,i386
buster2.2.4+dfsg-3amd64,arm64,armel,armhf,i386,ppc64el,s390x
Popcon: 8 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Mapsembler2 is a targeted assembly software. It takes as input a set of NGS raw reads (fasta or fastq, gzipped or not) and a set of input sequences (starters).

It first determines if each starter is read-coherent, e.g. whether reads confirm the presence of each starter in the original sequence. Then for each read-coherent starter, Mapsembler2 outputs its sequence neighborhood as a linear sequence or as a graph, depending on the user choice.

Mapsembler2 may be used for (not limited to):

  • Validate an assembled sequence (input as starter), e.g. from a de Bruijn graph assembly where read-coherence was not enforced.
  • Checks if a gene (input as starter) has an homolog in a set of reads
  • Checks if a known enzyme is present in a metagenomic NGS read set.
  • Enrich unmappable reads by extending them, possibly making them mappable
  • Checks what happens at the extremities of a contig
  • Remove contaminants or symbiont reads from a read set
Please cite: Pierre Peterlongo and Rayan Chikhi: Mapsembler, targeted and micro assembly of large NGS datasets on a desktop computer. (PubMed) BMC Bioinformatics 13:48 (2012)
Registry entries: Bio.Tools  OMICtools  bioconda 
Maq
kortlægger korte, fast-længde, polymorfiske DNA-sekvenslæsninger til reference-sekvenser
Versions of package maq
ReleaseVersionArchitectures
buster0.7.1-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.7.1-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.7.1-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
squeeze0.7.1-3amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
wheezy0.7.1-5amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie0.7.1-5amd64,armel,armhf,i386
stretch0.7.1-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package maq:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
scopeutility
useanalysing, comparing, searching
works-with-formatplaintext
Popcon: 14 users (25 upd.)*
Versions and Archs
License: DFSG free
Git

Maq (forkortelse af »Mapping and Assembly with Quality«) bygger kortlagte montager fra korte læsninger genereret af næste generation inden for maskiner til sekvensering. Det blev særligt designet til »Illumina-Solexa 1G Genetic Analyzer«, og har indledende funktionalitet til at håndtere ABI SOLid-data. Maq var tidligere kendt som mapass2.

Udvikling af Maq stoppede i 2008. Dets efterfølger er BWA og SAMtools.

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Maqview
Grafisk fremviser for læsesammenligninger for korte gensekvenser
Versions of package maqview
ReleaseVersionArchitectures
jessie0.2.5-6amd64,armel,armhf,i386
wheezy0.2.5-4amd64,armel,armhf,i386,ia64,mips,mipsel,powerpc,s390,s390x,sparc
stretch0.2.5-7amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.2.5-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.2.5-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.2.5-9amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 9 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Maqview er en grafisk fremviser for læsesammenligning. Den er specifikt designet for sammenligningsfilen Maq og giver dig mulighed for at se forskelle, basiskvaliteter og oversættelseskvaliteter. Maqview er ikke så smart som Consed eller GAP, men bare en simpel fremviser, så du kan se hvad der sker i et bestemt område.

I sammenligning med tgap-maq er den tekstbaserede fremviser for læsesammenligninger Maqview skrevet af James Bonfield hurtigere og den bruger mindre hukommelse og diskplads i sine indeks. Dette er muligt da tgap forsøger at være en almen fremviser, mens Maqview fuldt ud gør brug af det faktum, at en Maq-sammenligningsfil allerede er blevet sorteret. Maqview er også effektiv i fremvisning og tilbyder et kommandolinjeværktøj til hurtigt at hente ethvert område i en Maq-sammenligningsfil.

Please cite: Heng Li, Jue Ruan and Richard Durbin: Mapping short DNA sequencing reads and calling variants using mapping quality scores. (PubMed,eprint) Genome Research 18(11):1851-1858 (2008)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Mhap
locality-sensitive hashing to detect long-read overlaps
Versions of package mhap
ReleaseVersionArchitectures
sid2.1.3+dfsg-2all
stretch2.1.1+dfsg-1all
buster2.1.3+dfsg-2all
bullseye2.1.3+dfsg-2all
Popcon: 5 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

The MinHash Alignment Process (MHAP--pronounced MAP) is a reference implementation of a probabilistic sequence overlapping algorithm. Designed to efficiently detect all overlaps between noisy long-read sequence data. It efficiently estimates Jaccard similarity by compressing sequences to their representative fingerprints composed on min-mers (minimum k-mer).

Please cite: Konstantin Berlin, Sergey Koren, Chen-Shan Chin, James P Drake, Jane M Landolin and Adam M Phillippy: Assembling large genomes with single-molecule sequencing and locality-sensitive hashing. (PubMed) Nature Biotechnology 33(6):623–630 (2015)
Registry entries: OMICtools  bioconda 
Microbiomeutil
Microbiome Analysis Utilities
Versions of package microbiomeutil
ReleaseVersionArchitectures
sid20101212+dfsg1-2all
stretch20101212+dfsg1-1all
buster20101212+dfsg1-2all
bullseye20101212+dfsg1-2all
jessie20101212+dfsg-1all
Popcon: 6 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

The microbiomeutil package comes with the following utilities:

  • ChimeraSlayer: ChimeraSlayer for chimera detection.
  • NAST-iEr: NAST-based alignment tool.
  • WigeoN: A reimplementation of the Pintail 16S anomaly detection utility
  • RESOURCES: Reference 16S sequences and NAST-alignments that the tools above leverage.
Please cite: Brian J. Haas, Dirk Gevers, Ashlee M. Earl, Mike Feldgarden, Doyle V. Ward, Georgia Giannoukos, Dawn Ciulla, Diana Tabbaa, Sarah K. Highlander, Erica Sodergren, Barbara Methé, Todd Z. DeSantis, The Human Microbiome Consortium, Joseph F. Petrosino, Rob Knight and Bruce W. Birren: Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. (PubMed,eprint) Genome Research 21(3):494-504 (2011)
Registry entries: SciCrunch  OMICtools 
Mira-assembler
Hel Genome Shotgun og EST Sequence Assembler
Versions of package mira-assembler
ReleaseVersionArchitectures
jessie4.0.2-1amd64,armel,armhf,i386
buster4.9.6-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid4.9.6-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch4.9.6-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye4.9.6-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
wheezy3.4.0.1-3amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
Debtags of package mira-assembler:
roleprogram
Popcon: 6 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Mira er en specialiseret gensekvenssamler for sekvensprojekter regnet som »svære« på grund af et stort antal ensformige gentagelser. For expressed sequence tags-transskriptioner (EST'er) er miraEST specialiseret på rekonstruktion af urørte mRNA-transskriptioner mens det detekterer og klassificerer enlige nukleotidpolymorfismer (SNP), der opstår i forskellige variationer herudfra.

Sekvenssamleren bruges rutinemæssigt til forskellige opgaver såsom mutationsdetektering i forskellige celletyper, analyser af ligheder i transskriptioner mellem organismer og samling af urørte sekvenser fra forskellige kilder for oligodesign i kliniske mikroarrayeksperimenter.

Pakken tilbyder følgende kørbare filer:

  • mira: for samling af genomsekvenser
  • miramem: estimerer hukommelsen krævet af et projekt. Fungerer ved at lænke til mira.
  • mirabait: et »grep«-lignende værktøj til at vælge læsninger med kmerer op til 256 baser.
  • miraconvert: er et værktøj til at konvertere, udtrække og nogle gange genberegne alle slags data relateret til sekvenssamlingsfiler.
Please cite: Bastien Chevreux, Thomas Pfisterer, Bernd Drescher, Albert J. Driesel, Werner E. G. Müller, Thomas Wetter and Sándor Suhai: Using the miraEST Assembler for Reliable and Automated mRNA Transcript Assembly and SNP Detection in Sequenced ESTs. (PubMed,eprint) Genome Research 14(6):1147-1159 (2004)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Mothur
Programpakke for sekvensanalyse til forskning i mikrobiota
Versions of package mothur
ReleaseVersionArchitectures
wheezy1.24.1-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
sid1.42.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.38.1.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.33.3+dfsg-2amd64,armel,armhf,i386
bullseye1.42.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.41.21-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream1.43.0
Debtags of package mothur:
roleprogram
Popcon: 7 users (7 upd.)*
Newer upstream!
License: DFSG free
Git

Mothur søger at udvikle et enkelt stykke open source program, der kan udvides til at fylde bioinformatikbehov i mikrobiel økologisamfund. Den har indbygget funktionalitet for dotur, sons, treeclimber, s-libshuff, unifrac og meget mere. Ud over at forbedre fleksibiliteten af disse algoritmer er en række andre funktioner, herunder regnemaskiner og visualiseringsværktøjer, blevet tilføjet.

Please cite: Patrick D Schloss, Sarah L Westcott, Thomas Ryabin, Justine R Hall, Martin Hartmann, Emily B Hollister, Ryan A Lesniewski, Brian B Oakley, Donovan H Parks, Courtney J Robinson, Jason W Sahl, Blaz Stres, Gerhard G Thallinger, David J Van Horn and Carolyn F Weber: Introducing mothur: Open-source, platform-independent, community-supported software for describing and comparing microbial communities. (PubMed) Appl Environ Microbiol 75(23):7537-7541 (2009)
Registry entries: SciCrunch  OMICtools  bioconda 
Topics: Microbial ecology
Nanopolish
Konsensuskalder for nanopore-sekvensdata
Versions of package nanopolish
ReleaseVersionArchitectures
sid0.11.1-1amd64
buster0.11.0-2amd64
bullseye0.11.1-1amd64
stretch0.5.0-1amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
upstream0.11.2
Popcon: 4 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Nanoplish bruger en skjult Markovmodel på signalniveau til konsensuskald af nanospores genomsekvensdata. Programmet kan udføre analyse på signalniveau for Oxford Nanopore-sekvensdata. Nanopolish kan beregne en forbedret konsensussekvens for en kladdegenomsamling, registrere baseændringer, kalde SNP'er og indels med respekt for et referencegenom med mere.

Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Paleomix
pipelines and tools for the processing of ancient and modern HTS data
Versions of package paleomix
ReleaseVersionArchitectures
buster1.2.13.3-1amd64
sid1.2.13.3-1amd64
bullseye1.2.13.3-1amd64
upstream1.2.13.8
Popcon: 3 users (4 upd.)*
Newer upstream!
License: DFSG free
Git

The PALEOMIX pipelines are a set of pipelines and tools designed to aid the rapid processing of High-Throughput Sequencing (HTS) data: The BAM pipeline processes de-multiplexed reads from one or more samples, through sequence processing and alignment, to generate BAM alignment files useful in downstream analyses; the Phylogenetic pipeline carries out genotyping and phylogenetic inference on BAM alignment files, either produced using the BAM pipeline or generated elsewhere; and the Zonkey pipeline carries out a suite of analyses on low coverage equine alignments, in order to detect the presence of F1-hybrids in archaeological assemblages. In addition, PALEOMIX aids in metagenomic analysis of the extracts.

The pipelines have been designed with ancient DNA (aDNA) in mind, and includes several features especially useful for the analyses of ancient samples, but can all be for the processing of modern samples, in order to ensure consistent data processing.

Please cite: Mikkel Schubert, Luca Ermini, Clio Der Sarkissian, Hákon Jónsson, Aurélien Ginolhac, Robert Schaefer, Michael D Martin, Ruth Fernández, Martin Kircher, Molly McCue, Eske Willerslev and Ludovic Orlando: Characterization of ancient and modern genomes by SNP detection and phylogenomic and metagenomic analysis using PALEOMIX. (PubMed) Nature Protocols 9(5):1056-82 (2014)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Pbh5tools
tools for manipulating Pacific Biosciences HDF5 files
Versions of package pbh5tools
ReleaseVersionArchitectures
stretch0.8.0+dfsg-5all
buster0.8.0+git20170929.58d54ff+dfsg-1all
sid0.8.0+git20170929.58d54ff+dfsg-1all
upstream0.8.0+git20181212.9fa8fc4
Popcon: 4 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

This package provides functionality for manipulating and extracting data from cmp.h5 and bas.h5 files produced by the Pacific Biosciences sequencers. cmp.h5 files contain alignment information while bas.h5 files contain base-call information.

This package is part of the SMRTAnalysis suite.

Registry entries: SciCrunch  OMICtools  bioconda 
Pbhoney
genomic structural variation discovery
Versions of package pbhoney
ReleaseVersionArchitectures
sid15.8.24+dfsg-3all
buster15.8.24+dfsg-3all
stretch15.8.24+dfsg-2all
Popcon: 3 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

PBHoney is an implementation of two variant-identification approaches designed to exploit the high mappability of long reads (i.e., greater than 10,000 bp). PBHoney considers both intra-read discordance and soft-clipped tails of long reads to identify structural variants.

PBHoney is part of the PBSuite.

Registry entries: OMICtools 
Pbjelly
genome assembly upgrading tool
Versions of package pbjelly
ReleaseVersionArchitectures
stretch15.8.24+dfsg-2all
sid15.8.24+dfsg-3all
buster15.8.24+dfsg-3all
Popcon: 3 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

PBJelly is a highly automated pipeline that aligns long sequencing reads (such as PacBio RS reads or long 454 reads in fasta format) to high-confidence draft assembles. PBJelly fills or reduces as many captured gaps as possible to produce upgraded draft genomes.

PBJelly is part of the PBSuite.

Registry entries: OMICtools 
Pbsuite
software for Pacific Biosciences sequencing data
Versions of package pbsuite
ReleaseVersionArchitectures
buster15.8.24+dfsg-3all
stretch15.8.24+dfsg-2all
sid15.8.24+dfsg-3all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

The PBSuite contains two projects created for analysis of Pacific Biosciences long-read sequencing data.

  • PBJelly - genome upgrading tool
  • PBHoney - structural variation discovery
Registry entries: OMICtools 
Picard-tools
Command line tools to manipulate SAM and BAM files
Versions of package picard-tools
ReleaseVersionArchitectures
buster2.18.25+dfsg-2amd64
stretch2.8.1+dfsg-1all
jessie1.113-1all
sid2.18.25+dfsg-2amd64
wheezy1.46-1all
bullseye2.18.25+dfsg-2amd64
squeeze1.27-1all
upstream2.21.2
Popcon: 17 users (12 upd.)*
Newer upstream!
License: DFSG free
Git

SAM (Sequence Alignment/Map) format is a generic format for storing large nucleotide sequence alignments. Picard Tools includes these utilities to manipulate SAM and BAM files:

 AddCommentsToBam                  FifoBuffer
 AddOrReplaceReadGroups            FilterSamReads
 BaitDesigner                      FilterVcf
 BamIndexStats                     FixMateInformation
 BamToBfq                          GatherBamFiles
 BedToIntervalList                 GatherVcfs
 BuildBamIndex                     GenotypeConcordance
 CalculateHsMetrics                IlluminaBasecallsToFastq
 CalculateReadGroupChecksum        IlluminaBasecallsToSam
 CheckIlluminaDirectory            LiftOverIntervalList
 CheckTerminatorBlock              LiftoverVcf
 CleanSam                          MakeSitesOnlyVcf
 CollectAlignmentSummaryMetrics    MarkDuplicates
 CollectBaseDistributionByCycle    MarkDuplicatesWithMateCigar
 CollectGcBiasMetrics              MarkIlluminaAdapters
 CollectHiSeqXPfFailMetrics        MeanQualityByCycle
 CollectIlluminaBasecallingMetrics MergeBamAlignment
 CollectIlluminaLaneMetrics        MergeSamFiles
 CollectInsertSizeMetrics          MergeVcfs
 CollectJumpingLibraryMetrics      NormalizeFasta
 CollectMultipleMetrics            PositionBasedDownsampleSam
 CollectOxoGMetrics                QualityScoreDistribution
 CollectQualityYieldMetrics        RenameSampleInVcf
 CollectRawWgsMetrics              ReorderSam
 CollectRnaSeqMetrics              ReplaceSamHeader
 CollectRrbsMetrics                RevertOriginalBaseQualitiesAndAddMateCigar
 CollectSequencingArtifactMetrics  RevertSam
 CollectTargetedPcrMetrics         SamFormatConverter
 CollectVariantCallingMetrics      SamToFastq
 CollectWgsMetrics                 ScatterIntervalsByNs
 CompareMetrics                    SortSam
 CompareSAMs                       SortVcf
 ConvertSequencingArtifactToOxoG   SplitSamByLibrary
 CreateSequenceDictionary          SplitVcfs
 DownsampleSam                     UpdateVcfSequenceDictionary
 EstimateLibraryComplexity         ValidateSamFile
 ExtractIlluminaBarcodes           VcfFormatConverter
 ExtractSequences                  VcfToIntervalList
 FastqToSam                        ViewSam
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Topics: Sequencing; Document, record and content management
Pirs
Profile based Illumina pair-end Reads Simulator
Versions of package pirs
ReleaseVersionArchitectures
sid2.0.2+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.0.2+dfsg-5.1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster2.0.2+dfsg-8amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye2.0.2+dfsg-8amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

The program pIRS can be used for simulating Illumina PE reads, with a series of characters generated by Illumina sequencing platform, such as insert size distribution, sequencing error(substitution, insertion, deletion), quality score and GC content-coverage bias.

The insert size follows a normal distribution, so users should set the mean value and standard deviation. Usually the standard deviation is set as 1/20 of the mean value. The normal distribution by Box-Muller method is simulated.

The program simulates sequencing error, quality score and GC content- coverage bias according to the empirical distribution profile. Some default profiles counted from lots of real sequencing data are provided.

To simulate reads from diploid genome, users should simulate the diploid genome sequence firstly by setting the ratio of heterozygosis SNP, heterozygosis InDel and structure variation.

Please cite: Xuesong Hu, Jianying Yuan, Yujian Shi, Jianliang Lu, Binghang Liu, Zhenyu Li, Yanxiang Chen, Desheng Mu, Hao Zhang, Nan Li, Zhen Yue, Fan Bai, Heng Li and Wei Fan: pIRS: Profile-based Illumina pair-end reads simulator. (PubMed,eprint) Bioinformatics 28(11):1533-5 (2012)
Registry entries: OMICtools  bioconda 
Placnet
Plasmid Constellation Network project
Versions of package placnet
ReleaseVersionArchitectures
stretch1.03-2all
sid1.03-3all
bullseye1.03-3all
buster1.03-3all
Popcon: 5 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Placnet is a new tool for plasmid analysis in NGS projects. Placnet is optimized to work with Illumina sequences but it also works with 454, Iontorrent or any of the actual sequence technologies.

The input of placnet is a set of contigs and one or more SAM files with the mapping of the reads against the contigs. Placnet obtains a set of files, easily opened on Cytoscape software or other network tools.

Please cite: Val F. Lanza, María de Toro, M. Pilar Garcillán-Barcia, Azucena Mora, Jorge Blanco, Teresa M. Coque and Fernando de la Cruz: Plasmid Flux in Escherichia coli ST131 Sublineages, Analyzed by Plasmid Constellation Network (PLACNET), a New Method for Plasmid Reconstruction from Whole Genome Sequences. (PubMed,eprint) PLOS 10(12):e1004766 (2014)
Registry entries: OMICtools 
Poretools
toolkit for nanopore nucleotide sequencing data
Versions of package poretools
ReleaseVersionArchitectures
buster0.6.0+dfsg-3all
stretch0.6.0+dfsg-2all
bullseye0.6.0+dfsg-4all
sid0.6.0+dfsg-4all
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

poretools is a flexible toolkit for exploring datasets generated by nanopore sequencing devices from MinION for the purposes of quality control and downstream analysis. Poretools operates directly on the native FAST5 (a variant of the HDF5 standard) file format produced by ONT and provides a wealth of format conversion utilities and data exploration and visualization tools.

Please cite: Nicholas Loman and Aaron Quinlan: Poretools: a toolkit for analyzing nanopore sequence data. (PubMed,eprint) Bioinformatics 30(23):3399-3401 (2014)
Registry entries: OMICtools  bioconda 
Python3-airr
Data Representation Standard library for antibody and TCR sequences
Versions of package python3-airr
ReleaseVersionArchitectures
bullseye1.2.1-2all
buster1.2.1-2all
sid1.2.1-2all
Popcon: 5 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides a library by the AIRR community to for describing, reporting, storing, and sharing adaptive immune receptor repertoire (AIRR) data, such as sequences of antibodies and T cell receptors (TCRs). Some specific efforts include:

  • The MiAIRR standard for describing minimal information about AIRR datasets, including sample collection and data processing information.
  • Data representations (file format) specifications for storing large amounts of annotated AIRR data.
  • APIs for exposing a common interface to repositories/databases containing AIRR data.
  • A community standard for software tools which will allow conforming tools to gain community recognition.

This package installs the library for Python 3.

Python3-gffutils
Work with GFF and GTF files in a flexible database framework
Versions of package python3-gffutils
ReleaseVersionArchitectures
sid0.9-2all
bullseye0.9-2all
buster0.9-1all
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

A Python package for working with and manipulating the GFF and GTF format files typically used for genomic annotations. Files are loaded into a sqlite3 database, allowing much more complex manipulation of hierarchical features (e.g., genes, transcripts, and exons) than is possible with plain-text methods alone.

Registry entries: Bio.Tools  OMICtools  bioconda 
Python3-presto
toolkit for processing B and T cell sequences
Versions of package python3-presto
ReleaseVersionArchitectures
buster0.5.10-1all
sid0.5.13-2all
bullseye0.5.13-2all
Popcon: 3 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

pRESTO is a toolkit for processing raw reads from high-throughput sequencing of B cell and T cell repertoires.

Dramatic improvements in high-throughput sequencing technologies now enable large-scale characterization of lymphocyte repertoires, defined as the collection of trans-membrane antigen-receptor proteins located on the surface of B cells and T cells. The REpertoire Sequencing TOolkit (pRESTO) is composed of a suite of utilities to handle all stages of sequence processing prior to germline segment assignment. pRESTO is designed to handle either single reads or paired-end reads. It includes features for quality control, primer masking, annotation of reads with sequence embedded barcodes, generation of unique molecular identifier (UMI) consensus sequences, assembly of paired-end reads and identification of duplicate sequences. Numerous options for sequence sorting, sampling and conversion operations are also included.

Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Python3-pybedtools
Python 3 wrapper around BEDTools for bioinformatics work
Versions of package python3-pybedtools
ReleaseVersionArchitectures
sid0.8.0-2amd64,arm64,mips64el,ppc64el
bullseye0.8.0-1amd64,arm64,mips64el,ppc64el
buster0.8.0-1amd64,arm64,mips64el,ppc64el
Popcon: 1 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

The BEDTools suite of programs is widely used for genomic interval manipulation or “genome algebra”. pybedtools wraps and extends BEDTools and offers feature-level manipulations from within Python.

This is the Python 3 version.

Please cite: R. K. Dale, B. S. Pedersen and A. R. Quinlan: Pybedtools: a flexible Python library for manipulating genomic datasets and annotations". Bioinformatics 27(24):3423-3424 (2011)
Registry entries: Bio.Tools  OMICtools  bioconda 
Python3-sqt
SeQuencing Tools for biological DNA/RNA high-throughput data
Versions of package python3-sqt
ReleaseVersionArchitectures
sid0.8.0-3amd64,arm64,mips64el,ppc64el
buster0.8.0-3amd64,arm64,mips64el,ppc64el
bullseye0.8.0-3amd64,arm64,mips64el,ppc64el
Popcon: 2 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

sqt is a collection of command-line tools for working with high-throughput sequencing data. Conceptionally not fixed to use any particular language, many sqt subcommands are currently implemented in Python. For them, a Python package is available with functions for reading and writing FASTA/FASTQ files, computing alignments, quality trimming, etc.

The following tools are offered:

  • sqt-coverage -- Compute per-reference statistics such as coverage and GC content
  • sqt-fastqmod -- FASTQ modifications: shorten, subset, reverse complement, quality trimming.
  • sqt-fastastats -- Compute N50, min/max length, GC content etc. of a FASTA file
  • sqt-qualityguess -- Guess quality encoding of one or more FASTA files.
  • sqt-globalalign -- Compute a global or semiglobal alignment of two strings.
  • sqt-chars -- Count length of the first word given on the command line.
  • sqt-sam-cscq -- Add the CS and CQ tags to a SAM file with colorspace reads.
  • sqt-fastamutate -- Add substitutions and indels to sequences in a FASTA file.
  • sqt-fastaextract -- Efficiently extract one or more regions from an indexed FASTA file.
  • sqt-translate -- Replace characters in FASTA files (like the 'tr' command).
  • sqt-sam-fixn -- Replace all non-ACGT characters within reads in a SAM file.
  • sqt-sam-insertsize -- Mean and standard deviation of paired-end insert sizes.
  • sqt-sam-set-op -- Set operations (union, intersection, ...) on SAM/BAM files.
  • sqt-bam-eof -- Check for the End-Of-File marker in compressed BAM files.
  • sqt-checkfastqpe -- Check whether two FASTQ files contain correctly paired paired-end data.
Registry entries: bioconda 
Qcumber
Kvalitetskontrol af genomsekvenser
Versions of package qcumber
ReleaseVersionArchitectures
sid1.0.14+dfsg-1all
buster1.0.14+dfsg-1all
bullseye1.0.14+dfsg-1all
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

QCPipeline er et værktøj til kvalitetskontrol. Arbejdsforløbet er som i det følgende:

 1. Kvalitetskontrol med FastQC
 2. Ryd op i læsninger med Trimmomatic
 3. Kvalitetskontrol af læsningerne med FastQC
 4. Oversæt læsninger mod reference via bowtie2
 5. Klassificer læsninger med Kraken
Registry entries: OMICtools  bioconda 
Qiime
Kvantitativ indsigt i mikrobiel økologi
Versions of package qiime
ReleaseVersionArchitectures
bullseye2019.7.0-2all
sid2019.7.0-2all
jessie1.8.0+dfsg-4amd64,armel,armhf,i386
wheezy1.4.0-2amd64,armel,armhf,i386,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
upstream2019.10.0
Debtags of package qiime:
roleprogram
Popcon: 3 users (3 upd.)*
Newer upstream!
License: DFSG free
Git

QIIME 2 er en funktionsrig og decentraliseret mikrobiome analysepakke med fokus på data og analysegennemsigtighed. QIME 2 gør det muligt for forskere at starte en analyse med rå DNA-sekvensdata og afslutte med figurer og statistiske resultater i udgivelseskvalitet. Nøglefunktioner:

  • Integreret og automatisk registrering af dataherkomst
  • Semantisk typesystem
  • Udvidelsesmodulsystem for udvidelse af mikrobiome analysefunktionalitet
  • Understøttelse for flere typer af brugerflader (f.eks. API, kommandolinjen, grafisk)

QIIME 2 er et fuldstændigt nyt design og omskrivning af QIIME 1 mikrobiome analysedatakanalen. QIIME 2 vil adressere mange af begrænsningerne i QIIME 1, men de funktioner der gør QIIME 1 til en funktionsrig og bredt anvendt analysedatakanal bevares.

QIIME 2 understøtter i øjeblikket en oprindelig start til slut-mikrobiome analysedatakanal. Ny funktionalitet vil blive tilgængelig via QIIME 2-udvidelsesmoduler. Du kan se en liste over tilgængelige udvidelsesmoduler på QIIME 2's side over udvidelsesmoduler. »future«-siden viser udvidelsesmoduler under udvikling.

Please cite: Evan Bolyen, Jai Ram Rideout, Matthew R Dillon, Nicholas A Bokulich, Christian Abnet, Gabriel A Al-Ghalith, Harriet Alexander, Eric J Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J Brislawn, C Titus Brown, Benjamin J Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily Cope, Ricardo Da Silva, Pieter C Dorrestein, Gavin M Douglas, Daniel M Durall, Claire Duvallet, Christian F Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M Gauglitz, Deanna L Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin Huttley, Stefan Janssen, Alan K Jarmusch, Lingjing Jiang, Benjamin Kaehler, Kyo Bin Kang, Christopher R Keefe, Paul Keim, Scott T Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan GI Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D Martin, Daniel McDonald, Lauren J McIver, Alexey V Melnik, Jessica L Metcalf, Sydney C Morgan, Jamie Morton, Ahmad Turan Naimey, Jose A Navas-Molina, Louis Felix Nothias, Stephanie B Orchanian, Talima Pearson, Samuel L Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R Spear, Austin D Swafford, Luke R Thompson, Pedro J Torres, Pauline Trinh, Anupriya Tripathi, Peter J Turnbaugh, Sabah Ul-Hasan, Justin JJ van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C Weber, Chase HD Williamson, Amy D Willis, Zhenjiang Zech Xu, Jesse R Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight and J Gregory Caporaso: Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. (PubMed,eprint) Nature Biotechnology 37:852 - 857 (2019)
Registry entries: Bio.Tools  OMICtools 
Topics: Microbial ecology
Quorum
QUality Optimized Reads of genomic sequences
Versions of package quorum
ReleaseVersionArchitectures
bullseye1.1.1-2amd64,arm64,mips64el,ppc64el
buster1.1.1-2amd64,arm64,mips64el,ppc64el
sid1.1.1-2amd64,arm64,mips64el,ppc64el
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

QuorUM giver mulighed for at opnå trimmede og fejlkorrigerede læsninger, der resulterer i samlinger med længere contigs og færre fejl. QuorUM giver bedst ydeevne sammenlignet med andre offentliggjorte fejlkorrektorer i flere målinger. QuorUM implementeres effektivt ved at benytte nuværende multi-kerne beregningsarkitekturer, og den er velegnet til store datasæt (1 milliarder baser kontrolleres og korrigeres pr. dag pr. kerne). Tredjepartsassembleren (SOAPdenovo) har signifikant fordel af at bruge QuorUM-fejlkorrigerede læsninger. QuorUM-fejlkorrigerede læsninger resulterer i en faktor på 1,1 til 4 i forbedring i N50-contigstørrelse sammenlignet med de oprindelige læsninger med SOAPdenovo for de undersøgte datasæt.

Please cite: Guillaume Marçais, James A. Yorke and Aleksey Zimin: QuorUM: An Error Corrector for Illumina Reads. (PubMed,eprint) PLoS One 10(6):e0130821 (2015)
Registry entries: SciCrunch  OMICtools 
R-bioc-deseq2
R package for RNA-Seq Differential Expression Analysis
Versions of package r-bioc-deseq2
ReleaseVersionArchitectures
bullseye1.24.0+dfsg-1amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.26.0+dfsg-1amd64,arm64,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.22.2+dfsg-1amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.14.1-1amd64,arm64,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 10 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

Differential gene expression analysis based on the negative binomial distribution. Estimate variance-mean dependence in count data from high-throughput sequencing assays and test for differential expression based on a model using the negative binomial distribution.

Please cite: Michael I Love, Wolfgang Huber and Simon Anders: Moderated estimation of fold change and dispersion for {RNA}-seq data with {DESeq}2. (eprint) Genome Biol 15(12) (2014)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
R-bioc-hilbertvis
GNU R-pakke til at visualisere lange vektordata
Versions of package r-bioc-hilbertvis
ReleaseVersionArchitectures
bullseye1.42.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
squeeze1.5.0-2amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
wheezy1.14.0-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie1.24.0-1amd64,armel,armhf,i386
stretch1.32.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.40.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.44.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package r-bioc-hilbertvis:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
useanalysing
Popcon: 12 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

Dette værktøj giver dig mulighed for at vise meget lange datavektorer på en pladseffektiv måde, ved at organisere dataene via en 2D-Hilbertkurve. Brugeren kan så visuelt bedømme den store skalastruktur og distribution af funktioner på samme tid via den rå form og intensiteten for individuelle funktioner.

I bioinformatics er et typisk brugstilfælde ChIP-Chip og ChIP-Seq, eller grundlæggende alle slags genomdata, som passende vises som kvantitative spor (»wiggle data«) i genombrowsere såsom dem tilbudt af Ensembl eller UCSC.

Please cite: Simon Anders: Visualization of genomic data with the Hilbert curve. (PubMed,eprint) Bioinformatics 25(10):1231-1235 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
R-bioc-metagenomeseq
GNU R statistical analysis for sparse high-throughput sequencing
Versions of package r-bioc-metagenomeseq
ReleaseVersionArchitectures
stretch1.16.0-2all
sid1.24.1-1all
buster1.24.1-1all
upstream1.28.0
Popcon: 7 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

MetagenomeSeq is designed to determine features (be it Operational Taxanomic Unit (OTU), species, etc.) that are differentially abundant between two or more groups of multiple samples. metagenomeSeq is designed to address the effects of both normalization and under-sampling of microbial communities on disease association detection and the testing of feature correlations.

Registry entries: Bio.Tools  OMICtools  bioconda 
R-cran-alakazam
Immunoglobulin Clonal Lineage and Diversity Analysis
Versions of package r-cran-alakazam
ReleaseVersionArchitectures
sid0.3.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.2.11-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.3.0-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 6 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Alakazam is part of the Immcantation analysis framework for Adaptive Immune Receptor Repertoire sequencing (AIRR-seq) and provides a set of tools to investigate lymphocyte receptor clonal lineages, diversity, gene usage, and other repertoire level properties, with a focus on high-throughput immunoglobulin (Ig) sequencing.

Alakazam serves five main purposes:

  • Providing core functionality for other R packages in the Immcantation framework. This includes common tasks such as file I/O, basic DNA sequence manipulation, and interacting with V(D)J segment and gene annotations.
  • Providing an R interface for interacting with the output of the pRESTO and Change-O tool suites.
  • Performing lineage reconstruction on clonal populations of Ig sequences and analyzing the topology of the resultant lineage trees.
  • Performing clonal abundance and diversity analysis on lymphocyte repertoires.
  • Performing physicochemical property analyses of lymphocyte receptor sequences.
Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data. (eprint) 31:3356–3358 (2017)
Registry entries: OMICtools 
R-cran-shazam
Immunoglobulin Somatic Hypermutation Analysis
Versions of package r-cran-shazam
ReleaseVersionArchitectures
buster0.1.11-1all
sid0.2.1-1all
bullseye0.2.1-1all
Popcon: 6 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Provides a computational framework for Bayesian estimation of antigen-driven selection in immunoglobulin (Ig) sequences, providing an intuitive means of analyzing selection by quantifying the degree of selective pressure. Also provides tools to profile mutations in Ig sequences, build models of somatic hypermutation (SHM) in Ig sequences, and make model-dependent distance comparisons of Ig repertoires.

SHazaM is part of the Immcantation analysis framework for Adaptive Immune Receptor Repertoire sequencing (AIRR-seq) and provides tools for advanced analysis of somatic hypermutation (SHM) in immunoglobulin (Ig) sequences. Shazam focuses on the following analysis topics:

  • Quantification of mutational load SHazaM includes methods for determine the rate of observed and expected mutations under various criteria. Mutational profiling criteria include rates under SHM targeting models, mutations specific to CDR and FWR regions, and physicochemical property dependent substitution rates.
  • Statistical models of SHM targeting patterns Models of SHM may be divided into two independent components: 1) a mutability model that defines where mutations occur and 2) a nucleotide substitution model that defines the resulting mutation. Collectively these two components define an SHM targeting model. SHazaM provides empirically derived SHM 5-mer context mutation models for both humans and mice, as well tools to build SHM targeting models from data.
  • Analysis of selection pressure using BASELINe The Bayesian Estimation of Antigen-driven Selection in Ig Sequences (BASELINe) method is a novel method for quantifying antigen-driven selection in high-throughput Ig sequence data. BASELINe uses SHM targeting models can be used to estimate the null distribution of expected mutation frequencies, and provide measures of selection pressure informed by known AID targeting biases.
  • Model-dependent distance calculations SHazaM provides methods to compute evolutionary distances between sequences or set of sequences based on SHM targeting models. This information is particularly useful in understanding and defining clonal relationships.
Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data.. (PubMed,eprint) Bioinformatics 31(20):3356-3358 (2015)
Registry entries: OMICtools  bioconda 
R-cran-tcr
Advanced Data Analysis of Immune Receptor Repertoires
Versions of package r-cran-tcr
ReleaseVersionArchitectures
bullseye2.2.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.2.4-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.2.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 6 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Cells of the immune system are the grand exception to the rule that all cells of an individuum have (mostly exact) copies of the same DNA. B cells (which produce antibodies) and T cells (which communicate with cells) however have a section of their DNA with genes of the groups V, D and J that are reorganised within the genomic DNA to provide the flexibility to deal with yet unknown pathogens.

This package provides a platform for the advanced analysis of T cell receptor repertoire data and its visualisations.

Please cite: Vadim I. Nazarov, Mikhail V. Pogorelyy, Ekaterina A. Komech, Ivan V. Zvyagin, Dmitry A. Bolotin, Mikhail Shugay, Dmitry M. Chudakov, Yury B. Lebedev and Ilgar Z. Mamedov: tcR: an R package for T cell receptor repertoire advanced data analysis. (eprint) BMC Bioinformatics 16:175 (2015)
Registry entries: Bio.Tools  OMICtools  bioconda 
R-cran-tigger
Infers new Immunoglobulin alleles from Rep-Seq Data
Versions of package r-cran-tigger
ReleaseVersionArchitectures
sid0.4.0-1all
buster0.3.1-1all
bullseye0.4.0-1all
Popcon: 6 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Summary: Infers the V genotype of an individual from immunoglobulin (Ig) repertoire-sequencing (Rep-Seq) data, including detection of any novel alleles. This information is then used to correct existing V allele calls from among the sample sequences.

High-throughput sequencing of B cell immunoglobulin receptors is providing unprecedented insight into adaptive immunity. A key step in analyzing these data involves assignment of the germline V, D and J gene segment alleles that comprise each immunoglobulin sequence by matching them against a database of known V(D)J alleles. However, this process will fail for sequences that utilize previously undetected alleles, whose frequency in the population is unclear.

TIgGER is a computational method that significantly improves V(D)J allele assignments by first determining the complete set of gene segments carried by an individual (including novel alleles) from V(D)J-rearrange sequences. TIgGER can then infer a subject’s genotype from these sequences, and use this genotype to correct the initial V(D)J allele assignments.

The application of TIgGER continues to identify a surprisingly high frequency of novel alleles in humans, highlighting the critical need for this approach. TIgGER, however, can and has been used with data from other species.

Core Abilities:

  • Detecting novel alleles
  • Inferring a subject’s genotype
  • Correcting preliminary allele calls

Required Input

  • A table of sequences from a single individual, with columns containing the following:
  • V(D)J-rearranged nucleotide sequence (in IMGT-gapped format)
  • Preliminary V allele calls
  • Preliminary J allele calls
  • Length of the junction region
  • Germline Ig sequences in IMGT-gapped fasta format (e.g., as those downloaded from IMGT/GENE-DB)

The former can be created through the use of IMGT/HighV-QUEST and Change-O.

Please cite: Namita T. Gupta, Jason A. Vander Heiden, Mohamed Uduman, Daniel Gadala-Maria, Gur Yaari and Steven H. Kleinstein: Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data. (eprint) 31:3356–3358 (2017)
Registry entries: OMICtools  bioconda 
Rna-star
Ultrahurtig univerel RNA-seq-sammenligningsprogram
Versions of package rna-star
ReleaseVersionArchitectures
bullseye2.7.3a+dfsg-1amd64,arm64,mips64el,ppc64el
sid2.7.3a+dfsg-1amd64,arm64,mips64el,ppc64el
stretch2.5.2b+dfsg-1amd64,arm64,mips64el,ppc64el
buster2.7.0a+dfsg-1amd64,arm64,mips64el,ppc64el
Popcon: 10 users (11 upd.)*
Versions and Archs
License: DFSG free
Git

Programmet Spliced Transcripts Alignment to a Reference (STAR) baseret på en tidligere ubeskrevet RNA-seq-sammenligningsalgoritme, som bruger sekventiel maksimal kortlægningsparat seed-søgning i suffikstabeller uden komprimering efterfulgt af seed-klyngeopbygning og syning. STAR er bedre end andre sammenligningsprogrammer med en faktor >50 i kortlægningshastighed, sammenligning med menneskets genom 550 million 2 × 76 bp parret-slut læsninger per time på en moderat server med 12-kerner, mens der på samme tid er en forbedring af sammenligningssensitivitet og præcision. Udover fordomsfri de novo-registrering af kanoniske bindinger kan STAR registrere ikkekanoniske dele og chimeric (fusion) transkriptioner, og kan også oversætte RNA-sekvenser i fuld længde. Via Rocke 454-sekvensering af »reverse transcription polymerase chain reaction amplicons« validerede forfatterne eksperimentelt 1960 novel mellemgenom delbindinger med 80-90 % succes, underbyggende den høje præcision i START-kortlægningsstrategien.

Please cite: Alexander Dobin, Carrie A. Davis, Felix Schlesinger, Jorg Drenkow, Chris Zaleski, Sonali Jha, Philippe Batut, Mark Chaisson and Thomas R. Gingeras: STAR: ultrafast universal RNA-seq aligner. (PubMed,eprint) Bioinformatics 29(1):15-21 (2012)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Topics: Sequence analysis
Rtax
Classification of sequence reads of 16S ribosomal RNA gene
Versions of package rtax
ReleaseVersionArchitectures
sid0.984-6all
jessie0.984-2all
stretch0.984-5all
buster0.984-6all
bullseye0.984-6all
Popcon: 5 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Short-read technologies for microbial community profiling are increasingly popular, yet previous techniques for assigning taxonomy to paired-end reads perform poorly. RTAX provides rapid taxonomic assignments of paired-end reads using a consensus algorithm.

Please cite: David A. W. Soergel, Neelendu Dey, Rob Knight and Steven E. Brenner: Selection of primers for optimal taxonomic classification of environmental 16S rRNA gene sequences. (PubMed,eprint) The ISME Journal 6:1440–1444 (2012)
Registry entries: OMICtools 
Salmon
Wicked-hurtig transskriptkvantificering fra RNA-seq-data
Versions of package salmon
ReleaseVersionArchitectures
buster0.12.0+ds1-1amd64
bullseye0.12.0+ds1-1amd64
sid0.12.0+ds1-1amd64
stretch0.7.2+ds1-2amd64
upstream1.0.0
Popcon: 5 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Salmon er et wicked-hurtigt program til at producere et meget præcist transkriptionsniveau for kvantificeringsestimater fra RNA-seq-data. Salmon opnår nøjagtighed og hastighed via en række forskellige innovationer, herunder brug af simple justeringer (nøjagtige men hurtige til at beregne proxyer til traditionel læsningssammenligninger) og massivt parallelt stokastisk sammenbrudt variationsinferens. Resultatet er et alsidigt værktøj, som passer fint ind i mange forskellige datakanaler. For eksempel kan du vælge at gøre brug af simple justeringer af at give Salmon

 rå sekventeringslæsninger, eller hvis det er mere praktisk kan du give
Salmon regelmæssige sammenligninger (f.eks. beregnet med din

favoritsammenligner), og det vil bruge den samme wicked-hurtige og moderne inferensalgoritme til at estimere transkriptionsniveauer for dit eksperiment.

Please cite: Rob Patro, Geet Duggal and Carl Kingsford: Accurate, fast, and model-aware transcript expression quantification with Salmon. (eprint) bioRxiv (2015)
Registry entries: OMICtools  bioconda 
Sambamba
Værktøjer for arbejde med SAM/BAM-data
Versions of package sambamba
ReleaseVersionArchitectures
sid0.6.7-2amd64
upstream0.7.0
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

Sambamba positionerer sig selv som et højtydende alternativ til samtools og tilbyder værktøjer for

  • Funktionsrig filtrering med sambamba view --filter
  • Picard-lignende SAM-teksthovedsammenføjning i værktøjet merge
  • Valgfri for operationer på hele BAM'er
  • Hurtig kopiering af en region til en ny fil med værktøjet slice
  • Duplikere markering/fjernelse, via Picardkriteriet
Please cite: Artem Tarasov, Albert J. Vilella, Edwin Cuppen, Isaac J. Nijman and Pjotr Prins: Sambamba: fast processing of NGS alignment formats. (PubMed,eprint) Bioinformatics 31(12):2032-2034 (2015)
Registry entries: Bio.Tools  OMICtools  bioconda 
Samblaster
Markerer dubletter, udtrækker discordant/split-læsninger
Versions of package samblaster
ReleaseVersionArchitectures
bullseye0.1.24-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.1.24-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.24-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 3 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Nuværende »next-generation« sekventeringsteknologi kan ikke fortælle hvilken præcis sekvens de vil læse. De tager hvad der er tilgængelig. Og hvis nogle sekvenser læses meget ofte, så skal dette bruge lidt ekstra biomedicinsk tænkning. Genomet kan for eksempel blive duplikeret.

Samblaster er et hurtigt og fleksibelt program til at markere dubletter i read-id-grupperede paired-end SAM-filer. Det kan også valgfrit fremstille discordant read pairs og/eller opdele læsningsoversættelser til separate SAM-filer, og/eller unmapped/clipped læsninger til en separat FASTQ-fil. Når dubletter markeres vil samblaster kræver cirka 20 MB hukommelse per 1M læste par.

Please cite: Gregory G. Faust and Ira M. Hall: SAMBLASTER: fast duplicate marking and structural variant read extraction. (PubMed,eprint) Bioinformatics 30(17):2503-2505 (2014)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Samtools
Forarbejdning af sekvensopstillinger i SAM-, BAM- og CRAM-formater
Versions of package samtools
ReleaseVersionArchitectures
stretch1.3.1-3amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
jessie0.1.19-1amd64,armhf,i386
wheezy0.1.18-1amd64,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390
squeeze0.1.8-1amd64,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390
bullseye1.9-5amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
buster1.9-4amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
sid1.9-5amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
Debtags of package samtools:
fieldbiology
interfacecommandline
networkclient
roleprogram
scopeutility
uitoolkitncurses
useanalysing, calculating, filtering
works-withbiological-sequence
Popcon: 79 users (42 upd.)*
Versions and Archs
License: DFSG free
Git

Samtools er et sæt af værktøjer, der manipulerer sammenligninger af nukleotidsekvenser i det binære BAM-format. Værktøjet importerer fra og eksporterer til ascii SAM-formatet (Sequence Alignment/Map) og CRAM-formater, udfører sortering, sammenlægning og indeksering, og gør det muligt at hente læsninger i alle områder hurtigt. Det er designet til at arbejde på en strøm, og er i stand til at åbne en BAM- eller CRAM-fil (ikke SAM) på en ekstern FTP- eller HTTP-server.

The package is enhanced by the following packages: libbio-samtools-perl
Please cite: Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan, Nils Homer, Gabor Marth, Goncalo Abecasis, Richard Durbin and 1000 Genome Project Data Processing Subgroup: The Sequence Alignment/Map (SAM) Format and SAMtools. (PubMed,eprint) Bioinformatics 25(16):2078-2079 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Screenshots of package samtools
Scoary
Pangenom-brede associationsstudier
Versions of package scoary
ReleaseVersionArchitectures
sid1.6.16-2all
bullseye1.6.16-2all
buster1.6.16-1all
Popcon: 3 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Scoary er designet til at anvende gene_presence_absence.csv-filen fra Roary samt som en traits-fil oprettet af brugeren og beregne associationerne mellem alle gener i accessory-genet og egenskaberne. Den rapporterer en liste over gener sorteret efter styrke på association per egenskab.

Please cite: Ola Brynildsrud, Jon Bohlin, Lonneke Scheffer and Vegard Eldholm: Rapid scoring of genes in microbial pan-genome-wide association studies with Scoary. (PubMed,eprint) Genome Biology 17(238) (2016)
Registry entries: Bio.Tools  OMICtools  bioconda 
Scythe
Byesiansk adaptortrimmer for sekvenslæsninger
Versions of package scythe
ReleaseVersionArchitectures
stretch0.994-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.994+git20141017.20d3cff-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye0.994+git20141017.20d3cff-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.994+git20141017.20d3cff-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Scythe bruger en naiv bayesiansk fremgangsmåde til at klassificere forurenende understrenge i sekvenslæsninger. Den kigger på kvalitetsinformation, hvilket kan gøre den robust i udvælgelse af 3'-end adaptere, som ofte inkluderer baser i dårlig kvalitet.

Registry entries: SciCrunch  OMICtools 
Seqprep
Strippe adaptere og/eller sammenføjede parrede læsninger af DNA-sekvenser med overlap
Versions of package seqprep
ReleaseVersionArchitectures
buster1.3.2-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.3.2-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.3.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.3.2-3amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

SeqPrep er et program til at sammenlægge parrede Illuminalæsninger, der overlapper hinanden ind i en enkelt længere læsning. Det kan også bruges til sin adaptertilpasningsfunktion uden at udføre nogen parrede slut-overlapninger. Når en adaptersekvens er nuværende, det betyder, at de to læsninger skal overlappe (i de fleste tilfælde) så de er kraftigt fusioneret. Når læsninger ikke har adaptersekvens, skal de behandles omhyggeligt, når man laver sammenføjningen, så en langt mere specifik fremgangsmåde er valgt. Standardparametrene blev valgt med tanke på specificitet, så at de kunne køres på biblioteker, hvor meget få læsninger forventes at overlappe hinanden. Det er dog altid sikreste at gemme den overlappende procedure for biblioteker, hvor du har forudgående kendskab til, at en væsentlig del af læsningerne vil have overlapning.

Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Seqtk
Hurtigt letvægtsværktøj til behandling af sekvenser i formaterne FASTA eller FASTQ
Versions of package seqtk
ReleaseVersionArchitectures
sid1.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.0-1amd64,armel,armhf,i386
stretch1.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 11 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

I øjeblikket understøtter seqtk en kvalitetsbaseret justering med algoritmen phred, konvertering fra fastq til fasta, komplementering af omvendte sekvenser, udpakning eller maskering af delsekvender i regioner, der stammer fra en BED/navneliste-fil, og mere. Den indeholder et modul til at indsamle delvise prøver, der indsamler eksakt n sekvenser eller en fraktion af sekvenser.

Seqtk understøtter både inddatafiler af typen fasta og fastq, der valgfrit kan komprimeres med gzip.

Registry entries: Bio.Tools  OMICtools  bioconda 
Screenshots of package seqtk
Sga
De novo-genomsamler som bruger strenggrafer
Versions of package sga
ReleaseVersionArchitectures
buster0.10.15-4amd64,arm64,mips64el,ppc64el
stretch0.10.15-2amd64,arm64,mips64el,ppc64el
bullseye0.10.15-4amd64,arm64,mips64el,ppc64el
sid0.10.15-4amd64,arm64,mips64el,ppc64el
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Hovedformålet med SGA er at være meget hukommelseseffektivt, hvilket opnås ved at bruge en komprimeret repræsentation af DNA-sekvenslæsninger.

SGA er en novo-samler for DNS-sekvenslæsninger. Programmet er baseret på Gene Myers' strenggrafformulation af samling og bruger FM-index/Burrows-Wheeler-transform til effektivt at finde overlapninger mellem sekvenslæsninger.

Please cite: Jared T. Simpson and Richard Durbin: Efficient de novo assembly of large genomes using compressed data structures.. (PubMed,eprint) Genome Res 22(3):549-555 (2012)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Sickle
Vinduesopdelt adaptiv trimmingværktøj for FASTQ-filer der bruger kvalitet
Versions of package sickle
ReleaseVersionArchitectures
bullseye1.33+git20150314.f3d6ae3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.33-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.33+git20150314.f3d6ae3-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.33+git20150314.f3d6ae3-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

De fleste moderne sekventeringsteknologier fremstiller læsninger, som har lavere kvalitet mod 3'.end. Ukorrekte kaldte baser her påvirker negativt samlinger, oversættelse og bioinformatik-analyser.

Sickle er et værktøj, som bruger glidende vinduer sammen med kvalitets- og længdetærskler til at bestemme når kvaliteten er tilstrækkelig lav til at trimme 3'-end af læsninger. Programmet vil også fjerne læsninger baseret på længdens tærskel. Værktøjet bruger kvalitetsværdierne og glider et vindue på tværs af dem hvis længde er 0,1 gange længden af læsningen. Hvis denne længde er mindre end 1, så sættes vinduet til længden på læsningen. Elles glider vinduet langs kvalitetsværdierne indtil den gennemsnitlige kvalitet i vinduet er under tærsklen. På dette tidspunkt bestemmer algoritmen hvor i vinduet tabet opstår og klipper både læsningen og kvalitetsstrengene der. Hvis klip-punktet er mindre end minimumslængdens tærskel, så fjernes læsningen helt.

Sickle understøtter fire typer af kvalitetsværdier: Illumina, Solexa, Phred og Sanger. Bemærk at kvalitetsindstillingen Solexa er en tilnærmelse (den faktiske konvertering er en ikkelineær transformation). Sluttilnærmelsen er luk.

Sickle understøtter også filer pakket med gzip.

Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Smalt
Værktøj til sekvensoversættelse og sammenligning
Versions of package smalt
ReleaseVersionArchitectures
stretch0.7.6-6amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
jessie0.7.6-4amd64,armhf,i386
bullseye0.7.6-8amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
sid0.7.6-8amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
buster0.7.6-8amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 9 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

SMALT sammenligner effektivt DNA-sekvenslæsninger med et referencegenom. Læsninger fra en bred vifte af sekvensplatforme, for eksempel Illunina, Roche-454, Ion Torrent, PacBio eller ABI-Sanger, kan behandles inklusive parrede læsninger.

Programmet anvender et perfekt hashindeks med korte ord (<20 nukleotider lang), samplet ved ækvivalente trin langs genomreferencesekvenser.

For hver læsning bliver potentielt matchende segmenter i referencen identificeret fra seed-matchninger i indekset og efterfølgende sammenlignet med læsningen via en forbundet Smith-Waterman-algoritme.

Den bedste sammenligning af hver læsning rapporteres inklusive en bedømmelse af troværdighed for bedste oversættelse. Brugeren kan justere balancen mellem sensitivitet og hastighed ved at finjustere længden og mellemrum for hashede ord.

En tilstand for registrering af split-læsninger (chimeric) tilbydes. Programkørsel med flere tråde er også understøttet.

Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Remark of Debian Med team: This can be regarded as successor of ssaha2

This program is from the same author as ssaha2 and according to its author faster and more precise than ssaha2 (except for sequences > 2000bp).

Smrtanalysis
Programpakke for enkel molekyle, realtids sekventering
Versions of package smrtanalysis
ReleaseVersionArchitectures
stretch0~20161126all
sid0~20180814all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

SMRT®-analyse er en funktionsrig programpakke indenfor bioinformatik udviklet i åben kildekode og tilgængelig for analyse af DNA- sekventeringsdata fra Pacific Biosciences' SMRT-teknologi. Brugere kan vælge blandt en række analyseprotokoller, som udnytter PacBio® og tredjepartsværktøjer. Analyseprotokoller inkluderer de novo-genomsamling, cDNA-oversættelse, DNA base-ændringsregistrering og lang-amplicon analyse til at bestemme fasede konsensussekvenser.

Dette er en metapakke, som afhænger af komponenterne for SMRT Analysis.

Registry entries: Bio.Tools  SciCrunch  OMICtools 
Snap-aligner
Scalable Nucleotide Alignment Program
Versions of package snap-aligner
ReleaseVersionArchitectures
sid1.0~beta.18+dfsg-3amd64,arm64,mips64el,ppc64el
bullseye1.0~beta.18+dfsg-3amd64,arm64,mips64el,ppc64el
buster1.0~beta.18+dfsg-3amd64,arm64,mips64el,ppc64el
stretch1.0~beta.18+dfsg-1amd64,arm64,mips64el,ppc64el
Popcon: 4 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

SNAP er en ny sekvenssammenligner, som er 3-20 gange hurtigere og lige så præcis som eksisterende værktøjer såsom BWA-mem, Bowtie2 og Novoalign. Programmer kan afvikles på gængse x86-processorer og understøtter en rig fejlmodel, som gør at den billigt kan matche læsninger med flere forskelle fra referencen end andre værktøjer. Dette giver SNAP op til 2 gange lavere fejlrate end eksisterende værktøjer (i nogle tilfælde) og lader dig matche større mutationer, som de måske mangler. SNAP læser også BAM, FASTQ eller gzippet FASTQ og skriver SAM eller BAM, med indbygget sortering, dublet markering og BAM-indeks.

Please cite: Matei Zaharia, William J. Bolosky, Kristal Curtis, Armando Fox, David Patterson, Scott Shenker, Ion Stoica, Richard M. Karp and Taylor Sittler: Faster and More Accurate Sequence Alignment with SNAP. (eprint) arXiv preprint arXiv:1111.5572 (2011)
Registry entries: SciCrunch  OMICtools 
Sniffles
Strukturel variationskalder der bruger tredjegenerations sekventering
Versions of package sniffles
ReleaseVersionArchitectures
sid1.0.11+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.2+ds-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.11+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.11+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Sniffles er en strukturel variationskalder (SV), der bruger tredjegenerations sekventeringsdata såsom dem fra Pacific Biosciences- eller Oxford Nanopore-platforme. Programmet registrerer alle typer af SV'er via bevis fra delt-læst sammenligninger, høj mismatch regioner og dækningsanalyse.

Please cite: Fritz J. Sedlazeck, Philipp Rescheneder, Moritz Smolka, Han Fang, Maria Nattestad, Arndt von Haeseler and Michael Schatz: Accurate detection of complex structural variations using single molecule sequencing. (eprint) bioRxiv (2017)
Registry entries: OMICtools  bioconda 
Snp-sites
Binær kode for pakken snp-sites
Versions of package snp-sites
ReleaseVersionArchitectures
stretch2.3.2-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.5.0-1amd64,armel,armhf,i386
bullseye2.5.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid2.5.1-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster2.4.1-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 8 users (14 upd.)*
Versions and Archs
License: DFSG free
Git

Dette program finder single nucleotide polymorphism-sider (SNP) fra multi-fasta sammenligningsfiler (som kan være komprimerede). Dets resultat kan være i forskellige formater (Multi Fasta Alignment, Vcf, phylip).

Programmet er blevet udviklet på Wellcome Trust Sanger Institute.

En enkel nukleotid - polymorfi (SNP, udtalt snip; flertal snips) er en DNA-sekvensvariation, der opstår når en Single Nucleotide — A, T, C eller G — i genomet (eller en anden delt sekvens) er forskellig fra medlemmer af en biologisk art eller parrede kromosomer. For eksempel: To sekventerede DNA-fragmenter fra forskellige individer, AAGCCTA til AAGCTTA, indeholder en forskel i en enkel nukleotid. I dette tilfælde er der to alleler. Næsten alle fælles SNP'er har kun to alleler.

Please cite: Andrew J. Page, Ben Taylor, Aidan J. Delaney, Jorge Soares, Torsten Seemann, Jacqueline A. Keane and Simon R. Harris: SNP-sites: rapid efficient extraction of SNPs from multi-FASTA alignments. (eprint) Microbial Genomics 2(4) (2016)
Registry entries: OMICtools 
Topics: Genetic variation
Screenshots of package snp-sites
Snpomatic
Hurtig, stringent kort-læsning oversættelsesprogram
Versions of package snpomatic
ReleaseVersionArchitectures
stretch1.0-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0-4amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Sekvensteknologier med høj gennemløb opretter store mængder af korte læsninger. Oversættelse af disse til en referencesekvens forbruger store mængder af behandlingstid og hukommelse, og læste oversættelsesfejl kan føre til støj eller ukorrekte sammenligninger.

SNP-o-matic er et hurtigt, stringent kort-læsning oversættelsesprogram. Det understøtter en mængde af uddatatyper og formater, for brug i filtrering, sammenligninger, sekvensbaseret genotypekald, assisteret nysamling af contigs etc.

Please cite: Heinrich Magnus Manske and Dominic P. Kwiatkowski: SNP-o-matic. (PubMed,eprint) Bioinformatics 25(18):2434-2435 (2009)
Registry entries: Bio.Tools  OMICtools  bioconda 
Topics: Genetic variation; Mapping
Soapdenovo
Short-read samlingsmetode til at bygge de novo-kladdesamling
Versions of package soapdenovo
ReleaseVersionArchitectures
bullseye1.05-5amd64
buster1.05-5amd64
jessie1.05-2amd64
stretch1.05-3amd64
sid1.05-5amd64
Popcon: 6 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

SOAPdenovo er en lille short-read samlingsmetode, som kan bygge en de novo-kladdesamling for arvemassen i menneskestørrelse. Programmet er specielt designet til at samle »Illumina GA short reads«.

Programmet skaber nye muligheder for bygning af referencesekvenser og udføre præcise analyser af ej opdaget arvemasse på en omkostningseffektiv måde.

Denne version vedligeholdes ikke længere, overvej at bruge soapdenovo2.

Please cite: Ruiqiang Li, Hongmei Zhu, Jue Ruan, Wubin Qian, Xiaodong Fang, Zhongbin Shi, Yingrui Li, Shengting Li, Gao Shan, Karsten Kristiansen, Songgang Li, Huanming Yang, Jian Wang and Jun Wang: De novo assembly of human genomes with massively parallel short read sequencing. (PubMed,eprint) Genome Research 20(2):265-72 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Soapdenovo2
Short-read samlingsmetode til at bygge de novo-kladdesamling
Versions of package soapdenovo2
ReleaseVersionArchitectures
stretch240+dfsg1-2amd64
jessie240+dfsg-2amd64
sid241+dfsg-3amd64
bullseye241+dfsg-3amd64
buster241+dfsg-3amd64
Popcon: 6 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

SOAPdenovo er en lille short-read samlingsmetode, som kan bygge en de novo-kladdesamling for arvemassen i menneskestørrelse. Programmet er specielt designet til at samle »Illumina GA short reads«.

Programmet skaber nye muligheder for bygning af referencesekvenser og udføre præcise analyser af ej opdaget arvemasse på en omkostningseffektiv måde.

Please cite: Ruibang Luo, Binghang Liu, Yinlong Xie, Zhenyu Li, Weihua Huang, Jianying Yuan, Guangzhu He, Yanxiang Chen, Qi Pan, Yunjie Liu, Jingbo Tang, Gengxiong Wu, Hao Zhang, Yujian Shi, Yong Liu, Chang Yu, Bo Wang, Yao Lu, Changlei Han, David W Cheung, Siu-Ming Yiu, Shaoliang Peng, Zhu Xiaoqian, Guangming Liu, Xiangke Liao, Yingrui Li, Huanming Yang, Jian Wang, Tak-Wah Lam and Jun Wang: SOAPdenovo2: an empirically improved memory-efficient short-read de novo assembler. Giga Science 1(1):18 (2012)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Sortmerna
Værktøj til at filtrere, oversætte og OTU-udvælge NGS-læsninger
Versions of package sortmerna
ReleaseVersionArchitectures
buster2.1-3amd64,i386
stretch2.1-1amd64,i386
bullseye2.1-3amd64,i386
sid2.1-3amd64,i386
Popcon: 5 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

SortMerNA er et biologisk sekvensanalyseværktøj til at filtrere, oversætte og OTU-udvælge NGS-læsninger. Grundalgoritmen er baseret på tilnærmede seeds og muliggør hurtige og følsomme analyser af nukleotidsekvenser. Den vigtigste anvendelse af SortMeRNA er filtrering af rRNA fra metatranscriptomiske data. Yderligere applikationer omfatter OTU-plukning og taksonomitildeling til rådighed gennem QIIME v1.9+ (http://qiime.org - v1.9.0-rc1). SortMeRNA bruger som inddata en fil med læsninger (fasta- eller fastq- format) og en eller flere rRNA-databasefiler og sorterer rRNA og afviste læsninger væk i to filer specificeret af brugeren. Eventuelt kan det give lokale sammenligninger i høj kvalitet af rRNA-læsninger mod rRNA-databasen. SortMeRNA fungerer med Illumina-, 454-, Ion Torrent- og PacBio-data og kan fremstille SAM- og BLAST-lignende sammenligninger.

Please cite: Evguenia Kopylova, Laurent Noé and Hélène Touzet: SortMeRNA: fast and accurate filtering of ribosomal RNAs in metatranscriptomic data". (PubMed,eprint) Bioinformatics 28(24):3211-3217 (2012)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Spades
Genomsamler for single-celle- og isolates-datasæt
Versions of package spades
ReleaseVersionArchitectures
bullseye3.13.0+dfsg2-2amd64
stretch3.9.1+dfsg-1amd64
buster3.13.0+dfsg2-2amd64
sid3.13.0+dfsg2-2amd64
Popcon: 11 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

SPAdes - St. Petersburg-genomsamleren er lavet for både isolates- og single-celle MDA-bateriesamlinger. Den fungerer med Illumina- eller IonTorrent-læsninger og kan tilbyde hybride samlinger, der bruger PacBio- og Sangerlæsninger. Du kan også tilbyde yderligere contigs, som vil blive brugt som lange læsninger.

Please cite: Anton Bankevich, Sergey Nurk, Dmitry Antipov, Alexey A. Gurevich, Mikhail Dvorkin, Alexander S. Kulikov, Valery M. Lesin, Sergey I. Nikolenko, Son Pham, Andrey D. Prjibelski, Alexey V. Pyshkin, Alexander V. Sirotkin, Nikolay Vyahhi, Glenn Tesler, Max A. Alekseyev and Pavel A. Pevzner: SPAdes: A New Genome Assembly Algorithm and Its Applications to Single-Cell Sequencing. (PubMed,eprint) Journal of Computational Biology 19(5):455-477 (2012)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Sprai
Forbedring af single-pass-sekventeringslæsenøjagtighed
Versions of package sprai
ReleaseVersionArchitectures
sid0.9.9.23+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye0.9.9.23+dfsg-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch0.9.9.22+dfsg-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster0.9.9.23+dfsg-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Sprai er et værktøj til at rette sekventeringsfejl i single-pass- læsninger for de novo-samling. Det er oprindeligt designet for rettelse af sekventeringsfejl i enkelt molekyle DNS-sekventeringslæsninger, specielt i Continous Long Reads (CLR'er) oprettet af PacBio RS- sekvensprogrammer. Formålet med Sprai er ikke at maksimere præcisionen for fejlrettede læsninger. I stedet forsøger Sprai at maksimere kontinuiteten (dvs., N50 contig-længder) for samlede contig'er efter fejlrettelse.

Registry entries: OMICtools 
Sra-toolkit
Redskaber for NCBI Sequence Read Archive
Versions of package sra-toolkit
ReleaseVersionArchitectures
bullseye2.9.3+dfsg-1amd64
buster2.9.3+dfsg-1amd64
stretch2.8.1-2+dfsg-2amd64,i386
wheezy2.1.7a-1amd64,i386,kfreebsd-amd64,kfreebsd-i386
jessie2.3.5-2+dfsg-1amd64,i386
sid2.9.3+dfsg-1amd64
upstream2.10.0
Popcon: 14 users (9 upd.)*
Newer upstream!
License: DFSG free
Git

Værktøjer til at læse SRA-arkivet, generelt ved at konvertere individuelle kørsler til et ofte anvendt format såsom fastq.

De tekstmæssige dumpere »sra-dump« og »vdb-dump« tilbydes i denne udgivelse som en hjælp til visuel inspektion. Det er sandsynligt, at den faktiske uddataformatering vil blive ændret i den nære fremtid for en mere stringent, mere formaliseret repræsentation. AFHÆNG IKKE AF UDDATAFORMATET I DENNE UDGIVELSE.

Informationen »Help« vil blive forbedret i fremtidige udgivelser og værktøjsindstillingerne vil blive standardiseret på tværs af sættet. Yderligere dokumentation vil også blive lagt på NCBI-hjemmesiden.

Værktøjsindstillinger kan ændre sig i den næste udgivelse. Version 1- værktøjsindstillinger vil forblive understøttet hvor muligt for at bevare funktionaliteten på eksisterende skripter.

Please cite: Rasko Leinonen, Ruth Akhtar, Ewan Birney, James Bonfield, Lawrence Bower, Matt Corbett, Ying Cheng, Fehmi Demiralp, Nadeem Faruque, Neil Goodgame, Richard Gibson, Gemma Hoad, Christopher Hunter, Mikyung Jang, Steven Leonard, Quan Lin, Rodrigo Lopez, Michael Maguire, Hamish McWilliam, Sheila Plaister, Rajesh Radhakrishnan, Siamak Sobhany, Guy Slater, Petra Ten Hoopen, Franck Valentin, Robert Vaughan, Vadim Zalunin, Daniel Zerbino and Guy Cochrane: Improvements to services at the European Nucleotide Archive. (PubMed,eprint) Nucleic Acids Research 38(Database issue):D39-45 (2010)
Registry entries: Bio.Tools  OMICtools 
Srst2
Kort læsesekvensindtastning for bakterielle patogener
Versions of package srst2
ReleaseVersionArchitectures
sid0.2.0-6amd64
bullseye0.2.0-6amd64
stretch0.2.0-4amd64
buster0.2.0-6amd64
Popcon: 6 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Dette program er designet til at bruge Illumina-sekvensdata, en MLST-database og/eller en database med gensekvenser (f.eks. resistente gener, virulensgener etc.) og rapportere tilstedeværelsen af ST'er og/eller referencegener.

Please cite: Michael Inouye, Harriet Dashnow, Lesley-Ann Raven, Mark B Schultz, Bernard J Pope, Takehiro Tomita, Justin Zobel and Kathryn E Holt: SRST2: Rapid genomic surveillance for public health and hospital microbiology labs. (PubMed,eprint) Genome Medicine 6(11):90 (2014)
Registry entries: OMICtools  bioconda 
Ssake
Genomprogram for samling af millioner af meget korte DNA-sekvenser
Versions of package ssake
ReleaseVersionArchitectures
wheezy3.8-2all
sid4.0-3all
bullseye4.0-3all
buster4.0-2all
stretch3.8.4-1all
jessie3.8.2-1all
squeeze3.5-1all
Debtags of package ssake:
biologynuceleic-acids
fieldbiology
interfaceshell
roleprogram
scopeutility
useanalysing
Popcon: 8 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Short Sequence Assembly af K-mer search and 3′ read Extension (SSAKE) er et genomprogram for aggressiv samling af millioner af korte nukleotidsekvenser ved gradvis at søge efter perfekte 3'-meste k-merer ved hjælp af et DNA-præfikstræ. SSAKE er designet til at hjælpe med at udnytte oplysningerne fra korte sekvenser læst ved stringent klyngeopbygning i contig'er, der kan bruges til at karakterisere nye sekventeringsmål.

Please cite: Rene L. Warren, Granger G. Sutton, Steven J. M. Jones and Robert A. Holt: Assembling millions of short DNA sequences using SSAKE. (PubMed,eprint) Bioinformatics 23(4):500-501 (2007)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Topics: Sequence assembly
Stacks
Datakanal for bygning af loci fra kort-læs DNA-sekvenser
Versions of package stacks
ReleaseVersionArchitectures
stretch1.44-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
bullseye2.41+dfsg-1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
sid2.41+dfsg-1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
buster2.2+dfsg-1amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
Popcon: 5 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Stacks er en programdatakanal for bygning af loci (specifik placering af et gen) fra kort-læs sekvenser, såsom dem oprettet på platformen Illumina. Stacks blev udviklet for at fungere med begrænsning af enzymbaserede data, såsom RAD-seq, med det formål at bygge genetiske kort og udføre forskning indenfor befolkningsgener og fylogeografi.

Bemærk at denne pakke installerer Stacks på en måde der gør, at alle kommandoer skal køres som: $ stacks

Please cite: Julian Catchen, Paul A. Hohenlohe, Susan Bassham, Angel Amores and William A. Cresko: Stacks: an analysis tool set for population genomics. (PubMed) Molecular Ecology 22(11):3124-40 (2013)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Stringtie
Saml korte RNAseq-læsninger til transkripter
Versions of package stringtie
ReleaseVersionArchitectures
sid1.3.5+dfsg-1i386
sid1.3.6+dfsg-1amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
upstream2.0.4
Popcon: 1 users (1 upd.)*
Newer upstream!
License: DFSG free
Git

Mangfoldigheden af transkripter i menneskevævsprøver kan bestemmes via RNA-sekventering. Den præcise sekvens indhentet kan være vilkårlig, afhængig af anvendt teknologi. Og den kan være kort, dvs. kortere end transkripten. På et tidspunkt har mange korte læsninger brug for at samles til modellen for den fuldstændige transkript.

StringTie ved hvordan RNA-seq skal samles til potentielle transkripter uden behov for et referencegenom og tilbyder en kvantifikation af splice- varianterne.

Please cite: Mihaela Pertea, Geo M. Pertea, Corina .M. Antonescu, Tsung-Cheng Chang, Joshua T. Mendell and Steven L. Salzberg: StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology 33:290–295 (2015)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Subread
Værktøjssæt til at behandle næstegen. sekvensdata
Versions of package subread
ReleaseVersionArchitectures
stretch1.5.1+dfsg-4amd64,arm64,armel,armhf,i386,ppc64el
bullseye2.0.0+dfsg-1amd64,arm64,armel,armhf,i386,ppc64el
sid2.0.0+dfsg-1amd64,arm64,armel,armhf,i386,ppc64el
buster1.6.3+dfsg-1amd64,arm64,armel,armhf,i386,ppc64el
Popcon: 6 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Subread aligner kan bruges til at sammenligne gDNA-seq- og RNA-sew- læsninger. Subjunc aligner blev specifikt designet til registrering af exon-exon junction. For oversættelse af RNA-seq-læsninger kan Subread udføre lokale sammenligninger og Subjunc udfører globale sammenligninger.

Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Sumaclust
Hurtig og præcis klyngeopsætning af genomsekvenser
Versions of package sumaclust
ReleaseVersionArchitectures
buster1.0.31-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.0.31-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bullseye1.0.31-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch1.0.20-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream1.0.34
Popcon: 4 users (5 upd.)*
Newer upstream!
License: DFSG free
Git

Med udviklingen af den næste generation af sekventering skal effektive værktøjer håndterer millioner af sekvenser på en fornuftig tid. Sumaclust er et program udviklet af LECA. Sumaclust forsøger at klyngeopsætte sekvenser på en måde som er hurtig og præcis på samme tid. Dette værktøj er blevet udviklet som en tilpasning til den type af data som oprettes af DNA-metastregkodere, dvs. fuldt ud sekventeret, korte markører. Sumaclust klyngeopsætter via de samme klyngealgoritmer som UCLUST og CD-HIT. Denne algoritme er hovedsagelig nyttig til at registrere de »fejlramte« sekvenser opretter under amplifikation og sekvensprotokoller, afledt fra »true« sekvenser.

Registry entries: OMICtools  bioconda 
Sumatra
Hurtig og præcis sammenligning og sekvensklynger
Versions of package sumatra
ReleaseVersionArchitectures
bullseye1.0.31-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.31-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.0.31-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.0.20-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
upstream1.0.34
Popcon: 5 users (7 upd.)*
Newer upstream!
License: DFSG free
Git

Med udviklingen af den næste generation af sekventering skal effektive værktøjer håndterer millioner af sekvenser på en fornuftig tid. Sumatra er et program udviklet af LECA. Sumatra forsøger at sammenligne sekvenser på en måde som er hurtig og præcis på samme tid. Dette værktøj er blevet udviklet som en tilpasning til den type af data som oprettes af DNA-metastregkodere, dvs. fuldt ud sekventeret, korte markører. Sumatra beregner de parvis sammenligningsbedømmelser fra et datasæt eller mellem to datasæt, med mulighed for at angive en lighedstærskel hvorefter sekvenspar som har en lavere lighed ikke rapporteres. Uddata kan gå igennem en klassifikationsproces med programmer såsom MCL eller MOTHUR.

Registry entries: SciCrunch  OMICtools 
Tabix
Generisk indeksprogram for TAB-afgrænsede arvemassepositionsfiler
Versions of package tabix
ReleaseVersionArchitectures
jessie0.2.6-2armhf
sid1.9-11amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
jessie1.1-1amd64,armel,i386
stretch1.3.2-2amd64,arm64,armel,i386,mips64el,mipsel,ppc64el
bullseye1.9-11amd64,arm64,armel,armhf,mips64el,mipsel,ppc64el,s390x
buster1.9-11amd64,arm64,armel,armhf,mips,mips64el,mipsel,ppc64el,s390x
wheezy0.2.6-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
Debtags of package tabix:
roleprogram
works-with-formathtml
Popcon: 25 users (22 upd.)*
Versions and Archs
License: DFSG free
Git

Tabix indekserer filer hvor nogle kolonner indikerer sekvenskoordinater: navn (normalt et kromosom), start og stop. Inddatafilen skal være positionssorteret og komprimeret af bgzip (tilbudt i denne pakke), som har en grænseflade der ligner gzip. Efter indeksering er tabix i stand til hurtigt at hente datalinjer efter kromosomkoordinater. Hurtig dataindhentelse fungerer også over netværk hvis en URI angives som et filnavn.

Denne version af tabix er bygget fra HTSlib-kilden.

Please cite: Heng Li: Tabix: fast retrieval of sequence features from generic TAB-delimited files. (PubMed,eprint) Bioinformatics 27(5):718-719 (2011)
Registry entries: OMICtools  bioconda 
Screenshots of package tabix
Tophat
Hurtig splejsningsforbindelsesoversætter for RNA-sekvenslæsninger
Versions of package tophat
ReleaseVersionArchitectures
bullseye2.1.1+dfsg1-2amd64,arm64,mips64el,ppc64el,s390x
stretch2.1.1+dfsg-2amd64
buster2.1.1+dfsg1-2amd64,arm64,mips64el,ppc64el,s390x
jessie2.0.13+dfsg-1amd64
sid2.1.1+dfsg1-2amd64,arm64,mips64el,ppc64el,s390x
Popcon: 9 users (8 upd.)*
Versions and Archs
License: DFSG free
Git

TopHat sammenligner RNA-sekvenslæsninger med genomer i mammalian-størrelse via ultra høj-gennemløb kortlæsningsssammenligneren Bowtie, og analyserer så resultaterne for at identificere splejsningsforbindelser mellem exoner. TopHat er et samarbejde mellem University of Maryland Center for Bioinformatics og Computational Biology og University of California, Berkeley Departments for matematisk og molekylær- og cellebiologi.

The package is enhanced by the following packages: cufflinks
Please cite: Cole Trapnell, Lior Pachter and Steven L. Salzberg: TopHat: discovering splice junctions with RNA-Seq. (PubMed,eprint) Bioinformatics 25(9):1105-1111 (2009)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Transrate-tools
Hjælpeprogram til transrate
Versions of package transrate-tools
ReleaseVersionArchitectures
stretch1.0.0-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster1.0.0-2amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
bullseye1.0.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid1.0.0-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 4 users (5 upd.)*
Versions and Archs
License: DFSG free
Git

Transrate er et bibliotek og værktøj for kommandolinjen til kvalitetsvurdering af de-novo transkriptomforsamlinger.

Denne pakke tilbyder værktøjer for kommandolinjen brugt af transrate til at behandle BAM-filer.

Please cite: Richard Smith-Unna, Chris Boursnell, Rob Patro, Julian M. Hibberd and Steven Kelly: TransRate: reference-free quality assessment of de novo transcriptome assemblies.. (PubMed,eprint) Genome Research 26(8):1134-1144 (2016)
Registry entries: OMICtools  bioconda 
Trimmomatic
Fleksibelt værktøj til læsetrimning af Illumina NGS-data
Versions of package trimmomatic
ReleaseVersionArchitectures
sid0.39+dfsg-1all
stretch0.36+dfsg-1all
jessie0.32+dfsg-4all
buster0.38+dfsg-1all
bullseye0.39+dfsg-1all
Popcon: 10 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

Trimmomatic udfører en række nyttige trimningsopgaver for illumina-parret-end og enkelt sluttede data. Udvalget af trimningstrin og deres associerede parametre angives på kommandolinjen.

De nuværende trimningstrin er:

  • ILLUMINACLIP: Klip adapter og andre illumina-specifikke sekvenser fra læsningen.
  • SLIDINGWINDOW: Udfør en glidende vinduestrimning, der klipper når først gennemsnitskvaliteten i vinduet går under en tærskel.
  • LEADING: Klip baser væk fra begyndelsen af en læsning, hvis under en tærskelkvalitet
  • TRAILING: Klip baser væk i slutningen af læsningen, hvis under en tærskelkvalitet
  • CROP: Klip læsningen til en specificeret længde
  • HEADCROP: Klip det angivne antal baser fra begyndelsen af læsningen
  • MINLENGTH: Drop læsningen hvis den er under en angivet længde
  • TOPHRED33: Konverter kvalitetsbedømmelser til Phred-33
  • TOPHRED64: Konverter kvalitetsbedømmelser til Phred-64 Programmet fungerer med FASTQ (bruger phred + 33 eller phred + 64 kvalitetsbedømmelser afhængig af den anvendte Illuminadatakanal), enten uden komprimering eller gzipp'et FASTQ. Brug af gzip-formatet bestemmes baseret på .gz-udvidelsen.
Please cite: A.M. Bolger, M. Lohse and B. Usadel: Trimmomatic: a flexible trimmer for Illumina sequence data. (PubMed,eprint) Bioinformatics 30(15):2114-2120 (2014)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Topics: Sequencing
Screenshots of package trimmomatic
Trinityrnaseq
RNA-Seq De novo Assembly
Versions of package trinityrnaseq
ReleaseVersionArchitectures
sid2.6.6+dfsg-6amd64
buster2.6.6+dfsg-6amd64
stretch2.2.0+dfsg-2amd64
bullseye2.6.6+dfsg-6amd64
Popcon: 4 users (4 upd.)*
Versions and Archs
License: DFSG free
Git

Trinity repræsenterer en hidtil ukendt fremgangsmåde til effektiv og robust de novo-rekonstruktion af transkriptomer fra RNA-seq-data. Trinity kombinerer tre uafhængige programmoduler: Inchworm, Chrysalis, og Butterfly, anvendt sekventielt til at behandle store mængder af RNA-seq-læsninger. Trinity partitionerer sekvensdata i mange individuelle de Bruijn-grafer, der hver repræsenterer transkriptionel kompleksitet ved et givet gen eller locus, og derefter behandler hver graf uafhængigt for at udvinde fuld længde-isoformer ved splejsning og drille aparte transkripter afledt af paraloge gener.

Please cite: Manfred G Grabherr, Brian J Haas, Moran Yassour, Joshua Z Levin, Dawn A Thompson, Ido Amit, Xian Adiconis, Lin Fan, Raktima Raychowdhury, Qiandong Zeng, Zehua Chen, Evan Mauceli, Nir Hacohen, Andreas Gnirke, Nicholas Rhind, Federica di Palma, Bruce W Birren, Chad Nusbaum, Kerstin Lindblad-Toh, Nir Friedman and Aviv Regev: Full-length transcriptome assembly from RNA-Seq data without a reference genome.. (PubMed) Nature Biotechnology 29(7):644-652 (2011)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Uc-echo
Fejlkorrektionsalgoritme designet for kort-læsninger fra NGS
Versions of package uc-echo
ReleaseVersionArchitectures
bullseye1.12-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster1.12-11amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
jessie1.12-7amd64,armel,armhf,i386
stretch1.12-9amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.12-12amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 7 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

ECHO er en algoritme til fejlkorrektioner designet for kort-læsninger fra næstegenerations sekvensplatforme såsom Illuninas Genome Analyzer II. Algoritmen bruger en bayesiansk ramme til at forbedre kvaliteten af læsningerne i et givent datasæt ved at anvende maksimal a posteriori-estimering.

Please cite: W.-C. Kao, A.H. Chan and Y.S. Song: ECHO: A reference-free short-read error correction algorithm. (PubMed,eprint) Genome Research 21:1181-1192 (2011)
Registry entries: Bio.Tools  SciCrunch  OMICtools 
Topics: Data management; Sequencing
Vcftools
Samling af værktøjer til arbejdet med VCF-filer
Versions of package vcftools
ReleaseVersionArchitectures
jessie0.1.12+dfsg-1amd64,armel,armhf,i386
stretch0.1.14+dfsg-4+deb9u1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
wheezy0.1.9-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
bullseye0.1.16-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie-security0.1.12+dfsg-1+deb8u1amd64,armel,armhf,i386
sid0.1.16-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster0.1.16-1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package vcftools:
roleprogram
Popcon: 23 users (23 upd.)*
Versions and Archs
License: DFSG free
Git

VCFtools er en programpakke designet for arbejde med VCF-filer, såsom dem oprettet af 1000 Genomes Project. Formålet med VCFtools er at tilbyde metoder for arbejde med VCF-filer: validering, sammenføjning, sammenligning og beregning af noget grundlæggende statistik om befolkningsgenetik.

Please cite: Petr Danecek, Adam Auton, Goncalo Abecasis, Cornelis A. Albers, Eric Banks, Mark A. DePristo, Robert E. Handsaker, Gerton Lunter, Gabor T. Marth, Stephen T. Sherry, Gilean McVean and Richard Durbin: The variant call format and VCFtools. (PubMed,eprint) Bioinformatics 27(15):2156-8 (2011)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Velvet
Sekvens-assembler for nukleinsyre til meget korte læsninger
Versions of package velvet
ReleaseVersionArchitectures
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
squeeze1.0.02~nozlibcopy-1amd64,armel,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,sparc
bullseye1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
wheezy1.2.03~nozlibcopy-1amd64,armel,armhf,i386,ia64,kfreebsd-amd64,kfreebsd-i386,mips,mipsel,powerpc,s390,s390x,sparc
jessie1.2.10+dfsg1-1amd64,armel,armhf,i386
buster1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
Debtags of package velvet:
biologynuceleic-acids
fieldbiology, biology:bioinformatics
interfacecommandline
roleprogram
useanalysing
Popcon: 8 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet er en »de novo«-genomisk assembler som er specielt designet for teknologier til kort læsning, såsom Solexa eller 454, udviklet af Daniel Zerbino og Ewan Birney ved European Bioinformatics Institue (EMBL-EBI), nær Cambridge, i Storbritannien.

Velvet kan i øjeblikket tage korte læsesekvenser, fjerner fejl og fremstiller dernæst unikke »contig'er« i høj kvalitet. Det anvender derefter parvis læseinformation, hvis tilgængelig, til at indhente de gentagne områder mellem contig'erne.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Velvet-long
Sekvens-assembler for nukleinsyre til meget korte læsninger - lang version
Versions of package velvet-long
ReleaseVersionArchitectures
bullseye1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie1.2.10+dfsg1-1amd64,armel,armhf,i386
buster1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch1.2.10+dfsg1-3amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid1.2.10+dfsg1-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Velvet er en »de novo«-genomisk assembler som er specielt designet for teknologier til kort læsning, såsom Solexa eller 454, udviklet af Daniel Zerbino og Ewan Birney ved European Bioinformatics Institue (EMBL-EBI), nær Cambridge, i Storbritannien.

Velvet kan i øjeblikket tage korte læsesekvenser, fjerner fejl og fremstiller dernæst unikke »contig'er« i høj kvalitet. Det anvender derefter parvis læseinformation, hvis tilgængelig, til at indhente de gentagne områder mellem contig'erne.

Denne pakke installerer specielle long-mode-versioner af Velvet, som anbefalet i Velvetøvelserne.

Please cite: Daniel R. Zerbino and Ewan Birney: Velvet: Algorithms for de novo short read assembly using de Bruijn graphs. (PubMed,eprint) Genome Research 18(5):821-829 (2008)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Velvetoptimiser
Optimer automatisk Velvet do novo-samlingsparametre
Versions of package velvetoptimiser
ReleaseVersionArchitectures
sid2.2.6-2all
stretch2.2.5-5all
buster2.2.6-2all
jessie2.2.5-2all
bullseye2.2.6-2all
Popcon: 4 users (7 upd.)*
Versions and Archs
License: DFSG free
Git

VelvetOptimiser er et flertrådet Perlskript for automatisk optimering af de tre primære parameterindstillinger (K, -exp_cov, -cov_cutoff) for Velvet de novo-sekvensassembler.

Registry entries: Bio.Tools  OMICtools  bioconda 
Vsearch
Værktøj til behandling af metagenomiske sekvenser
Versions of package vsearch
ReleaseVersionArchitectures
bullseye2.13.6-1amd64
buster2.10.4-1amd64
stretch2.3.4-1amd64
sid2.13.6-1amd64
upstream2.14.1
Popcon: 4 users (6 upd.)*
Newer upstream!
License: DFSG free
Git

Alsidigt 64-bit flertrådet værktøj for behandling af metagenomiske sekvenser, inklusive søgning, klyngeopbygning, chimera-detektion, dereplikation, sortering, maskering og blanding.

Formålet med projektet er at oprette et alternativ til USEARCH-værktøjet udviklet af Robert C. Edgar (2010). Det nye værktøj bør:

  • have et 64-bit design som håndterer meget store databaser og meget mere end 4 gb hukommelse
  • være så præcis som eller mere præcis end usearch
  • være så hurtige som eller hurtigere end usearch
Please cite: Torbjørn Rognes, Tomáš Flouri, Ben Nichols, Christopher Quince and Frédéric Mahé: VSEARCH: a versatile open source tool for metagenomics. (eprint) PeerJ 4:e2584
Registry entries: Bio.Tools  OMICtools  bioconda 
Wham-align
Wisconsin's High-Throughput Alignment Method
Maintainer: Steffen Moeller
Versions of package wham-align
ReleaseVersionArchitectures
bullseye0.1.5-2amd64,i386
sid0.1.5-2amd64,i386
Popcon: 1 users (9 upd.)*
Versions and Archs
License: DFSG free
Git

This package provides functionality analogous to BWA or bowtie in aligning reads from next-generation DNA sequencing machines against a reference genome.

Please cite: Yinan Li, Allie Terrell and Jignesh M. Patel: WHAM: A High-throughput Sequence Alignment Method (eprint) Proceedings of the ACM SIGMOD International Conference on Management of Data, SIGMOD 2011, Athens, Greece (2011)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Wigeon
Ny implementering af Pintail 16S-detektionsredskabet for DNA-anamolier
Versions of package wigeon
ReleaseVersionArchitectures
sid20101212+dfsg1-2all
stretch20101212+dfsg1-1all
jessie20101212+dfsg-1all
buster20101212+dfsg1-2all
bullseye20101212+dfsg1-2all
Popcon: 8 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

WigeoN undersøger sekvensbevarelse mellem en forespørgsel og en troværdig referencesekvens, begge i NAST-sammenligningsformat. Baseret på sekvensidentiteten mellem forespørgslen og referencesekvensen, er der en forventet mængde af variation blandt sammenligningen. Hvis den observerede variation er større end 95 %-kvartilen for distributionen af variation observeret mellem sekvenser der ikke er unormale, så registreres det som en anomali.

WigeoN er en ny implementering af den fleksible kommandolinjebaserede Pintail-algoritme Appl Environ. Microbiol. 2005 Dec;7112:7724-36.

WigeoN er kun nyttig til registrering af kimærer og anomalier i næsten fuldlængde 16S rRNA-sekvenser. WigeoN mangler sensitivitet med sekvenser mindre end 1.000 bp.

For at afvikle WigeoN skal du bruge NAST-formaterede sekvenser oprettet af redskabet nast-ier.

WigeoN er en del af programpakken microbiomeutil.

The package is enhanced by the following packages: microbiomeutil-data
Please cite: Brian J. Haas, Dirk Gevers, Ashlee M. Earl, Mike Feldgarden, Doyle V. Ward, Georgia Giannoukos, Dawn Ciulla, Diana Tabbaa, Sarah K. Highlander, Erica Sodergren, Barbara Methé, Todd Z. DeSantis, The Human Microbiome Consortium, Joseph F. Petrosino, Rob Knight and Bruce W. Birren: Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. (PubMed,eprint) Genome Research 21(3):494-504 (2011)
Registry entries: SciCrunch  OMICtools 

Debian packages in contrib or non-free

Bcbio
toolkit for analysing high-throughput sequencing data
Versions of package bcbio
ReleaseVersionArchitectures
bullseye1.1.2-3all
buster1.1.2-3all
sid1.1.7-1 (contrib)all
upstream1.1.8
Popcon: 4 users (4 upd.)*
Newer upstream!
License: DFSG free, but needs non-free components
Git

This package installs the command line tools of the bcbio-nextgen toolkit implementing best-practice pipelines for fully automated high throughput sequencing analysis.

A high-level configuration file specifies inputs and analysis parameters to drive a parallel pipeline that handles distributed execution, idempotent processing restarts and safe transactional steps. The project contributes a shared community resource that handles the data processing component of sequencing analysis, providing researchers with more time to focus on the downstream biology.

Registry entries: Bio.Tools  OMICtools  bioconda 
Cufflinks
Transcript assembly, differential expression and regulation for RNA-Seq
Versions of package cufflinks
ReleaseVersionArchitectures
jessie2.2.1-1 (non-free)amd64
buster2.2.1+dfsg.1-3 (non-free)amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
sid2.2.1+dfsg.1-4 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
stretch2.2.1-3 (non-free)amd64
bullseye2.2.1+dfsg.1-4 (non-free)amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
wheezy1.3.0-2 (non-free)amd64
Popcon: 3 users (1 upd.)*
Versions and Archs
License: non-free
Git

Cufflinks assembles transcripts, estimates their abundances, and tests for differential expression and regulation in RNA-Seq samples. It accepts aligned RNA-Seq reads and assembles the alignments into a parsimonious set of transcripts. Cufflinks then estimates the relative abundances of these transcripts based on how many reads support each one.

Please cite: Cole Trapnell, Brian A Williams, Geo Pertea, Ali Mortazavi, Gordon Kwan, Marijke J van Baren, Steven L Salzberg, Barbara J Wold and Lior Pachter: Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. (PubMed) Nature Biotechnology 28(5):511-515 (2010)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Igv
Integrative Genomics Viewer
Versions of package igv
ReleaseVersionArchitectures
squeeze1.5.14-1 (non-free)all
sid2.4.17+dfsg-1 (non-free)all
stretch2.3.90+dfsg-1 (non-free)all
jessie2.3.38+dfsg-1 (non-free)all
wheezy2.0.30-1 (non-free)all
upstream2.7.2
Debtags of package igv:
fieldbiology
interfacex11
networkclient
roleprogram
scopeutility
useviewing
works-withbiological-sequence
Popcon: 1 users (0 upd.)*
Newer upstream!
License: non-free
Git

The Integrative Genomics Viewer (IGV) is a high-performance viewer that efficiently handles large heterogeneous data sets, while providing a smooth and intuitive user experience at all levels of genome resolution. A key characteristic of IGV is its focus on the integrative nature of genomic studies, with support for both array-based and next-generation sequencing data, and the integration of clinical and phenotypic data. Although IGV is often used to view genomic data from public sources, its primary emphasis is to support researchers who wish to visualize and explore their own data sets or those from colleagues. To that end, IGV supports flexible loading of local and remote data sets, and is optimized to provide high-performance data visualization and exploration on standard desktop systems.

Please cite: James T Robinson, Helga Thorvaldsdóttir, Wendy Winckler, Mitchell Guttman, Eric S Lander, Gad Getz and Jill P Mesirov: Integrative genomics viewer. (PubMed,eprint) Nature Biotechnology 29(1):24–26 (2011)
Registry entries: Bio.Tools  SciCrunch  OMICtools  bioconda 
Vdjtools
framework for post-analysis of B/T cell repertoires
Versions of package vdjtools
ReleaseVersionArchitectures
sid1.2.1+git20190311-1 (non-free)all
Popcon: users ( upd.)*
Versions and Archs
License: non-free
Git

VDJtools is an open-source Java/Groovy-based framework designed to facilitate analysis of immune repertoire sequencing (RepSeq) data. VDJtools computes a wide set of statistics and is able to perform various forms of cross-sample analysis. Both comprehensive tabular output and publication-ready plots are provided.

The main aims of the VDJtools Project are:

  • To ensure consistency between post-analysis methods and results
  • To save the time of bioinformaticians analyzing RepSeq data
  • To create an API framework facilitating development of new RepSeq analysis applications
  • To provide a simple enough command line tool so it could be used by immunologists and biologists with little computational background
Please cite: Mikhail Shugay, Dmitriy V. Bagaev, Maria A. Turchaninova, Dmitriy A. Bolotin, Olga V. Britanova, Ekaterina V. Putintseva, Mikhail V. Pogorelyy, Vadim I. Nazarov, Ivan V. Zvyagin, Vitalina I. Kirgizova, Kirill I. Kirgizov, Elena V. Skorobogatova and Dmitriy M. Chudakov: VDJtools: Unifying Post-analysis of T Cell Receptor Repertoires. (PubMed,eprint) PLoS Computational Biology 11(11):e1004503 (2015)
Registry entries: OMICtools 

Packaging has started and developers might try the packaging code in VCS

Mosaik-aligner
reference-guided aligner for next-generation sequencing
Versions of package mosaik-aligner
ReleaseVersionArchitectures
VCS2.2.30+20140627-1all
Versions and Archs
License: MIT
Debian package not available
Git
Version: 2.2.30+20140627-1

MosaikBuild converts various sequence formats into Mosaik’s native read format. MosaikAligner pairwise aligns each read to a specified series of reference sequences. MosaikSort resolves paired-end reads and sorts the alignments by the reference sequence coordinates. Finally, MosaikText converts alignments to different text-based formats.

At this time, the workflow consists of supplying sequences in FASTA, FASTQ, Illumina Bustard & Gerald, or SRF file formats and producing results in the BLAT axt, the BAM/SAM, the UCSC Genome Browser bed, or the Illumina ELAND formats.

Umap
quantify genome and methylome mappability
Versions of package umap
ReleaseVersionArchitectures
VCS1.0.0-1all
Versions and Archs
License: GPL-3.0
Debian package not available
Git
Version: 1.0.0-1

Umap identifies uniquely mappable regions of any genome. Its Bismap extension identifies mappability of the bisulfite converted genome (methylome).

Please cite: Mehran Karimzadeh, Carl Ernst, Anshul Kundaje and Michael M. Hoffman: Umap and Bismap: quantifying genome and methylome mappability. (PubMed,eprint) Nucleic Acids Res. 46(20):e120 (2018)

No known packages available

Annovar
annotate genetic variants detected from diverse genomes
License: Open Source for non-profit
Debian package not available

ANNOVAR is an efficient software tool to utilize update-to-date information to functionally annotate genetic variants detected from diverse genomes (including human genome hg18, hg19, as well as mouse, worm, fly, yeast and many others). Given a list of variants with chromosome, start position, end position, reference nucleotide and observed nucleotides, ANNOVAR can perform:

 1. Gene-based annotation: identify whether SNPs or CNVs cause protein coding
    changes and the amino acids that are affected. Users can flexibly use RefSeq
    genes, UCSC genes, ENSEMBL genes, GENCODE genes, or many other gene definition
    systems.
 2. Region-based annotations: identify variants in specific genomic regions,
    for example, conserved regions among 44 species, predicted transcription
    factor binding sites, segmental duplication regions, GWAS hits, database
    of genomic variants, DNAse I hypersensitivity sites, ENCODE
    H3K4Me1/H3K4Me3/H3K27Ac/CTCF sites, ChIP-Seq peaks, RNA-Seq peaks, or many
    other annotations on genomic intervals.
 3. Filter-based annotation: identify variants that are reported in dbSNP,
    or identify the subset of common SNPs (MAF>1%) in the 1000 Genome Project,
    or identify subset of non-synonymous SNPs with SIFT score>0.05, or many
    other annotations on specific mutations.
 4. Other functionalities: Retrieve the nucleotide sequence in any
    user-specific genomic positions in batch, identify a candidate gene list
    for Mendelian diseases from exome data, identify a list of SNPs from
    1000 Genomes that are in strong LD with a GWAS hit, and many other
    creative utilities.

In a modern desktop computer (3GHz Intel Xeon CPU, 8Gb memory), for 4.7 million variants, ANNOVAR requires ~4 minutes to perform gene-based functional annotation, or ~15 minutes to perform stepwise "variants reduction" procedure, making it practical to handle hundreds of human genomes in a day.

Forge
genome assembler for mixed read types
License: Apache 2.0
Debian package not available

Forge Genome Assembler is a parallel, MPI based genome assembler for mixed read types.

Forge is a classic "Overlap layout consensus" genome assembler written by Darren Platt and Dirk Evers. Implemented in C++ and using the parallel MPI library, it runs on one or more machines in a network and can scale to very large numbers of reads provided there is enough collective memory on the machines used. It generates a full consensus alignment of all reads, can handle mixtures of sanger, 454 and illumina reads. There is some support for solid color space and it includes built in tools for vector trimming and contamination screening.

Forge and was originally developed at Exelixis and they have kindly agreed to place the software which underwent much subsequent development outside Exelixis, into the public domain. Forge works with most of the common MPI implementations.

Remark of Debian Med team: Competitor to MIRA2 and wgs-assembler

This package was requested by William Spooner whs@eaglegenomics.com as a competitor to MIRA2 and wgs-assembler.

*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 202490