Debian Science Project
Summary
Data Management
pacchetti Data Management di Debian Science

Questo metapacchetto installerà pacchetti per assistere in attività di gestione dei dati come ottenere dati da risorse remote, mantenere dati sotto controllo di versione, ecc.

Description

For a better overview of the project's availability as a Debian package, each head row has a color code according to this scheme:

If you discover a project which looks like a good candidate for Debian Science to you, or if you have prepared an unofficial Debian package, please do not hesitate to send a description of that project to the Debian Science mailing list

Links to other tasks

Debian Science Data Management packages

Official Debian packages with high relevance

datalad
piattaforma di distribuzione e gestione di file di dati
Versions of package datalad
ReleaseVersionArchitectures
sid0.19.6-2all
stretch0.4.1-1all
trixie0.19.6-2all
bookworm0.18.1-2all
bullseye0.14.0-1all
buster0.11.2-2all
upstream1.0.0
Popcon: 40 users (10 upd.)*
Newer upstream!
License: DFSG free
Git

DataLad è una piattaforma per distribuzione e gestione di dati che fornisce accesso a un'ampia gamma di risorse di dati già disponibili online. Usando git-annex come suo backend per la logistica dei dati, fornisce le seguenti funzionalità internamente o disponibili attraverso estensioni aggiuntive:

  • interfacce a riga di comando e Python per manipolare raccolte di insiemi di dati (installazione, disinstallazione, aggiornamento, pubblicazione, salvataggio, ecc.) e file/directory separati (aggiunta, recupero);
  • estrarre, aggregare e cercare all'interno di varie fonti di metadati (xmp, EXIF, ecc.; installare datalad-neuroimaging per la gestione di DICOM, BIDS, NIfTI);
  • esplora siti web per preparare automaticamente e aggiornare repository di git-annex con il contenuto dei siti web online, S3, ecc. (installare datalad-crawler).
datalad-container
estensione di DataLad per lavorare con ambienti in contenitori
Maintainer: Yaroslav Halchenko
Versions of package datalad-container
ReleaseVersionArchitectures
sid1.2.5-1all
buster0.2.2-2all
bullseye1.1.2-1all
bookworm1.1.9-1all
trixie1.2.5-1all
Popcon: 4 users (3 upd.)*
Versions and Archs
License: DFSG free

Questa estensione migliora DataLad (http://datalad.org) per lavorare con contenitori computazionali.

git-annex
gestisce file con git, senza gestirne i contenuti dentro git
Versions of package git-annex
ReleaseVersionArchitectures
sid10.20240129-1amd64,arm64,i386,mips64el,ppc64el,riscv64,s390x
bullseye8.20210223-2amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
buster-backports8.20200330-1~bpo10+1amd64,arm64,armel,armhf,i386,mips,mips64el,mipsel,ppc64el,s390x
buster7.20190129-3amd64,arm64,armhf,i386
stretch-backports7.20190129-2~bpo9+1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
stretch-backports7.20181211-2~bpo9+1mips
stretch-backports6.20180913-1~bpo9+1mipsel
stretch6.20170101-1+deb9u2amd64,arm64,i386,mips,mips64el,mipsel,ppc64el,s390x
stretch-security6.20170101-1+deb9u1amd64,i386
jessie-security5.20141125+oops-1+deb8u2amd64,armel,armhf,i386
jessie5.20141125+deb8u1amd64,armel,armhf,i386
trixie10.20240129-1amd64,arm64,i386,mips64el,ppc64el,s390x
bookworm-backports10.20240129-1~bpo12+1amd64,arm64,armel,i386,mips64el,mipsel,ppc64el,s390x
bookworm10.20230126-3amd64,arm64,i386,mips64el,mipsel,ppc64el,s390x
Debtags of package git-annex:
develrcs
roleprogram
works-withfile
Popcon: 424 users (55 upd.)*
Versions and Archs
License: DFSG free
Git

git-annex permette di gestire grandi file con git, senza gestire il loro contenuto in git. È in grado di sincronizzare, fare il backup ed archiviare dati offline e online. Le somme di controllo (checksum) e la cifratura mantengono i dati integri e al sicuro. Con git-annex si trasferisce la potenza e la natura distribuita di git nella gestione di grandi file.

Può conservare file grandi in molti luoghi, da dischi locali a un buon numero di servizi di archiviazione su cloud, inclusi S3, WebDAV e rsync, con dozzine di fornitori di archiviazione su cloud utilizzabili grazie a plugin. I file possono essere conservati cifrati con gpg, in modo che il fornitore di archiviazione su cloud non possa vedere i dati dell'utente. git-annex tiene traccia di dove ogni file è archiviato, in modo da sapere quante copie sono disponibili, ed ha parecchie funzionalità per assicurare che i dati dell'utente siano preservati.

git-annex può anche essere usato per mantenere una cartella sincronizzata tra computer, notando quando i file vengono cambiati e facendo il commit automatico su git trasferendoli ad altri computer. L'applicazione web git-annex facilita la configurazione e l'uso di git-annex per questo scopo.

The package is enhanced by the following packages: elpa-git-annex elpa-magit-annex keysafe
Screenshots of package git-annex
hdf5-filter-plugin
filtri esterni per HDF5: LZ4, BZip2, Bitshuffle
Versions of package hdf5-filter-plugin
ReleaseVersionArchitectures
bookworm0.0~git20221111.49e3b65-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie0.0~git20221111.49e3b65-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid0.0~git20221111.49e3b65-4amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il meccanismo dei filtri esterni introdotto con HDF5 1.8.12 permette alle applicazioni di utilizzare filtri personalizzati non forniti dalla libreria HDF5 principale, senza ricompilare le applicazioni. Questo pacchetto fornisce filtri esterni per HDF5 per:

  • l'algoritmo di compressione LZ4,
  • compressione BZip2.
hdf5-filter-plugin-blosc-serial
blocking, shuffling and lossless compression library
Versions of package hdf5-filter-plugin-blosc-serial
ReleaseVersionArchitectures
sid0.0~git20220616.9683f7d-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.0~git20220616.9683f7d-5amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.0~git20220616.9683f7d-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (13 upd.)*
Versions and Archs
License: DFSG free
Git

This package contains a filter for HDF5 that uses the Blosc compressor. By installing this filter, you can read and write HDF5 files with Blosc-compressed datasets.

hdf5-filter-plugin-zfp-serial
plugin di compressione per la libreria HDF5 che usa la compressione ZFP
Versions of package hdf5-filter-plugin-zfp-serial
ReleaseVersionArchitectures
sid1.1.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64
bookworm1.1.0+git20221021-4amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
experimental1.1.0+git20230428-0+exp2amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie1.1.1-2amd64,arm64,armel,armhf,i386,mips64el,ppc64el
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

H5Z-ZFP è un filtro di compressione per HDF5 che usa la compressione ZFP, supportando la compressione di dati interi e a virgola mobile con e senza perdita per raggiungere obiettivi di bitrate, accuratezza e precisione.

nexus-tools
formato NeXus per file di dati scientifici - applicazioni
Versions of package nexus-tools
ReleaseVersionArchitectures
trixie4.4.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
sid4.4.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bullseye4.4.3-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
bookworm4.4.3-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
jessie4.3.2-svn1921-2amd64,armel,armhf,i386
Popcon: 3 users (6 upd.)*
Versions and Archs
License: DFSG free
Git

NeXus è un formato di dati comune per la scienza di neutroni, raggi X e muoni. Esso viene sviluppato come standard internazionale da scienziati e programmatori che rappresentano le principali strutture scientifiche in Europa, Asia, Australia e Nord America per facilitare una maggiore cooperazione nell'analisi e visualizzazione di dati di neutroni, raggi X e muoni.

Questo è il pacchetto che contiene alcune applicazioni per leggere e scrivere file NeXus.

plfit
fit di distribuzioni a legge di potenza con dati empirici -- interfacce
Versions of package plfit
ReleaseVersionArchitectures
trixie0.9.4+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm0.9.4+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid0.9.6+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 2 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Il software plfit fa il fit di distribuzioni a legge di potenza su dati empirici (discreti o continui), secondo il metodo di Clauset, Shalizi e Newman [SIAM Review 51, 661-703 (2009)].

Questo pacchetto fornisce due utilità a riga di comando: plfit e plgen.

The package is enhanced by the following packages: plfit-doc
python3-jdata
JData encoder/decoder for python 3
Versions of package python3-jdata
ReleaseVersionArchitectures
bullseye0.3.6-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
sid0.3.6-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.3.6-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bookworm0.3.6-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 1 users (2 upd.)*
Versions and Archs
License: DFSG free
Git

The JData Specification (https://github.com/fangq/jdata/) defines a lightweight language-independent data annotation interface targeted at storing and sharing complex data structures across different programming languages such as MATLAB, JavaScript, python etc. Using JData formats, a complex python data structure can be encoded as a dict object that is easily serialized as a JSON/binary JSON file and share such data between programs of different languages.

python3-mdp
toolkit modulare per elaborazione dei dati
Versions of package python3-mdp
ReleaseVersionArchitectures
jessie3.3-2all
stretch3.5-1all
sid3.6-5all
bookworm3.6-2amd64,arm64,mips64el,ppc64el
bullseye3.6-1.1all
Popcon: 12 users (3 upd.)*
Versions and Archs
License: DFSG free
Git

Infrastruttura Python per elaborazione di dati per creare software per complesse elaborazioni di dati combinando in pipe e reti algoritmi largamente usati di apprendimento macchina. Gli algoritmi implementati includono: PCA (Principal Component Analysis), ICA (Independent Component Analysis), SFA (Slow Feature Analysis), ISFA (Independent Slow Feature Analysis), GNG (Growing Neural Gas), analisi fattoriale, FDA (Fisher Discriminant Analysis) e classificatori gaussiani.

The package is enhanced by the following packages: python3-sklearn
python3-nxs
formato NeXus per file di dati scientifici - collegamento Python 3
Versions of package python3-nxs
ReleaseVersionArchitectures
bullseye4.4.1-3all
trixie4.4.1-4all
sid4.4.1-4all
bookworm4.4.1-4all
Popcon: 1 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

NeXus è un formato di dati comune per la scienza di neutroni, raggi X e muoni. Esso viene sviluppato come standard internazionale da scienziati e programmatori che rappresentano le principali strutture scientifiche in Europa, Asia, Australia e Nord America per facilitare una maggiore cooperazione nell'analisi e visualizzazione di dati di neutroni, raggi X e muoni.

Questo è il pacchetto che contiene i collegamenti Python 3.

python3-pyzoltan
wrapper per la libreria di gestione di dati Zoltan
Versions of package python3-pyzoltan
ReleaseVersionArchitectures
trixie1.0.1-9amd64,arm64,ppc64el,s390x
sid1.0.1-9amd64,arm64,ppc64el,riscv64,s390x
bookworm1.0.1-5+deb12u1amd64,arm64,ppc64el,s390x
bullseye1.0.1-2+deb11u1amd64,arm64,ppc64el,s390x
Popcon: 5 users (20 upd.)*
Versions and Archs
License: DFSG free
Git

PyZoltan, come suggerisce il nome, è un wrapper Python per la libreria per gestione di dati Zoltan.

PyZoltan fa da wrapper solo per specifici oggetti e routine. Attualmente sono supportate le seguenti funzionalità di Zoltan:

  • bilanciamento dinamico del carico usando algoritmi geometrici;
  • comunicazione punto-punto non strutturata;
  • directory dei dati distribuite.
virtuoso-opensource
database ad alte prestazioni
Versions of package virtuoso-opensource
ReleaseVersionArchitectures
experimental7.2.12+dfsg-0.1all
buster6.1.6+dfsg2-4all
bullseye7.2.5.1+dfsg1-0.1all
bookworm7.2.5.1+dfsg1-0.3all
sid7.2.5.1+dfsg1-0.8all
jessie6.1.6+dfsg2-2all
stretch6.1.6+dfsg2-4all
upstream7.2.12
Debtags of package virtuoso-opensource:
rolemetapackage, program
works-withdb
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

OpenLink Virtuoso è un database SQL relazionale ad oggetti ad alte prestazioni. Fornisce transazioni, un compilatore SQL intelligente, backup a caldo, supporto per SQL:1999, un potente linguaggio stored procedure che gestisce Java o .NET lato server ed altro ancora. Gestisce tutte le principali interfacce di accesso ai dati incluse ODBC, JDBC, ADO.NET e OLE/DB.

Virtuoso gestisce SPARQL incorporato in SQL per l'interrogazione di dati RDF archiviati nel suo database. SPARQL trae beneficio dal supporto a basso livello nel motore stesso, come le regole per conversione di tipi compatibili SPARQL e un tipo di dati IRI dedicato.

Si installi questo metapacchetto per la suite completa di pacchetti che compongono Virtuoso OSE ("Open-Source Edition").

visidata
esplorazione veloce di dati in colonna nel terminale
Versions of package visidata
ReleaseVersionArchitectures
bullseye2.2.1-1all
bookworm2.11-1all
buster1.5.2-1all
sid3.0.2-1all
trixie3.0.2-1all
Popcon: 34 users (14 upd.)*
Versions and Archs
License: DFSG free
Git

VisiData è un'utilità per terminale multifunzione per esplorare, pulire, ristrutturare e analizzare dati tabulari. Le fonti attualmente gestite sono TSV, CSV, testo a larghezza fissa, JSON, SQLite, HTTP, HTML, .xls e .xlsx (Microsoft Excel).

Official Debian packages with lower relevance

libnexus-dev
formato NeXus per file di dati scientifici - librerie di sviluppo
Versions of package libnexus-dev
ReleaseVersionArchitectures
sid4.4.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
bookworm4.4.3-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
trixie4.4.3-6amd64,arm64,armel,armhf,i386,mips64el,ppc64el,s390x
bullseye4.4.3-5amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el,s390x
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

NeXus è un formato di dati comune per la scienza di neutroni, raggi X e muoni. Esso viene sviluppato come standard internazionale da scienziati e programmatori che rappresentano le principali strutture scientifiche in Europa, Asia, Australia e Nord America per facilitare una maggiore cooperazione nell'analisi e visualizzazione di dati di neutroni, raggi X e muoni.

Questo è il pacchetto che contiene le librerie di sviluppo.

libnexus-java
formato NeXus per file di dati scientifici - librerie Java
Versions of package libnexus-java
ReleaseVersionArchitectures
sid4.4.3-6all
bullseye4.4.3-5all
bookworm4.4.3-5all
trixie4.4.3-6all
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

NeXus è un formato di dati comune per la scienza di neutroni, raggi X e muoni. Esso viene sviluppato come standard internazionale da scienziati e programmatori che rappresentano le principali strutture scientifiche in Europa, Asia, Australia e Nord America per facilitare una maggiore cooperazione nell'analisi e visualizzazione di dati di neutroni, raggi X e muoni.

Questo è il pacchetto che contiene le librerie Java.

libplfit-dev
fit di distribuzioni a legge di potenza con dati empirici -- sviluppo
Versions of package libplfit-dev
ReleaseVersionArchitectures
trixie0.9.4+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm0.9.4+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
sid0.9.6+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
Popcon: 0 users (1 upd.)*
Versions and Archs
License: DFSG free
Git

Il software plfit fa il fit di distribuzioni a legge di potenza su dati empirici (discreti o continui), secondo il metodo di Clauset, Shalizi e Newman [SIAM Review 51, 661-703 (2009)].

Questo pacchetto contiene i file header, le librerie statiche e i collegamenti simbolici che sono necessari agli sviluppatori che usano la libreria plfit.

The package is enhanced by the following packages: plfit-doc
python3-openpyxl
modulo Python 3 per leggere e scrivere file OpenXML xlsx/xlsm
Versions of package python3-openpyxl
ReleaseVersionArchitectures
trixie3.1.2+dfsg-6all
bullseye3.0.3-1all
bookworm3.0.9-1all
buster2.4.9-1all
sid3.1.2+dfsg-6all
stretch2.3.0-3all
Popcon: 249 users (336 upd.)*
Versions and Archs
License: DFSG free
Git

Openpyxl è un modulo in puro Python 3 per leggere e scrivere file (OpenXML) xlsx/xlsm di Excel 2007.

Questo pacchetto contiene il modulo stesso.

python3-opentsne
t-Distributed Stochastic Neighbor Embedding algorithm
Versions of package python3-opentsne
ReleaseVersionArchitectures
sid0.5.0-2i386
sid1.0.0-1amd64,arm64,armel,armhf,mips64el,ppc64el,riscv64,s390x
upstream1.0.1
Popcon: 0 users (0 upd.)*
Newer upstream!
License: DFSG free
Git

Modular Python implementation of t-Distributed Stochasitc Neighbor Embedding (t-SNE), a popular dimensionality-reduction algorithm for visualizing high-dimensional data sets. openTSNE incorporates the latest improvements to the t-SNE algorithm, including the ability to add new data points to existing embeddings, massive speed improvements, enabling t-SNE to scale to millions of data points and various tricks to improve global alignment of the resulting visualizations.

python3-plfit
fit di distribuzioni a legge di potenza con dati empirici -- Python
Versions of package python3-plfit
ReleaseVersionArchitectures
sid0.9.6+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el,riscv64,s390x
trixie0.9.4+ds-1amd64,arm64,armel,armhf,i386,mips64el,ppc64el
bookworm0.9.4+ds-1amd64,arm64,armel,armhf,i386,mips64el,mipsel,ppc64el
Popcon: 0 users (0 upd.)*
Versions and Archs
License: DFSG free
Git

Il software plfit fa il fit di distribuzioni a legge di potenza su dati empirici (discreti o continui), secondo il metodo di Clauset, Shalizi e Newman [SIAM Review 51, 661-703 (2009)].

Questo pacchetto fornisce un modulo Python.

The package is enhanced by the following packages: plfit-doc
*Popularitycontest results: number of people who use this package regularly (number of people who upgraded this package recently) out of 235965