view test-data/release220/readme.md @ 7:3b1d503c6260 draft default tip

planemo upload for repository https://github.com/galaxyproject/tools-iuc/tree/master/data_managers/data_manager_gtdbtk_database_installer commit 671e8c706fa211b6ec1c476d3d1a36d098822fe5
author iuc
date Thu, 03 Oct 2024 12:42:22 +0000
parents df84aaed4769
children
line wrap: on
line source

# Explanation

This tar.gz is just a dummy file that mimics the structure of the GTDB-tk releases as shown below and can be used as test case for
the data manager !

Thanks https://github.com/SantaMcCloud for downloading and providing the structure of all the latest releases !

Folder structur from: https://data.gtdb.ecogenomic.org/releases/release202/202.0/auxillary_files/gtdbtk_r202_data.tar.gz
        ::

            release202/
            ├─msa/
            │ ├─gtdb_r202_bac120.faa
            │ └─gtdb_r202_ar122.faa
            ├─masks/
            │ ├─gtdb_r202_ar122.mask
            │ └─gtdb_r202_bac120.mask
            ├─metadata/
            │ └─metadata.txt
            ├─pplacer/
            │ ├─gtdb_r202_bac120.refpkg/
            │ │ ├─bac120_r202_unroot.pplacer.tree
            │ │ ├─bac120_msa_reps_r202.faa
            │ │ ├─CONTENTS.json
            │ │ ├─fitting_stats.log
            │ │ └─phylo_model0ghuj7aq.json
            │ └─gtdb_r202_ar122.refpkg/
            │   ├─CONTENTS.json
            │   ├─fitting_stats.log
            │   ├─ar122_msa_reps_r202.faa
            │   ├─phylo_modelbf90ubog.json
            │   └─ar122_r202_unroot.pplacer.tree
            ├─radii/
            │ └─gtdb_radii.tsv
            ├─fastani/
            │ ├─database/
            │ │ ├─GCF/
            │ │ └─GCA/
            │ └─genome_paths.tsv
            ├─markers/
            │ ├─tigrfam/
            │ │ ├─tigrfam.hmm.h3f
            │ │ ├─tigrfam.hmm
            │ │ ├─individual_hmms/
            │ │ ├─tigrfam.hmm.h3m
            │ │ ├─tigrfam.hmm.h3i
            │ │ └─tigrfam.hmm.h3p
            │ └─pfam/
            │   ├─Pfam-A.hmm.h3i
            │   ├─generatePfamdat.py
            │   ├─Pfam-A.hmm.h3p
            │   ├─individual_hmms/
            │   ├─Pfam-A.hmm
            │   ├─Pfam-A.hmm.h3m
            │   ├─Pfam-A.hmm.h3f
            │   └─Pfam-A.hmm.dat
            ├─manifest.tsv
            ├─mrca_red/
            │ ├─gtdbtk_r202_bac120.tsv
            │ └─gtdbtk_r202_ar122.tsv
            └─taxonomy/
            └─gtdb_taxonomy.tsv

Folder structur from: https://data.gtdb.ecogenomic.org/releases/release207/207.0/auxillary_files/gtdbtk_r207_data.tar.gz
        ::

            release207/
            ├─pplacer/
            │ ├─gtdb_r207_ar53.refpkg/
            │ │ ├─fitting_stats_merge.log
            │ │ ├─ar53_msa_reps_r207.faa
            │ │ ├─phylo_model1xblv9t2.json
            │ │ ├─gtdb_r207_ar53_decorated_fullids_unrooted.tree
            │ │ └─CONTENTS.json
            │ └─gtdb_r207_bac120.refpkg/
            │   ├─bac120_msa_reps_r207.faa
            │   ├─phylo_modeloxtr1_fu.json
            │   ├─gtdb_r207_bac120_fasttree.log
            │   ├─gtdb_r207_bac120_decorated_unrooted.tree
            │   └─CONTENTS.json
            ├─temp/
            ├─metadata/
            │ └─metadata.txt
            ├─masks/
            │ ├─gtdb_r207_bac120.mask
            │ └─gtdb_r207_ar53.mask
            ├─msa/
            │ ├─gtdb_r207_bac120.faa
            │ └─gtdb_r207_ar53.faa
            ├─mrca_red/
            │ ├─gtdbtk_r207_bac120.tsv
            │ └─gtdbtk_r207_ar53.tsv
            ├─split/
            │ ├─high/
            │ │ ├─red/
            │ │ └─pplacer/
            │ └─low/
            │   ├─tree_mapping.tsv
            │   ├─red/
            │   └─pplacer/
            ├─markers/
            │ ├─pfam/
            │ │ ├─Pfam-A.hmm.h3i
            │ │ ├─Pfam-A.hmm.h3p
            │ │ ├─generatePfamdat.py
            │ │ ├─Pfam-A.hmm.h3m
            │ │ ├─individual_hmms/
            │ │ ├─Pfam-A.hmm
            │ │ ├─Pfam-A.hmm.dat
            │ │ ├─Pfam-A.hmm.dat.origin
            │ │ └─Pfam-A.hmm.h3f
            │ └─tigrfam/
            │   ├─tigrfam.hmm.h3p
            │   ├─tigrfam.hmm.h3i
            │   ├─tigrfam.hmm.h3m
            │   ├─individual_hmms/
            │   ├─tigrfam.hmm
            │   └─tigrfam.hmm.h3f
            ├─fastani/
            │ ├─database/
            │ │ ├─GCA/
            │ │ ├─GCF/
            │ │ └─gtdb.log
            │ ├─empty_dir/
            │ ├─create_genome_paths.sh
            │ └─genome_paths.tsv
            ├─taxonomy/
            │ ├─bac120_taxonomy_r207_reps.tsv
            │ ├─gtdb_taxonomy.tsv
            │ └─ar53_taxonomy_r207_reps.tsv
            └─radii/
            └─gtdb_radii.tsv

Folder structur from: https://data.gtdb.ecogenomic.org/releases/release214/214.1/auxillary_files/gtdbtk_r214_data.tar.gz
        ::

            release214/
            ├─pplacer/
            │ ├─gtdb_r214_bac120.refpkg/
            │ │ ├─gtdb_r214_bac120_fasttree.log
            │ │ ├─phylo_model15qtkqsz.json
            │ │ ├─gtdb_r214_bac120_decorated_unrooted.tree
            │ │ ├─bac120_msa_r214.faa
            │ │ └─CONTENTS.json
            │ └─gtdb_r214_ar53.refpkg/
            │   ├─ar53_msa_r214.faa
            │   ├─gtdb_r214_ar53_decorated_unrooted.tree
            │   ├─fitting_stats.log
            │   ├─phylo_model9npj926p.json
            │   └─CONTENTS.json
            ├─temp/
            ├─taxonomy/
            │ ├─gtdb_taxonomy.tsv
            │ ├─ar53_taxonomy_r214_reps.tsv
            │ └─bac120_taxonomy_r214_reps.tsv
            ├─mrca_red/
            │ ├─gtdbtk_r214_ar53.tsv
            │ └─gtdbtk_r214_bac120.tsv
            ├─split/
            │ ├─backbone/
            │ │ ├─red/
            │ │ └─pplacer/
            │ └─class_level/
            │   ├─tree_mapping.tsv
            │   ├─red/
            │   └─pplacer/
            ├─msa/
            │ ├─gtdb_r214_ar53.faa
            │ └─gtdb_r214_bac120.faa
            ├─radii/
            │ └─gtdb_radii.tsv
            ├─mash/
            ├─markers/
            │ ├─pfam/
            │ │ ├─Pfam-A.hmm.h3p
            │ │ ├─individual_hmms/
            │ │ ├─Pfam-A.hmm.h3i
            │ │ ├─Pfam-A.hmm.h3m
            │ │ ├─generatePfamdat.py
            │ │ ├─Pfam-A.hmm
            │ │ ├─Pfam-A.hmm.dat.origin
            │ │ ├─Pfam-A.hmm.dat
            │ │ └─Pfam-A.hmm.h3f
            │ └─tigrfam/
            │   ├─tigrfam.hmm.h3m
            │   ├─tigrfam.hmm
            │   ├─individual_hmms/
            │   ├─tigrfam.hmm.h3p
            │   ├─tigrfam.hmm.h3i
            │   └─tigrfam.hmm.h3f
            ├─metadata/
            │ └─metadata.txt
            ├─fastani/
            │ ├─database/
            │ │ ├─GCF/
            │ │ └─GCA/
            │ └─genome_paths.tsv
            └─masks/
            ├─gtdb_r214_bac120.mask
            └─gtdb_r214_ar53.mask

Folder structur from: https://data.gtdb.ecogenomic.org/releases/release220/220.0/auxillary_files/gtdbtk_package/full_package/gtdbtk_r220_data.tar.gz
        ::

            release220/
            ├─radii/
            │ └─gtdb_radii.tsv
            ├─split/
            │ ├─class_level/
            │ │ ├─tree_mapping.tsv
            │ │ ├─red/
            │ │ └─pplacer/
            │ └─backbone/
            │   ├─pplacer/
            │   └─red/
            ├─taxonomy/
            │ ├─ar53_taxonomy_r220_reps.tsv
            │ ├─gtdb_taxonomy.tsv
            │ └─bac120_taxonomy_r220_reps.tsv
            ├─markers/
            │ ├─tigrfam/
            │ │ ├─tigrfam.hmm.h3i
            │ │ ├─tigrfam.hmm.h3p
            │ │ ├─tigrfam.hmm
            │ │ ├─individual_hmms/
            │ │ ├─tigrfam.hmm.h3m
            │ │ └─tigrfam.hmm.h3f
            │ └─pfam/
            │   ├─Pfam-A.hmm.h3m
            │   ├─Pfam-A.hmm.h3i
            │   ├─Pfam-A.hmm.h3p
            │   ├─Pfam-A.hmm.dat.origin
            │   ├─Pfam-A.hmm.dat
            │   ├─individual_hmms/
            │   ├─Pfam-A.hmm.h3f
            │   ├─Pfam-A.hmm
            │   └─generatePfamdat.py
            ├─msa/
            │ ├─gtdb_r220_bac120.faa
            │ └─gtdb_r220_ar53.faa
            ├─masks/
            │ ├─gtdb_r220_ar53.mask
            │ └─gtdb_r220_bac120.mask
            ├─mrca_red/
            │ ├─gtdbtk_r220_ar53.tsv
            │ └─gtdbtk_r220_bac120.tsv
            ├─skani/
            │ ├─database/
            │ │ ├─GCF/
            │ │ └─GCA/
            │ ├─create_genome_paths.sh
            │ └─genome_paths.tsv
            ├─pplacer/
            │ ├─gtdb_r220_bac120.refpkg/
            │ │ ├─CONTENTS.json
            │ │ ├─bac120_msa_r220.faa
            │ │ ├─gtdb_r220_bac120_decorated_unrooted.tree
            │ │ ├─gtdb_r220_bac120_fasttree.log
            │ │ └─phylo_modelw962mykd.json
            │ └─gtdb_r220_ar53.refpkg/
            │   ├─gtdb_r220_ar53_decorated_unrooted.tree
            │   ├─CONTENTS.json
            │   ├─phylo_model0lt93bak.json
            │   ├─fitting_stats.log
            │   └─ar53_msa_r220.faa
            └─metadata/
            └─metadata.txt