comparison test-data/release220/readme.md @ 6:df84aaed4769 draft

planemo upload for repository https://github.com/galaxyproject/tools-iuc/tree/master/data_managers/data_manager_gtdbtk_database_installer commit a7a73e892ade5f3cb5207c411b8ac27b684316ff
author iuc
date Mon, 09 Sep 2024 09:01:39 +0000
parents
children
comparison
equal deleted inserted replaced
5:e7b39a7e0024 6:df84aaed4769
1 # Explanation
2
3 This tar.gz is just a dummy file that mimics the structure of the GTDB-tk releases as shown below and can be used as test case for
4 the data manager !
5
6 Thanks https://github.com/SantaMcCloud for downloading and providing the structure of all the latest releases !
7
8 Folder structur from: https://data.gtdb.ecogenomic.org/releases/release202/202.0/auxillary_files/gtdbtk_r202_data.tar.gz
9 ::
10
11 release202/
12 ├─msa/
13 │ ├─gtdb_r202_bac120.faa
14 │ └─gtdb_r202_ar122.faa
15 ├─masks/
16 │ ├─gtdb_r202_ar122.mask
17 │ └─gtdb_r202_bac120.mask
18 ├─metadata/
19 │ └─metadata.txt
20 ├─pplacer/
21 │ ├─gtdb_r202_bac120.refpkg/
22 │ │ ├─bac120_r202_unroot.pplacer.tree
23 │ │ ├─bac120_msa_reps_r202.faa
24 │ │ ├─CONTENTS.json
25 │ │ ├─fitting_stats.log
26 │ │ └─phylo_model0ghuj7aq.json
27 │ └─gtdb_r202_ar122.refpkg/
28 │ ├─CONTENTS.json
29 │ ├─fitting_stats.log
30 │ ├─ar122_msa_reps_r202.faa
31 │ ├─phylo_modelbf90ubog.json
32 │ └─ar122_r202_unroot.pplacer.tree
33 ├─radii/
34 │ └─gtdb_radii.tsv
35 ├─fastani/
36 │ ├─database/
37 │ │ ├─GCF/
38 │ │ └─GCA/
39 │ └─genome_paths.tsv
40 ├─markers/
41 │ ├─tigrfam/
42 │ │ ├─tigrfam.hmm.h3f
43 │ │ ├─tigrfam.hmm
44 │ │ ├─individual_hmms/
45 │ │ ├─tigrfam.hmm.h3m
46 │ │ ├─tigrfam.hmm.h3i
47 │ │ └─tigrfam.hmm.h3p
48 │ └─pfam/
49 │ ├─Pfam-A.hmm.h3i
50 │ ├─generatePfamdat.py
51 │ ├─Pfam-A.hmm.h3p
52 │ ├─individual_hmms/
53 │ ├─Pfam-A.hmm
54 │ ├─Pfam-A.hmm.h3m
55 │ ├─Pfam-A.hmm.h3f
56 │ └─Pfam-A.hmm.dat
57 ├─manifest.tsv
58 ├─mrca_red/
59 │ ├─gtdbtk_r202_bac120.tsv
60 │ └─gtdbtk_r202_ar122.tsv
61 └─taxonomy/
62 └─gtdb_taxonomy.tsv
63
64 Folder structur from: https://data.gtdb.ecogenomic.org/releases/release207/207.0/auxillary_files/gtdbtk_r207_data.tar.gz
65 ::
66
67 release207/
68 ├─pplacer/
69 │ ├─gtdb_r207_ar53.refpkg/
70 │ │ ├─fitting_stats_merge.log
71 │ │ ├─ar53_msa_reps_r207.faa
72 │ │ ├─phylo_model1xblv9t2.json
73 │ │ ├─gtdb_r207_ar53_decorated_fullids_unrooted.tree
74 │ │ └─CONTENTS.json
75 │ └─gtdb_r207_bac120.refpkg/
76 │ ├─bac120_msa_reps_r207.faa
77 │ ├─phylo_modeloxtr1_fu.json
78 │ ├─gtdb_r207_bac120_fasttree.log
79 │ ├─gtdb_r207_bac120_decorated_unrooted.tree
80 │ └─CONTENTS.json
81 ├─temp/
82 ├─metadata/
83 │ └─metadata.txt
84 ├─masks/
85 │ ├─gtdb_r207_bac120.mask
86 │ └─gtdb_r207_ar53.mask
87 ├─msa/
88 │ ├─gtdb_r207_bac120.faa
89 │ └─gtdb_r207_ar53.faa
90 ├─mrca_red/
91 │ ├─gtdbtk_r207_bac120.tsv
92 │ └─gtdbtk_r207_ar53.tsv
93 ├─split/
94 │ ├─high/
95 │ │ ├─red/
96 │ │ └─pplacer/
97 │ └─low/
98 │ ├─tree_mapping.tsv
99 │ ├─red/
100 │ └─pplacer/
101 ├─markers/
102 │ ├─pfam/
103 │ │ ├─Pfam-A.hmm.h3i
104 │ │ ├─Pfam-A.hmm.h3p
105 │ │ ├─generatePfamdat.py
106 │ │ ├─Pfam-A.hmm.h3m
107 │ │ ├─individual_hmms/
108 │ │ ├─Pfam-A.hmm
109 │ │ ├─Pfam-A.hmm.dat
110 │ │ ├─Pfam-A.hmm.dat.origin
111 │ │ └─Pfam-A.hmm.h3f
112 │ └─tigrfam/
113 │ ├─tigrfam.hmm.h3p
114 │ ├─tigrfam.hmm.h3i
115 │ ├─tigrfam.hmm.h3m
116 │ ├─individual_hmms/
117 │ ├─tigrfam.hmm
118 │ └─tigrfam.hmm.h3f
119 ├─fastani/
120 │ ├─database/
121 │ │ ├─GCA/
122 │ │ ├─GCF/
123 │ │ └─gtdb.log
124 │ ├─empty_dir/
125 │ ├─create_genome_paths.sh
126 │ └─genome_paths.tsv
127 ├─taxonomy/
128 │ ├─bac120_taxonomy_r207_reps.tsv
129 │ ├─gtdb_taxonomy.tsv
130 │ └─ar53_taxonomy_r207_reps.tsv
131 └─radii/
132 └─gtdb_radii.tsv
133
134 Folder structur from: https://data.gtdb.ecogenomic.org/releases/release214/214.1/auxillary_files/gtdbtk_r214_data.tar.gz
135 ::
136
137 release214/
138 ├─pplacer/
139 │ ├─gtdb_r214_bac120.refpkg/
140 │ │ ├─gtdb_r214_bac120_fasttree.log
141 │ │ ├─phylo_model15qtkqsz.json
142 │ │ ├─gtdb_r214_bac120_decorated_unrooted.tree
143 │ │ ├─bac120_msa_r214.faa
144 │ │ └─CONTENTS.json
145 │ └─gtdb_r214_ar53.refpkg/
146 │ ├─ar53_msa_r214.faa
147 │ ├─gtdb_r214_ar53_decorated_unrooted.tree
148 │ ├─fitting_stats.log
149 │ ├─phylo_model9npj926p.json
150 │ └─CONTENTS.json
151 ├─temp/
152 ├─taxonomy/
153 │ ├─gtdb_taxonomy.tsv
154 │ ├─ar53_taxonomy_r214_reps.tsv
155 │ └─bac120_taxonomy_r214_reps.tsv
156 ├─mrca_red/
157 │ ├─gtdbtk_r214_ar53.tsv
158 │ └─gtdbtk_r214_bac120.tsv
159 ├─split/
160 │ ├─backbone/
161 │ │ ├─red/
162 │ │ └─pplacer/
163 │ └─class_level/
164 │ ├─tree_mapping.tsv
165 │ ├─red/
166 │ └─pplacer/
167 ├─msa/
168 │ ├─gtdb_r214_ar53.faa
169 │ └─gtdb_r214_bac120.faa
170 ├─radii/
171 │ └─gtdb_radii.tsv
172 ├─mash/
173 ├─markers/
174 │ ├─pfam/
175 │ │ ├─Pfam-A.hmm.h3p
176 │ │ ├─individual_hmms/
177 │ │ ├─Pfam-A.hmm.h3i
178 │ │ ├─Pfam-A.hmm.h3m
179 │ │ ├─generatePfamdat.py
180 │ │ ├─Pfam-A.hmm
181 │ │ ├─Pfam-A.hmm.dat.origin
182 │ │ ├─Pfam-A.hmm.dat
183 │ │ └─Pfam-A.hmm.h3f
184 │ └─tigrfam/
185 │ ├─tigrfam.hmm.h3m
186 │ ├─tigrfam.hmm
187 │ ├─individual_hmms/
188 │ ├─tigrfam.hmm.h3p
189 │ ├─tigrfam.hmm.h3i
190 │ └─tigrfam.hmm.h3f
191 ├─metadata/
192 │ └─metadata.txt
193 ├─fastani/
194 │ ├─database/
195 │ │ ├─GCF/
196 │ │ └─GCA/
197 │ └─genome_paths.tsv
198 └─masks/
199 ├─gtdb_r214_bac120.mask
200 └─gtdb_r214_ar53.mask
201
202 Folder structur from: https://data.gtdb.ecogenomic.org/releases/release220/220.0/auxillary_files/gtdbtk_package/full_package/gtdbtk_r220_data.tar.gz
203 ::
204
205 release220/
206 ├─radii/
207 │ └─gtdb_radii.tsv
208 ├─split/
209 │ ├─class_level/
210 │ │ ├─tree_mapping.tsv
211 │ │ ├─red/
212 │ │ └─pplacer/
213 │ └─backbone/
214 │ ├─pplacer/
215 │ └─red/
216 ├─taxonomy/
217 │ ├─ar53_taxonomy_r220_reps.tsv
218 │ ├─gtdb_taxonomy.tsv
219 │ └─bac120_taxonomy_r220_reps.tsv
220 ├─markers/
221 │ ├─tigrfam/
222 │ │ ├─tigrfam.hmm.h3i
223 │ │ ├─tigrfam.hmm.h3p
224 │ │ ├─tigrfam.hmm
225 │ │ ├─individual_hmms/
226 │ │ ├─tigrfam.hmm.h3m
227 │ │ └─tigrfam.hmm.h3f
228 │ └─pfam/
229 │ ├─Pfam-A.hmm.h3m
230 │ ├─Pfam-A.hmm.h3i
231 │ ├─Pfam-A.hmm.h3p
232 │ ├─Pfam-A.hmm.dat.origin
233 │ ├─Pfam-A.hmm.dat
234 │ ├─individual_hmms/
235 │ ├─Pfam-A.hmm.h3f
236 │ ├─Pfam-A.hmm
237 │ └─generatePfamdat.py
238 ├─msa/
239 │ ├─gtdb_r220_bac120.faa
240 │ └─gtdb_r220_ar53.faa
241 ├─masks/
242 │ ├─gtdb_r220_ar53.mask
243 │ └─gtdb_r220_bac120.mask
244 ├─mrca_red/
245 │ ├─gtdbtk_r220_ar53.tsv
246 │ └─gtdbtk_r220_bac120.tsv
247 ├─skani/
248 │ ├─database/
249 │ │ ├─GCF/
250 │ │ └─GCA/
251 │ ├─create_genome_paths.sh
252 │ └─genome_paths.tsv
253 ├─pplacer/
254 │ ├─gtdb_r220_bac120.refpkg/
255 │ │ ├─CONTENTS.json
256 │ │ ├─bac120_msa_r220.faa
257 │ │ ├─gtdb_r220_bac120_decorated_unrooted.tree
258 │ │ ├─gtdb_r220_bac120_fasttree.log
259 │ │ └─phylo_modelw962mykd.json
260 │ └─gtdb_r220_ar53.refpkg/
261 │ ├─gtdb_r220_ar53_decorated_unrooted.tree
262 │ ├─CONTENTS.json
263 │ ├─phylo_model0lt93bak.json
264 │ ├─fitting_stats.log
265 │ └─ar53_msa_r220.faa
266 └─metadata/
267 └─metadata.txt