qiime2_suite: qiime2/qiime_sample-classifier

annotate qiime2/qiime_sample-classifier_maturity-index.xml @ 3:558645416841 draft

Uploaded

author	florianbegusch
date	Sun, 21 Jul 2019 02:21:34 -0400
parents	51025741f326
children

rev	line source
0 370e0b6e9826 Uploaded florianbegusch parents: diff changeset	1 <?xml version="1.0" ?>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	2 <tool id="qiime_sample-classifier_maturity-index" name="qiime sample-classifier maturity-index" version="2019.4">
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	3 <description> - Microbial maturity index prediction.</description>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	4 <requirements>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	5 <requirement type="package" version="2019.4">qiime2</requirement>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	6 </requirements>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	7 <command>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	8 <![CDATA[
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	9 qiime sample-classifier maturity-index --i-table=$itable
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	10
2 51025741f326 Uploaded florianbegusch parents: 1 diff changeset	11 #if $input_files_mmetadatafile:
0 370e0b6e9826 Uploaded florianbegusch parents: diff changeset	12 #def list_dict_to_string(list_dict):
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	13 #set $file_list = list_dict[0]['additional_input'].__getattr__('file_name')
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	14 #for d in list_dict[1:]:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	15 #set $file_list = $file_list + ' --m-metadata-file=' + d['additional_input'].__getattr__('file_name')
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	16 #end for
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	17 #return $file_list
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	18 #end def
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	19
2 51025741f326 Uploaded florianbegusch parents: 1 diff changeset	20 --m-metadata-file=$list_dict_to_string($input_files_mmetadatafile)
51025741f326 Uploaded florianbegusch parents: 1 diff changeset	21 #end fi
51025741f326 Uploaded florianbegusch parents: 1 diff changeset	22
51025741f326 Uploaded florianbegusch parents: 1 diff changeset	23
51025741f326 Uploaded florianbegusch parents: 1 diff changeset	24 --p-group-by="$pgroupby" --p-column="$pcolumn" --p-control="$pcontrol"
0 370e0b6e9826 Uploaded florianbegusch parents: diff changeset	25
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	26 #set $pnjobs = '${GALAXY_SLOTS:-4}'
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	27
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	28 #if str($pnjobs):
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	29 --p-n-jobs="$pnjobs"
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	30 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	31
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	32
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	33 #if $pparametertuning:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	34 --p-parameter-tuning
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	35 #else
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	36 --p-no-parameter-tuning
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	37 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	38
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	39 #if $pstep:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	40 --p-step=$pstep
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	41 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	42
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	43 #if $pstratify:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	44 --p-stratify
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	45 #else
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	46 --p-no-stratify
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	47 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	48
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	49 #if $poptimizefeatureselection:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	50 --p-optimize-feature-selection
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	51 #else
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	52 --p-no-optimize-feature-selection
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	53 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	54
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	55 #if $ptestsize:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	56 --p-test-size=$ptestsize
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	57 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	58 --o-visualization=ovisualization
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	59 #if str($pestimator) != 'None':
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	60 --p-estimator=$pestimator
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	61 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	62
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	63 #if $pmazstats:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	64 --p-maz-stats
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	65 #else
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	66 --p-no-maz-stats
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	67 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	68
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	69 #if str($cmdconfig) != 'None':
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	70 --cmd-config=$cmdconfig
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	71 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	72
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	73 #if $pcv:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	74 --p-cv=$pcv
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	75 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	76
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	77 #if $pnestimators:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	78 --p-n-estimators=$pnestimators
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	79 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	80
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	81 #if str($prandomstate):
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	82 --p-random-state="$prandomstate"
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	83 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	84 ;
1 255f48db74f8 Hotfix florianbegusch parents: 0 diff changeset	85 qiime tools export --input-path ovisualization.qzv --output-path out && mkdir -p '$ovisualization.files_path'
0 370e0b6e9826 Uploaded florianbegusch parents: diff changeset	86 && cp -r out/* '$ovisualization.files_path'
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	87 && mv '$ovisualization.files_path/index.html' '$ovisualization'
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	88 ]]>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	89 </command>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	90 <inputs>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	91 <param format="qza,no_unzip.zip" label="--i-table: FeatureTable[Frequency] Feature table containing all features that should be used for target prediction. [required]" name="itable" optional="False" type="data"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	92
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	93 <repeat name="input_files_mmetadatafile" optional="False" title="--m-metadata-file">
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	94 <param label="--m-metadata-file: Metadata file or artifact viewable as metadata. This option may be supplied multiple times to merge metadata. [required]" name="additional_input" type="data" format="tabular,qza,no_unzip.zip" />
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	95 </repeat>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	96
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	97 <param label="--p-column: Numeric metadata column to use as prediction target. [required]" name="pcolumn" optional="False" type="text"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	98
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	99 <param label="--p-group-by: Categorical metadata column to use for plotting and significance testing between main treatment groups. [required]" name="pgroupby" optional="False" type="text"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	100 <param label="--p-control: Value of group_by to use as control group. The regression model will be trained using only control group data, and the maturity scores of other groups consequently will be assessed relative to this group. [required]" name="pcontrol" optional="False" type="text"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	101
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	102 <param label="--p-estimator: Regression model to use for prediction.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	103 [default: RandomForestRegressor]" name="pestimator" optional="True" type="select">
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	104 <option selected="True" value="None">Selection is Optional</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	105 <option value="Ridge">Ridge</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	106 <option value="RandomForestRegressor">RandomForestRegressor</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	107 <option value="GradientBoostingRegressor">GradientBoostingRegressor</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	108 <option value="ExtraTreesRegressor">ExtraTreesRegressor</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	109 <option value="SVR">SVR</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	110 <option value="ElasticNet">ElasticNet</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	111 <option value="Lasso">Lasso</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	112 </param>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	113 <param label="--p-n-estimators: Number of trees to grow for estimation. More trees will improve predictive accuracy up to a threshold level, but will also increase time and memory requirements. This parameter only affects ensemble estimators, such as Random Forest, AdaBoost, ExtraTrees, and GradientBoosting. [default: 100]" name="pnestimators" optional="True" type="integer" value="100"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	114
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	115 <param label="--p-test-size: Fraction of input samples to exclude from training set and use for classifier testing. [default: 0.2]" name="ptestsize" optional="True" type="float" value="0.2"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	116
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	117 <param label="--p-step: If optimize_feature_selection is True, step is the percentage of features to remove at each iteration. [default: 0.05]" name="pstep" optional="True" type="float" value="0.05"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	118
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	119 <param label="--p-cv: Number of k-fold cross-validations to perform. [default: 5]" name="pcv" optional="True" type="integer" value="5"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	120
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	121 <param label="--p-random-state: Seed used by random number generator. [optional]" name="prandomstate" optional="True" type="text"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	122
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	123 <param label="--p-parameter-tuning: --p-no-parameter-tuning Automatically tune hyperparameters using random grid search. [default: True]" name="pparametertuning" checked="True" type="boolean"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	124 <param label="--p-optimize-feature-selection: --p-no-optimize-feature-selection Automatically optimize input feature selection using recursive feature elimination. [default: True]" name="poptimizefeatureselection" checked="True" type="boolean"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	125
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	126 <param label="--p-stratify: --p-no-stratify Evenly stratify training and test data among metadata categories. If True, all values in column must match at least two samples. [default: False]" name="pstratify" checked="False" type="boolean"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	127
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	128 <param label="--p-maz-stats: --p-no-maz-stats Calculate anova and pairwise tests on MAZ scores. [default: True]" name="pmazstats" checked="True" type="boolean"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	129
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	130 <param label="--cmd-config: Use config file for command options" name="cmdconfig" optional="True" type="data"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	131 </inputs>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	132 <outputs>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	133 <data format="html" label="${tool.name} on ${on_string}: visualization.qzv" name="ovisualization"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	134 </outputs>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	135 <help>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	136 <![CDATA[
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	137 Microbial maturity index prediction.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	138 -------------------------------------
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	139
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	140 Calculates a "microbial maturity" index from a regression model trained on
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	141 feature data to predict a given continuous metadata column, e.g., to
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	142 predict age as a function of microbiota composition. The model is trained
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	143 on a subset of control group samples, then predicts the column value for
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	144 all samples. This visualization computes maturity index z-scores to compare
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	145 relative "maturity" between each group, as described in
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	146 doi:10.1038/nature13421. This method can be used to predict between-group
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	147 differences in relative trajectory across any type of continuous metadata
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	148 gradient, e.g., intestinal microbiome development by age, microbial
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	149 succession during wine fermentation, or microbial community differences
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	150 along environmental gradients, as a function of two or more different
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	151 "treatment" groups.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	152
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	153 Parameters
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	154 ----------
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	155 table : FeatureTable[Frequency]
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	156 Feature table containing all features that should be used for target
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	157 prediction.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	158 metadata : Metadata
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	159 \
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	160 column : Str
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	161 Numeric metadata column to use as prediction target.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	162 group_by : Str
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	163 Categorical metadata column to use for plotting and significance
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	164 testing between main treatment groups.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	165 control : Str
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	166 Value of group_by to use as control group. The regression model will be
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	167 trained using only control group data, and the maturity scores of other
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	168 groups consequently will be assessed relative to this group.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	169 estimator : Str % Choices({'ElasticNet', 'ExtraTreesRegressor', 'GradientBoostingRegressor', 'Lasso', 'RandomForestRegressor', 'Ridge', 'SVR'}), optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	170 Regression model to use for prediction.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	171 n_estimators : Int % Range(1, None), optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	172 Number of trees to grow for estimation. More trees will improve
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	173 predictive accuracy up to a threshold level, but will also increase
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	174 time and memory requirements. This parameter only affects ensemble
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	175 estimators, such as Random Forest, AdaBoost, ExtraTrees, and
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	176 GradientBoosting.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	177 test_size : Float % Range(0.0, 1.0, inclusive_start=False), optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	178 Fraction of input samples to exclude from training set and use for
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	179 classifier testing.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	180 step : Float % Range(0.0, 1.0, inclusive_start=False), optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	181 If optimize_feature_selection is True, step is the percentage of
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	182 features to remove at each iteration.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	183 cv : Int % Range(1, None), optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	184 Number of k-fold cross-validations to perform.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	185 random_state : Int, optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	186 Seed used by random number generator.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	187 parameter_tuning : Bool, optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	188 Automatically tune hyperparameters using random grid search.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	189 optimize_feature_selection : Bool, optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	190 Automatically optimize input feature selection using recursive feature
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	191 elimination.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	192 stratify : Bool, optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	193 Evenly stratify training and test data among metadata categories. If
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	194 True, all values in column must match at least two samples.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	195 maz_stats : Bool, optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	196 Calculate anova and pairwise tests on MAZ scores.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	197
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	198 Returns
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	199 -------
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	200 visualization : Visualization
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	201 \
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	202 ]]>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	203 </help>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	204 <macros>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	205 <import>qiime_citation.xml</import>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	206 </macros>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	207 <expand macro="qiime_citation" />
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	208 </tool>

Mercurial > repos > florianbegusch > qiime2_suite

annotate qiime2/qiime_sample-classifier_maturity-index.xml @ 3:558645416841 draft