Repository 'snp_mapping_using_wgs'
hg clone https://toolshed.g2.bx.psu.edu/repos/gregory-minevich/snp_mapping_using_wgs

Changeset 32:11da66cb7216 (2014-05-09)
Previous changeset 31:e4d90981c7a1 (2014-05-09) Next changeset 33:f19399eea0c4 (2014-05-09)
Commit message:
Uploaded
added:
SNP_Mapping.xml
b
diff -r e4d90981c7a1 -r 11da66cb7216 SNP_Mapping.xml
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/SNP_Mapping.xml Fri May 09 15:41:24 2014 -0400
b
b'@@ -0,0 +1,151 @@\n+<tool id="snp_mapping_using_wgs" name="CloudMap: Hawaiian Variant Mapping with WGS data">\n+    <description>Map a mutation by plotting recombination frequencies resulting from crossing to a highly polymorphic strain</description>\n+    <command interpreter="python">\n+\t#if $source.source_select=="elegans" #SNP_Mapping.py --sample_vcf "$sample_vcf" --loess_span "$loess_span" --d_yaxis "$d_yaxis" --h_yaxis "$h_yaxis" --points_color "$points_color" --loess_color "$loess_color" --output "$output" --location_plot_output "$location_plot_output" --standardize "$standardize" --normalize_bins "$normalize_bins" --break_file "$source.Celegans"\n+    #else if  $source.source_select=="brachypodium" #SNP_Mapping.py --sample_vcf "$sample_vcf" --loess_span "$loess_span" --d_yaxis "$d_yaxis" --h_yaxis "$h_yaxis" --points_color "$points_color" --loess_color "$loess_color" --output "$output" --location_plot_output "$location_plot_output" --standardize "$standardize" --normalize_bins "$normalize_bins" --break_file "$source.Brachy"  \n+\t#else if  $source.source_select=="arabidopsis" #SNP_Mapping.py --sample_vcf "$sample_vcf" --loess_span "$loess_span" --d_yaxis "$d_yaxis" --h_yaxis "$h_yaxis" --points_color "$points_color" --loess_color "$loess_color" --output "$output" --location_plot_output "$location_plot_output" --standardize "$standardize" --normalize_bins "$normalize_bins" --break_file "$source.Arabidop" \n+\t#else if  $source.source_select=="other" #SNP_Mapping.py --sample_vcf "$sample_vcf" --loess_span "$loess_span" --d_yaxis "$d_yaxis" --h_yaxis "$h_yaxis" --points_color "$points_color" --loess_color "$loess_color" --output "$output" --location_plot_output "$location_plot_output" --standardize "$standardize" --normalize_bins "$normalize_bins" --break_file "$source.Other" \n+\t#end if \n+    </command>\n+\n+    <inputs>\n+\t<conditional name="source">\n+\t\t<param name="source_select" type="select" label="Please select the species">\n+            <option value="elegans">C. elegans</option>\n+            <option value="brachypodium">Brachypodium</option>\n+            <option value="arabidopsis">Arabidopsis</option>\n+            <option value="other">Other</option>\n+      \t</param>\n+      \t<when value="elegans">\n+        \t<param name="Celegans" type="hidden" value="C.elegans" label="The C.elegans configuration file by default" help="C.elegans help" />\n+\t\t</when>\n+        <when value="brachypodium">\n+            <param name="Brachy" type="hidden" value="Brachypodium" label="The Brachypodium configuration file by default" help="Brachypodium help" />\n+        </when>\n+      \t<when value="arabidopsis">\n+        \t<param name="Arabidop" type="hidden" value="Arabidopsis" label="The Arabidopsis configuration file by default" help="Arabidopsis help" />\n+\t\t</when>\n+      \t<when value="other">\n+        \t<param name="Other" type="data" format="tabular" label="Please select your \'Other species\' configuration file from your history" help="Tabular configuration file for Other species support" />\n+\t\t</when>\n+    </conditional>  \n+        <param name="sample_vcf" size = "125" type="data" format="vcf" label="WGS Mutant VCF File" help="WGS Mutant VCF file from pooled F2 mutants that have been crossed to a mapping strain. The VCF should contain data from only mapping strain (e.g. Hawaiian) SNP positions" />\n+\t\t<param name="loess_span" size = "15" type="float" value=".1" label="Loess span" help="Parameter that controls the degree of data smoothing."/>    \n+\t\t<param name="d_yaxis" size = "15" type="float" value="1" label="Y-axis upper limit for scatter plot" />\n+\t\t<param name="h_yaxis" size = "15" type="integer" value="0" label="Y-axis upper limit for frequency plot" help="\'0\' default adjusts scale to tallest peak" />\n+\t\t<param name="points_color" size = "15" type="text" value="gray27" label="Color for data points" help="See below for list of supported colors"/> \n+\t\t<param name="loess_color" size = "15" type="text" value="red" label="Color for loess regression '..b"ots is described in the CloudMap paper (Fig.6A):\n+\n+.. image:: http://www.hobertlab.org/CloudMap/Doitsidou_2010_PLoS_Fig.1_500px.png\n+\n+\n+------\n+\n+**Input:**\n+\n+\n+This tool accepts as input a single VCF file containing reference (e.g. Bristol) and alternate (e.g. Hawaiian) mapping strain alleles calls at each of the mapping strain variant positions (e.g. 112,000 Hawaiian SNPs) in the pooled mutant sample. This input VCF is generated at an earlier analysis step by running the GATK Unified Genotyper on a BAM alignment file of the pooled mutant sample with a provided reference file of mapping strain variants (e.g. Hawaiian SNPs) in VCF format. The reader is referred to the user guide and online video for direction on this procedure. \n+\n+Default GATK Unified Genotyper parameters for mapping quality, base quality and coverage at each SNP position typically yield good results, though users may experiment with adjusting these parameters. In our testing, low threshold filtering on base pair quality (default settings) has been useful in improving accuracy of plots while high threshold filtering on coverage has skewed plot accuracy.  \n+\n+The required VCF of mapping strain (e.g. Hawaiian) SNPs is a reference file that contains mapping strain SNP positions and reference base pairs at each position. It is available in the `CloudMap Shared Data library`__ \n+\n+    .. __: http://usegalaxy.org/library\n+\n+You may also make your own VCF of mapping strain variant positions following the steps described in the CloudMap paper.\n+\n+The CloudMap Hawaiian Variant Mapping with WGS Data tool supports data from any organism that has been crossed to a mapping strain for which variant information is available. C. elegans and Arabidopsis are natively supported. For all other organisms, users must provide a simple tab-delimited configuration file containing chromosome numbers and respective lengths (example configuration files for most major organisms provided at http://usegalaxy.org/cloudmap). Additional files required for other organisms are the same as described for C. elegans: a VCF file consisting of pooled F2 mutant progeny sequencing data, and a VCF file of the mapping strain variants.\n+\n+\n+**Output:**\n+\n+The tool also provides a tabular output file that contains a count of the number of reference and alternate variants at each mapping strain variant position as well as the ratio of mapping strain (e.g. Hawaiian)/alternate SNPs. The position of each mapping strain SNP in map units and physical coordinates is also provided in the output file.  \n+\n+\n+------\n+\n+**Settings:**\n+\n+.. class:: infomark\n+\n+Information on loess regression and the loess span parameter:\n+http://en.wikipedia.org/wiki/Local_regression\n+\n+.. class:: infomark\n+\n+Based on our testing, we've settled on .1 as a loess span default. Larger values result in smoothing of the line to reflect trends at a more macro level. Smaller values result in loess lines that more closely reflect local data fluctuations. \n+\n+.. class:: infomark\n+\n+Supported colors for data points and loess regression line:\n+\n+http://www.stat.columbia.edu/~tzheng/files/Rcolor.pdf\n+\n+http://research.stowers-institute.org/efg/R/Color/Chart/ColorChart.pdf\n+\n+\n+\n+.. class:: warningmark\n+\n+This tool requires that the statistical programming environment R has been installed on the system hosting Galaxy (http://www.r-project.org/). If you are running this tool on Galaxy via the Cloud, this does not apply to you.\n+\n+\n+------\n+\n+**Citation:**\n+\n+This tool is part of the CloudMap package from the Hobert Lab. If you use this tool, please cite `Gregory Minevich, Danny S. Park, Daniel Blankenberg, Richard J. Poole, and Oliver Hobert.  CloudMap: A Cloud-based Pipeline for Analysis of Mutant Genome Sequences. (Genetics 2012 In Press)`__\n+\n+    .. __: http://hobertlab.org/cloudmap\n+\n+Correspondence to gm2123@columbia.edu (Gregory Minevich) or r.poole@ucl.ac.uk (Richard J. Poole) or or38@columbia.edu (Oliver Hobert)\n+    </help>\n+</tool>\n"