Repository 'ballgown_wrapper'
hg clone https://toolshed.g2.bx.psu.edu/repos/theo.collard/ballgown_wrapper

Changeset 17:05977e96375b (2017-10-03)
Previous changeset 16:4290f0f3d908 (2017-10-03)
Commit message:
Uploaded
modified:
ballgown.xml
b
diff -r 4290f0f3d908 -r 05977e96375b ballgown.xml
--- a/ballgown.xml Tue Oct 03 09:25:35 2017 -0400
+++ b/ballgown.xml Tue Oct 03 09:25:51 2017 -0400
[
b'@@ -1,235 +1,331 @@\n-<tool id="ballgown" name="Ballgown" version="0.5.0" workflow_compatible="true">\n-  <description>Flexible, isoform-level differential expression analysis</description>\n-  <requirements>\n-    <requirement type="package" version="2.2.0">bioconductor-ballgown</requirement>\n-    <requirement type="package" version="0.5.0">r-dplyr</requirement>\n-    <requirement type="package" version="1.3.2">r-optparse</requirement>\n-\n-  </requirements>\n-  <command interpreter="Rscript" detect_errors="aggressive">\n-\t\t##------------------------------------------------------------------------------------\n-\t\t## This function reads the input file with the mapping between samples and files\n-\t\t## E.g. of result:\n-\t\t## mapping = {\n-\t\t##     "e2t.ctab"   : "sample1",\n-\t\t##     "other.ctab" : "sample2",\n-\t\t##     "i2t.ctab"   : "sample1",\n-\t\t##     "t_data.ctab": "sample1"\n-\t\t##      ...\n-\t\t## }\n-\t\t##------------------------------------------------------------------------------------\n-\t\t#def read_sample_mapping_file(sample_mapping_file):\n-\t\t\t#try\n-\t\t\t\t#set mapping = {}\n-\t\t\t\t#set file = open($sample_mapping_file.dataset.dataset.get_file_name(),\'r\')\n-\t\t\t\t#for $line in $file:\n-\t\t\t\t\t#set content= $line.strip().split(\'\\t\')\n-\t\t\t\t\t#for $map in $content:\n-\t\t\t\t\t\t#set mapping[$map]= $content[0]\n-\t\t\t\t\t#end for\n-\t\t\t\t#end for\n-\t\t\t\t#return $mapping\n-\t\t\t#except\n-\t\t\t\t#return None\n-\t\t\t#end try\n-\t\t#end def\n-\n-\t\t##------------------------------------------------------------------------------------\n-\t\t## This function returns the name of the sample associated to a given file\n-\t\t##------------------------------------------------------------------------------------\n-\t\t#def get_sample_name($dataset, $sample_mapping):\n-\t\t\t##If the file with samples mapping was provided\n-\t\t\t#if $sample_mapping != None:\n-\t\t\t\t#return $sample_mapping.get($dataset.name, None)\n-\t\t\t##Otherwise with extract the sample name from the filename\n-\t\t\t#else:\n-\t\t\t\t#return str($dataset.element_identifier)\n-\t\t\t#end if\n-\t\t#end def\n-\n-\t\t##------------------------------------------------------------------------------------\n-\t\t## This function reads a dataset or list of datasets and sets the corresponding value\n-\t\t## in the $result variable\n-\t\t## e.g. of result\n-\t\t##\'sample1\' : {\n-\t\t##         \'e_data\': \'/export/galaxy-central/database/files/000/dataset_13.dat\'\n-\t\t##         \'i_data\': \'/export/galaxy-central/database/files/000/dataset_10.dat\',\n-\t\t##         \'t_data\': \'/export/galaxy-central/database/files/000/dataset_12.dat\',\n-\t\t##         \'e2t\': \'/export/galaxy-central/database/files/000/dataset_9.dat\',\n-\t\t##         \'i2t\': \'/export/galaxy-central/database/files/000/dataset_11.dat\'\n-\t\t##      },\n-\t\t##------------------------------------------------------------------------------------\n-\t\t#def read_input_files($param_name, $param_value, $result, $sample_mapping, $create_if_empty):\n-\t\t\t## If input is a data collection\n-\t\t\t#if isinstance($param_value, list):\n-\t\t\t\t## For each dataset\n-\t\t\t\t#for $dataset in $param_value:\n-\t\t\t\t\t## Get the sample name\n-\t\t\t\t\t#set sample_name = $get_sample_name($dataset, $sample_mapping)\n-\t\t\t\t\t## Check if sample is already registered\n-\t\t\t\t\t#if not($result.has_key($sample_name)):\n-\t\t\t\t\t\t#if ($create_if_empty == True):\n-\t\t\t\t\t\t\t#set result[$sample_name] = {}\n-\t\t\t\t\t\t#else:\n-\t\t\t\t\t\t\t#raise ValueError("Error in input. Please check that input contains all the required files for sample " + $sample_name)\n-\t\t\t\t\t\t#end if\n-\t\t\t\t\t#end if\n-\t\t\t\t\t## Register the file to the sample\n-\t\t\t\t\t#set result[$sample_name][$param_name] = str($dataset.dataset.dataset.get_file_name())\n-\t\t\t\t#end for\n-\t\t\t#else:\n-\t\t\t\t#if not($result.has_key("sample_1")):\n-\t\t\t\t\t#set result["sample_1"] = {}\n-\t\t\t\t#end if\n-\t\t\t\t#set result["sample_1"][$param_name] = str($param_name.dataset.dataset.get_file_name())\n-\t\t\t#end if\n-\t\t\t#return $result\n-\t\t#end def\n-\n-\t\t##------------------------------------------------------------------------------------\n-\t\t## Main body of the tool\n-\t\t##-------------------------------------------------'..b'ndard deviation of multi-map-corrected per-base coverage\r\n+- **i_data**: intron- (i.e., junction-) level expression measurements. Tab file or collection of tab files. One row per intron. Columns are i_id (numeric intron id), chr, strand, start, end (genomic location of the intron), and the following expression measurements for each sample:\r\n+          * rcount: number of reads supporting the intron\r\n+          * ucount: number of uniquely mapped reads supporting the intron\r\n+          * mrcount: multi-map-corrected number of reads supporting the intron\r\n+- **t_data**: transcript-level expression measurements. Tab file or collection of tab files. One row per transcript. Columns are:\r\n+          * t_id: numeric transcript id\r\n+          * chr, strand, start, end: genomic location of the transcript\r\n+          * t_name: Cufflinks-generated transcript id\r\n+          * num_exons: number of exons comprising the transcript\r\n+          * length: transcript length, including both exons and introns\r\n+          * gene_id: gene the transcript belongs to\r\n+          * gene_name: HUGO gene name for the transcript, if known\r\n+          * cov: per-base coverage for the transcript (available for each sample)\r\n+          * FPKM: Cufflinks-estimated FPKM for the transcript (available for each sample)\r\n+- **e2t**: Tab file or collection of tab files. Table with two columns, e_id and t_id, denoting which exons belong to which transcripts. These ids match the ids in the e_data and t_data tables.\r\n+- **i2t**: Tab file or collection of tab files. Table with two columns, i_id and t_id, denoting which introns belong to which transcripts. These ids match the ids in the i_data and t_data tables.\r\n+- samples_names: (optional) Tab file. Table with five columns, one row per sample. Defines which files from the input belong to each sample in the experiment.\r\n+\r\n+.. class:: infomark\r\n+\r\n+\'\'\'TIP\'\'\' *Note* Here\'s an example of a good phenotype data file for your experiment.\r\n+\r\n++--------------+-------------------------+-------------------------+---+\r\n+|ids           |experimental variable 1  |experimental variable 2  |...|\r\n++==============+=========================+=========================+===+\r\n+|sample 1      |value 1                  |value 2                  |...|\r\n++--------------+-------------------------+-------------------------+---+\r\n+|sample 2      |value 2                  |value 1                  |...|\r\n++--------------+-------------------------+-------------------------+---+\r\n+|sample 3      |value 1                  |value 2                  |...|\r\n++--------------+-------------------------+-------------------------+---+\r\n+|sample 4      |value 2                  |value 1                  |...|\r\n++--------------+-------------------------+-------------------------+---+\r\n+|...           |value 1                  |value 2                  |...|\r\n++--------------+-------------------------+-------------------------+---+\r\n+\r\n+\r\n+.. class:: infomark\r\n+\r\n+*Note* The minimal transcript expression is a number used to filter the transcripts that\r\n+are less or not expressed in our samples when compared to the genome\r\n+\r\n+-----------------------\r\n+**Outputs**\r\n+-----------------------\r\n+\r\n+This tool has 3 outputs:\r\n+\r\n+- **transcripts expression** : this is a csv file containing all the transcripts that are expressed above the transcripts expression value\r\n+- **genes expression** : this is a csv file containing all the genes that are expressed above the transcripts expression value\r\n+- **Ballgown object** : this is the ballgown object created during the process. This file can be re-used later for further analysis in a R console.\r\n+\r\n+----\r\n+\r\n+**Authors**: Th\xc3\xa9o Collard [SLU Global Bioinformatics Centre], Rafael Hern\xc3\xa1ndez de Diego [SLU Global Bioinformatics Centre], and Tomas Klingstr\xc3\xb6m [SLU Global Bioinformatics Centre]\r\n+    ]]></help>\r\n+    <citations>\r\n+        <citation type="doi">doi:10.1038/nprot.2016.095</citation>\r\n+    </citations>\r\n+</tool>\r\n'