Repository 'obi_ngsfilter'
hg clone https://toolshed.g2.bx.psu.edu/repos/iuc/obi_ngsfilter

Changeset 4:91a1ed0b486f (2024-03-20)
Previous changeset 3:3bf57dadf7cd (2021-05-10)
Commit message:
planemo upload for repository https://github.com/galaxyproject/tools-iuc/tree/master/tools/obitools commit dabf62d438facc62f3e606ff4419092fdcdfaa44
modified:
macros.xml
ngsfilter.xml
test-data/input_ngsfilter_extrafile.txt
b
diff -r 3bf57dadf7cd -r 91a1ed0b486f macros.xml
--- a/macros.xml Mon May 10 19:34:54 2021 +0000
+++ b/macros.xml Wed Mar 20 13:16:28 2024 +0000
b
@@ -5,7 +5,11 @@
             <requirement type="package" version="@TOOL_VERSION@">obitools</requirement>
         </requirements>
     </xml>
-
+    <xml name="bio_tools">
+        <xrefs>
+            <xref type="bio.tools">obitools</xref>
+        </xrefs>
+    </xml>
     <token name="@TOOL_VERSION@">1.2.13</token>
     <token name="@PROFILE@">21.01</token>
 
b
diff -r 3bf57dadf7cd -r 91a1ed0b486f ngsfilter.xml
--- a/ngsfilter.xml Mon May 10 19:34:54 2021 +0000
+++ b/ngsfilter.xml Wed Mar 20 13:16:28 2024 +0000
[
b'@@ -1,125 +1,126 @@\n-<tool id="obi_ngsfilter" name="NGSfilter" version="@TOOL_VERSION@" profile="@PROFILE@">\n-    <description>Assigns sequence records to the corresponding experiment/sample based on DNA tags and primers</description>\n-    <macros>\n-        <import>macros.xml</import>\n-    </macros>\n-    <expand macro="requirements"/>\n-    <expand macro="stdio"/>\n-    <command><![CDATA[\n-        @GUNZIP_INPUT@\n-\n-        ngsfilter\n-\n-        --without-progress-bar\n-        -t \'$inputextrafile\' \n-        #if $bool\n-            -u unident\n-        #end if\n-        -e \'$mismatch\'\n-        @INPUT_FORMAT@\n-        @OUT_FORMAT@\n-        input\n-        @GZIP_OUTPUT@\n-        > \'$output\'\n-\n-        #if $bool\n-            #if $input.ext.endswith(".gz")\n-                && gzip -c unident > \'$unident\'\n-            #else\n-                && mv unident \'$unident\'\n-            #end if\n-            #set outputs = [("output", $output), ("unident", $unident)]\n-        #end if\n-        @GENERATE_GALAXY_JSON@\n-    ]]></command>\n-    <inputs>\n-        <param name="inputextrafile" type="data" format="tabular" label="Parameter file" help="extrafile describing the DNA tags and primers sequences used for each sample" />\n-        <param name="input" type="data" format="@INPUT_FORMATS@" label="Read from file" help="file of Illumina pair-end reads assembled by illuminapairedend" />\n-        <param name="mismatch" type="integer" value="2" label="Number of errors allowed for matching primers (default = 2)" />\n-        <param name="bool" type="boolean" checked="true" label="Do you want to generate a file with unidentified sequences?" />\n-        <expand macro="input_format_options_macro"/>\n-        <expand macro="out_format_macro"/>\n-    </inputs>\n-    <outputs>\n-        <data name="unident"  format="auto" label="${tool.name} on ${on_string}: Unassigned sequences">\n-            <filter>bool is True</filter>\n-        </data>\n-        <data name="output"  format="auto" label="${tool.name} on ${on_string}: Trimmed and annotated" />\n-    </outputs>\n-    <tests>\n-       <test>\n-           <param name="inputextrafile" value="input_ngsfilter_extrafile.txt" />\n-           <param name="input" value="illuminapairedend.output.fastq" ftype="fastqsanger" />\n-           <param name="mismatch" value="2" />\n-           <param name="bool" value="False" />\n-           <output name="output" file="output_ngsfilter.fastq" ftype="fastqsanger"/>\n-       </test>\n-       <test>\n-           <param name="inputextrafile" value="input_ngsfilter_extrafile.txt" />\n-           <param name="input" value="illuminapairedend.output.fastq.gz" ftype="fastqsanger.gz" />\n-           <param name="mismatch" value="3" />\n-           <param name="bool" value="True" />\n-           <output name="output" file="output_ngsfilter_error_3.fastq" ftype="fastqsanger.gz" decompress="true"/>\n-           <output name="unident" file="output_ngsfilter_unidentified.fastq" ftype="fastqsanger.gz" decompress="true"/>\n-       </test>\n-   </tests>\n-    <help><![CDATA[\n-\n-.. class:: infomark\n-\n-**What it does**\n-\n-A DNA metabarcoding experiment can be considered as a set a PCR products mixed together and sequenced using a next generation sequencer ({i.e.} a solexa or a 454).\n-To distinguish between this different PCR products, pairs of small DNA sequences (call tags, see the oligoTag command and its associated paper for more\n-informations on the design of such tags) unique for each PCR products are concatenated to the PCR primers.\n-As they are amplified during the PCR, these tags should be recognizable, together with their respective primers, at the beginning and the end of the reads.\n-The first step in data analysis is thus to demultiplex the large resulting sequence file by identifying these DNA tags and the primers.\n-\n-Usually the results of sequencing are stored in one or more files formatted according to the fasta or fastq format. ngsfilter take as input such sequence file and an extra file describing the DNA tag'..b't"  format="auto" label="${tool.name} on ${on_string}: Trimmed and annotated"/>\r\n+    </outputs>\r\n+    <tests>\r\n+       <test expect_num_outputs="1">\r\n+           <param name="inputextrafile" value="input_ngsfilter_extrafile.txt" />\r\n+           <param name="input" value="illuminapairedend.output.fastq" ftype="fastqsanger"/>\r\n+           <param name="mismatch" value="2" />\r\n+           <param name="bool" value="False" />\r\n+           <output name="output" file="output_ngsfilter.fastq" ftype="fastqsanger"/>\r\n+       </test>\r\n+       <test expect_num_outputs="2">\r\n+           <param name="inputextrafile" value="input_ngsfilter_extrafile.txt"/>\r\n+           <param name="input" value="illuminapairedend.output.fastq.gz" ftype="fastqsanger.gz"/>\r\n+           <param name="mismatch" value="3"/>\r\n+           <param name="bool" value="True"/>\r\n+           <output name="output" file="output_ngsfilter_error_3.fastq" ftype="fastqsanger.gz" decompress="true"/>\r\n+           <output name="unident" file="output_ngsfilter_unidentified.fastq" ftype="fastqsanger.gz" decompress="true"/>\r\n+       </test>\r\n+   </tests>\r\n+    <help><![CDATA[\r\n+\r\n+.. class:: infomark\r\n+\r\n+**What it does**\r\n+\r\n+A DNA metabarcoding experiment can be considered as a set a PCR products mixed together and sequenced using a next generation sequencer ({i.e.} a solexa or a 454).\r\n+To distinguish between this different PCR products, pairs of small DNA sequences (call tags, see the oligoTag command and its associated paper for more\r\n+informations on the design of such tags) unique for each PCR products are concatenated to the PCR primers.\r\n+As they are amplified during the PCR, these tags should be recognizable, together with their respective primers, at the beginning and the end of the reads.\r\n+The first step in data analysis is thus to demultiplex the large resulting sequence file by identifying these DNA tags and the primers.\r\n+\r\n+Usually the results of sequencing are stored in one or more files formatted according to the fasta or fastq format. ngsfilter take as input such sequence file and an extra file describing the DNA tags and primers sequences used for each sample.\r\n+\r\n+The results consist of sequences trimmed of the primers and tags and annotated with the corresponding sample (and possibly some extra informations).\r\n+Sequences for which the tags and primers have not been well identified, and which are thus unassigned to any sample, are tagged as erroneous sequences\r\n+by ngsfilter. Such erroneous sequences are not reported by the program unless specified by the appropriate option.\r\n+\r\n+--------\r\n+\r\n+**Help**\r\n+Extrafile format:\r\n+\r\n+a tab delimited tabular file with 8 columns.\r\n+\r\n+experiment_name\tsample_name\toligo_tag(s)\tforward_primer\treverse_primer\tF\t@\textra_information\r\n+\r\n+ex:\r\n+\r\n+laos_gh LA01E1a agcgacta:acacacac GGGCAATCCTGAGCCAA CCATTGAGTCTCTGCACCTATC F @ position=04_01A;\r\n+\r\n+laos_gh LA01E1b tcagtgtc:acacacac GGGCAATCCTGAGCCAA CCATTGAGTCTCTGCACCTATC F @ position=04_01B;\r\n+\r\n+laos_gh LA01E2a actctgct:acacacac GGGCAATCCTGAGCCAA CCATTGAGTCTCTGCACCTATC F @ position=04_01C;\r\n+\r\n+laos_gh LA01E2b atatagcg:acacacac GGGCAATCCTGAGCCAA CCATTGAGTCTCTGCACCTATC F @ position=04_01D;\r\n+\r\n+laos_gh LA01P1a ctatgcta:acacacac GGGCAATCCTGAGCCAA CCATTGAGTCTCTGCACCTATC F @ position=04_01E;\r\n+\r\n+laos_gh LA01P1b tcgcgctg:acacacac GGGCAATCCTGAGCCAA CCATTGAGTCTCTGCACCTATC F @ position=04_01F;\r\n+\r\n+laos_gh LA01P2a agcacagt:acacacac GGGCAATCCTGAGCCAA CCATTGAGTCTCTGCACCTATC F @ position=04_01G;\r\n+\r\n+laos_gh LA01P2b tagctagt:acacacac GGGCAATCCTGAGCCAA CCATTGAGTCTCTGCACCTATC F @ position=04_01H;\r\n+\r\n+laos_gh LA02E1a agcgacta:acagcaca GGGCAATCCTGAGCCAA CCATTGAGTCTCTGCACCTATC F @ position=04_02A;\r\n+\r\n+laos_gh LA02E1b tcagtgtc:acagcaca GGGCAATCCTGAGCCAA CCATTGAGTCTCTGCACCTATC F @ position=04_02B;\r\n+\r\n+laos_gh LA02E2a actctgct:acagcaca GGGCAATCCTGAGCCAA CCATTGAGTCTCTGCACCTATC F @ position=04_02C;\r\n+\r\n+@OBITOOLS_LINK@\r\n+\r\n+\r\n+]]>\r\n+\r\n+    </help>\r\n+    <expand macro="citation" />\r\n+\r\n+</tool>\r\n'
b
diff -r 3bf57dadf7cd -r 91a1ed0b486f test-data/input_ngsfilter_extrafile.txt
--- a/test-data/input_ngsfilter_extrafile.txt Mon May 10 19:34:54 2021 +0000
+++ b/test-data/input_ngsfilter_extrafile.txt Wed Mar 20 13:16:28 2024 +0000
b
@@ -1,4 +1,4 @@
-wolf_diet    13a_F730603      aattaac  TTAGATACCCCACTATGC    TAGAACAGGCTCCTCTAG     F       @
-wolf_diet    15a_F730814      gaagtag  TTAGATACCCCACTATGC    TAGAACAGGCTCCTCTAG     F       @
-wolf_diet    26a_F040644      gaatatc  TTAGATACCCCACTATGC    TAGAACAGGCTCCTCTAG     F       @
-wolf_diet    29a_F260619      gcctcct  TTAGATACCCCACTATGC    TAGAACAGGCTCCTCTAG     F       @
+wolf_diet 13a_F730603 aattaac TTAGATACCCCACTATGC TAGAACAGGCTCCTCTAG F @
+wolf_diet 15a_F730814 gaagtag TTAGATACCCCACTATGC TAGAACAGGCTCCTCTAG F @
+wolf_diet 26a_F040644 gaatatc TTAGATACCCCACTATGC TAGAACAGGCTCCTCTAG F @
+wolf_diet 29a_F260619 gcctcct TTAGATACCCCACTATGC TAGAACAGGCTCCTCTAG F @