Repository 'samtools_markdup'
hg clone https://toolshed.g2.bx.psu.edu/repos/iuc/samtools_markdup

Changeset 0:046cbf29795a (2018-09-28)
Next changeset 1:83b8e36e9cbe (2019-09-06)
Commit message:
planemo upload for repository https://github.com/galaxyproject/tools-iuc/tree/master/tool_collections/samtools/samtools_markdup commit 0fe00966500158720fb63dc9b28f6a4ca0d1e1eb
added:
macros.xml
samtools_markdup.xml
test-data/5_markdup.expected.bam
test-data/5_markdup.expected.sam
test-data/5_markdup.sam
test-data/6_remove_dups.expected.bam
test-data/6_remove_dups.expected.sam
test-data/6_remove_dups.sam
test-data/7_mark_supp_dup.bam
test-data/7_mark_supp_dup.expected.bam
test-data/7_mark_supp_dup.expected.sam
test-data/7_mark_supp_dup.sam
b
diff -r 000000000000 -r 046cbf29795a macros.xml
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/macros.xml Fri Sep 28 04:29:07 2018 -0400
[
b'@@ -0,0 +1,172 @@\n+<macros>\n+    <xml name="requirements">\n+        <requirements>\n+            <requirement type="package" version="@TOOL_VERSION@">samtools</requirement>\n+            <yield/>\n+        </requirements>\n+    </xml>\n+    <token name="@TOOL_VERSION@">1.9</token>\n+    <token name="@FLAGS@">#set $flags = sum(map(int, str($filter).split(\',\')))</token>\n+    <token name="@PREPARE_IDX@"><![CDATA[\n+        ##prepare input and indices \n+        ln -s \'$input\' infile &&\n+        #if $input.is_of_type(\'bam\'):\n+            #if str( $input.metadata.bam_index ) != "None":\n+                ln -s \'${input.metadata.bam_index}\' infile.bai &&\n+            #else:\n+                samtools index infile infile.bai &&\n+            #end if\n+        #elif $input.is_of_type(\'cram\'):\n+            #if str( $input.metadata.cram_index ) != "None":\n+                ln -s \'${input.metadata.cram_index}\' infile.crai &&\n+            #else:\n+                samtools index infile infile.crai &&\n+            #end if\n+        #end if\n+    ]]></token>\n+    <token name="@PREPARE_IDX_MULTIPLE@"><![CDATA[\n+        ##prepare input and indices \n+        #for $i, $bam in enumerate( $input_bams ):\n+            ln -s \'$bam\' \'${i}\' &&\n+            #if $bam.is_of_type(\'bam\'):\n+                #if str( $bam.metadata.bam_index ) != "None":\n+                    ln -s \'${bam.metadata.bam_index}\' \'${i}.bai\' &&\n+                #else:\n+                    samtools index \'${i}\' \'${i}.bai\' &&\n+                #end if\n+            #elif $bam.is_of_type(\'cram\'):\n+                #if str( $bam.metadata.cram_index ) != "None":\n+                    ln -s \'${bam.metadata.cram_index}\' \'${i}.crai\' &&\n+                #else:\n+                    samtools index \'${i}\' \'${i}.crai\' &&\n+                #end if\n+            #end if\n+        #end for\n+    ]]></token>\n+    <token name="@PREPARE_FASTA_IDX@"><![CDATA[\n+        ##checks for reference data ($addref_cond.addref_select=="history" or =="cached")\n+        ##and sets the -t/-T parameters accordingly:\n+        ##- in case of history a symbolic link is used because samtools (view) will generate\n+        ##  the index which might not be possible in the directory containing the fasta file\n+        ##- in case of cached the absolute path is used which allows to read the cram file\n+        ##  without specifying the reference\n+        #if $addref_cond.addref_select == "history":\n+            ln -s \'${addref_cond.ref}\' reference.fa &&\n+            samtools faidx reference.fa &&\n+            #set reffa="reference.fa"\n+            #set reffai="reference.fa.fai"\n+        #elif $addref_cond.addref_select == "cached":\n+            #set reffa=str($addref_cond.ref.fields.path)\n+            #set reffai=str($addref_cond.ref.fields.path)+".fai"\n+        #else\n+            #set reffa=None\n+            #set reffai=None\n+        #end if\n+    ]]></token>\n+    <token name="@ADDTHREADS@"><![CDATA[\n+        ##compute the number of ADDITIONAL threads to be used by samtools (-@)\n+        addthreads=\\${GALAXY_SLOTS:-1} && (( addthreads-- )) &&\n+    ]]></token>\n+    <token name="@ADDMEMORY@"><![CDATA[\n+        ##compute the number of memory available to samtools sort (-m)\n+        ##use only 75% of available: https://github.com/samtools/samtools/issues/831\n+        addmemory=\\${GALAXY_MEMORY_MB_PER_SLOT:-768} && \n+        ((addmemory=addmemory*75/100)) &&\n+    ]]></token>\n+    <xml name="seed_input">\n+       <param name="seed" type="integer" optional="True" label="Seed for random number generator" help="If empty a random seed is used." /> \n+    </xml>\n+    <xml name="flag_options">\n+        <option value="1">read is paired</option>\n+        <option value="2">read is mapped in a proper pair</option>\n+        <option value="4">read is unmapped</option>\n+        <option value="8">mate is unmapped</option>\n+        <option value="16">read reverse strand</option>\n+        <option value="32">mate reverse strand</option>\n+        <option value="64">read is the'..b'on>\n+        <option value="1024">read is a PCR or optical duplicate</option>\n+        <option value="2048">supplementary alignment</option>\n+    </xml>\n+\n+    <!-- region specification macros and tokens for tools that allow the specification \n+         of region by bed file / space separated list of regions -->\n+    <token name="@REGIONS_FILE@"><![CDATA[\n+        #if $cond_region.select_region == \'tab\':\n+            -t \'$cond_region.targetregions\'\n+        #end if\n+    ]]></token>\n+    <token name="@REGIONS_MANUAL@"><![CDATA[\n+        #if $cond_region.select_region == \'text\':\n+            #for $i, $x in enumerate($cond_region.regions_repeat):\n+               \'${x.region}\'\n+            #end for\n+        #end if\n+    ]]></token>\n+    <xml name="regions_macro">\n+        <conditional name="cond_region">\n+            <param name="select_region" type="select" label="Filter by regions" help="restricts output to only those alignments which overlap the specified region(s)">\n+                <option value="no" selected="True">No</option>\n+                <option value="text">Manualy specify regions</option>\n+                <option value="tab">Regions from tabular file</option>\n+            </param>\n+            <when value="no"/>\n+            <when value="text">\n+                <repeat name="regions_repeat" min="1" default="1" title="Regions">\n+                    <param name="region" type="text" label="region" help="format chr:from-to">\n+                        <validator type="regex" message="Required format: CHR[:FROM[-TO]]; where CHR: string containing any character except quotes, whitespace and colon; FROM and TO: any integer">^[^\\s\'\\":]+(:\\d+(-\\d+){0,1}){0,1}$</validator>\n+                    </param>\n+                </repeat>\n+            </when>\n+            <when value="tab">\n+                <param name="targetregions" argument="-t/--target-regions" type="data" format="tabular" label="Target regions file" help="Do stats in these regions only. Tab-delimited file chr,from,to (1-based, inclusive)" />\n+            </when>\n+        </conditional>\n+    </xml>\n+\n+    <xml name="citations">\n+        <citations>\n+            <citation type="bibtex">\n+                @misc{SAM_def,\n+                title={Definition of SAM/BAM format},\n+                url = {https://samtools.github.io/hts-specs/},}\n+            </citation>\n+            <citation type="doi">10.1093/bioinformatics/btp352</citation>\n+            <citation type="doi">10.1093/bioinformatics/btr076</citation>\n+            <citation type="doi">10.1093/bioinformatics/btr509</citation>\n+            <citation type="bibtex">\n+                @misc{Danecek_et_al,\n+                Author={Danecek, P., Schiffels, S., Durbin, R.},\n+                title={Multiallelic calling model in bcftools (-m)},\n+                url = {http://samtools.github.io/bcftools/call-m.pdf},}\n+            </citation>\n+            <citation type="bibtex">\n+                @misc{Durbin_VCQC,\n+                Author={Durbin, R.},\n+                title={Segregation based metric for variant call QC},\n+                url = {http://samtools.github.io/bcftools/rd-SegBias.pdf},}\n+            </citation>\n+            <citation type="bibtex">\n+                @misc{Li_SamMath,\n+                Author={Li, H.},\n+                title={Mathematical Notes on SAMtools Algorithms},\n+                url = {http://www.broadinstitute.org/gatk/media/docs/Samtools.pdf},}\n+            </citation>\n+            <citation type="bibtex">\n+                @misc{SamTools_github,\n+                title={SAMTools GitHub page},\n+                url = {https://github.com/samtools/samtools},}\n+            </citation>\n+        </citations>\n+    </xml>\n+    <xml name="version_command">\n+        <version_command><![CDATA[samtools 2>&1 | grep Version]]></version_command>\n+    </xml>\n+    <xml name="stdio">\n+        <stdio>\n+            <exit_code range="1:" level="fatal" description="Error" />\n+        </stdio>\n+    </xml>\n+</macros>\n'
b
diff -r 000000000000 -r 046cbf29795a samtools_markdup.xml
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/samtools_markdup.xml Fri Sep 28 04:29:07 2018 -0400
[
@@ -0,0 +1,80 @@
+<tool id="samtools_markdup" name="Samtools markdup" version="@TOOL_VERSION@">
+    <description>marks duplicate alignments</description>
+    <macros>
+        <import>macros.xml</import>
+    </macros>
+    <expand macro="requirements"/>
+    <expand macro="stdio"/>
+    <expand macro="version_command"/>
+    <command><![CDATA[
+@ADDTHREADS@
+## coordinate sort input 
+#if not $bamfile.is_of_type('bam'):
+    samtools sort
+    -@ \$addthreads -m \${GALAXY_MEMORY_MB:-768}M -T sorttemp
+    -O sam
+    -o coordsort.sam
+    '$bamfile' &&
+#else:
+    ln -s '$bamfile' coordsort.sam &&
+#end if
+
+samtools markdup 
+
+-@ \$addthreads
+#if str($maxlen) != '':
+    -l $maxlen
+#end if 
+$remove 
+$stats 
+$supp
+coordsort.sam 
+'$output'
+    ]]></command>
+    <inputs>
+        <param name="bamfile" type="data" format="sam,bam,cram" optional="false" label="Alignment" />
+        <param name="remove" type="boolean" argument="-r" truevalue="-r" falsevalue="" label="Remove duplicate reads" />
+        <param name="maxlen" type="integer" optional="true" argument="-l" min="0" label="Expected maximum read length of INT bases. (default 300)"/>
+ <param name="stats" type="boolean" argument="-s" truevalue="-s" falsevalue="" label="Print basic statistics" />
+ <param name="supp" type="boolean" argument="-S" truevalue="-S" falsevalue="" label="Mark supplementary reads of duplicates as duplicates" />
+    </inputs>
+    <outputs>
+ <!-- output bam, if input was name sorted then restore this sorting order -->
+ <data name="output" format="bam"/>
+    </outputs>
+    <tests>
+        <!-- tests and data extracted from 
+      https://github.com/samtools/samtools/blob/6d79411685d8f0fbb34e123f52d72b63271f4dcb/test/test.pl#L2616 
+             TODO the 1st 4 tests are negative, I do not know how to test for the error code 
+-->
+<!--    test_cmd($opts, out=>'markdup/1_name_sort.expected.sam', err=>'1_name_sort.expected.sam.err', cmd=>"$$opts{bin}/samtools markdup${threads} -O sam $$opts{path}/markdup/1_name_sort.sam -", expect_fail=>1);
+    test_cmd($opts, out=>'markdup/2_bad_order.expected.sam', err=>'2_bad_order.expected.sam.err', cmd=>"$$opts{bin}/samtools markdup${threads} -O sam $$opts{path}/markdup/2_bad_order.sam -", expect_fail=>1);
+    test_cmd($opts, out=>'markdup/3_missing_mc.expected.sam', err=>'3_missing_mc.expected.sam.err', cmd=>"$$opts{bin}/samtools markdup${threads} -O sam $$opts{path}/markdup/3_missing_mc.sam -", expect_fail=>1);
+    test_cmd($opts, out=>'markdup/4_missing_ms.expected.sam', err=>'4_missing_ms.expected.sam.err', cmd=>"$$opts{bin}/samtools markdup${threads} -O sam $$opts{path}/markdup/4_missing_ms.sam -", expect_fail=>1);-->
+        <test>
+            <param name="bamfile" value="5_markdup.sam" />
+            <output name="output" file="5_markdup.expected.bam" />
+        </test>
+        <!--    test_cmd($opts, out=>'markdup/5_markdup.expected.sam', cmd=>"$$opts{bin}/samtools markdup${threads} -O sam $$opts{path}/markdup/5_markdup.sam -");-->
+        <test>
+            <param name="bamfile" value="6_remove_dups.sam" />
+            <param name="remove" value="-r" />
+            <output name="output" file="6_remove_dups.expected.bam" />
+        </test>
+        <!--    test_cmd($opts, out=>'markdup/6_remove_dups.expected.sam', cmd=>"$$opts{bin}/samtools markdup${threads} -O sam -r $$opts{path}/markdup/6_remove_dups.sam -");-->
+        <test>
+            <param name="bamfile" value="7_mark_supp_dup.bam" />
+            <param name="supp" value="-S" />
+            <output name="output" file="7_mark_supp_dup.expected.bam" />
+        </test>
+        <!--
+        test_cmd($opts, out=>'markdup/7_mark_supp_dup.expected.sam', cmd=>"$$opts{bin}/samtools markdup${threads} -S -O sam $$opts{path}/markdup/7_mark_supp_dup.sam -");-->
+    </tests>
+    <help>
+Mark duplicate alignments from a coordinate sorted file that has been run through fixmate with the -m option. This program relies on the MC and ms tags that fixmate provides. 
+
+Note: The Galaxy tool sorts the data automatically if the input is SAM or query name sorted. 
+The output is BAM (which is query name sorted again if the input is).
+    </help>
+    <expand macro="citations"/>
+</tool>
b
diff -r 000000000000 -r 046cbf29795a test-data/5_markdup.expected.bam
b
Binary file test-data/5_markdup.expected.bam has changed
b
diff -r 000000000000 -r 046cbf29795a test-data/5_markdup.expected.sam
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/5_markdup.expected.sam Fri Sep 28 04:29:07 2018 -0400
b
b'@@ -0,0 +1,18 @@\n+@HD\tVN:1.4\tSO:coordinate\n+@SQ\tSN:contig_000000000\tLN:11391\n+entry1\t1187\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n+entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n+entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n+entry4\t1187\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n+entry1\t1107\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n+entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n+entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAA'..b'TTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG\tBCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF\tAS:i:0\tXS:i:0\tMQ:i:49\tMC:Z:35M215S\tms:i:9339\n+entry6\t1161\tcontig_000000000\t304\t49\t35M215S\t=\t304\t0\tATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT\tABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0\tNM:i:0\tAS:i:35\tXS:i:0\tMC:Z:*\tms:i:9398\n+entry5\t83\tcontig_000000000\t422\t60\t250M\t=\t304\t-368\tTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA\t.DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9461\n+entry7\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:4569\n+entry7\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tCAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG\t////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8580\n+entry8\t1145\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n+entry8\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n'
b
diff -r 000000000000 -r 046cbf29795a test-data/5_markdup.sam
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/5_markdup.sam Fri Sep 28 04:29:07 2018 -0400
b
b'@@ -0,0 +1,18 @@\n+@HD\tVN:1.4\tSO:coordinate\n+@SQ\tSN:contig_000000000\tLN:11391\n+entry1\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n+entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n+entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n+entry4\t163\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n+entry1\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n+entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n+entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACT'..b'ACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG\tBCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF\tAS:i:0\tXS:i:0\tMQ:i:49\tMC:Z:35M215S\tms:i:9339\n+entry6\t137\tcontig_000000000\t304\t49\t35M215S\t=\t304\t0\tATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT\tABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0\tNM:i:0\tAS:i:35\tXS:i:0\tMC:Z:*\tms:i:9398\n+entry5\t83\tcontig_000000000\t422\t60\t250M\t=\t304\t-368\tTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA\t.DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9461\n+entry7\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:4569\n+entry7\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tCAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG\t////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8580\n+entry8\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n+entry8\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n'
b
diff -r 000000000000 -r 046cbf29795a test-data/6_remove_dups.expected.bam
b
Binary file test-data/6_remove_dups.expected.bam has changed
b
diff -r 000000000000 -r 046cbf29795a test-data/6_remove_dups.expected.sam
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/6_remove_dups.expected.sam Fri Sep 28 04:29:07 2018 -0400
b
@@ -0,0 +1,12 @@
+@HD VN:1.4 SO:coordinate
+@SQ SN:contig_000000000 LN:11391
+entry2 163 contig_000000000 109 60 250M = 137 278 TATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG BBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00 NM:i:2 AS:i:240 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9279
+entry3 99 contig_000000000 116 60 250M = 222 356 ATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG BBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9509
+entry2 83 contig_000000000 137 60 250M = 109 -278 GTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG 0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8804
+entry3 147 contig_000000000 222 60 250M = 116 -356 TAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTA 9BGC0FFBGFFGGGGFFGFEGGHGHGCGHHHHGHGGHGHHHGHHHHGHHGGGHHHHFHGHGHHHHHHGHHFHHHHHHHHHGHHHHGHHGHHHHG2HHGFHHGHHHHHHDFHHHGGHHGHGHHHFHHDHHHHHHHHHHHHFHHHHHGHHHHHHHHHHHHFFHHHHGHHHHHHFHHHHHHHHHHHHHHGCGGGHHHGGGGGGGGGGGGGGGHHHHHGHHHHHHHHHHHHHGGGGGGGGGGFFFFFFFBBBBB NM:i:1 AS:i:245 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9634
+entry5 163 contig_000000000 304 60 250M = 422 368 ATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGTCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAG AABBBFFFFFFFGGGFGGGGGGHHHHHHHHHGHHHHHHHGGHGHHHHHHHHHHGHHHHHHHHFHFGHHHHHHHHHGHGGHFHHHHHHHHHHGFFHHHHHEHHHGHHHHHGDEEGHGHGEGGHHHHHHHHHGHHHFGHHHHHHHFGHHHHHGG?GGGAGHHFFHHFFGG2>@FGGFGFBGGHFHGHHHHHFFF?FGHHGGGGFGEGGHHGGGGHGFGDGHGHHFHEGFHGFGFFHFFHHFHGHFHBFGGF? NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9562
+entry6 69 contig_000000000 304 0 * = 304 0 GCGGTGGAACGCCGCTTCGGCAACGATCTTCCGTCGTCTCCAGTGGAGTGGCTGACGGATAATGGTTCATGCTACCGGGCTAATGAAACACGCCAGTTCGCCCGGATGTTGGGACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG BCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF AS:i:0 XS:i:0 MQ:i:49 MC:Z:35M215S ms:i:9339
+entry5 83 contig_000000000 422 60 250M = 304 -368 TGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA .DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9461
+entry7 121 contig_000000000 3891 60 250M = 3891 0 ACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC 99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB NM:i:0 AS:i:250 XS:i:0 MC:Z:* ms:i:4569
+entry7 181 contig_000000000 3891 0 * = 3891 0 CAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG ////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8580
+entry8 181 contig_000000000 3891 0 * = 3891 0 GACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT 9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8542
b
diff -r 000000000000 -r 046cbf29795a test-data/6_remove_dups.sam
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/6_remove_dups.sam Fri Sep 28 04:29:07 2018 -0400
b
b'@@ -0,0 +1,18 @@\n+@HD\tVN:1.4\tSO:coordinate\n+@SQ\tSN:contig_000000000\tLN:11391\n+entry1\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n+entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n+entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n+entry4\t163\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n+entry1\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n+entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n+entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACT'..b'ACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG\tBCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF\tAS:i:0\tXS:i:0\tMQ:i:49\tMC:Z:35M215S\tms:i:9339\n+entry6\t137\tcontig_000000000\t304\t49\t35M215S\t=\t304\t0\tATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT\tABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0\tNM:i:0\tAS:i:35\tXS:i:0\tMC:Z:*\tms:i:9398\n+entry5\t83\tcontig_000000000\t422\t60\t250M\t=\t304\t-368\tTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA\t.DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9461\n+entry7\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:4569\n+entry7\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tCAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG\t////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8580\n+entry8\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n+entry8\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n'
b
diff -r 000000000000 -r 046cbf29795a test-data/7_mark_supp_dup.bam
b
Binary file test-data/7_mark_supp_dup.bam has changed
b
diff -r 000000000000 -r 046cbf29795a test-data/7_mark_supp_dup.expected.bam
b
Binary file test-data/7_mark_supp_dup.expected.bam has changed
b
diff -r 000000000000 -r 046cbf29795a test-data/7_mark_supp_dup.expected.sam
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/7_mark_supp_dup.expected.sam Fri Sep 28 04:29:07 2018 -0400
b
b'@@ -0,0 +1,25 @@\n+@HD\tVN:1.4\tSO:coordinate\n+@SQ\tSN:contig_000000000\tLN:11391\n+@SQ\tSN:contig_000000008\tLN:29043\n+entry1\t1187\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n+entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n+entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n+entry4\t1187\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n+entry1\t1107\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n+entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n+entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGT'..b'GBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n+entry8\t1205\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n+entry9\t1187\tcontig_000000008\t28855\t12\t54S189M7S\t=\t28855\t189\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATGTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGTGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT\tBCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF1EGGHHHHHGCEFEEGFHFHFHFHHHH4444?44FE4B4?4D44D444433B20/??FH2?/?/32222D2FB//F>2FDHF00???/??CHGGGHFHBGHB<>1<<1DF1D0=<0FDGB0=000</<.G:CHB:.;;000;00CH0;0;0;00;\tNM:i:3\tAS:i:174\tXS:i:159\tSA:Z:contig_000000008,28949,+,95M155S,12,1;\tMQ:i:30\tMC:Z:34S189M27S\tms:i:8529\n+entry10\t99\tcontig_000000008\t28855\t15\t54S189M7S\t=\t28855\t189\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT\tDDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHHEHGHHHHHGHGFFGGHHFHHHHHHHHHHGFEFDFHHHHHHHHHHHHGHFGFHHFEHDGGHCCFEHFHHFHHHHH/FFFHGHHHCCGGGGFHGHGHHHHHHEDDFDHFFHHHHFGHFGFDHDGEDFHHCEECFGHEEFAHFCGH1CF1E1FBFFGF\tNM:i:1\tAS:i:184\tXS:i:164\tSA:Z:contig_000000008,28949,+,95M155S,15,1;\tMQ:i:32\tMC:Z:34S189M27S\tms:i:8035\n+entry9\t1107\tcontig_000000008\t28855\t30\t34S189M27S\t=\t28855\t-189\tTACTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA\t:0FGEEGGGGGGEEHHHHC:00C:CGGGC0GBFGD0<DHFEHHHD=00<<.1<0GFE.FCG1FDF11BHGFCAHFFBFCEGCF</HFDGDHDFFB22GDHFHHG4?3?B?4?4F4FFH?D4BF3/333HHGGEEGBHBHHFFHEHHEGF2HHFEGHGGGHHFHHHFDGBAHHFHHHHHFHFHHFGHHEHHHHGHG5HHGGGGGHGHGHHHHHHHHHHHHHHHGFHHHGGGGGGGGGGGFFFFFFFDDDDD\tNM:i:1\tAS:i:184\tXS:i:145\tMQ:i:12\tMC:Z:54S189M7S\tms:i:7507\n+entry10\t147\tcontig_000000008\t28855\t32\t34S189M27S\t=\t28855\t-189\tTGTTTTGTTGGGTTGTTTTTTACATTTATTTAGTTATTTATATTATATCTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTTCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA\t<:.:.<.EEA..A:<-000<00000<:000DGFDH0H=0HD00H===.10.11<BCDHGGDGHF11GBFHEFEFGCFF//C/FA?AHEGFDG?B?BD3GG4FHHGDDG4BHDFHEDEF?F4?GB/3B3HGGHGHHHHHHHFHHHHHHFB3HFEGGHGCGHGHHGFGG5BHHHGHFFHHBFGHFHHF5FHHHHHHGDHG2G5FHHGHGHHHHHHHHHHHHHHHGGHHHGGGGGGGGGGGFFFFFFFCDDDC\tNM:i:2\tAS:i:179\tXS:i:137\tMQ:i:15\tMC:Z:54S189M7S\tms:i:9375\n+entry9\t3235\tcontig_000000008\t28949\t12\t95M155H\t=\t28855\t95\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT\tBCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF\tNM:i:1\tAS:i:90\tXS:i:0\tSA:Z:contig_000000008,28855,+,54S189M7S,12,3;\n+entry10\t2147\tcontig_000000008\t28949\t15\t95M155H\t=\t28855\t95\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT\tDDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHH\tNM:i:1\tAS:i:90\tXS:i:0\tSA:Z:contig_000000008,28855,+,54S189M7S,15,1;\n'
b
diff -r 000000000000 -r 046cbf29795a test-data/7_mark_supp_dup.sam
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/7_mark_supp_dup.sam Fri Sep 28 04:29:07 2018 -0400
b
b'@@ -0,0 +1,25 @@\n+@HD\tVN:1.4\tSO:coordinate\n+@SQ\tSN:contig_000000000\tLN:11391\n+@SQ\tSN:contig_000000008\tLN:29043\n+entry1\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n+entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n+entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n+entry4\t163\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n+entry1\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n+entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n+entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGT'..b'G<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n+entry8\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n+entry9\t163\tcontig_000000008\t28855\t12\t54S189M7S\t=\t28855\t189\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATGTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGTGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT\tBCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF1EGGHHHHHGCEFEEGFHFHFHFHHHH4444?44FE4B4?4D44D444433B20/??FH2?/?/32222D2FB//F>2FDHF00???/??CHGGGHFHBGHB<>1<<1DF1D0=<0FDGB0=000</<.G:CHB:.;;000;00CH0;0;0;00;\tNM:i:3\tAS:i:174\tXS:i:159\tSA:Z:contig_000000008,28949,+,95M155S,12,1;\tMQ:i:30\tMC:Z:34S189M27S\tms:i:8529\n+entry10\t99\tcontig_000000008\t28855\t15\t54S189M7S\t=\t28855\t189\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT\tDDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHHEHGHHHHHGHGFFGGHHFHHHHHHHHHHGFEFDFHHHHHHHHHHHHGHFGFHHFEHDGGHCCFEHFHHFHHHHH/FFFHGHHHCCGGGGFHGHGHHHHHHEDDFDHFFHHHHFGHFGFDHDGEDFHHCEECFGHEEFAHFCGH1CF1E1FBFFGF\tNM:i:1\tAS:i:184\tXS:i:164\tSA:Z:contig_000000008,28949,+,95M155S,15,1;\tMQ:i:32\tMC:Z:34S189M27S\tms:i:8035\n+entry9\t83\tcontig_000000008\t28855\t30\t34S189M27S\t=\t28855\t-189\tTACTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA\t:0FGEEGGGGGGEEHHHHC:00C:CGGGC0GBFGD0<DHFEHHHD=00<<.1<0GFE.FCG1FDF11BHGFCAHFFBFCEGCF</HFDGDHDFFB22GDHFHHG4?3?B?4?4F4FFH?D4BF3/333HHGGEEGBHBHHFFHEHHEGF2HHFEGHGGGHHFHHHFDGBAHHFHHHHHFHFHHFGHHEHHHHGHG5HHGGGGGHGHGHHHHHHHHHHHHHHHGFHHHGGGGGGGGGGGFFFFFFFDDDDD\tNM:i:1\tAS:i:184\tXS:i:145\tMQ:i:12\tMC:Z:54S189M7S\tms:i:7507\n+entry10\t147\tcontig_000000008\t28855\t32\t34S189M27S\t=\t28855\t-189\tTGTTTTGTTGGGTTGTTTTTTACATTTATTTAGTTATTTATATTATATCTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTTCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA\t<:.:.<.EEA..A:<-000<00000<:000DGFDH0H=0HD00H===.10.11<BCDHGGDGHF11GBFHEFEFGCFF//C/FA?AHEGFDG?B?BD3GG4FHHGDDG4BHDFHEDEF?F4?GB/3B3HGGHGHHHHHHHFHHHHHHFB3HFEGGHGCGHGHHGFGG5BHHHGHFFHHBFGHFHHF5FHHHHHHGDHG2G5FHHGHGHHHHHHHHHHHHHHHGGHHHGGGGGGGGGGGFFFFFFFCDDDC\tNM:i:2\tAS:i:179\tXS:i:137\tMQ:i:15\tMC:Z:54S189M7S\tms:i:9375\n+entry9\t2211\tcontig_000000008\t28949\t12\t95M155H\t=\t28855\t95\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT\tBCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF\tNM:i:1\tAS:i:90\tXS:i:0\tSA:Z:contig_000000008,28855,+,54S189M7S,12,3;\n+entry10\t2147\tcontig_000000008\t28949\t15\t95M155H\t=\t28855\t95\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT\tDDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHH\tNM:i:1\tAS:i:90\tXS:i:0\tSA:Z:contig_000000008,28855,+,54S189M7S,15,1;\n'