Previous changeset 2:a312a0fdaf31 (2021-04-22) Next changeset 4:8c440c3002bc (2021-12-19) |
Commit message:
"planemo upload for repository https://github.com/galaxyproject/tools-iuc/tree/master/tool_collections/samtools/samtools_markdup commit 0f75269223c0821c6c82acf98fde947d0f816f2b" |
modified:
macros.xml samtools_markdup.xml test-data/stats.txt |
added:
test-data/10_markdup.expected.cram test-data/10_markdup.sam test-data/1_markdup.expected.bam test-data/1_markdup.expected.sam test-data/1_markdup.sam test-data/2_remove_dups.expected.bam test-data/2_remove_dups.expected.sam test-data/2_remove_dups.sam test-data/3_mark_supp_dup.bam test-data/3_mark_supp_dup.expected.bam test-data/3_mark_supp_dup.expected.sam test-data/3_mark_supp_dup.sam test-data/3_two_read_mapped.sam test-data/6_markdup.expected.bam test-data/7_markdup.expected.bam test-data/8_markdup.expected.bam test-data/9_markdup.expected.sam test-data/test.fa test-data/test.fa.fai |
removed:
test-data/5_markdup.expected.bam test-data/5_markdup.expected.sam test-data/5_markdup.sam test-data/6_remove_dups.expected.bam test-data/6_remove_dups.expected.sam test-data/6_remove_dups.sam test-data/7_mark_supp_dup.bam test-data/7_mark_supp_dup.expected.bam test-data/7_mark_supp_dup.expected.sam test-data/7_mark_supp_dup.sam test-data/7_two_read_mapped.sam |
b |
diff -r a312a0fdaf31 -r d0a568e1904b macros.xml --- a/macros.xml Thu Apr 22 12:58:55 2021 +0000 +++ b/macros.xml Tue Sep 28 16:14:29 2021 +0000 |
[ |
@@ -5,10 +5,16 @@ <yield/> </requirements> </xml> - <token name="@TOOL_VERSION@">1.9</token> - <token name="@FLAGS@">#set $flags = sum(map(int, str($filter).split(',')))</token> + <token name="@TOOL_VERSION@">1.13</token> + <token name="@PROFILE@">20.05</token> + <token name="@FLAGS@"><![CDATA[ + #set $flags = 0 + #if $filter + #set $flags = sum(map(int, str($filter).split(','))) + #end if + ]]></token> <token name="@PREPARE_IDX@"><![CDATA[ - ##prepare input and indices + ##prepare input and indices ln -s '$input' infile && #if $input.is_of_type('bam'): #if str( $input.metadata.bam_index ) != "None": @@ -25,7 +31,7 @@ #end if ]]></token> <token name="@PREPARE_IDX_MULTIPLE@"><![CDATA[ - ##prepare input and indices + ##prepare input and indices #for $i, $bam in enumerate( $input_bams ): ln -s '$bam' '${i}' && #if $bam.is_of_type('bam'): @@ -63,6 +69,51 @@ #set reffai=None #end if ]]></token> + + <xml name="optional_reference"> + <conditional name="addref_cond"> + <param name="addref_select" type="select" label="Use a reference sequence"> + <help>@HELP@</help> + <option value="no">No</option> + <option value="history">Use a genome/index from the history</option> + <option value="cached">Use a built-in genome</option> + </param> + <when value="no"/> + <when value="history"> + <param name="ref" argument="@ARGUMENT@" type="data" format="fasta,fasta.gz" label="Reference"/> + </when> + <when value="cached"> + <param name="ref" argument="@ARGUMENT@" type="select" label="Reference"> + <options from_data_table="fasta_indexes"> + <filter type="data_meta" ref="input" key="dbkey" column="dbkey"/> + </options> + <validator type="no_options" message="No reference genome is available for the build associated with the selected input dataset"/> + </param> + </when> + </conditional> + </xml> + <xml name="mandatory_reference" token_help="" token_argument=""> + <conditional name="addref_cond"> + <param name="addref_select" type="select" label="Use a reference sequence"> + <help>@HELP@</help> + <option value="history">Use a genome/index from the history</option> + <option value="cached">Use a built-in genome</option> + </param> + <when value="history"> + <param name="ref" argument="@ARGUMENT@" type="data" format="fasta,fasta.gz" label="Reference"/> + </when> + <when value="cached"> + <param name="ref" argument="@ARGUMENT@" type="select" label="Reference"> + <options from_data_table="fasta_indexes"> + <filter type="data_meta" ref="input" key="dbkey" column="dbkey"/> + <validator message="No reference genome is available for the build associated with the selected input dataset" type="no_options" /> + </options> + </param> + </when> + </conditional> + </xml> + + <token name="@ADDTHREADS@"><![CDATA[ ##compute the number of ADDITIONAL threads to be used by samtools (-@) addthreads=\${GALAXY_SLOTS:-1} && (( addthreads-- )) && @@ -70,28 +121,28 @@ <token name="@ADDMEMORY@"><![CDATA[ ##compute the number of memory available to samtools sort (-m) ##use only 75% of available: https://github.com/samtools/samtools/issues/831 - addmemory=\${GALAXY_MEMORY_MB_PER_SLOT:-768} && + addmemory=\${GALAXY_MEMORY_MB_PER_SLOT:-768} && ((addmemory=addmemory*75/100)) && ]]></token> <xml name="seed_input"> - <param name="seed" type="integer" optional="True" label="Seed for random number generator" help="If empty a random seed is used." /> + <param name="seed" type="integer" optional="True" label="Seed for random number generator" help="If empty a random seed is used." /> </xml> - <xml name="flag_options"> - <option value="1">Read is paired</option> - <option value="2">Read is mapped in a proper pair</option> - <option value="4">Read is unmapped</option> - <option value="8">Mate is unmapped</option> - <option value="16">Read is mapped to the reverse strand of the reference</option> - <option value="32">Mate is mapped to the reverse strand of the reference</option> - <option value="64">Read is the first in a pair</option> - <option value="128">Read is the second in a pair</option> - <option value="256">Alignment of the read is not primary</option> - <option value="512">Read fails platform/vendor quality checks</option> - <option value="1024">Read is a PCR or optical duplicate</option> - <option value="2048">Alignment is supplementary</option> + <xml name="flag_options" token_s1="false" token_s2="false" token_s4="false" token_s8="false" token_s16="false" token_s32="false" token_s64="false" token_s128="false" token_s256="false" token_s512="false" token_s1024="false" token_s2048="false"> + <option value="1" selected="@S1@">Read is paired</option> + <option value="2" selected="@S2@">Read is mapped in a proper pair</option> + <option value="4" selected="@S4@">Read is unmapped</option> + <option value="8" selected="@S8@">Mate is unmapped</option> + <option value="16" selected="@S16@">Read is mapped to the reverse strand of the reference</option> + <option value="32" selected="@S32@">Mate is mapped to the reverse strand of the reference</option> + <option value="64" selected="@S64@">Read is the first in a pair</option> + <option value="128" selected="@S128@">Read is the second in a pair</option> + <option value="256" selected="@S256@">Alignment of the read is not primary</option> + <option value="512" selected="@S512@">Read fails platform/vendor quality checks</option> + <option value="1024" selected="@S1024@">Read is a PCR or optical duplicate</option> + <option value="2048" selected="@S2048@">Alignment is supplementary</option> </xml> - <!-- region specification macros and tokens for tools that allow the specification + <!-- region specification macros and tokens for tools that allow the specification of region by bed file / space separated list of regions --> <token name="@REGIONS_FILE@"><![CDATA[ #if $cond_region.select_region == 'tab': |
b |
diff -r a312a0fdaf31 -r d0a568e1904b samtools_markdup.xml --- a/samtools_markdup.xml Thu Apr 22 12:58:55 2021 +0000 +++ b/samtools_markdup.xml Tue Sep 28 16:14:29 2021 +0000 |
[ |
b'@@ -1,4 +1,4 @@\n-<tool id="samtools_markdup" name="Samtools markdup" version="@TOOL_VERSION@+galaxy3">\n+<tool id="samtools_markdup" name="Samtools markdup" version="@TOOL_VERSION@" profile="@PROFILE@" >\n <description>marks duplicate alignments</description>\n <macros>\n <import>macros.xml</import>\n@@ -8,7 +8,7 @@\n <expand macro="version_command"/>\n <command><![CDATA[\n @ADDTHREADS@\n-## coordinate sort input \n+## coordinate sort input\n #if not $bamfile.is_of_type(\'bam\'):\n samtools sort\n -@ \\$addthreads -m \\${GALAXY_MEMORY_MB:-768}M -T "\\${TMPDIR:-.}"\n@@ -19,72 +19,104 @@\n ln -s \'$bamfile\' coordsort.sam &&\n #end if\n \n-samtools markdup \n+samtools markdup\n \n -@ \\$addthreads\n #if str($maxlen) != \'\':\n -l $maxlen\n-#end if \n-$remove \n-$stats \n+#end if\n+$remove\n $supp\n-coordsort.sam \n+#if $odist:\n+ -d $odist\n+#end if\n+$existing_tags\n+-m $mode\n+$include_fails\n+#if $output_options.stats == \'yes\'\n+ -s\n+ -f \'$stats_output\'\n+#end if\n+-O $output_options.output_format.select_oformat\n+#if $output_options.output_format.select_oformat == "CRAM"\n+ --reference \'$output_options.output_format.ref_file\'\n+#end if\n+coordsort.sam\n \'$output\'\n-#if $stats\n- 2> >(tee -a \'$stats_output\' >&2)\n-#end if\n ]]></command>\n <inputs>\n <param name="bamfile" type="data" format="sam,bam,cram" optional="false" label="Alignment" />\n <param name="remove" type="boolean" argument="-r" truevalue="-r" falsevalue="" label="Remove duplicate reads" />\n- <param name="maxlen" type="integer" optional="true" argument="-l" min="0" label="Expected maximum read length of INT bases. (default 300)"/>\n- <param name="stats" type="boolean" argument="-s" truevalue="-s" falsevalue="" label="Print basic statistics" />\n <param name="supp" type="boolean" argument="-S" truevalue="-S" falsevalue="" label="Mark supplementary reads of duplicates as duplicates" />\n+ <param name="existing_tags" type="boolean" argument="-c" truevalue="-c" falsevalue="" label="Clear previous duplicate settings and tags." />\n+ <param name="maxlen" type="integer" optional="true" argument="-l" min="0" label="Expected maximum read length of INT bases. (default 300, min=0)"/>\n+ <param name="odist" type="integer" optional="true" argument="-d" min="1" label="Optical distance (if set, marks with dt tag, min=1)"/>\n+ <param argument="--mode" type="select" label="Duplicate decision method for paired reads.">\n+ <option selected="true" value="t">(t) measure positions based on template start/end.</option>\n+ <option value="s">(s) measure positions based on sequence start. </option>\n+ </param>\n+ <param argument="--include-fails" type="boolean" truevalue="--include-fails" falsevalue="" label="Include quality check failed reads." />\n+ <section name="output_options" title="Output Options" expanded="true">\n+ <param name="stats" type="select" argument="-s" label="Print basic statistics">\n+ <option value="yes">Yes</option>\n+ <option value="no" selected="True">No</option>\n+ </param>\n+ <conditional name="output_format">\n+ <param name="select_oformat" type="select" label="Output format" help="Specify output format">\n+ <option value="SAM">SAM</option>\n+ <option value="BAM" selected="True">BAM</option>\n+ <option value="CRAM">CRAM</option>\n+ </param>\n+ <when value="SAM" />\n+ <when value="BAM" />\n+ <when value="CRAM">\n+ <param name="ref_file" type="data" format="fasta" label="Reference FASTA file" />\n+ </when>\n+ </conditional>\n+ </section>\n </inputs>\n <outputs>\n <!-- output bam, if input was name sorted then restore this sorting order -->\n- <data name="output" format="bam"/>\n+ <data name="output" format="bam" '..b'"output" file="7_mark_supp_dup.expected.bam" />\n+ <output name="output" file="3_mark_supp_dup.expected.bam" ftype="bam" lines_diff="4" />\n </test>\n- <!-- test stats output -->\n+ <!-- 4) test stats output -->\n <test expect_num_outputs="2">\n- <param name="bamfile" value="5_markdup.sam" />\n- <param name="stats" value="-s" />\n- <output name="output" file="5_markdup.expected.bam" />\n- <output name="stats_output" file="stats.txt" />\n+ <param name="bamfile" value="1_markdup.sam" />\n+ <param name="stats" value="yes" />\n+ <output name="output" file="1_markdup.expected.bam" ftype="bam" lines_diff="4" />\n+ <output name="stats_output" file="stats.txt" lines_diff="2" />\n </test>\n- <!-- check that stderr is not swallowed w test data from fixmate -->\n+ <!-- 5) check that stderr is not swallowed w test data from fixmate -->\n <test expect_num_outputs="2" expect_exit_code="1" expect_failure="true">\n- <param name="bamfile" value="7_two_read_mapped.sam" />\n- <param name="stats" value="true"/>\n+ <param name="bamfile" value="3_two_read_mapped.sam" />\n+ <param name="stats" value="yes"/>\n <!-- for some reason this is not possible at the moment\n <output name="stats_output">\n <assert_contents>\n@@ -95,11 +127,43 @@\n <has_line line="[markdup] error: no MC tag. Please run samtools fixmate on file first."/>\n </assert_stderr>\n </test>\n+ <!-- 6) check optical distance and check -c option -->\n+ <test expect_num_outputs="1">\n+ <param name="bamfile" value="1_markdup.sam" />\n+ <param name="odist" value="10" />\n+ <param name="existing_tags" value="-c" />\n+ <output name="output" file="6_markdup.expected.bam" ftype="bam" lines_diff="4" />\n+ </test>\n+ <!-- 7) check new mode s -->\n+ <test expect_num_outputs="1">\n+ <param name="bamfile" value="1_markdup.sam" />\n+ <param name="mode_selector" value="s" />\n+ <output name="output" file="7_markdup.expected.bam" ftype="bam" lines_diff="4" />\n+ </test>\n+ <!-- 8) check include-fails -->\n+ <test expect_num_outputs="1">\n+ <param name="bamfile" value="1_markdup.sam" />\n+ <param name="fails" value="- -include-fails" />\n+ <output name="output" file="8_markdup.expected.bam" ftype="bam" lines_diff="4" />\n+ </test>\n+ <!-- 9) test sam format -->\n+ <test expect_num_outputs="1">\n+ <param name="bamfile" value="1_markdup.sam" />\n+ <param name="select_oformat" value="SAM" />\n+ <output name="output" file="9_markdup.expected.sam" lines_diff="4" />\n+ </test>\n+ <!-- 10) test cram format -->\n+ <test expect_num_outputs="1">\n+ <param name="bamfile" value="10_markdup.sam" />\n+ <param name="select_oformat" value="CRAM" />\n+ <param name="ref_file" value="test.fa" />\n+ <output name="output" file="10_markdup.expected.cram" compare="sim_size" delta="250"/>\n+ </test>\n </tests>\n <help>\n-Mark duplicate alignments from a coordinate sorted file that has been run through fixmate with the -m option. This program relies on the MC and ms tags that fixmate provides. \n+Mark duplicate alignments from a coordinate sorted file that has been run through fixmate with the -m option. This program relies on the MC and ms tags that fixmate provides.\n \n-Note: The Galaxy tool sorts the data automatically if the input is SAM or query name sorted. \n+Note: The Galaxy tool sorts the data automatically if the input is SAM or query name sorted.\n The output is BAM (which is query name sorted again if the input is).\n \n The optional basic statistics output of samtools markdup can be visualized with MultiQC.\n' |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/10_markdup.expected.cram |
b |
Binary file test-data/10_markdup.expected.cram has changed |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/10_markdup.sam --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/10_markdup.sam Tue Sep 28 16:14:29 2021 +0000 |
b |
@@ -0,0 +1,15 @@ +@HD VN:1.4 SO:unsorted +@SQ SN:CHROMOSOME_I LN:100 +@RG ID:UNKNOWN SM:UNKNOWN +@PG ID:bowtie2 PN:bowtie2 VN:2.0.0-beta5 +@PG ID:0 CL:aaaaa/aaa/aaaaa/aaaaaa/aaaaaaaaa/aaa/iuc/package_aaaaaaaaa_x_y/aaaaaaaaaaaa/bin/aaaaaaaaaaaaaaaaa aaaaaaaaaa /aaaa/aaaaa/aaa/aaaaaaaaaaaaaaaaaaa/tools/aaaaaaaaa/test-data/test.cram aa /aaaa/aaaaa/aaa/aaaaaaaaaaaaaaaaaaa/tools/aaaaaaaaa/test-data/test.fa -O test PN:samtools VN:1.2 +SRR065390.14978392 16 CHROMOSOME_I 2 1 27M1D73M * 0 0 CCTAGCCCTAACCCTAACCCTAACCCTAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAA #############################@B?8B?BA@@DDBCDDCBC@CDCDCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC RG:Z:UNKNOWN XG:i:1 XM:i:5 XN:i:0 XO:i:1 AS:i:-18 XS:i:-18 YT:Z:UU +SRR065390.921023 16 CHROMOSOME_I 3 12 100M * 0 0 CTAAGCCTAAATCTAAGCCTAACCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAA ###############################################???88:;98768700000<>:BBA?BBAB?BBBBBBBB>B>BB::;?:00000 RG:Z:UNKNOWN XG:i:0 XM:i:3 XN:i:0 XO:i:0 AS:i:-6 XS:i:-13 YT:Z:UU +SRR065390.1871511 16 CHROMOSOME_I 3 1 100M * 0 0 CTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAA <?@<@A8>0:BB@>B<=B@???@=8@B>BB@CA@DACDCBBCCCA@CCCCACCBCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC RG:Z:UNKNOWN XG:i:0 XM:i:0 XN:i:0 XO:i:0 AS:i:0 XS:i:0 YT:Z:UU +SRR065390.3743423 16 CHROMOSOME_I 3 1 100M * 0 0 CTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAA ##################?6@:7<=@3=@ABAAB>BDBBABADABDDDBDDBCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC RG:Z:UNKNOWN XG:i:0 XM:i:0 XN:i:0 XO:i:0 AS:i:0 XS:i:0 YT:Z:UU +SRR065390.4251890 16 CHROMOSOME_I 3 1 100M * 0 0 CTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAA ###########@BB=BCBBC?B>B;>B@@ADBBB@DBBBBDCCBBCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC RG:Z:UNKNOWN XG:i:0 XM:i:0 XN:i:0 XO:i:0 AS:i:0 XS:i:0 YT:Z:UU +SRR065390.5238868 16 CHROMOSOME_I 3 1 100M * 0 0 CTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAA @,=@@D8D;?BBB>;?BBB==BB@D;>D>BBB>BBDDB<DABADCACDCCBCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC RG:Z:UNKNOWN XG:i:0 XM:i:0 XN:i:0 XO:i:0 AS:i:0 XS:i:0 YT:Z:UU +SRR065390.6023338 0 CHROMOSOME_I 3 1 100M * 0 0 CTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAAGCTAC CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC@CCDDDBCCABB=DABBA?################ RG:Z:UNKNOWN XG:i:0 XM:i:3 XN:i:0 XO:i:0 AS:i:-6 XS:i:-6 YT:Z:UU +SRR065390.6815812 16 CHROMOSOME_I 3 1 100M * 0 0 CTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAA ###############?@.@?B;B0B=;<DADB@@BDDBBDDBCBCBD@CCDCCCCCCCDCCCCCCCCACCCCCCCCCCBCCCCCCDCCCCCCCCCCCBCC RG:Z:UNKNOWN XG:i:0 XM:i:0 XN:i:0 XO:i:0 AS:i:0 XS:i:0 YT:Z:UU +SRR065390.6905811 16 CHROMOSOME_I 3 1 100M * 0 0 CTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAA #######################BB@>A<BC>@@BCCB@=BACBCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC RG:Z:UNKNOWN XG:i:0 XM:i:0 XN:i:0 XO:i:0 AS:i:0 XS:i:0 YT:Z:UU +SRR065390.8289592 16 CHROMOSOME_I 3 1 100M * 0 0 CTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAAGCCTAA ###############################A?@C9@@BC=AABDD@A@DC@CB=@BA?6@CCAAC@+CCCCCCCCCCCCCCC@CCCCCCCCCCCCCCCC RG:Z:UNKNOWN XG:i:0 XM:i:0 XN:i:0 XO:i:0 AS:i:0 XS:i:0 YT:Z:UU |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/1_markdup.expected.bam |
b |
Binary file test-data/1_markdup.expected.bam has changed |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/1_markdup.expected.sam --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/1_markdup.expected.sam Tue Sep 28 16:14:29 2021 +0000 |
b |
b'@@ -0,0 +1,18 @@\n+@HD\tVN:1.4\tSO:coordinate\n+@SQ\tSN:contig_000000000\tLN:11391\n+entry1\t1187\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n+entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n+entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n+entry4\t1187\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n+entry1\t1107\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n+entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n+entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAA'..b'TTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG\tBCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF\tAS:i:0\tXS:i:0\tMQ:i:49\tMC:Z:35M215S\tms:i:9339\n+entry6\t1161\tcontig_000000000\t304\t49\t35M215S\t=\t304\t0\tATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT\tABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0\tNM:i:0\tAS:i:35\tXS:i:0\tMC:Z:*\tms:i:9398\n+entry5\t83\tcontig_000000000\t422\t60\t250M\t=\t304\t-368\tTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA\t.DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9461\n+entry7\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:4569\n+entry7\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tCAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG\t////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8580\n+entry8\t1145\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n+entry8\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n' |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/1_markdup.sam --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/1_markdup.sam Tue Sep 28 16:14:29 2021 +0000 |
b |
b'@@ -0,0 +1,18 @@\n+@HD\tVN:1.4\tSO:coordinate\n+@SQ\tSN:contig_000000000\tLN:11391\n+entry1\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n+entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n+entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n+entry4\t163\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n+entry1\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n+entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n+entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACT'..b'ACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG\tBCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF\tAS:i:0\tXS:i:0\tMQ:i:49\tMC:Z:35M215S\tms:i:9339\n+entry6\t137\tcontig_000000000\t304\t49\t35M215S\t=\t304\t0\tATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT\tABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0\tNM:i:0\tAS:i:35\tXS:i:0\tMC:Z:*\tms:i:9398\n+entry5\t83\tcontig_000000000\t422\t60\t250M\t=\t304\t-368\tTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA\t.DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9461\n+entry7\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:4569\n+entry7\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tCAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG\t////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8580\n+entry8\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n+entry8\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n' |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/2_remove_dups.expected.bam |
b |
Binary file test-data/2_remove_dups.expected.bam has changed |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/2_remove_dups.expected.sam --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/2_remove_dups.expected.sam Tue Sep 28 16:14:29 2021 +0000 |
b |
@@ -0,0 +1,12 @@ +@HD VN:1.4 SO:coordinate +@SQ SN:contig_000000000 LN:11391 +entry2 163 contig_000000000 109 60 250M = 137 278 TATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG BBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00 NM:i:2 AS:i:240 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9279 +entry3 99 contig_000000000 116 60 250M = 222 356 ATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG BBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9509 +entry2 83 contig_000000000 137 60 250M = 109 -278 GTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG 0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8804 +entry3 147 contig_000000000 222 60 250M = 116 -356 TAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTA 9BGC0FFBGFFGGGGFFGFEGGHGHGCGHHHHGHGGHGHHHGHHHHGHHGGGHHHHFHGHGHHHHHHGHHFHHHHHHHHHGHHHHGHHGHHHHG2HHGFHHGHHHHHHDFHHHGGHHGHGHHHFHHDHHHHHHHHHHHHFHHHHHGHHHHHHHHHHHHFFHHHHGHHHHHHFHHHHHHHHHHHHHHGCGGGHHHGGGGGGGGGGGGGGGHHHHHGHHHHHHHHHHHHHGGGGGGGGGGFFFFFFFBBBBB NM:i:1 AS:i:245 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9634 +entry5 163 contig_000000000 304 60 250M = 422 368 ATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGTCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAG AABBBFFFFFFFGGGFGGGGGGHHHHHHHHHGHHHHHHHGGHGHHHHHHHHHHGHHHHHHHHFHFGHHHHHHHHHGHGGHFHHHHHHHHHHGFFHHHHHEHHHGHHHHHGDEEGHGHGEGGHHHHHHHHHGHHHFGHHHHHHHFGHHHHHGG?GGGAGHHFFHHFFGG2>@FGGFGFBGGHFHGHHHHHFFF?FGHHGGGGFGEGGHHGGGGHGFGDGHGHHFHEGFHGFGFFHFFHHFHGHFHBFGGF? NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9562 +entry6 69 contig_000000000 304 0 * = 304 0 GCGGTGGAACGCCGCTTCGGCAACGATCTTCCGTCGTCTCCAGTGGAGTGGCTGACGGATAATGGTTCATGCTACCGGGCTAATGAAACACGCCAGTTCGCCCGGATGTTGGGACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG BCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF AS:i:0 XS:i:0 MQ:i:49 MC:Z:35M215S ms:i:9339 +entry5 83 contig_000000000 422 60 250M = 304 -368 TGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA .DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9461 +entry7 121 contig_000000000 3891 60 250M = 3891 0 ACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC 99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB NM:i:0 AS:i:250 XS:i:0 MC:Z:* ms:i:4569 +entry7 181 contig_000000000 3891 0 * = 3891 0 CAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG ////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8580 +entry8 181 contig_000000000 3891 0 * = 3891 0 GACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT 9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8542 |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/2_remove_dups.sam --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/2_remove_dups.sam Tue Sep 28 16:14:29 2021 +0000 |
b |
b'@@ -0,0 +1,18 @@\n+@HD\tVN:1.4\tSO:coordinate\n+@SQ\tSN:contig_000000000\tLN:11391\n+entry1\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n+entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n+entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n+entry4\t163\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n+entry1\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n+entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n+entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACT'..b'ACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG\tBCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF\tAS:i:0\tXS:i:0\tMQ:i:49\tMC:Z:35M215S\tms:i:9339\n+entry6\t137\tcontig_000000000\t304\t49\t35M215S\t=\t304\t0\tATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT\tABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0\tNM:i:0\tAS:i:35\tXS:i:0\tMC:Z:*\tms:i:9398\n+entry5\t83\tcontig_000000000\t422\t60\t250M\t=\t304\t-368\tTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA\t.DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9461\n+entry7\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:4569\n+entry7\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tCAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG\t////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8580\n+entry8\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n+entry8\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n' |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/3_mark_supp_dup.bam |
b |
Binary file test-data/3_mark_supp_dup.bam has changed |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/3_mark_supp_dup.expected.bam |
b |
Binary file test-data/3_mark_supp_dup.expected.bam has changed |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/3_mark_supp_dup.expected.sam --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/3_mark_supp_dup.expected.sam Tue Sep 28 16:14:29 2021 +0000 |
b |
b'@@ -0,0 +1,25 @@\n+@HD\tVN:1.4\tSO:coordinate\n+@SQ\tSN:contig_000000000\tLN:11391\n+@SQ\tSN:contig_000000008\tLN:29043\n+entry1\t1187\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n+entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n+entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n+entry4\t1187\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n+entry1\t1107\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n+entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n+entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGT'..b'GBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n+entry8\t1205\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n+entry9\t1187\tcontig_000000008\t28855\t12\t54S189M7S\t=\t28855\t189\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATGTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGTGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT\tBCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF1EGGHHHHHGCEFEEGFHFHFHFHHHH4444?44FE4B4?4D44D444433B20/??FH2?/?/32222D2FB//F>2FDHF00???/??CHGGGHFHBGHB<>1<<1DF1D0=<0FDGB0=000</<.G:CHB:.;;000;00CH0;0;0;00;\tNM:i:3\tAS:i:174\tXS:i:159\tSA:Z:contig_000000008,28949,+,95M155S,12,1;\tMQ:i:30\tMC:Z:34S189M27S\tms:i:8529\n+entry10\t99\tcontig_000000008\t28855\t15\t54S189M7S\t=\t28855\t189\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT\tDDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHHEHGHHHHHGHGFFGGHHFHHHHHHHHHHGFEFDFHHHHHHHHHHHHGHFGFHHFEHDGGHCCFEHFHHFHHHHH/FFFHGHHHCCGGGGFHGHGHHHHHHEDDFDHFFHHHHFGHFGFDHDGEDFHHCEECFGHEEFAHFCGH1CF1E1FBFFGF\tNM:i:1\tAS:i:184\tXS:i:164\tSA:Z:contig_000000008,28949,+,95M155S,15,1;\tMQ:i:32\tMC:Z:34S189M27S\tms:i:8035\n+entry9\t1107\tcontig_000000008\t28855\t30\t34S189M27S\t=\t28855\t-189\tTACTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA\t:0FGEEGGGGGGEEHHHHC:00C:CGGGC0GBFGD0<DHFEHHHD=00<<.1<0GFE.FCG1FDF11BHGFCAHFFBFCEGCF</HFDGDHDFFB22GDHFHHG4?3?B?4?4F4FFH?D4BF3/333HHGGEEGBHBHHFFHEHHEGF2HHFEGHGGGHHFHHHFDGBAHHFHHHHHFHFHHFGHHEHHHHGHG5HHGGGGGHGHGHHHHHHHHHHHHHHHGFHHHGGGGGGGGGGGFFFFFFFDDDDD\tNM:i:1\tAS:i:184\tXS:i:145\tMQ:i:12\tMC:Z:54S189M7S\tms:i:7507\n+entry10\t147\tcontig_000000008\t28855\t32\t34S189M27S\t=\t28855\t-189\tTGTTTTGTTGGGTTGTTTTTTACATTTATTTAGTTATTTATATTATATCTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTTCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA\t<:.:.<.EEA..A:<-000<00000<:000DGFDH0H=0HD00H===.10.11<BCDHGGDGHF11GBFHEFEFGCFF//C/FA?AHEGFDG?B?BD3GG4FHHGDDG4BHDFHEDEF?F4?GB/3B3HGGHGHHHHHHHFHHHHHHFB3HFEGGHGCGHGHHGFGG5BHHHGHFFHHBFGHFHHF5FHHHHHHGDHG2G5FHHGHGHHHHHHHHHHHHHHHGGHHHGGGGGGGGGGGFFFFFFFCDDDC\tNM:i:2\tAS:i:179\tXS:i:137\tMQ:i:15\tMC:Z:54S189M7S\tms:i:9375\n+entry9\t3235\tcontig_000000008\t28949\t12\t95M155H\t=\t28855\t95\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT\tBCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF\tNM:i:1\tAS:i:90\tXS:i:0\tSA:Z:contig_000000008,28855,+,54S189M7S,12,3;\n+entry10\t2147\tcontig_000000008\t28949\t15\t95M155H\t=\t28855\t95\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT\tDDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHH\tNM:i:1\tAS:i:90\tXS:i:0\tSA:Z:contig_000000008,28855,+,54S189M7S,15,1;\n' |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/3_mark_supp_dup.sam --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/3_mark_supp_dup.sam Tue Sep 28 16:14:29 2021 +0000 |
b |
b'@@ -0,0 +1,25 @@\n+@HD\tVN:1.4\tSO:coordinate\n+@SQ\tSN:contig_000000000\tLN:11391\n+@SQ\tSN:contig_000000008\tLN:29043\n+entry1\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n+entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n+entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n+entry4\t163\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n+entry1\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n+entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n+entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGT'..b'G<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n+entry8\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n+entry9\t163\tcontig_000000008\t28855\t12\t54S189M7S\t=\t28855\t189\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATGTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGTGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT\tBCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF1EGGHHHHHGCEFEEGFHFHFHFHHHH4444?44FE4B4?4D44D444433B20/??FH2?/?/32222D2FB//F>2FDHF00???/??CHGGGHFHBGHB<>1<<1DF1D0=<0FDGB0=000</<.G:CHB:.;;000;00CH0;0;0;00;\tNM:i:3\tAS:i:174\tXS:i:159\tSA:Z:contig_000000008,28949,+,95M155S,12,1;\tMQ:i:30\tMC:Z:34S189M27S\tms:i:8529\n+entry10\t99\tcontig_000000008\t28855\t15\t54S189M7S\t=\t28855\t189\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT\tDDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHHEHGHHHHHGHGFFGGHHFHHHHHHHHHHGFEFDFHHHHHHHHHHHHGHFGFHHFEHDGGHCCFEHFHHFHHHHH/FFFHGHHHCCGGGGFHGHGHHHHHHEDDFDHFFHHHHFGHFGFDHDGEDFHHCEECFGHEEFAHFCGH1CF1E1FBFFGF\tNM:i:1\tAS:i:184\tXS:i:164\tSA:Z:contig_000000008,28949,+,95M155S,15,1;\tMQ:i:32\tMC:Z:34S189M27S\tms:i:8035\n+entry9\t83\tcontig_000000008\t28855\t30\t34S189M27S\t=\t28855\t-189\tTACTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA\t:0FGEEGGGGGGEEHHHHC:00C:CGGGC0GBFGD0<DHFEHHHD=00<<.1<0GFE.FCG1FDF11BHGFCAHFFBFCEGCF</HFDGDHDFFB22GDHFHHG4?3?B?4?4F4FFH?D4BF3/333HHGGEEGBHBHHFFHEHHEGF2HHFEGHGGGHHFHHHFDGBAHHFHHHHHFHFHHFGHHEHHHHGHG5HHGGGGGHGHGHHHHHHHHHHHHHHHGFHHHGGGGGGGGGGGFFFFFFFDDDDD\tNM:i:1\tAS:i:184\tXS:i:145\tMQ:i:12\tMC:Z:54S189M7S\tms:i:7507\n+entry10\t147\tcontig_000000008\t28855\t32\t34S189M27S\t=\t28855\t-189\tTGTTTTGTTGGGTTGTTTTTTACATTTATTTAGTTATTTATATTATATCTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTTCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA\t<:.:.<.EEA..A:<-000<00000<:000DGFDH0H=0HD00H===.10.11<BCDHGGDGHF11GBFHEFEFGCFF//C/FA?AHEGFDG?B?BD3GG4FHHGDDG4BHDFHEDEF?F4?GB/3B3HGGHGHHHHHHHFHHHHHHFB3HFEGGHGCGHGHHGFGG5BHHHGHFFHHBFGHFHHF5FHHHHHHGDHG2G5FHHGHGHHHHHHHHHHHHHHHGGHHHGGGGGGGGGGGFFFFFFFCDDDC\tNM:i:2\tAS:i:179\tXS:i:137\tMQ:i:15\tMC:Z:54S189M7S\tms:i:9375\n+entry9\t2211\tcontig_000000008\t28949\t12\t95M155H\t=\t28855\t95\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT\tBCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF\tNM:i:1\tAS:i:90\tXS:i:0\tSA:Z:contig_000000008,28855,+,54S189M7S,12,3;\n+entry10\t2147\tcontig_000000008\t28949\t15\t95M155H\t=\t28855\t95\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT\tDDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHH\tNM:i:1\tAS:i:90\tXS:i:0\tSA:Z:contig_000000008,28855,+,54S189M7S,15,1;\n' |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/3_two_read_mapped.sam --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/3_two_read_mapped.sam Tue Sep 28 16:14:29 2021 +0000 |
b |
@@ -0,0 +1,22 @@ +@HD VN:1.4 SO:queryname +@SQ SN:ref1 LN:45 +@SQ SN:ref2 LN:40 +of1 99 ref1 10 30 23M = 8 2 AAGTCGGCAGCGTCAGATGTGTA ??????????????????????? +of1 147 ref1 8 30 23M = 10 -2 CTGTCTCTTATACACATCTCCTT ??????????????????????? +r001 83 ref1 37 30 9M = 7 -39 CAGCGCCAT * +r001 163 ref1 7 30 8M4I4M1D3M = 37 39 TTAGATAAAGAGGATACTG * XX:B:S,12561,2,20,112 YY:i:100 +r002 0 ref1 9 30 1S2I6M1P1I1P1I4M2I * 0 0 AAAAGATAAGGGATAAA * XA:Z:abc XB:i:-10 +r003 0 ref1 9 30 5H6M * 0 0 AGCTAA * +r003 16 ref1 29 30 6H5M * 0 0 TAGGC * +r004 0 ref1 16 30 6M14N1I5M * 0 0 ATAGCTCTCAGC * +r007 8 ref1 9 30 5H6M * 0 0 AGCTAA * +r007 4 ref1 9 30 * * 0 0 GGGGGG * +r008 12 ref1 9 30 5H6M * 0 0 AGCTAA * +r008 4 ref1 9 30 * * 0 0 GGGGGG * +uu1 4 * 0 30 * * 0 0 TAATTGGGTCTTCAGAGCACCTA ??????????????????????? +x1 0 ref2 1 30 20M * 0 0 AGGTTTTATAAAACAAATAA * +x2 0 ref2 2 30 21M * 0 0 GGTTTTATAAAACAAATAATT ????????????????????? +x3 0 ref2 6 30 9M4I13M * 0 0 TTATAAAACAAATAATTAAGTCTACA ?????????????????????????? +x4 0 ref2 10 30 25M * 0 0 CAAATAATTAAGTCTACAGAGCAAC ????????????????????????? +x5 0 ref2 12 30 24M * 0 0 AATAATTAAGTCTACAGAGCAACT ???????????????????????? +x6 0 ref2 14 30 23M * 0 0 TAATTAAGTCTACAGAGCAACTA ??????????????????????? |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/5_markdup.expected.bam |
b |
Binary file test-data/5_markdup.expected.bam has changed |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/5_markdup.expected.sam --- a/test-data/5_markdup.expected.sam Thu Apr 22 12:58:55 2021 +0000 +++ /dev/null Thu Jan 01 00:00:00 1970 +0000 |
b |
b'@@ -1,18 +0,0 @@\n-@HD\tVN:1.4\tSO:coordinate\n-@SQ\tSN:contig_000000000\tLN:11391\n-entry1\t1187\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n-entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n-entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n-entry4\t1187\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n-entry1\t1107\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n-entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n-entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAA'..b'TTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG\tBCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF\tAS:i:0\tXS:i:0\tMQ:i:49\tMC:Z:35M215S\tms:i:9339\n-entry6\t1161\tcontig_000000000\t304\t49\t35M215S\t=\t304\t0\tATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT\tABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0\tNM:i:0\tAS:i:35\tXS:i:0\tMC:Z:*\tms:i:9398\n-entry5\t83\tcontig_000000000\t422\t60\t250M\t=\t304\t-368\tTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA\t.DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9461\n-entry7\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:4569\n-entry7\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tCAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG\t////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8580\n-entry8\t1145\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n-entry8\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n' |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/5_markdup.sam --- a/test-data/5_markdup.sam Thu Apr 22 12:58:55 2021 +0000 +++ /dev/null Thu Jan 01 00:00:00 1970 +0000 |
b |
b'@@ -1,18 +0,0 @@\n-@HD\tVN:1.4\tSO:coordinate\n-@SQ\tSN:contig_000000000\tLN:11391\n-entry1\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n-entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n-entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n-entry4\t163\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n-entry1\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n-entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n-entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACT'..b'ACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG\tBCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF\tAS:i:0\tXS:i:0\tMQ:i:49\tMC:Z:35M215S\tms:i:9339\n-entry6\t137\tcontig_000000000\t304\t49\t35M215S\t=\t304\t0\tATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT\tABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0\tNM:i:0\tAS:i:35\tXS:i:0\tMC:Z:*\tms:i:9398\n-entry5\t83\tcontig_000000000\t422\t60\t250M\t=\t304\t-368\tTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA\t.DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9461\n-entry7\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:4569\n-entry7\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tCAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG\t////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8580\n-entry8\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n-entry8\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n' |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/6_markdup.expected.bam |
b |
Binary file test-data/6_markdup.expected.bam has changed |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/6_remove_dups.expected.bam |
b |
Binary file test-data/6_remove_dups.expected.bam has changed |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/6_remove_dups.expected.sam --- a/test-data/6_remove_dups.expected.sam Thu Apr 22 12:58:55 2021 +0000 +++ /dev/null Thu Jan 01 00:00:00 1970 +0000 |
b |
@@ -1,12 +0,0 @@ -@HD VN:1.4 SO:coordinate -@SQ SN:contig_000000000 LN:11391 -entry2 163 contig_000000000 109 60 250M = 137 278 TATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG BBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00 NM:i:2 AS:i:240 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9279 -entry3 99 contig_000000000 116 60 250M = 222 356 ATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG BBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9509 -entry2 83 contig_000000000 137 60 250M = 109 -278 GTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG 0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8804 -entry3 147 contig_000000000 222 60 250M = 116 -356 TAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTA 9BGC0FFBGFFGGGGFFGFEGGHGHGCGHHHHGHGGHGHHHGHHHHGHHGGGHHHHFHGHGHHHHHHGHHFHHHHHHHHHGHHHHGHHGHHHHG2HHGFHHGHHHHHHDFHHHGGHHGHGHHHFHHDHHHHHHHHHHHHFHHHHHGHHHHHHHHHHHHFFHHHHGHHHHHHFHHHHHHHHHHHHHHGCGGGHHHGGGGGGGGGGGGGGGHHHHHGHHHHHHHHHHHHHGGGGGGGGGGFFFFFFFBBBBB NM:i:1 AS:i:245 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9634 -entry5 163 contig_000000000 304 60 250M = 422 368 ATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGTCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAG AABBBFFFFFFFGGGFGGGGGGHHHHHHHHHGHHHHHHHGGHGHHHHHHHHHHGHHHHHHHHFHFGHHHHHHHHHGHGGHFHHHHHHHHHHGFFHHHHHEHHHGHHHHHGDEEGHGHGEGGHHHHHHHHHGHHHFGHHHHHHHFGHHHHHGG?GGGAGHHFFHHFFGG2>@FGGFGFBGGHFHGHHHHHFFF?FGHHGGGGFGEGGHHGGGGHGFGDGHGHHFHEGFHGFGFFHFFHHFHGHFHBFGGF? NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9562 -entry6 69 contig_000000000 304 0 * = 304 0 GCGGTGGAACGCCGCTTCGGCAACGATCTTCCGTCGTCTCCAGTGGAGTGGCTGACGGATAATGGTTCATGCTACCGGGCTAATGAAACACGCCAGTTCGCCCGGATGTTGGGACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG BCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF AS:i:0 XS:i:0 MQ:i:49 MC:Z:35M215S ms:i:9339 -entry5 83 contig_000000000 422 60 250M = 304 -368 TGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA .DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9461 -entry7 121 contig_000000000 3891 60 250M = 3891 0 ACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC 99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB NM:i:0 AS:i:250 XS:i:0 MC:Z:* ms:i:4569 -entry7 181 contig_000000000 3891 0 * = 3891 0 CAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG ////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8580 -entry8 181 contig_000000000 3891 0 * = 3891 0 GACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT 9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8542 |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/6_remove_dups.sam --- a/test-data/6_remove_dups.sam Thu Apr 22 12:58:55 2021 +0000 +++ /dev/null Thu Jan 01 00:00:00 1970 +0000 |
b |
b'@@ -1,18 +0,0 @@\n-@HD\tVN:1.4\tSO:coordinate\n-@SQ\tSN:contig_000000000\tLN:11391\n-entry1\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n-entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n-entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n-entry4\t163\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n-entry1\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n-entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n-entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACT'..b'ACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG\tBCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF\tAS:i:0\tXS:i:0\tMQ:i:49\tMC:Z:35M215S\tms:i:9339\n-entry6\t137\tcontig_000000000\t304\t49\t35M215S\t=\t304\t0\tATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT\tABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0\tNM:i:0\tAS:i:35\tXS:i:0\tMC:Z:*\tms:i:9398\n-entry5\t83\tcontig_000000000\t422\t60\t250M\t=\t304\t-368\tTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA\t.DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9461\n-entry7\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:4569\n-entry7\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tCAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG\t////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8580\n-entry8\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n-entry8\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n' |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/7_mark_supp_dup.bam |
b |
Binary file test-data/7_mark_supp_dup.bam has changed |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/7_mark_supp_dup.expected.bam |
b |
Binary file test-data/7_mark_supp_dup.expected.bam has changed |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/7_mark_supp_dup.expected.sam --- a/test-data/7_mark_supp_dup.expected.sam Thu Apr 22 12:58:55 2021 +0000 +++ /dev/null Thu Jan 01 00:00:00 1970 +0000 |
b |
b'@@ -1,25 +0,0 @@\n-@HD\tVN:1.4\tSO:coordinate\n-@SQ\tSN:contig_000000000\tLN:11391\n-@SQ\tSN:contig_000000008\tLN:29043\n-entry1\t1187\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n-entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n-entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n-entry4\t1187\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n-entry1\t1107\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n-entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n-entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGT'..b'GBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n-entry8\t1205\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n-entry9\t1187\tcontig_000000008\t28855\t12\t54S189M7S\t=\t28855\t189\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATGTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGTGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT\tBCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF1EGGHHHHHGCEFEEGFHFHFHFHHHH4444?44FE4B4?4D44D444433B20/??FH2?/?/32222D2FB//F>2FDHF00???/??CHGGGHFHBGHB<>1<<1DF1D0=<0FDGB0=000</<.G:CHB:.;;000;00CH0;0;0;00;\tNM:i:3\tAS:i:174\tXS:i:159\tSA:Z:contig_000000008,28949,+,95M155S,12,1;\tMQ:i:30\tMC:Z:34S189M27S\tms:i:8529\n-entry10\t99\tcontig_000000008\t28855\t15\t54S189M7S\t=\t28855\t189\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT\tDDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHHEHGHHHHHGHGFFGGHHFHHHHHHHHHHGFEFDFHHHHHHHHHHHHGHFGFHHFEHDGGHCCFEHFHHFHHHHH/FFFHGHHHCCGGGGFHGHGHHHHHHEDDFDHFFHHHHFGHFGFDHDGEDFHHCEECFGHEEFAHFCGH1CF1E1FBFFGF\tNM:i:1\tAS:i:184\tXS:i:164\tSA:Z:contig_000000008,28949,+,95M155S,15,1;\tMQ:i:32\tMC:Z:34S189M27S\tms:i:8035\n-entry9\t1107\tcontig_000000008\t28855\t30\t34S189M27S\t=\t28855\t-189\tTACTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA\t:0FGEEGGGGGGEEHHHHC:00C:CGGGC0GBFGD0<DHFEHHHD=00<<.1<0GFE.FCG1FDF11BHGFCAHFFBFCEGCF</HFDGDHDFFB22GDHFHHG4?3?B?4?4F4FFH?D4BF3/333HHGGEEGBHBHHFFHEHHEGF2HHFEGHGGGHHFHHHFDGBAHHFHHHHHFHFHHFGHHEHHHHGHG5HHGGGGGHGHGHHHHHHHHHHHHHHHGFHHHGGGGGGGGGGGFFFFFFFDDDDD\tNM:i:1\tAS:i:184\tXS:i:145\tMQ:i:12\tMC:Z:54S189M7S\tms:i:7507\n-entry10\t147\tcontig_000000008\t28855\t32\t34S189M27S\t=\t28855\t-189\tTGTTTTGTTGGGTTGTTTTTTACATTTATTTAGTTATTTATATTATATCTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTTCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA\t<:.:.<.EEA..A:<-000<00000<:000DGFDH0H=0HD00H===.10.11<BCDHGGDGHF11GBFHEFEFGCFF//C/FA?AHEGFDG?B?BD3GG4FHHGDDG4BHDFHEDEF?F4?GB/3B3HGGHGHHHHHHHFHHHHHHFB3HFEGGHGCGHGHHGFGG5BHHHGHFFHHBFGHFHHF5FHHHHHHGDHG2G5FHHGHGHHHHHHHHHHHHHHHGGHHHGGGGGGGGGGGFFFFFFFCDDDC\tNM:i:2\tAS:i:179\tXS:i:137\tMQ:i:15\tMC:Z:54S189M7S\tms:i:9375\n-entry9\t3235\tcontig_000000008\t28949\t12\t95M155H\t=\t28855\t95\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT\tBCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF\tNM:i:1\tAS:i:90\tXS:i:0\tSA:Z:contig_000000008,28855,+,54S189M7S,12,3;\n-entry10\t2147\tcontig_000000008\t28949\t15\t95M155H\t=\t28855\t95\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT\tDDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHH\tNM:i:1\tAS:i:90\tXS:i:0\tSA:Z:contig_000000008,28855,+,54S189M7S,15,1;\n' |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/7_mark_supp_dup.sam --- a/test-data/7_mark_supp_dup.sam Thu Apr 22 12:58:55 2021 +0000 +++ /dev/null Thu Jan 01 00:00:00 1970 +0000 |
b |
b'@@ -1,25 +0,0 @@\n-@HD\tVN:1.4\tSO:coordinate\n-@SQ\tSN:contig_000000000\tLN:11391\n-@SQ\tSN:contig_000000008\tLN:29043\n-entry1\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n-entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n-entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n-entry4\t163\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n-entry1\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n-entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8804\n-entry3\t147\tcontig_000000000\t222\t60\t250M\t=\t116\t-356\tTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGT'..b'G<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n-entry8\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n-entry9\t163\tcontig_000000008\t28855\t12\t54S189M7S\t=\t28855\t189\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATGTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGTGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT\tBCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF1EGGHHHHHGCEFEEGFHFHFHFHHHH4444?44FE4B4?4D44D444433B20/??FH2?/?/32222D2FB//F>2FDHF00???/??CHGGGHFHBGHB<>1<<1DF1D0=<0FDGB0=000</<.G:CHB:.;;000;00CH0;0;0;00;\tNM:i:3\tAS:i:174\tXS:i:159\tSA:Z:contig_000000008,28949,+,95M155S,12,1;\tMQ:i:30\tMC:Z:34S189M27S\tms:i:8529\n-entry10\t99\tcontig_000000008\t28855\t15\t54S189M7S\t=\t28855\t189\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT\tDDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHHEHGHHHHHGHGFFGGHHFHHHHHHHHHHGFEFDFHHHHHHHHHHHHGHFGFHHFEHDGGHCCFEHFHHFHHHHH/FFFHGHHHCCGGGGFHGHGHHHHHHEDDFDHFFHHHHFGHFGFDHDGEDFHHCEECFGHEEFAHFCGH1CF1E1FBFFGF\tNM:i:1\tAS:i:184\tXS:i:164\tSA:Z:contig_000000008,28949,+,95M155S,15,1;\tMQ:i:32\tMC:Z:34S189M27S\tms:i:8035\n-entry9\t83\tcontig_000000008\t28855\t30\t34S189M27S\t=\t28855\t-189\tTACTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA\t:0FGEEGGGGGGEEHHHHC:00C:CGGGC0GBFGD0<DHFEHHHD=00<<.1<0GFE.FCG1FDF11BHGFCAHFFBFCEGCF</HFDGDHDFFB22GDHFHHG4?3?B?4?4F4FFH?D4BF3/333HHGGEEGBHBHHFFHEHHEGF2HHFEGHGGGHHFHHHFDGBAHHFHHHHHFHFHHFGHHEHHHHGHG5HHGGGGGHGHGHHHHHHHHHHHHHHHGFHHHGGGGGGGGGGGFFFFFFFDDDDD\tNM:i:1\tAS:i:184\tXS:i:145\tMQ:i:12\tMC:Z:54S189M7S\tms:i:7507\n-entry10\t147\tcontig_000000008\t28855\t32\t34S189M27S\t=\t28855\t-189\tTGTTTTGTTGGGTTGTTTTTTACATTTATTTAGTTATTTATATTATATCTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTTCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA\t<:.:.<.EEA..A:<-000<00000<:000DGFDH0H=0HD00H===.10.11<BCDHGGDGHF11GBFHEFEFGCFF//C/FA?AHEGFDG?B?BD3GG4FHHGDDG4BHDFHEDEF?F4?GB/3B3HGGHGHHHHHHHFHHHHHHFB3HFEGGHGCGHGHHGFGG5BHHHGHFFHHBFGHFHHF5FHHHHHHGDHG2G5FHHGHGHHHHHHHHHHHHHHHGGHHHGGGGGGGGGGGFFFFFFFCDDDC\tNM:i:2\tAS:i:179\tXS:i:137\tMQ:i:15\tMC:Z:54S189M7S\tms:i:9375\n-entry9\t2211\tcontig_000000008\t28949\t12\t95M155H\t=\t28855\t95\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT\tBCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF\tNM:i:1\tAS:i:90\tXS:i:0\tSA:Z:contig_000000008,28855,+,54S189M7S,12,3;\n-entry10\t2147\tcontig_000000008\t28949\t15\t95M155H\t=\t28855\t95\tCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT\tDDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHH\tNM:i:1\tAS:i:90\tXS:i:0\tSA:Z:contig_000000008,28855,+,54S189M7S,15,1;\n' |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/7_markdup.expected.bam |
b |
Binary file test-data/7_markdup.expected.bam has changed |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/7_two_read_mapped.sam --- a/test-data/7_two_read_mapped.sam Thu Apr 22 12:58:55 2021 +0000 +++ /dev/null Thu Jan 01 00:00:00 1970 +0000 |
b |
@@ -1,22 +0,0 @@ -@HD VN:1.4 SO:queryname -@SQ SN:ref1 LN:45 -@SQ SN:ref2 LN:40 -of1 99 ref1 10 30 23M = 8 2 AAGTCGGCAGCGTCAGATGTGTA ??????????????????????? -of1 147 ref1 8 30 23M = 10 -2 CTGTCTCTTATACACATCTCCTT ??????????????????????? -r001 83 ref1 37 30 9M = 7 -39 CAGCGCCAT * -r001 163 ref1 7 30 8M4I4M1D3M = 37 39 TTAGATAAAGAGGATACTG * XX:B:S,12561,2,20,112 YY:i:100 -r002 0 ref1 9 30 1S2I6M1P1I1P1I4M2I * 0 0 AAAAGATAAGGGATAAA * XA:Z:abc XB:i:-10 -r003 0 ref1 9 30 5H6M * 0 0 AGCTAA * -r003 16 ref1 29 30 6H5M * 0 0 TAGGC * -r004 0 ref1 16 30 6M14N1I5M * 0 0 ATAGCTCTCAGC * -r007 8 ref1 9 30 5H6M * 0 0 AGCTAA * -r007 4 ref1 9 30 * * 0 0 GGGGGG * -r008 12 ref1 9 30 5H6M * 0 0 AGCTAA * -r008 4 ref1 9 30 * * 0 0 GGGGGG * -uu1 4 * 0 30 * * 0 0 TAATTGGGTCTTCAGAGCACCTA ??????????????????????? -x1 0 ref2 1 30 20M * 0 0 AGGTTTTATAAAACAAATAA * -x2 0 ref2 2 30 21M * 0 0 GGTTTTATAAAACAAATAATT ????????????????????? -x3 0 ref2 6 30 9M4I13M * 0 0 TTATAAAACAAATAATTAAGTCTACA ?????????????????????????? -x4 0 ref2 10 30 25M * 0 0 CAAATAATTAAGTCTACAGAGCAAC ????????????????????????? -x5 0 ref2 12 30 24M * 0 0 AATAATTAAGTCTACAGAGCAACT ???????????????????????? -x6 0 ref2 14 30 23M * 0 0 TAATTAAGTCTACAGAGCAACTA ??????????????????????? |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/8_markdup.expected.bam |
b |
Binary file test-data/8_markdup.expected.bam has changed |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/9_markdup.expected.sam --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/9_markdup.expected.sam Tue Sep 28 16:14:29 2021 +0000 |
b |
b'@@ -0,0 +1,20 @@\n+@HD\tVN:1.4\tSO:coordinate\n+@SQ\tSN:contig_000000000\tLN:11391\n+@PG\tID:samtools\tPN:samtools\tVN:1.12\tCL:samtools sort -@ 0 -m 768M -T . -O sam -o coordsort.sam /tmp/tmpuzvw6tdp/files/b/a/d/dataset_badf390c-6dae-4603-937a-f000db10e1eb.dat\n+@PG\tID:samtools.1\tPN:samtools\tPP:samtools\tVN:1.12\tCL:samtools markdup -@ 0 -m t -O SAM coordsort.sam /tmp/tmpuzvw6tdp/files/c/4/1/dataset_c4121439-d0e4-4e9a-b597-951d44bf57bc.dat\n+entry1\t1187\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tGATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG\t1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00\tNM:i:18\tAS:i:164\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:6744\n+entry2\t163\tcontig_000000000\t109\t60\t250M\t=\t137\t278\tTATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG\tBBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00\tNM:i:2\tAS:i:240\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9279\n+entry3\t99\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9509\n+entry4\t1187\tcontig_000000000\t116\t60\t250M\t=\t222\t356\tATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG\tBCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9604\n+entry1\t1107\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tTTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG\t;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11>\tNM:i:7\tAS:i:222\tXS:i:19\tMQ:i:60\tMC:Z:250M\tms:i:5687\n+entry2\t83\tcontig_000000000\t137\t60\t250M\t=\t109\t-278\tGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG\t0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFF'..b'TTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG\tBCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF\tAS:i:0\tXS:i:0\tMQ:i:49\tMC:Z:35M215S\tms:i:9339\n+entry6\t1161\tcontig_000000000\t304\t49\t35M215S\t=\t304\t0\tATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT\tABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0\tNM:i:0\tAS:i:35\tXS:i:0\tMC:Z:*\tms:i:9398\n+entry5\t83\tcontig_000000000\t422\t60\t250M\t=\t304\t-368\tTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA\t.DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC\tNM:i:0\tAS:i:250\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:9461\n+entry7\t121\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:4569\n+entry7\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tCAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG\t////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8580\n+entry8\t1145\tcontig_000000000\t3891\t60\t250M\t=\t3891\t0\tACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC\t99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A\tNM:i:0\tAS:i:250\tXS:i:0\tMC:Z:*\tms:i:3281\n+entry8\t181\tcontig_000000000\t3891\t0\t*\t=\t3891\t0\tGACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT\t9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111\tAS:i:0\tXS:i:0\tMQ:i:60\tMC:Z:250M\tms:i:8542\n' |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/stats.txt --- a/test-data/stats.txt Thu Apr 22 12:58:55 2021 +0000 +++ b/test-data/stats.txt Tue Sep 28 16:14:29 2021 +0000 |
b |
@@ -1,5 +1,16 @@ -READ 16 WRITTEN 16 -EXCLUDED 3 EXAMINED 13 -PAIRED 10 SINGLE 3 -DULPICATE PAIR 4 DUPLICATE SINGLE 2 -DUPLICATE TOTAL 6 +COMMAND: samtools markdup -@ 0 -s coordsort.sam /tmp/tmpea8lprdd/files/2/2/4/dataset_224df993-f6bf-4c7d-99a1-2e9dd51c2a57.dat +READ: 16 +WRITTEN: 16 +EXCLUDED: 3 +EXAMINED: 13 +PAIRED: 10 +SINGLE: 3 +DUPLICATE PAIR: 4 +DUPLICATE SINGLE: 2 +DUPLICATE PAIR OPTICAL: 0 +DUPLICATE SINGLE OPTICAL: 0 +DUPLICATE NON PRIMARY: 0 +DUPLICATE NON PRIMARY OPTICAL: 0 +DUPLICATE PRIMARY TOTAL: 6 +DUPLICATE TOTAL: 6 +ESTIMATED_LIBRARY_SIZE: 4 |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/test.fa --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/test.fa Tue Sep 28 16:14:29 2021 +0000 |
b |
@@ -0,0 +1,3 @@ +>CHROMOSOME_I +gcctaagcctaagcctaagcctaagcctaagcctaagcctaagcctaagc +ctaagcctaagcctaagcctaagcctaagcctaagcctaagcctaagcct |
b |
diff -r a312a0fdaf31 -r d0a568e1904b test-data/test.fa.fai --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/test.fa.fai Tue Sep 28 16:14:29 2021 +0000 |
b |
@@ -0,0 +1,1 @@ +CHROMOSOME_I 100 14 50 51 |