Repository 'rename_scaffolds'
hg clone https://toolshed.g2.bx.psu.edu/repos/yating-l/rename_scaffolds

Changeset 0:65c9ce351343 (2017-01-20)
Next changeset 1:0d13e4410c3d (2018-06-18)
Commit message:
planemo upload commit af6c4dc7f6d6795f2b2db7299eb14ae1d5622ac1
added:
rename.py
rename_scaffold.xml
test-data/Dbia3.fa
test-data/Dbia3_index.fa
test-data/Dbia3_renamed.fa
b
diff -r 000000000000 -r 65c9ce351343 rename.py
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/rename.py Fri Jan 20 17:06:52 2017 -0500
[
@@ -0,0 +1,38 @@
+"""
+Call rename to rename scaffolds in reference genome so that the sequence names are less than 31 characters. Rename all scaffolds to scaffold_1, scaffold_2, ..., scaffold_N and provide a name mapping file
+"""
+import sys
+from collections import OrderedDict
+
+def rename(inputfile, outputfile, indexfile):
+    namemap = OrderedDict()
+    with open(outputfile, 'w') as out:
+        with open(inputfile, 'r') as rf:
+            lines = rf.readlines()
+            i = 1
+            for line in lines:
+                if ">" in line:
+                    oldname = line[1:].rstrip()
+                    newname = "scaffold_" + str(i)
+                    line = ">" + newname
+                    i = i+1
+                    namemap[oldname] = newname
+                #TODO: Add line breaks to chromosome sequences that are in a single line
+                #else:
+                    #if (len(line) > 50):
+                        #for 
+                out.write(line.rstrip() + "\n")
+    with open(indexfile, 'w') as index:
+        for k in namemap:
+            index.write(k + "\t" + namemap[k] + "\n")
+
+def main():
+    inputfile = str(sys.argv[1])
+    outputfile = str(sys.argv[2])
+    indexfile = str(sys.argv[3])
+    rename(inputfile, outputfile, indexfile)
+
+if __name__ == "__main__":
+    main()
+    
+
b
diff -r 000000000000 -r 65c9ce351343 rename_scaffold.xml
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/rename_scaffold.xml Fri Jan 20 17:06:52 2017 -0500
[
@@ -0,0 +1,30 @@
+<tool id="rename_scaffold" name="rename the scaffolds" version="0.1.0">
+    <description>Rename the scaffolds so that they won't exceed 31 characters</description>
+<stdio>
+    <exit_code range="1:" />
+</stdio>
+<command><![CDATA[
+    python $__tool_directory__/rename.py $input $output $index
+]]></command>
+<inputs>
+    <param name="input" type="data" format="fasta"/>
+</inputs>
+<outputs>
+    <data name="output" format="fasta" label="${tool.name} on ${on_string}: renamed_reference" />
+    <data name="index" format="fasta" label="${tool.name} on ${on_string}: name mapping"/>
+</outputs>
+<tests>
+    <test>
+        <!-- Test with Dbia3.fa -->
+        <param name="input" value="Dbia3.fa" />
+        <output name="output" file="Dbia3_renamed.fa"/>
+        <output name="index" file="Dbia3_index.fa"/>
+    </test>
+</tests>
+<help><![CDATA[
+This tool is to rename scaffolds in reference genome so that the sequence names are less than 31 characters. Rename all scaffolds to scaffold_1, scaffold_2, ..., scaffold_N and provide a name mapping file
+
+]]></help>
+<citations>
+</citations>
+</tool>
\ No newline at end of file
b
diff -r 000000000000 -r 65c9ce351343 test-data/Dbia3.fa
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/Dbia3.fa Fri Jan 20 17:06:52 2017 -0500
b
b'@@ -0,0 +1,66784 @@\n+>contig1\n+AAAACTAATTTTATCAAAATCGGACAACTATATCATATAGCTGCCATACG\n+AACGATCGGAAAATTGGTAAGTAAATAATTAAAAATATTATATCTTTGGT\n+GTGTTTTTGGAAATAACATTTTTTAATATGTTTTGAATTTTGAATTAAAT\n+TCTATCAAAATCGGACGACTATATCATATAGCTGCCATACAAACGATCGG\n+AAAATTGGTGAATAAATAATATGAAAAAATTATATCTTTGGTTATTTTTT\n+AGACAAATAACCTCCAACGCTTGGAAATAACATTTTTTAATTAGTTATAA\n+ATTTGATATTTTAATTTTATCAAAATCGGACGAATATAGCATATAGCTGT\n+TAAAATAATATGAAACAAATTATAGCTCCGGTGTTTTTTACATATTATCT\n+TATACTATTGGGAAAATAGTTTATTATATTTTAAAGAATTTCCAATTAAA\n+CTCTAACATATAGCTTTCAAAGAAACGGTCAAAAAAGTAAAGAAATCATT\n+TTTTTTTAACATCACTGAAGCTAGAAACAATCCTTAAAAATGTAACATGG\n+TGTTAGTAGCATTGAAAATTGCTTATAACTGCAAAGGGAAAACAAACATC\n+GGCTTGCCGAATGTAATTTCCATTCTTGTTTGACTTGAGTTTATAACTTA\n+CAATTATGGTAAGGTGCCTGATTTTGGTTTTTGCCATACGGTATGTGGTA\n+GTTATCATTTTGCCGTGCTATAAGTGACATCACAGCCGATTCTTTTACTC\n+CATAATGGGCCAATGTGTTGAGGCGTTTCCATCCATTTATTGTTTTTGTA\n+GTTAGGTCTTCATCTTGTAATGTGAGATGACCTCCTCTTCCATGCCTCCA\n+TTCTAAGTCAACTTCGTGCACAGATGGTCTCATAGAAAACGGAGTATTTT\n+TAAAAATTGCGTCCAAAATTTTTAATTTAACTTGCGATATGGTATCCAAA\n+TCGTTTACACGACATTGGACTTTTTCATCAAGATCATCTTGTAAAATGTG\n+CAAAATTACAACAGAATGGGTAACTTGTTCGTGGAGAAGTCGTTCCTCTG\n+AAAGTGAATAACGAGCATCGTGGGTTATTGCGTCCACCAAACCCTTTTCA\n+ATTTGATGCTTAATTGCCTTGAACAGCAAAAATAAATTAGATCCAGCATA\n+TTCTTTTAGGTAGTCGTACATACAAATTGCTAAGTAGTTTGTTAACATTT\n+TTTCAACTACGCTCTCAGTGCGTCGTAGCATTAGCTGAGGATGCTTGCTG\n+GCGAGCGATTTGTCAATTAATCGCAATAAAAGGGACTTTAAAATTTCCGT\n+CGCATATTCCATTTTGTTCATTAGAACAACCATAAGTAAAGAGGCGACGT\n+TAACTCGATCGCGAATTGAGAAAGATGACCGTTGAGCTTCTAAAGTTTCT\n+ATGAACAATAGTAAAAAATATTTGTTTCCAATAAGTTGCTCGAATTGTAT\n+CATAGCTGCATCATAGTTAGTGTGCGGGCTACTTCCACAAAATTTTCGGG\n+AGTTTAGAATAGGATGATCTGATACACCGGGAAAGAAAACTTTCATAATG\n+TAATTGACGTGATCTAACGTTGGTATACCGGTGCTCTCCAAATCTGCTGT\n+TAGATCGGTCATGTCCGTTTGGAGCTCAGCAAATGCCTGTTTACACTCAG\n+AACGAACGTTGCTTTCCAATGTTATCATCTGTATCTGAATTCGTTTGTAT\n+TCCCGTTCTGCTTGGGTCGATTTCCTTCTAAATATTATTAGTACGACAAC\n+CAAAACGATGACAAGCACTGCAACTGTCAATATAACGACAAACATGGCAT\n+GTGAAAAAACATAGGGTTTATTTAAATCATATTTCAAATATCCTATGGCG\n+AAACGAAGATTTCGCCCTACTTTAACCACAACTAGAGGTAAATCTGTCGA\n+TTGATCCACACCATTTTCATCAGTTGGGAGTGGTTGATGTTCCGGTGGAA\n+TGCACAAAAGTTGAGTTAGTGTAAGGCTTGTTATATTGCATTGAGTAGTA\n+CCAATGGTTACATTAACGTCGTATTCATCAGCTGCCAAATTTAGTAGCTC\n+GCCTTCAATAACCAAGCTGTCACCCTTGTATAGTTTAATTCCGTCATTTG\n+GAAATGGTAAATATTTTGGATCGGCTAAATAAACAATAGTGCTCCTGATA\n+TCATGAAAGTATTTATTTAGATCTCGAACAAGCTGTACATTGTCCATTAC\n+AAAACTAAGTTGTAAATTCAGTTGCGTTTCATGGACCTTTACAAAAGTTG\n+TAACATCCATATTATTATTGACGAAATAGCTAGGCGCAGTTCCCCCTGTT\n+GTGTATATATGAAAGTTGTCTACGAAGTCTGCTTTTCGCTTTCGTCTAGA\n+ATATTCGTTCTGATGCGCACTTTCATTTTTAAAGTCAAATTCCGAATCCA\n+TCACTCTGTTAGAACTTTTAAATGCTTGAAATTTATCATTTACCGGAGGA\n+GATGGGCATTCCATTTGATTTGAATTGATTACTACGCAAGATGTTTTGTT\n+TACTCTTTCATTATCAAAAAAAACTTCAAGTTCAGGCTTTTGAATTGAAT\n+TAAGATACATTCCATGAACGGTCAGAACGCGACCACCACTTACAAAACTG\n+CGTAAAGGCTTAATCTGCATTATACGCGGGTCTTGGGTATAGTTAAAAAT\n+AGAACAGGGCTGCCTTGGTAACGTACGAAATTGGTATGAACCGAAATTAC\n+TTCGAGTTAGATTTTTATTGGGTATAGTTGCGGGTGAGATATGACATTCT\n+AAAGTTCGGTTGGCACCGTCAATAAGAAGGTGTAGAGACCGTATTGGTTC\n+TGGCTGGGTCGCCTCTGATGTAGTACTACTAACTTGAGTTGAAGAAGCTT\n+GTGTAACGTTTATATGACACTCGTACTCATCTAAATATGCTCGCATGGTT\n+GATCCAATGTTCAAAAACTTTCCTATTAACGACAATTGTGTTCCTCCCGA\n+CCTGGGCCCAATCGTGGGATATAATCCTGTTAGCAAAACATTCTTAAAGT\n+GAAATTGTACACTAGATTCAGTATACCCTGCATCATTTGCAACCTTTATA\n+GGCGCTGACATTTCATACATCACTGCTCCAGTGCGGCATTCGATCTTTAC\n+AGAAATTTGGTAGTTGACTAGTTCACAAGGCACAGACCCAATAAATATTT\n+TTCCACGCACATCTCCTTCGCGAATGCCCAAATTACTGCCTTCAATTGTA\n+ATAAGGGTACCACCCTCAATAGGTCCAGATAACGGTTTAATAATATCGAT\n+CCTTGGTAAAGGGCACTCGTTTTCTTTAGTTGTTTTTGATCCTGCACTAA\n+TAGCACGATCACTGTCTGCTATGCAAGTCTCGTTATATACACATGAGTTG\n+CTGCACCAAGCACATTGGTATTTTGGATCACGAGTGACACACAAACTGCA\n+ATCAGCATGATCCCGATGTGAGCCCAGTACGTCGCATTTATATAATGTAA\n+CAATCGCCGTGTCCACATAGTGCTGGAAATTCCATGTAATTACAACCTTT\n+GCTTGGTATTCATGTGTATTAGTCTCGTAGAAATAAGGTGTTTTTTCACA\n+AACAACAATCTTGTTTGACTCAATGTGGGCAGGCAATAGCATCTGAGCAG\n+CTTCAATATGAACTGTACACAAGAATCCAGCGTGAGCGCTTTTGGGTTTT\n+GGTAAGTTTTCTATCTCTAAACGAATTTCTTTTGGCACCCGCACCGGTAA\n+AAGAATCGCCGGACGATTGCTTTTTAAATGGGGGCATTGACCAACACTAG\n+TTACCGAATTTTCTATATTACGACATTGTATTGATTGATGGACACATTTA\n+TTGTCAAAAATACACC'..b'CCACTGGACCCGTTGGATAGCGTC\n+GGCACTTTTCTGTTTGGTGCCATTCACTGGTCACTAGTAGGACCGCTCTG\n+CCTATTAAAATAGGAGTGCTGCTTAGAATTTATTTCAGCAAGACAGCCGT\n+AAGATATATATGAATAGTATTTAACGGCAGTGGCAGAGGCCTTTACAATA\n+TAAGGCTTTACGGGATTTTAAACAATGAAAAACAAAAATATTTTTATAGA\n+GTCGAGATAAAATACTTTTTACAATAAATACTAAGTATTTTTAAAAGATA\n+AAAATATTTAAAAGTAAATACTGAATATTTTAACAGGTGTTAAGTACTGG\n+GAACTGTGACTAAGGACGGCGGTATATCGCTACCATAATATTTTTAAAGG\n+AACTGAATACTGAAAGATGTGACCAAAATGGTAGAATATCGCTAACGAAA\n+ATCACAGACGCAAATATCGATAGTGGCCTAGAGACCCGATATCGCCGCCG\n+TGATTATCGATGAAACTACAGCTGAGCTGCTTGTTTACATTCTAAAGTTA\n+AAATTTTTAAAAATTTCCAATACAAAAAAAAATTCTTCGTATTAACACGG\n+CTGTTTGCCGGTAAGATCTGAAGTGGATTCAAGTTGCAGCACCCTCAGGA\n+AAAGAATAAATTATTATAATATAATAATATAATATAAAGAATTTAAATTC\n+GAACCAAACGCGGTATGTCACTCTTCATTTAGAGAATTTGTGGCTTTGTT\n+TTGTACAAAAAACTATTCTTTTTTCTTGAAAATTAGCATCAAGAATTTAT\n+TGCCAAAACAGAACGCAATTCTGCTAAATCTGGTTACCCTGCCAAATGGC\n+TGGCCGTTCTGTGCATTCAATAACACAAGCTAACGGCTTACGGCACATTC\n+GGAAAGATCCAAAAGAATTTCTATTCCGGCATTTTTTATGTATTATCGTC\n+CAATTTTTGTATGTGTATTCATTCTTTTGGCTGTCCGTTATTAAGCTTTT\n+CTTATCCACATAAGCTGACCAGCTGCCAAAAAGCCGACCGTTTTGTGCAG\n+CCAATAACCCAAGCTAACTATCAACAGCAATTTCGAAAAATCCAGAAGAA\n+GCTATCCTTCGGCAATTTTTTCTTATATTATAATTTTTTTGTCACAATTT\n+TTTGTCAAAAAATCGACAATAATTAAGTGTTTACATTTTAATGCGATTTA\n+ATTGGAAATTTGAATTCGAATCAAACGCGGTGTCACTCTACATATGGACA\n+ATTTGTGGCTACAAAATTAGTTGAAAGTGCATGTTTTTTTTTAAGTGAAA\n+TAAAACAAAAACAGCAATAACAGGCCAAAATGTTGTTTTATAAATAAATA\n+CTTACATATCCGCATATAAATATGAATGAAAAAAAAAACAGCAAGACTGG\n+GCCAAAATATTGTTCTTTAATATGTAAATAAATACATATCTACATATACA\n+TATGTGGACAAAAGTGTTAAAATTAGTTAATAGTGCATGTTTTTTAAATG\n+AAAAAATAAAACAAAAAAAGCAAGCAAATATAAATTATATTCCACACACA\n+TTTACAATAATTTCAAACTACGCTAAAAATACCCAACAGAAAAAACATAG\n+AAAGGTAAACAAAATACAAGAATATCAAAAAAAATCTAATTTTCACGTTG\n+TTGTGGCCGGTACCACCGGTCATACATACATATAGATACATATTTAGATT\n+CTCACAAAAAGAATAGAAAATTACCGCTAATTTCCTTATATACGTTTTTG\n+TTTTCAGTGTTTTGAAATAGTATTTTTCAAACAAAAAACAATACAAAAGG\n+GTTAAAAAAATTGTTCGATTGGCTTTAACATACTAATTAAAAAAAATCAC\n+AATTTTTTGGCAAAATATCGAAAAAAATTAAGTGTTTACATTTTTATGCG\n+AATTATTTGGAAATTTAAATAAGAACCCAACGCGGTTTGTCACTCTACAT\n+ATGGACAATTTGTGGCTTTGTTTTGAACAAAAAATGAATTTTTTTTTACT\n+CAAAATTAACAAGAAGAAACAGTAATGCGGGTTTTGATCGCAATTCTGCT\n+AAATCGAATTTCCGTGCCCAAAGGCTGACCTTTTTGTGCAGCAAATAGCC\n+CAAGCTAATAATCTACAGCAATTTCTTAAAGACCGAAAATGTATCAACTT\n+CGGCAAAATATGAAAATTTAACATTTATTTTTCAACATTTTTTGCCAAAT\n+AATCGACAAAAATTTCAGTGTCCCGATTTGGATGCGAATTAATTGAGGAC\n+AATTGTGACTTTGTTTTGTAAAAAAACTATTTTTTTTACTGAAAATTACA\n+ATCAAGAATCTAAGGCCAAATCAGAATATTTTCACTGCGGTTTTTTGATC\n+GCAATTCTGCTAAATCGGGTTCCGTGCCAAAAAGCTGACTATTTTTTTTA\n+CTGAGAATTAGCATCAAGAATTTATTGCCAAAACAGAACGCAATTCTGCT\n+AAATCGGGTTGCCCTGCCAAAAGGCTGGCCGTTTTGCGCATTCAATAACA\n+CAAGCTAACGGTTTACAGCACATTCGGAAAGATCCAAAAGAATTTCTATT\n+TCGGCATTTTTTATGTATTATCGTCTAATTTTGGTATGTGTATTCATTCT\n+TTTGGCTGTCCGTTATTAAGCTGCTTTTCTTATTCACATATTCAATGGCG\n+CAGTACATAAAAAGAATGAACCGTGGTTTTCTTGCCCTCTCCATCTCCCT\n+CTACCACTTCCCCTCTCAACAACTATCTCACGCACTCTGTCCCTTCTCGT\n+CTCTGTCACCCTCTCTTTACCTACCTCACTCTGGCACACTCTCTCTACCT\n+ATCTCACTCTGTCACCTTCTTCTACCTAATTCTCTCTGTCGCGCTCGCTC\n+TCTCAACATGCCTTTCGCACCGTATCTCTTCGTTTCTCTGTATGCTTGCT\n+CTCTTAATTTAAGTTTCTCTTTCTTTGTGTTCAATATCTTTCGCGCTCGT\n+GACTCCTATTGACCGGACTCTGAGCGGTGCTCATTAAGAGTGGAGTTTTC\n+GATGATGGCGGGTGGCGCGAACGAGAATTTTTTACATAAAGGTAAGTTGC\n+CAATTCTTTTTTAAATGTGACATACAGCATGCATATTTTATTTATTGTAA\n+TTATATGTGAAAGAATAAAATTATATGTACTTTTATCTAATCTATTGCAT\n+CTATTTTTTCACAGGTAAACGAGTCACACGAGAAGTAAAACACAAACACA\n+AGGATCAAAATAAAATTCAGGTGAGTGAACGAACGTGTTGAAAGTAGTTA\n+ATAGTGCATGTCTATTTAAGTGTAAGAAACAAAAAAGACACAAATGGGCC\n+AATAATTCGTTTCTTTAATAGATAACTGCCTATATTATGTTCAAACTATG\n+CTAAAAAGACCCAAAAGGAAAACATAAAGTATATACCTTGCAAAATGAAT\n+AAAAAGAAATCATATATATTCATATACGTTTGACCGGTACCACCGGTCAT\n+ACATACATAAACATAAACACAAAAAGACTAGAATATAAATACCATATTTT\n+TGATTGGCTTAAAAATGGCACAAAAAAAAGATAAAAACTAGAGTGTCTAG\n+CTTTAAGTGACAATCGACTCGGAAAATGATCAAGAAATAAATGAAAAATT\n+TGTCTTGCGGCTTTTTGGTCGCAATTCTAAATCGGTTTGTATGTATGTCA\n+CTCTTCATGTATACAATTTGGTGGCTTTGTATTCCACAAAAGTCACAGTA\n+GTCACAAAAGTTTTTTTTACTGAAAATTACCATCAAGAGTCTATGGCCAA\n+ATCAGAATATTTTCACTGCGGTTTTTTATTTCAATTCTGCTAAATCGGGT\n+TTCCGTGCCAAAAAGCTTTTGCAGCCAACAACAATATTCAATTTTTTGGC\n+AAAAAATCGACAAAAAAATT\n'
b
diff -r 000000000000 -r 65c9ce351343 test-data/Dbia3_index.fa
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/Dbia3_index.fa Fri Jan 20 17:06:52 2017 -0500
b
@@ -0,0 +1,70 @@
+contig1 scaffold_1
+contig2 scaffold_2
+contig3 scaffold_3
+contig4 scaffold_4
+contig5 scaffold_5
+contig6 scaffold_6
+contig7 scaffold_7
+contig8 scaffold_8
+contig9 scaffold_9
+contig10 scaffold_10
+contig11 scaffold_11
+contig12 scaffold_12
+contig13 scaffold_13
+contig14 scaffold_14
+contig15 scaffold_15
+contig16 scaffold_16
+contig17 scaffold_17
+contig18 scaffold_18
+contig19 scaffold_19
+contig20 scaffold_20
+contig21 scaffold_21
+contig22 scaffold_22
+contig23 scaffold_23
+contig24 scaffold_24
+contig25 scaffold_25
+contig26 scaffold_26
+contig27 scaffold_27
+contig28 scaffold_28
+contig29 scaffold_29
+contig30 scaffold_30
+contig31 scaffold_31
+contig32 scaffold_32
+contig33 scaffold_33
+contig34 scaffold_34
+contig35 scaffold_35
+contig36 scaffold_36
+contig37 scaffold_37
+contig38 scaffold_38
+contig39 scaffold_39
+contig40 scaffold_40
+contig41 scaffold_41
+contig42 scaffold_42
+contig43 scaffold_43
+contig44 scaffold_44
+contig45 scaffold_45
+contig46 scaffold_46
+contig47 scaffold_47
+contig48 scaffold_48
+contig49 scaffold_49
+contig50 scaffold_50
+contig51 scaffold_51
+contig52 scaffold_52
+contig53 scaffold_53
+contig54 scaffold_54
+contig55 scaffold_55
+contig56 scaffold_56
+contig57 scaffold_57
+contig58 scaffold_58
+contig59 scaffold_59
+contig60 scaffold_60
+contig61 scaffold_61
+contig62 scaffold_62
+contig63 scaffold_63
+contig64 scaffold_64
+contig65 scaffold_65
+contig66 scaffold_66
+contig67 scaffold_67
+contig68 scaffold_68
+contig69 scaffold_69
+contig70 scaffold_70
b
diff -r 000000000000 -r 65c9ce351343 test-data/Dbia3_renamed.fa
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/Dbia3_renamed.fa Fri Jan 20 17:06:52 2017 -0500
b
b'@@ -0,0 +1,66784 @@\n+>scaffold_1\n+AAAACTAATTTTATCAAAATCGGACAACTATATCATATAGCTGCCATACG\n+AACGATCGGAAAATTGGTAAGTAAATAATTAAAAATATTATATCTTTGGT\n+GTGTTTTTGGAAATAACATTTTTTAATATGTTTTGAATTTTGAATTAAAT\n+TCTATCAAAATCGGACGACTATATCATATAGCTGCCATACAAACGATCGG\n+AAAATTGGTGAATAAATAATATGAAAAAATTATATCTTTGGTTATTTTTT\n+AGACAAATAACCTCCAACGCTTGGAAATAACATTTTTTAATTAGTTATAA\n+ATTTGATATTTTAATTTTATCAAAATCGGACGAATATAGCATATAGCTGT\n+TAAAATAATATGAAACAAATTATAGCTCCGGTGTTTTTTACATATTATCT\n+TATACTATTGGGAAAATAGTTTATTATATTTTAAAGAATTTCCAATTAAA\n+CTCTAACATATAGCTTTCAAAGAAACGGTCAAAAAAGTAAAGAAATCATT\n+TTTTTTTAACATCACTGAAGCTAGAAACAATCCTTAAAAATGTAACATGG\n+TGTTAGTAGCATTGAAAATTGCTTATAACTGCAAAGGGAAAACAAACATC\n+GGCTTGCCGAATGTAATTTCCATTCTTGTTTGACTTGAGTTTATAACTTA\n+CAATTATGGTAAGGTGCCTGATTTTGGTTTTTGCCATACGGTATGTGGTA\n+GTTATCATTTTGCCGTGCTATAAGTGACATCACAGCCGATTCTTTTACTC\n+CATAATGGGCCAATGTGTTGAGGCGTTTCCATCCATTTATTGTTTTTGTA\n+GTTAGGTCTTCATCTTGTAATGTGAGATGACCTCCTCTTCCATGCCTCCA\n+TTCTAAGTCAACTTCGTGCACAGATGGTCTCATAGAAAACGGAGTATTTT\n+TAAAAATTGCGTCCAAAATTTTTAATTTAACTTGCGATATGGTATCCAAA\n+TCGTTTACACGACATTGGACTTTTTCATCAAGATCATCTTGTAAAATGTG\n+CAAAATTACAACAGAATGGGTAACTTGTTCGTGGAGAAGTCGTTCCTCTG\n+AAAGTGAATAACGAGCATCGTGGGTTATTGCGTCCACCAAACCCTTTTCA\n+ATTTGATGCTTAATTGCCTTGAACAGCAAAAATAAATTAGATCCAGCATA\n+TTCTTTTAGGTAGTCGTACATACAAATTGCTAAGTAGTTTGTTAACATTT\n+TTTCAACTACGCTCTCAGTGCGTCGTAGCATTAGCTGAGGATGCTTGCTG\n+GCGAGCGATTTGTCAATTAATCGCAATAAAAGGGACTTTAAAATTTCCGT\n+CGCATATTCCATTTTGTTCATTAGAACAACCATAAGTAAAGAGGCGACGT\n+TAACTCGATCGCGAATTGAGAAAGATGACCGTTGAGCTTCTAAAGTTTCT\n+ATGAACAATAGTAAAAAATATTTGTTTCCAATAAGTTGCTCGAATTGTAT\n+CATAGCTGCATCATAGTTAGTGTGCGGGCTACTTCCACAAAATTTTCGGG\n+AGTTTAGAATAGGATGATCTGATACACCGGGAAAGAAAACTTTCATAATG\n+TAATTGACGTGATCTAACGTTGGTATACCGGTGCTCTCCAAATCTGCTGT\n+TAGATCGGTCATGTCCGTTTGGAGCTCAGCAAATGCCTGTTTACACTCAG\n+AACGAACGTTGCTTTCCAATGTTATCATCTGTATCTGAATTCGTTTGTAT\n+TCCCGTTCTGCTTGGGTCGATTTCCTTCTAAATATTATTAGTACGACAAC\n+CAAAACGATGACAAGCACTGCAACTGTCAATATAACGACAAACATGGCAT\n+GTGAAAAAACATAGGGTTTATTTAAATCATATTTCAAATATCCTATGGCG\n+AAACGAAGATTTCGCCCTACTTTAACCACAACTAGAGGTAAATCTGTCGA\n+TTGATCCACACCATTTTCATCAGTTGGGAGTGGTTGATGTTCCGGTGGAA\n+TGCACAAAAGTTGAGTTAGTGTAAGGCTTGTTATATTGCATTGAGTAGTA\n+CCAATGGTTACATTAACGTCGTATTCATCAGCTGCCAAATTTAGTAGCTC\n+GCCTTCAATAACCAAGCTGTCACCCTTGTATAGTTTAATTCCGTCATTTG\n+GAAATGGTAAATATTTTGGATCGGCTAAATAAACAATAGTGCTCCTGATA\n+TCATGAAAGTATTTATTTAGATCTCGAACAAGCTGTACATTGTCCATTAC\n+AAAACTAAGTTGTAAATTCAGTTGCGTTTCATGGACCTTTACAAAAGTTG\n+TAACATCCATATTATTATTGACGAAATAGCTAGGCGCAGTTCCCCCTGTT\n+GTGTATATATGAAAGTTGTCTACGAAGTCTGCTTTTCGCTTTCGTCTAGA\n+ATATTCGTTCTGATGCGCACTTTCATTTTTAAAGTCAAATTCCGAATCCA\n+TCACTCTGTTAGAACTTTTAAATGCTTGAAATTTATCATTTACCGGAGGA\n+GATGGGCATTCCATTTGATTTGAATTGATTACTACGCAAGATGTTTTGTT\n+TACTCTTTCATTATCAAAAAAAACTTCAAGTTCAGGCTTTTGAATTGAAT\n+TAAGATACATTCCATGAACGGTCAGAACGCGACCACCACTTACAAAACTG\n+CGTAAAGGCTTAATCTGCATTATACGCGGGTCTTGGGTATAGTTAAAAAT\n+AGAACAGGGCTGCCTTGGTAACGTACGAAATTGGTATGAACCGAAATTAC\n+TTCGAGTTAGATTTTTATTGGGTATAGTTGCGGGTGAGATATGACATTCT\n+AAAGTTCGGTTGGCACCGTCAATAAGAAGGTGTAGAGACCGTATTGGTTC\n+TGGCTGGGTCGCCTCTGATGTAGTACTACTAACTTGAGTTGAAGAAGCTT\n+GTGTAACGTTTATATGACACTCGTACTCATCTAAATATGCTCGCATGGTT\n+GATCCAATGTTCAAAAACTTTCCTATTAACGACAATTGTGTTCCTCCCGA\n+CCTGGGCCCAATCGTGGGATATAATCCTGTTAGCAAAACATTCTTAAAGT\n+GAAATTGTACACTAGATTCAGTATACCCTGCATCATTTGCAACCTTTATA\n+GGCGCTGACATTTCATACATCACTGCTCCAGTGCGGCATTCGATCTTTAC\n+AGAAATTTGGTAGTTGACTAGTTCACAAGGCACAGACCCAATAAATATTT\n+TTCCACGCACATCTCCTTCGCGAATGCCCAAATTACTGCCTTCAATTGTA\n+ATAAGGGTACCACCCTCAATAGGTCCAGATAACGGTTTAATAATATCGAT\n+CCTTGGTAAAGGGCACTCGTTTTCTTTAGTTGTTTTTGATCCTGCACTAA\n+TAGCACGATCACTGTCTGCTATGCAAGTCTCGTTATATACACATGAGTTG\n+CTGCACCAAGCACATTGGTATTTTGGATCACGAGTGACACACAAACTGCA\n+ATCAGCATGATCCCGATGTGAGCCCAGTACGTCGCATTTATATAATGTAA\n+CAATCGCCGTGTCCACATAGTGCTGGAAATTCCATGTAATTACAACCTTT\n+GCTTGGTATTCATGTGTATTAGTCTCGTAGAAATAAGGTGTTTTTTCACA\n+AACAACAATCTTGTTTGACTCAATGTGGGCAGGCAATAGCATCTGAGCAG\n+CTTCAATATGAACTGTACACAAGAATCCAGCGTGAGCGCTTTTGGGTTTT\n+GGTAAGTTTTCTATCTCTAAACGAATTTCTTTTGGCACCCGCACCGGTAA\n+AAGAATCGCCGGACGATTGCTTTTTAAATGGGGGCATTGACCAACACTAG\n+TTACCGAATTTTCTATATTACGACATTGTATTGATTGATGGACACATTTA\n+TTGTCAAAAATAC'..b'CCACTGGACCCGTTGGATAGCGTC\n+GGCACTTTTCTGTTTGGTGCCATTCACTGGTCACTAGTAGGACCGCTCTG\n+CCTATTAAAATAGGAGTGCTGCTTAGAATTTATTTCAGCAAGACAGCCGT\n+AAGATATATATGAATAGTATTTAACGGCAGTGGCAGAGGCCTTTACAATA\n+TAAGGCTTTACGGGATTTTAAACAATGAAAAACAAAAATATTTTTATAGA\n+GTCGAGATAAAATACTTTTTACAATAAATACTAAGTATTTTTAAAAGATA\n+AAAATATTTAAAAGTAAATACTGAATATTTTAACAGGTGTTAAGTACTGG\n+GAACTGTGACTAAGGACGGCGGTATATCGCTACCATAATATTTTTAAAGG\n+AACTGAATACTGAAAGATGTGACCAAAATGGTAGAATATCGCTAACGAAA\n+ATCACAGACGCAAATATCGATAGTGGCCTAGAGACCCGATATCGCCGCCG\n+TGATTATCGATGAAACTACAGCTGAGCTGCTTGTTTACATTCTAAAGTTA\n+AAATTTTTAAAAATTTCCAATACAAAAAAAAATTCTTCGTATTAACACGG\n+CTGTTTGCCGGTAAGATCTGAAGTGGATTCAAGTTGCAGCACCCTCAGGA\n+AAAGAATAAATTATTATAATATAATAATATAATATAAAGAATTTAAATTC\n+GAACCAAACGCGGTATGTCACTCTTCATTTAGAGAATTTGTGGCTTTGTT\n+TTGTACAAAAAACTATTCTTTTTTCTTGAAAATTAGCATCAAGAATTTAT\n+TGCCAAAACAGAACGCAATTCTGCTAAATCTGGTTACCCTGCCAAATGGC\n+TGGCCGTTCTGTGCATTCAATAACACAAGCTAACGGCTTACGGCACATTC\n+GGAAAGATCCAAAAGAATTTCTATTCCGGCATTTTTTATGTATTATCGTC\n+CAATTTTTGTATGTGTATTCATTCTTTTGGCTGTCCGTTATTAAGCTTTT\n+CTTATCCACATAAGCTGACCAGCTGCCAAAAAGCCGACCGTTTTGTGCAG\n+CCAATAACCCAAGCTAACTATCAACAGCAATTTCGAAAAATCCAGAAGAA\n+GCTATCCTTCGGCAATTTTTTCTTATATTATAATTTTTTTGTCACAATTT\n+TTTGTCAAAAAATCGACAATAATTAAGTGTTTACATTTTAATGCGATTTA\n+ATTGGAAATTTGAATTCGAATCAAACGCGGTGTCACTCTACATATGGACA\n+ATTTGTGGCTACAAAATTAGTTGAAAGTGCATGTTTTTTTTTAAGTGAAA\n+TAAAACAAAAACAGCAATAACAGGCCAAAATGTTGTTTTATAAATAAATA\n+CTTACATATCCGCATATAAATATGAATGAAAAAAAAAACAGCAAGACTGG\n+GCCAAAATATTGTTCTTTAATATGTAAATAAATACATATCTACATATACA\n+TATGTGGACAAAAGTGTTAAAATTAGTTAATAGTGCATGTTTTTTAAATG\n+AAAAAATAAAACAAAAAAAGCAAGCAAATATAAATTATATTCCACACACA\n+TTTACAATAATTTCAAACTACGCTAAAAATACCCAACAGAAAAAACATAG\n+AAAGGTAAACAAAATACAAGAATATCAAAAAAAATCTAATTTTCACGTTG\n+TTGTGGCCGGTACCACCGGTCATACATACATATAGATACATATTTAGATT\n+CTCACAAAAAGAATAGAAAATTACCGCTAATTTCCTTATATACGTTTTTG\n+TTTTCAGTGTTTTGAAATAGTATTTTTCAAACAAAAAACAATACAAAAGG\n+GTTAAAAAAATTGTTCGATTGGCTTTAACATACTAATTAAAAAAAATCAC\n+AATTTTTTGGCAAAATATCGAAAAAAATTAAGTGTTTACATTTTTATGCG\n+AATTATTTGGAAATTTAAATAAGAACCCAACGCGGTTTGTCACTCTACAT\n+ATGGACAATTTGTGGCTTTGTTTTGAACAAAAAATGAATTTTTTTTTACT\n+CAAAATTAACAAGAAGAAACAGTAATGCGGGTTTTGATCGCAATTCTGCT\n+AAATCGAATTTCCGTGCCCAAAGGCTGACCTTTTTGTGCAGCAAATAGCC\n+CAAGCTAATAATCTACAGCAATTTCTTAAAGACCGAAAATGTATCAACTT\n+CGGCAAAATATGAAAATTTAACATTTATTTTTCAACATTTTTTGCCAAAT\n+AATCGACAAAAATTTCAGTGTCCCGATTTGGATGCGAATTAATTGAGGAC\n+AATTGTGACTTTGTTTTGTAAAAAAACTATTTTTTTTACTGAAAATTACA\n+ATCAAGAATCTAAGGCCAAATCAGAATATTTTCACTGCGGTTTTTTGATC\n+GCAATTCTGCTAAATCGGGTTCCGTGCCAAAAAGCTGACTATTTTTTTTA\n+CTGAGAATTAGCATCAAGAATTTATTGCCAAAACAGAACGCAATTCTGCT\n+AAATCGGGTTGCCCTGCCAAAAGGCTGGCCGTTTTGCGCATTCAATAACA\n+CAAGCTAACGGTTTACAGCACATTCGGAAAGATCCAAAAGAATTTCTATT\n+TCGGCATTTTTTATGTATTATCGTCTAATTTTGGTATGTGTATTCATTCT\n+TTTGGCTGTCCGTTATTAAGCTGCTTTTCTTATTCACATATTCAATGGCG\n+CAGTACATAAAAAGAATGAACCGTGGTTTTCTTGCCCTCTCCATCTCCCT\n+CTACCACTTCCCCTCTCAACAACTATCTCACGCACTCTGTCCCTTCTCGT\n+CTCTGTCACCCTCTCTTTACCTACCTCACTCTGGCACACTCTCTCTACCT\n+ATCTCACTCTGTCACCTTCTTCTACCTAATTCTCTCTGTCGCGCTCGCTC\n+TCTCAACATGCCTTTCGCACCGTATCTCTTCGTTTCTCTGTATGCTTGCT\n+CTCTTAATTTAAGTTTCTCTTTCTTTGTGTTCAATATCTTTCGCGCTCGT\n+GACTCCTATTGACCGGACTCTGAGCGGTGCTCATTAAGAGTGGAGTTTTC\n+GATGATGGCGGGTGGCGCGAACGAGAATTTTTTACATAAAGGTAAGTTGC\n+CAATTCTTTTTTAAATGTGACATACAGCATGCATATTTTATTTATTGTAA\n+TTATATGTGAAAGAATAAAATTATATGTACTTTTATCTAATCTATTGCAT\n+CTATTTTTTCACAGGTAAACGAGTCACACGAGAAGTAAAACACAAACACA\n+AGGATCAAAATAAAATTCAGGTGAGTGAACGAACGTGTTGAAAGTAGTTA\n+ATAGTGCATGTCTATTTAAGTGTAAGAAACAAAAAAGACACAAATGGGCC\n+AATAATTCGTTTCTTTAATAGATAACTGCCTATATTATGTTCAAACTATG\n+CTAAAAAGACCCAAAAGGAAAACATAAAGTATATACCTTGCAAAATGAAT\n+AAAAAGAAATCATATATATTCATATACGTTTGACCGGTACCACCGGTCAT\n+ACATACATAAACATAAACACAAAAAGACTAGAATATAAATACCATATTTT\n+TGATTGGCTTAAAAATGGCACAAAAAAAAGATAAAAACTAGAGTGTCTAG\n+CTTTAAGTGACAATCGACTCGGAAAATGATCAAGAAATAAATGAAAAATT\n+TGTCTTGCGGCTTTTTGGTCGCAATTCTAAATCGGTTTGTATGTATGTCA\n+CTCTTCATGTATACAATTTGGTGGCTTTGTATTCCACAAAAGTCACAGTA\n+GTCACAAAAGTTTTTTTTACTGAAAATTACCATCAAGAGTCTATGGCCAA\n+ATCAGAATATTTTCACTGCGGTTTTTTATTTCAATTCTGCTAAATCGGGT\n+TTCCGTGCCAAAAAGCTTTTGCAGCCAACAACAATATTCAATTTTTTGGC\n+AAAAAATCGACAAAAAAATT\n'