# HG changeset patch # User iuc # Date 1444396962 14400 # Node ID c28817831a244f6bca83db189b2e4b9a881d0fef planemo upload for repository https://github.com/galaxyproject/tools-iuc/tree/master/tools/transtermhp commit 799339e22181d28cb2b145454d353d6025779636 diff -r 000000000000 -r c28817831a24 macros.xml --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/macros.xml Fri Oct 09 09:22:42 2015 -0400 @@ -0,0 +1,25 @@ + + + + + transtermhp + biopython + bcbiogff + + + + 2.09 + + + + + + + + + + + + + + diff -r 000000000000 -r c28817831a24 test-data/sequence.fasta --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/sequence.fasta Fri Oct 09 09:22:42 2015 -0400 @@ -0,0 +1,574 @@ +>KT001911 +CCAGCTAAGAAAAGATTTAATATGATGTGCAAGTAAGGTGTAAATTGGCTGCGGAAACAGTCAACCTTCT +TCCATACAAGAGTTGAGTGCAAACAACTATTCATTTTGGTTATGTTATAGTCCTTGAAACAAAATACAGT +GCTAGGCTGCTTTCTTTATGAAGGTAGCTTTTTTTATTTGCAAAAATATATAATTGGTTTACATGTTGAA +CGAAAGGAGCTTAGAACATGGCTAGATTAACACCTAAGCAACAAATGTTTGTTAAAGAGTATCTAATTGA +CTTGAACGCAACACAAGCGGCTTTACGTGCTGGCTATAGTGCAAAGACTGCTAAACAAACAGGCACAGAG +AACCTATCTAAACCTATCATTCAAGCTGAGATACAGAAGCACATGAACAATAGGGCTGAGAAGATTGACG +TTAGCGCTGACCGCATTTTACAAGAGTTGGCTGCTATTGCCTTTCATGATGTAAATGAGGTTGTGTATGT +CGATACAAGGGAGTATGTGAGCGGCTGGAAGATTACTCAAAAAGAAACAGATGAACAACCGGAAATAAAA +GAACCTATGTACAGCACCGCGCAAATGGTTGTTGTAAAAGATTTATCGGAGCTTACGCCGCTGCAGCGCA +AAAGTATTGCCGCTATTAAGCAAGGTAAAGAAGGTATTGAAATAAAGTTTCATGACAAGATTAAGGCTGC +TGAATTACTCGGCAAACATATGAAACTATTCGCTGATAAGATTGAACACAGCGGAGAAATTACTCATAAT +ACAGTAGATTTGAGCGGGCTTTCTACGGAGGAGCTGAGAAAACTTGCTAAAATTGAGTGAATCACAACGA +ATTGCTGTTGCTATCGAAGCACAGAAGGAACTTGCACGCCGTAATTACGGTGACTATGTTACTTATGTTC +ATCAGGGGCGCTATGTACACGCAAGGCACACGCTCTTTATTACCGATATTCTGCAGCGTGCCATTGATAA +CAAAAAGAAAATGCGATCAGGTGAAATAGAAACAGAAAACCAATACATCATGATTAATATGCCGCCGCGT +CATGGTAAGTCAATGACAGCTACGGAAACATACCCTAGCTATTATCTTGGTCACTTTCCAGAGGATAGAG +TTATAGAGATAAGCTACAATGATACCTTTGCAAAGAAGTTCGGTAAGAAGAATAAAGAGAAGGTTAGGCA +GTTCGGCGTTGATTTATTCGGCGTGAATGTTTCTAAGCGAGCTTCTGCCACAGATACATGGTATTTAGAG +AATGAAATAGGCGGTATGCTTTCGCGTGGTGCTCTTGCTGGTATCACTGGCGAAGGGGCAGACCTCATGT +TAATTGATGACCCAATAAAGAACAGGGAAGAAGCTGACAGCGAAACGCACAGGGAAAAACTTTGGAATGA +ATGGGTAGATAGCTTTTCTTCTCGTTTACACCCCGGCGCTATTGTCATTATCATTCTTACACGTTGGCAT +GAAGATGACTTACAAGGGCGCTTACTATCTAAAGAATATGGTGAACCGCTGCCCTGGCAAGTGTACAATT +TCCCGCTAGAAGCTGACGAGAAACACGTTAACGAAGAAGGCAACCAGCTCAATAGAGAAATAGGCGAACC +ACTTTGGCCCGAACGTTACGGCAAGAAGTTCATTGAACAACGTAAGCTCTACCCTTCTTCTTTTAATTCA +CTTTATCAAGGTAGACCAACAGCGGCAGAAGGTAATATGCTTAAAAGGCATTGGTGGAACTTCTATGATG +AGTACCCTATTGTCGCTCAGGAACTTATTTCGGTTGATGCCACGTTTAAAGATAAAGATGATAGCGATTA +TGTTTCTATTCAAGTGTGGGGCAAGGTTGGAATGGATATGTACCTAAAAGACCGCATTAAGGCGCGTATG +AATTTCCCCGCTACTTTAAAAGCGGTGCGTAACATGATTAAGCGTCACCCTGCAGCAGTTATCCGCTTAA +TAGAGGATAAAGCAAACGGCACAGCTATCATATCTATGCTACACAGGGAAATAGGCGGTATAATTGCAGT +AAATCCGCAAGGCGGTAAAGTCGCACGCGTTCAAGCTGTTTCTCCTTTTATTGAAAGTGGTAACGTATGG +CTACCAAGACACGAGCCATTTACACAGGAAATCATAGAAGAAGCTGCAGCATTTCCGAATGGGGCGCATG +ATGATGATGTGGATTCGATGTCTCAGGCGTTAAATAGATTCATCTATCACACTGGCGAACTACCGGAGCC +GGAAAAACCACCATTGCCGCAAGCGTTCCAAACTAATCACGATGAGGAAGGGGATTTTTTAACATGGTAA +CTGAAATATTATGTGGAGTCAGTGGGGTTGCTATTGGTTATATTGGCTATTTAATTGCGACACTTAAAGC +TGCAAAGAAAGAGAATCAACATGACCGCCTATACGACAATTTGCACACAAAATATACTAATTTAGTTAGT +GAAGATGTGCAATTGCAAGCGGATTATAAGCAATTGAAGGCAGACTTTCAACAATTAGCGGAGGAACATG +CAGCAAGAAAAGAAGCTAACTCTAAATTAGCTGCAGGCAACAACGCTATTGCTAAGGAGTACCACGATTT +AAAAGCGAAATACGAAACGTTAAAAGAGAATCATGCGCCGTTTGCTGCTTTAAATCCATTTGAAGCACAA +GCTATGCACGCTATGGCTAGTCAATCGGTAGTAGACGAATGGTTAAACGGAGAAAAGGAGGTTAAATAAT +GGCTAAACAACAACAGCAAGCCGCTGCAACAGGTAGCGAACCGAAAACAGTCATGCCGCCGGAACAAATG +GAGCTCATTTCTCAACGTGCTCAAAAGGTTGAGAAGGAGTATAAACAGTCACTTGACTATAAGCGGTCAC +AAAACTTCCTTACATCATGGGCTACATACGAGAGATTCAAGGCAGGGGACCAATGGCCCGCAGTAACAGA +ACGTACAAAGATGTTACCGCGTCCAGTGTTTAATATCATTGAACAAATTGTAGGGCATAAAGTTGCAACG +ATCATGAACGAAAATATTAAAATGGTCTTTTCTGCTTTAGATGTTGACGAACCGGACCAAGATAACCCGG +AGCTTCAAGGGCAAGACATTGAACAGTGGGAAGGCGCTGACTTATTCAGTAAATACAGTGATAGCGTATG +GGAGCACATTAAACAAGATATGCTCAACGAAGAAATGTTAGAGAATGCCGCCGCTGTTGGTAGTGGCTTC +ATTCACTACTATTGGGACCCTAATGTAAAAGGCGGTAACAAGCTGAAATACAACGGTGACATTAAAGGCG +AAGTAATTGACGCGGTTAATTTCTTCCCTGGCAATCCGCAAGTTGCTGACGTTCAGAAGCAACCATATAT +CATTATCACGAGCCGCGAGCTTGTAAGTGATGTGAAGAACGCTGCTATTAATAACGGTTTGCCGCCTGAG +TATGTCGATATGATTAAAGAGGACAAAGAAACGCAAGACCAGGCATACGATATGGCACAGAATGAACAGG +ACGGAGATAGCAAGATTACTGTATTAACCCGCTATTATAAGAAGAATGGTGAAGTACATTTTGTTAAAGT +TGCAGCAGGCGTATTAATTAAAGATGAAACGCCTATGGGCTTTGAACGTTACCCAATTGTTATGATGAAC +TGGAAGCGCCGTAAGAAATCTATTTTCGGTGTTGGAGATATTGAGAGCTTAATTCCCAATCAAAAAGCTA +TTAACTTCTTAATGGCTATGCAGCTTCTTTCTGCTCAATTAACAGGTTGGCCGAAGATGGTCGTTAACCG +CTCATATGTTAAGCAGCGTATTAAGAATGAGCCGGGCGAAATCATTTATACAGATGCACCACCGGATAAA +CCGAACAGCGGCATTGAATATATGAATCCAGCTTCTATGCCTTCTCATGTGCCAGAGTTAGTTGATAACT +TTGTAGGATATACGAAGGAAACAGCGGGCGCGAATGAAAATGCAATGGGTGAGAATAACAGCAGCGACTT +GAACGCTACCGCTATTATTCAATTACAAAAGGCTGCAGGCATTCCGCTTGAATCAATTAAGCGCCGCTTC +TATCAAGCTATGGAAGATGTAGGTTTGATATGGATGCAGTTCTTTAAAACAAAGTACAACACGCTACGAA +TGATTAAGCTACAAAACGATGAGGGCGAAGAATACCACCAAGAGTTTCAAGGCGATGACTATGCAGACGT +AGACATGCGCTGTAAAATAGACATTGGTCCTTCAAGCTCATACAGTGAAACGTTAATGATGTCTAGTTTA +GATAAATTCCTAGATATGCAGTTAATAGATTTCCTCACGTATCTTGAATTAGTGCCGAAGAATGTTGTAC +CTTTTAAAGACAGGCTCATTAGAATGGTTAAACAAAAAATGCAGGAACAGGAACAAATGGGAGAACAGCA +ATTCCAGCAGCTCCTTGAAACGATGGACCCTGCAGAACAAGAAGCCTACCTTTCGGCACCGCCGCAATTA +CAGGCGCAAATGAAAGCGCAAATTATGGGCGGTCAAGAAGGACAACCACCGGGCGCAGCTCCACCAGCGG +GAGGAATGCCACAAGGCGCACCACCAGCACCAGGAGGAATGCCACCGGGAGGACAACCACCAGCGCCACA +ACCAATAGGCGGGTAATTTCGACATAAGTAAAATTTATATATATCATATCTCGACCTGAGCAAGTCGTTA +AATCTACTCATATTTTCCCAACCATAGGAAAAGGAGTGTTTCACAATGGATAACGAATTAGCAGGCTTAG +GCAACCAAACCGAAGCGGCAGGCGGTCAAGATAGTTTTGACCAACAGCAAGGATTTGAAGGGCAAGAACA +GCAACAAGGATTTGAACAGCAACAGCAGGGCGAAGCTCCACCACAAGCAGAGCCACAATATTTTAATGTT +AAATACAACAAAGAAGAAATGCAGATTCCTTACGACCAAGCACCGGACTATATCCAAAAAGGATTGAATT +ACGATAAGCAAGTTGAGCGCCTAAACACCTACCAAAGTGATTTAGAGCGTGTTGCGCGTGTGTCCGGTTA +TGGTTCAGTTGAGGAAATGCGAGAAGCATTAAGCCAACACGAACAAGAGTTAGAAGCTGAACAATGGCGC +GAGCAGGGAATTGACCCGGACGCTATGAACAAGTTCCTTGAAAATCACCCTGACATACAATATGCGCGCG +AAATGAAAGCGCAGCAAGCGGCACAACAACAGTTTGACAAGTACGTTTCTGAGTTTCAACAAGCTCACCC +GGACGTAACGCCAAACGATGTAAGCCAAGAAGTGTTCAACTTAATGGACGCGCGCGGGCTATCTCTTACA +GAAGCATACCGCATTCACAATTACGACCAATTAGCTAAGAGCGCCCAACAAAAGGCTATCAATAGCTTAA +ATCAAAATAGCAGCTCGTCACCTGGTTCTTTAGGAGCTGCGGGGGCTGAACATACACAAAGCGTTTCAAG +TATGTCATCGGCTGACTTTGCTAAAATGATTGCACAAGTTAAGGCTGGTGAACGTACTTCATTTTAATTA +AAAAGGAGTGCATGAGCACATGGCTACAAACGTACAAGGTTATAACGCCACTTCCGGCGTAAACGCGTTA +ACAGCAGAACAAGCAGAGTTTTACAACCGTACAATGCTTGAAAGATTAACACCTGAGTTATTCTTCTTAA +ATTACGGAGAAAAGAAAAACATTCCTAAAAACAGCGGTGCAACAACTTCTTTCCGCCGTTTAAACTCTTT +AGCGGTTTCAACTACTGCTCTTACTGAAGGTGTAACACCTGATGGCGTAGATTTGAACATCACTAAAATT +ATCGCTACTGTTCAACAATACGGTAACTGGACTAAAATTTCTGAGTTCATTAACCTTACAGGGTTAGACC +CGCTATTAACTGAAACTGCTGAGTTAATGGGCGAAAACGCAGGCGAATCTATTGATACAATTTGCCGCGA +TATGATCTATGCAGGAACTAACGTACAATACGCTGGCGGTAAAACTGCGCGTAACTTACTTACTGCTGCA +GACAAAATCACAGCATTAGATATTCTTAAAGCTCGCCGTACTTTAAAACGTAACAAGGTTAAACAAATTA +GTTTACCAGGCGGCGGCAAAGGTTACTTAGCTTTCATTCATACAGACGTTGCAACAGACTTAATGCAAAC +GCAAGAATGGAAAGACCAAAATACTTACGTTGATACTAAAAACCGTCAAGAAGGTATTTTAGGTAAAATG +TACGGCATCTATTTCTTAGAAGCTGACAACGCTATGAAATGGGCGGGCGCTGGTGCTTCATCTGCTGACG +TATTCGGCACGCTATTTATTGGTAAGGGCGCTTATGGTGTACCTGACGTAGCGGGCAGCTCTAAGCCTGA +AATGATTGTACACAAAGCAGGAAGCGGCGGTACTAATGACCCGCTTAACATGTTCAACACTGTAGCGTGG +AAATGTGCTCTTACTGTAGCTCGTTTACAGGAACTTGCTATGGTTCGCCTAGAAACTGGCGCAACAGTTT +AATAACTTAATAGGAGCGCTTAAAACCGCTCCTATTTTATTTTAATTAAAAAGTGGAGGTTTTATATTAT +GGCACCTAAAACAACTAAAACAGAGCAAGAAGAAGTCGTGAAAACACCTGAGCAAATCGCAATGGAAGAA +AAGACACTTGAAGCACAAGCGAAAGCAGAAGAAAAGAACTTCAAGCAGCAATTAAAAGAAATGCCTAAAA +AGCTTATTCATATTCCAGAGGACCCAAACAACCCGGACGATGTTGTTTCTATTACGTGGAATGGCGTAAC +TTATGCAGTACCACGCGGGCAACAGTTTGAGGTTCCTTATGTAATTGCTGATATTTTCTATGATTCATAT +AAACGTACTCAGGAAGTTAACAAGCGCATTCGTGAATCTACACGAAAAGAAATTACAGTCTTATAATTGA +GGTGATATAGATGGGCCGATGGGCAGCAAATGGCACATACGTAGATAATACGGTTGATGTTGCCGACATT +CAAAGCAGCGGGCTAGTGCCAACAGAGGAACAAGCGAAGTATACACCGCAGGAAAAAACGTTAAATGCCG +TTACTGTTACAGCAGGGGGAGCAACAAACTTTACGAGTAACATTGTTACTATGGACGGTTTTAACACTTT +AGGAGTAGGTTTAACAGCAGATATTTCACATTCGTGGAATTTAAACGTTTACTCTTCTCCTGACGGTACG +ACTTTAATTAGCCCTGCTTTTATAACGCAGTCTAGCACCAGCACAACAAAAGGCGGTTCGGGTACGTGTC +CTTTAAACTTTGCAGTTATTCAAATTGTAAATAATGACGCAGCTACCCGAACGTACAACGCGTGGTCTAG +GAAATTGAATTTATAGGGGGTTAATTAATGGCAACATTCATCGAAACTATGCCGAAACATGATGATGAAA +TGCTAGGAGAAGTTTTCAATATGTCTCCTATAGGTGAAGCAAACGGCGAATTTATTGATGGTTATATGAG +AACGGCTTTCTTTACCGCTCATTATGAGAGTATTGCAAACGCAACAGCAAGCCCGTTAACTCAAACGAAC +TACGAAGCTTTAAAGGCTATTAATAAGTATTGGAAAATAAACGCGATCAATTGGAGAAAGAACGGCGTGT +TTCCTGTTTACAACATTCCTGCTGATAAATTGATTGATGAAGAAGAAGCTTTCTTGCTTGAAATGTACCC +GCCACCAGCGGAAGAAGAACAACCTACAACAGAAGAAAACACAACGGAGGGAGCTTAAACGCTCTCTTTT +TTTGAAAGGAGATTTATATGTTATATCCTAAAAAGAATTTAATACCACCGTTAAAAGATTATGACTTTTC +AAAGGCTGGAAGTGTATATACTGCGCCGCCTGGTTCTTATTGGCTTTCCAGTTTCGCGCCTTCTCAAACG +GACTATGTAACATTCAAATCAGAATATTATTTTGAAACTACAGCTTCGGGAAACAATAGAGACGTTATTG +TATTAGTTCCCGCTAAACCTAACACAGCATATAAGCCTAGTTGTGACACTAATGCAGATATTCATTTGAT +GTACTATGACGATAAGCGTGCCAAAATAACACAGACTTACAATACAATAAGCGCGAACGTTGCCGGTGTT +ACGCCTGCCGGTTGTGCTTTTATTGGTTTTGTTTTAACAAACAGAGGACTAGGACCGGGCACATATTACT +TTAAAAACTGGCAGCTTGAAGAAGTTGCGACAGCTACAAGCCCGGCTACACCCTTCGAGCCGTACCAATT +AACGAATAAACGCGCAGCAGTACGCAAAGATATTATTGCGCCGGATATTCTAGGCACATCGCATAACTTT +GTTTCCGGTAACGTGTACAAAGTAAAGCAAGATGTACGTTTAACTAAAGCGAAATTTGAATCATTAACCG +CTGGTTCATTCAACGTTGCTATTTATGAATGGGTAGAAGGTACCGGAAAAGTAGGTAATGCACTATTTCA +AAGAGACGCAGACTACGGCACAGGCGTTTACTCTTACGATTTCGGCGGCATAACTCTTAAAGCTGGTAAG +TCATACTTTATCGGACGATATGACCAGACAAACGCTGCAGCTATCAAGCGGATAACAGGAGCATCAATAA +ACGTAGGGAATTATGTTGAATGGGTAGGCGGTACAACATTAAGTCAAACAACGATCATTTACCCTACTTC +TTATTATTCGTTCTTTGCTATCGAATTTGAATTGATTAAGCCGGCGGTAATGTCACCCGCTAAAAATTTA +TTGCCTGATTCTTCGGGGTGGGAAACTGGAAGTATTAACGGCGTTGACGGTGTTTTACTTGTGAACGTAT +CACGTTTAAGAACTAAGGATTTAATTCCGGTTACTCCTAATAAGAAATACAAATTAGATTTTAACCCGGC +TTGCATGTCAGAAGTTTATTTTTATAATGATTCCGGTTATGTTGGTAAACCTTACAACTGGAGCTACGGA +CCGAATGATATTAATGTTCCGTCAAATGCTACTTATATTCGCGTATTGCTTAGATACCCGAATGACAAAG +CACTTCAACCTAGTGAAATAAATATTATGGCTCCGGTTCTATATGACCCTAACATATTGGTTAACAAGCC +CGCTAAATTAATAAGCGATGGCGCTTTAAATGTTCCTTTAACTTCTGATTTATGGGTGCTTAGAAGCGGA +ACAACATATAAAAGATTTGAAGGGAATCGTGTTTACTGGAACTCTAATGCAGATTACGCAGGCATTCAAT +TGATTCTCGCAAACATGGGCTATAAAGACAGTGATTTTCAAGGGAAAGACATTGTATTTGGCGGAGACGT +TCACCCGCTGGCAACGGTTATGTTTTATTACAAAAAATCCGATGGCACACCAACATATATAGGCGTTTCA +AAAGTAACCGATAACGGCGCAAGAGCTATGAATATTCCTTATGGTTCAACAGAGCACCGCATATATGTAC +AAAGTGATGCAGGCGGGCGCGGTGAGTTATGGTGTGAGAATGTATATGTAAAATTCGGTACAGAAAAAGG +AATTAAACCGTACAATCCGACAAACAAGAAAGCTGTTTTATATCCGCAGAAGAATTTATTTACGTTTGAA +GGTTGTAAAATCACATCGGGCGGGGGGAGTTCTTTTACAGTTATTTCACCTAACGAAGTTATTGTGTCAT +CAGTTTTGAATGCTTTTACAGCAATAGAAACAGTGAAAATGACAGTTAAACCTAACACACAGTATACAAT +CAGTTACGAAGTGGAGCATATCACTGGAATTGACCCGCCGCGCGTATCGCCGCGAAAAGGTAGTGACCGC +TCAGGAATAACGCTCACAGATGGAGCGGGTTCTAAAACTATGACATTCAATACAGGAAGCGAAACAGAAA +TTTATTTCCTGTTATATGCTAACTTGGCAGATGTATCAGCACCGCAAAGCAACAGATATAAAAGGGTTCA +AGTTGAAGAAGGAACACAAACACCTTTCGAGCCGTACCGTTTAGGCAATAAACGAGCTTAATAAATTAAA +AGGAGTGGTTTAAATGCCAGTAATTAAAACAGCAGCACGCAAAATAGGTGATGATTGGGTAACTGAAATT +CACGATAGCGTGGGAACTGTCGAGATTACGTATACATTCTTAGAAGCTAACCAGCGCGATACAATGGATT +TTGCAAATTTAAGCGGTGATACCCTAACCTTAACGATAAATGCTACAGTAAAGACAGTTAACGCGTATCA +AACGGTGCGTGTTAACACAGAAAAATTTACTGCTTTTAAAGTGAAATCGAATAAGAGTTCTAGTGCTTTT +CGTGCTCGTTCTTCTTATGATGTGGCGGTAGCTCCTGCAAACTTAAATGCAGGAACGGCAACAACCGCAG +ACGTAGCAAACAAATTAAATGCCCTTATGGACCAAATGAAAGCTGCAGGGGTTATAAAGTGAGGTGTGTA +TATGAATCTAGGAGAAGCAAAAGCGCACGCGTTGGCTTTAATGGCAGAGTATTCGATAGACGGATTAGAA +ATATCGGACGCAGAAAACGCCGATTATTTAAAGCGTATGCCCTTATTTGCTCATGAAGCACAAATGGACA +TTTCCGCCCGCTCAGGTGTTACGGCGGTTATGTCCTTTGAGCTAGTGAAGCAAGATGACAAGAAGTACAA +TTACATTGCTTTACCCGCTGATTATCGCGAAATGAAGTATGTTTTCTGGAATGAAGAACTGTTCACAGGA +AACTATAGCATTTTAAACAATCAGATTCGCTTTAACGCTGGTTTTGACGGAACAATAGACCTTTACTATT +GGAAGTATCCGCAACAGCTTACAACGCGAACTGACGACAATTACGAATTTGAAATAGATAGGGAATATCA +CCATTTAATTCCTTACTATCTCGGCGGTAAATGTATGCAAGATGAAAACCAGGACATCGCAGAGCGTTTA +TTGAGTGATTACTATAATCGTTTGAGTGATGTTAAAGAAGCTCATGAAGATGGGCAAGAACGCATAGACA +ATATTTTCACTATCTTCTAGGAGGTGCAAACGTGCCAACAATTAAAGCACCGGATAAATTTTTTGGTAGC +AATGTTGTTACTGAATTTATCGACAGCGTGGGAACATCTGAAATAACATACACGTTTACAGGTGAGCCAC +GCGAAGAAATCAGACTTCAAAACCTCAGTACGGCAACGGTCATTTTGACTGTTGCCGGTCAAGAGGTAAC +AGCGGAAGCGTTTAGCTCTATAAAAGTTAGTGACTTATCCGTAATGGATTTTAAAGTAAAGTCATTATTG +GGCGGTGCTTCATTTCGTTTGACCGCTTCTTATGTTACGGAAGATGAAGAGGACGAAATTAAACTAGAAA +AAGAAATCTCTAACGTAAGAAACAAACAGAATAACAAAGATGTTGTTGTTGATTACAAGGTGGAAAAAGG +TGTATTAAAAAATGCTGCTTCACTGATTCAAAAAGCAATAGACGAATGCACGCCGGTTGGCTTATGGGTG +GTCATTCCTAAAGGTGATTACTATTTAGAAAAGTCATTGATTGCTAAGGCCGGTCTTAAAATGATTATTC +ATAAAGACGCGAAGCTGCTCCGCTATCATAACGATTGCATGGTTTTAAATGGCGTGCCTGGCGATATGGT +AGGGCAAAGTGATATATGGATTGATGGCGGGCAATGGGACTGCAGAGGGCATTTAATTGCAGATGATGGC +AGCGCCTTTGCTATGGGGTACGCGAAAAACATTACATTGCGTAACCTTAAAATCTATAATGTTAACTTCT +CTCATGGTATGGAAATCTGCGCGATTGATACGGCAGATATTGAGTTTTGCGAAGGGTACGGCTTTATTGA +CACTGGCGGCACTCGTACAACAGCGGAATTTATACAAATAGAACGCGGAACGCCTACCGGTTTCCCTTAC +TTTGGACCGGGTGACGGTACACCATGTAAAAACATTTACGTTAAGCGGGCAAAGATTGGACCTAGTGCCA +ATGCTCCTTCTTTCAATGTTGGAGTTGGTTCTCATGACAACATCATAAACACTGGCGCTATCGGCGTTCA +TATTATTGATTGTGATTTTTCGCAAGCAGTTAAAACAGGAATGCAGCTAAGAGGACTTAGAAACACAGTT +GTTGAGCGTGTAATTGCATACGGTGAGAAAGGCGTAGAGATTGGACACGATAACGCAACAGAAACTAATG +TCCTTATTCGTGACAGTGATATAAAAGGCACTCTTACAAGCGGCATTACACTAGATGGCGTAACAAAGCT +TGTTATTGAGCATACCAAAATTGACGGATATACAAACGGCATTTACGGTTTGCGCTCTAAAGATATTGAC +ATTGATAAAAAGTGTGACATATCCGGGCAAACAAGTGACGCGGTGGCTATCATCACTAACTCATCTAACG +TATCGGTTGCCCGCTGCATTATTCGTAAAGCTGGTAGACACGCGTTTAATATTTATGACAACGCTTCGCA +CTATCGCATAAAAGAAAACACAGTAATTGACGTTGCAACGAACGTATTTAACTTAGCAGGCAGCAATACA +AAACAAATGCACATTCGAGAAAATACGGTGTTAGATACAACTTTAACAAACATCGTGAACGCGAGCGCCG +GAGTTGATAAACTATTCTTTAAAGATAATGTTTACCCTGCTTCAATCGCTACGCCTATTGTATCGTCTGC +TACTAATAGTACAGTTCTAGCGGCTGATAATATAACATTCTAGGAGGTGCGCTAATGCCTACAATTGATT +TAACCACAGCAAGACAGCAAGGGAACGAAGTTGCATTAGACTTCCTTTCCAGCGTTTCGAGTACCGGGGA +AACTTATGTTTTCCCTGACTCTTATTACGGCGATTCACTCAAAATAGAAAATATGTCTAGTGCTGACATT +TATGTGTCGGTTGGTTCGGTAAGCAATCAGTTAGTACGAGCTTTCGAGAAATATAATTTCGGTAATGAAA +AGTTCAATCAATTCTTTGTGAAAGCTGCTGTTGGAATGGGTTCATTCCGCGTGCGCTTATCACACTTTGA +ATATGACGAGCCGGACGAAAAAGGACTAGATACAAAGATTGAGAAGGCAAAAAAGGTAGGTTCAGATGCT +TCATTCTTTTGGCTTCCACCTACGCAACCCGGCACTAACTGGGGTGAAAATGGAGTTCCGACAAGCAAAG +ACCCGGAAGGCGTTATTAATGCCTTATATGAGCCTTTACGAGCTTATGACCCTACTTACATTAAAAGATA +CCTTGCTGGAACTTCTACCGTAAATAACAGTAGCCCAACAGACACAGGCGTTTATAACATTTACCGCTAT +GAGTTCACGCCTGAGAACTACACAAAAACAATTATCTTGTCGAGCGGCACGCATGGAAATGAGTATACTG +CCTTCTTTACACTATGGCGTTTCCTTAATCATTTAGTAAGAGATTGGGAGATATACCCGCAGCTAAAATA +CGCTAGGCAGAATGTGCGTTTCATCATAATGCCTATCAATAATCCCTGGGGCTTTAAAAATGTTAAGCGT +CAAAATGCTAACTTAGTCGATTTAAACCGTAACACTGATTATCTATGGAACTATATTACTAGCTCCAAGT +TTCAACCAGGCGGCGCGAACTATAAAGGACCTTCGCCGTTCAGTGAAAAAGAAAGTCAAATTTATAGAGA +TACATTAAACATGTTCCCTGACGCATTAGCAGCAATTGACTTTCACACGATCATTACCGTAGCTGCAGAA +CACATTGTTTACACGCCGCGATACATCACGCAAAACAGAAGAATTTTCAATGATGTTATTGATTGGCTAT +ACAAACAAGGCAATCGGATTGTAAATGGTACGTCTGCTGTCCCTACACTTTCATGTTGGGCCGCTTCTAC +TCATGGCATGACAGTAGCAAACCCGGAGTGGTTCAACGGATTGTACGGAGCTAACCGAAACAGTACAGAA +ATGACGGAGTGTTTAAAGTTCTTTGGTAACGTTGCTTTACAAGCGTGTACTCTAACGCATAAGGCAAAAG +ACAACACTAACCGGGAAAGAAAGTCGGCGTGGTTGATGTACGATAAAAAGACCTCTCCTACTCCTTTAGT +GCTTACGTCAACTATATTCAGTAACTTTAAACTTGTTTATCAATGGGAGGACATTAAGCGTCATGGTGTT +TTAAGAGCAGAAGGGCGCGTAACATTTACTATTTCCGCTCCTTGTACTGTTTCTTTTAATCCTACTGTTT +ATCAGTCCTACCACCCGGAAATGAGTTGGACGAATACAAAAGATGCTGATACATTCACAGTTTCGGAAAC +ATACGCGGCTGCTGGTACATATTCATTACCGCTAAAAGCGTTTATGAATGTTTTCCCCACGAACTACAAC +GAAACTGGCGCAGGGGAAACGCAACGTACTGCAGAAGCTAAATTTCGTCTACGTGGTAAGAGCACAGCGG +GAAGCATTACAATTGAACGTGCAAGGATTGAATTGTCATATGAACAAACTGACCAGGGCATTCCGGTGAA +ATATGTTAATTACACAGGACTTGAAGCAAGCCCGGAAGGTTCCGACTTTAACGTTGACTATCCGGACCCG +GCTAAGTTTGTAGATGATATGGCAGATGATGATTAATAAGGAGTGATTAAATGGCGCGTCCAAAGATTCA +AGAACGCACGCCTGACTTGCTACGCGTTGAGCCCTTTTTAGGGCTTAACGTTTCGCAAGCTGCAGAGCAA +ATTAATGACCACCAAAGCCCGGACCTTTTAAACGTGATTGTTAGTAAGACCGGGAATCTTGACAAGCGAA +CAGGATATAAAAAAGCTTTTACAACTAGCTTAGGCAGCGGCAGGATAACAGGAATGTACCTATATCGAAA +GATTGATGACACGAAGGTATTTCTATTCGGTTGGGACACAAAGCTTTATAAACTAGAAAATGGTGCGCCT +GTGTTGCTATCCTCCACGTTCAGCGGTAACGAACTTTCATTTTTCGTCATGAATAATAAATGCTACATTC +AGGACGGAACGAAAATGCAAGTAACTGACGGAGTGACAGTAAGTGACATTGTGCCTTATATCCCTACTGT +TTCAATCAGTAAAACGCCGCTTGGTGGTGGTACACCTTTTGAGGACTTTAACCTATTAGGCGGGGGCTTT +AAAGATTCGTTTAGTGGTGATGGTACAGCGAAAGATTACCAGCTTTCTTTCAGTGGCATTGATGCGGATA +AGGTAACAGCAACCGTTGACGGAGCTAATAAGGTAGAGGGTACAGACTTCACCGTAAACCGTACAAGCGG +AAAGGTTACTTTTACAACAGCTCCAACAAAAGGAACGAACAACGTAATTATTACCGGATATAAACGCCGC +CAGGACTTAGAAAGAAAAATCCATAAGTGCCGCATAAATGTTTTATATGGTGGAGCGAATGACACGCGGG +TTTTTGTTGCTGGAAATGTTGACTTACTTAACGTGATGTATGGCAGCGGTGTGAATGACCCGACATACTT +TCCAGAGAATCGCTTCTATCAGATTGGTGCTGACAGTGAATACATTATGAACTTTGCTAAACAGTTCGAC +ACGCTTGTAATTATTAAAGAGCGTTCTATATGGGGTATGTCATTTGAATTAAAAGATGGTGTGCCTAGTT +ACCCTACTAAACCGCTAAACGATACGACAGGGGCAGTATCACGAAATAGTGTGCAAGTATTAGACAACAC +GCCTGTTATGTTTAACGATAAGGGCGTTTTTTCTTTGACTTCTTCCAACGTTCGTGATGAACGAAATGTA +TCTTTAATTTCTGAGGATATTAACCCAGCGCTTCTAGTTGAAGCGAATAAACAGAACGCGAAAACAATTG +ATTACGATAGAAAATATTTTCTTGCTTTAAACAATCGCGTGTACGTGTACGATTATGATATTAAATCATG +GTATCAATTCGACAACATTAACGCGTGTAATTTCCTTGAAGTAGATGGACGTTTATATTTCGGCGCATTA +GATAAAGGTATGATTTACATGTTCATGAAGCCTACTGACACATACCCATACAACGATGACGGAAAAGCGA +TCAATGCGTACTGGAAATCTAAGCTGTTCACTTTTGATGCTGACGAACTAAAAAAGATGGTTGATAAAGT +GTTTTTTAGTTTGAAAGTCGGTAAGGCTTCAAGTGCTGACCTCTATTACATTACCAACAAGAAATATAGT +AATCTAATAAAGAACGTTGAAATCAACGGTTTTATGGATTTTCGTTTTCTTGATTTCAACAACTTTACCT +TTAATACTTCCGCTTTTCCTAAAGAAGCAGCGGCAAGGATTAAAGCGAAAAAGATTACACATTTTCAAAT +TCTGTTTAAGAATGACCGATTGAACGAAGGAATGGGCATTTCTTCTGCAGCAATTAAGTATCGTTACATG +AGCTATATTAAGTAAAGGAGTGTAGAGAATGGCACTAGGAAAAATCAACGGATTTACTAAGCGTGTTGGT +GATTTACCGGACGTTCCGCAAATGTCCAGCGCTGAGTTGAAGAACTACTTTGATTCATCGCCTGACGAAA +TTAAAACAGCTTTCAACGCTCTTATTGACGCATTACAAAGTACAGCGTCAGGCAATAGCGGAGCTTCAAA +CATTAAGCTTGAAACAATTAGCGGCTTAACTGCTGCAGATGTACAAGCAGCTATTAAAAGTTTATCCGAC +AACAAAACAAATAAAACCGGGGACCACGCCGGAACATGGGCAGGGTATACGCCTAGTAATTTCCCGCTTG +CCGTTACGCGTGACCAAATGTTTATCATCGCAGAAGCAGATACCATTTACAACGGTCAAAGCGGGGAGCG +TTACCCGCTCGGCTTATCGCTTATGACTATTTCCGGTTCTCAATGGGCATATCCTGAGAATTACGGAATG +GTTATGACATACAAATTTTCAAACGTTCGTATGACACAATATTTTCACCAAGTAGCAGGCGGCTTAAATG +CTTACTTCCGTCATTGGACTATTGATAATGGGTATACAGCATGGCAGAAACTAGCGACTGATAACACCGT +TAACGCTGCTATCGGAGCGGTTGTGAAAGGCGGCAAGATTCAAGCGGGCACAATTTCTTTTTCGCTTGCA +GCTTCCGGCAATACATCAAAAACAATTTCTTTCCCCGAAGCTTTTTCAACCGGTCCGGCTGTTACTGCTT +CCGTTCGTAACTCGTCTAACCCGGAAAACTTTGGTGACTTAACTATTACCAGCGTTTCGTCTACCGGGTT +TACATTAGTCGGACGAAATAACACCATTAGCCCGGTTACAGTTAACTATAGCTGGATTGCAATGGTATAA +GGAGGTTAAAACATGAGTGTGATTATGCACGATATTAAAGCAAATAAAGAAACATCACTTTCAACAATGC +AAATGCGTATTGAAGGAAATGAAATCATTATTATGCCTGGCATTTACTACAACCAAGATGAAAACATTTT +CGAGCTATCAATTGAAAAGCGGTTCACTATTCCGCTTGAAGCTGGACATTATGAAGTTTGGATTTATCCA +GCAGGAGAAATGAAGTTAGAAAAGAATTTTCATGTAGATGAGCCATATATTGATATGCTGCTATGGGTTG +AAATGCCGGAGGGGGCAAAGTCTCTAGCAGATGCAGAGATTAATTTTAAGCGCTTTTTGGAGGTGGTTTA +ATTGGCTTCTATAAAAATGGGTGATGATTTTTACCAAGATGAAAAGGGGCGCACGTATAAGCAGAATAAA +TCGACACAGTATAAACGTGTTTACCAGGATTCAAAATATTTAGGGCAAGGCATGTGGAAAGATACCAAAG +ACCGCTTATACAAAGCGGATAAAAGCACGAATTGGCAGCGCCAATATAACGTGAGTAAGAACAAGGGTAA +CTCATATACTCAAATTGGAGATAACCAATACGAGCAAGCAAACGGCGGCATTTTCTCTTTTGAAACTGGC +TTATATAAAGAGAATGGTGTTGAGAAATACGGACAGCACCGCGTATACAATGACCCGCGTAAAAAGCTAG +AAGATGATATTAATAAAACGTATGATTCGCAGCTAGCCGATTACCGCATGAAACGCGATAAGGCAAAGAA +GGAAGTTGAAGGACAAAAGAAACAAGTAGGGCAACAGTTTTACGATCAAAAAAATGCTGCCGATGTAGTG +AGCCAACAGAACGCGCAGAAGCTCCGCGAAATGATGGCGGCTAACGGATTAACTAAAACAGGCGAAAACG +TTAGTGCTTCAGTAGCTCAGGGCAACACGCGACAAAACGCGTTGAATACTCTTTCTAAAGAGGAATCGAG +CCAACAAGGGCAACTTGACCAGCGTATTACTGAAATCATGGACCCGGCGCAAGAAAAGAGTATTGAAGCA +GCACGAGCGGAAGCTCTCACGCAAGGTAAGCAATGGGCTGAGGACCAATTCCAACAACAAAAAAACAACT +GGCAAAACCAGCAATTCCAAAACATGCAATTCCAATGGCAGCAACAGCAAGCTAACCAGCAGCAAAGTAA +CTGGCAGAAGCAGTTTGATGCTACTAATAGCCAATGGAATCAGTCATTCCAGCAAGGAAACAGCCAATGG +CAGCAACAATTTAATGCACAAAATAGCCAATGGCAGAAGCAATTTGAATCTAGTAATTCTCAATTCAATC +AAACTCTTGCTTTCCAAAAGCAACAATGGAAAGAACAGAATGCAACGAACAAGAGCCAATGGCAAGCTGA +ACAGGATTGGAGAAAGTACACTTATAACAATATGTCTGCTTCTGAAAAGGCGCAGCTTGATTGGAATAAG +AAACAGTTTGGCGATGAAATGGCTTGGAGACAGTACGAACTTAATTACAACGGTAACATTGCTATGTCAC +AAGCTCAGGCTCAAGCTAGTGCTTATGCAGGTATGGACGGTTCTAGTTCGGGTTTTCTGGGGTAGCCGGA +GGGAGGGCGATACTAGGCGTTTCCCAAAAGTATCTTAATGGTGGTAGTAAATATGTGTTCGGTGGTGGGC +GTTCTGAAAAGGACATCGCCGCCGGGCGCTTTGACTGCTCATCTTATGTACGTTGGGCTTATAGCCAATT +AGGAATAAACTTAGGACCATTGACCAGCACTTCAACAGAGACATTGAAAAATAAGGGAACGGCAGTAAAA +GGCGGCATTAAAAACGCTCAACCCGGCGACTTACTTTTCTTTGATACATACAAGAAAAATGGTCACGTTG +TTATTTATCTCGGAAACAATCAATTCATTGGTGCTCAGGGTAAAACAGGTGTCGGCATTGTCGATATGAA +TAGCTCTTACGGTAAATACTTCACGAAACGTTTTAGCGGCAATATTCGCCGTATTGCTGGTGGTGGAAAT +GTTGGGGCTGCTCTAGGTGGCGGCGGTGCTGTCATGAGTGGAGCGGGTACAGGTACAGCATATAGACAAG +CACCTTCTAACTTAATGGGCCCGATTAATAACGCGGCTAAACAATACGGTGTAAATCCAAACTTAATTGC +TGCTATTATTAAGAAAGAATCAACGTTTAAAAGCGGCTTGACATCTTCCGCAGGGGCTAAAGGCTACATG +CAATTAATGCCTGCTACCGCTCGTGCTATGGGAGTTAAAAACCCCTGGGATACTCAGCAAAATATTAACG +GCGGCACAAAGTATATAGCGCAGCAGCTTAAAACTTACAAGAATAACATACCTCTTGCGTTAGCTGCTTA +TAACTGGGGACCGGGCAACTTGAATAAAGCTATCCGAAAAGCTGGCGGCAGCAAAGATTGGAACCAAATA +CGCCGCTTTGCTCCAAAAGAAACGCGTGATTATGTAGATAAAATTATGGGTTGGAGGTAGATTAAATGGC +GTATAAACCTTATAAGTACGATGAAAACGCAGGGCAAAAGCGCATTGATGAAATGTTTGGTAAGGGTGCT +TACAATGCGGGAATGAATCAAGCAAAGAAAATAGGTTACTGGAAAGCGCAGCCCGAAATTGAAAAGATGA +AATGGAAGCAAAGACAAGAAGCTTTCAAAGAAGCGGAGCGCCAACGAAAAGAAGCAGAGCGCGAAGCAGA +ACGCGAATATAAGGCGCGTGTAGCTGCAGAGAAAAAAGCCAATGCAGAAAAGTATCGTATGCAAGAAGCG +GCTAAGAAACAAGGGCGGGGCGGCGTAATGCCTTCCCGCAAGCAAGTACAAAAAGAAGCGAAGATACAAG +CTTATTACAAGAAACATGGTAAATTCCCTAAATCTATTCAAGATGAATTAGACAGTATGCCTACCCTTAG +CAAAGCTCATATTGACGCGGTGCATAAAGGTAAAAAGAGCAAAGGGGGAAAAGGCAAGGGAAAAAAGTCC +AAAAAGAAAAAGGGCTTTTTGGAAAAGGCGGGTTCTTTTCTTTCTGACGTTGGGCATGATGTGGGTAATT +CGATCAAGAACGAATTTAAAGCAGAGAAGAAAAAAGCAGTAAGCGGCGCTAAAGATTTTAAATACGCTTA +TCAAGCTCTTAACCCTTTCGATAAGGTATCAGCTAAAGAAGCGAATGCGAAATCTAAAAAGAATCATCAG +AAGCTCGCTAAAAGCAAAGCGGTTAAAGAACAAGACCGCACAACTATGCGAATTGCAGACAGCGCAACAC +TAGGGCTTTTATCTAACGCTCAAAAACGCGTAACAGGTAAAGAAGCTGCTTATAAATCAAAACGAAAAGT +CGGTAAAGGTGGAGCAACTGACTTTATAGCGGATTCACTTGGAATGCTTGCGCCGGGTGGTGCTTCTTAT +AAGGGAGCAAAAGCAATCGGCAAAGTTGCGGAAGCTGGTAAGCTCGGTAAAGCCGCAATGAAAGGCACTA +AGTTTGCTAAAAACTCAGGTAAATTTAACAAAGAAGTTCTACGTGGTATGACTGCCGGGGCGCTATACTC +AGGCGGTGAAGTCGGTATACGCGAAGGATTAAACGGAAAAGATTATAACTGGAAAGAGAACACGCGTGAC +GCTGCATTAAATATGCTCGTCGGTGGTGTTGCAGATGGTGGAGGGCATTTACTAGGGCGCGGCTTAAAAT +CGCTTATGAAGGGAAATAAAGCGTCACAGGTACAAGGTGCTCGAAACGTTTTAAATGATGACCCTTTTAA +CCTTCAACGTTTCAACGGAACGAAAAGAGAAAGTGTAAAAGGCACGTTTGATGGTCAGAATATTGTTGAC +AGAAACGCGCCACGTTTACCAGCTCCACAAGAGGAAGCAATGAGACGATTGAGCGGAGCAACAAAAAACC +CTATGGACGATGCGGTAAGAGGTTTAAACTCTCCTATTGTTCGAGACAATGCAGCACGTTTCAGAAAGTC +GGTTGACATTCAAGGCACGCCGCAGCTTAACGAGCCATTAGGACAAGGCAAAAGCTCAGAGTATTGGAAG +CAGCAATTAGACGATTTACAAAGCGGCACGCCTAGCGATGACACGTTAAAAGAATTTAACGATATGGTAA +ACAAACAAGTTGACTATTTAAAATCTTCTCTTGCTAATCGCGGCGGGGTTGAAGTTGGCACAACAGATAA +CGGCATGGTGGGCAATCATCGTGAAGTTACTGGACGTTATACAGTTTCTAAAAACCCTGGCTGGTATCAA +GATTTCTTTAAACAAAATGGGCGTGCGCCTAATCAATCAGAGCTTAAAGACATCGCAGCAAAGCAAGTTA +TGGACGGTTTTAAAGATGAATTTGGAGACGTTCCGCAATGGCAGCCTAAAGCATTAGATGACTTAGACCA +ACAAAGAGCTGACGTTGAGGAAGCGCTTGGAGGTTCAGAAGGGCGTTTTCGCGAAGCTGACGGAGTGGAC +GAAGTTCTGCGGGCCATTGATGAGCAAAAGAATAAAATTTATGCTGATTATGAAAAAATCCTGAGCGGCA +ATTTCACTGGAACACCTTCACAGAAACAAGCTATTCAGAACTTAATGCAGCAAAACCCGGATTTCAAAGG +CATGACGCTAGACCAATTGCAACAGCTTGCTAACCCGCTAGAAGATAGCTTAGATGTAAAGCCGCTGCAG +TTTAAAAAATCCGTTCAGAATCGCGGCACTAAAATTGTTAAAGGTCCTGACGGTAGACCGATTGTAGTTC +CTAAGTATGAAAAGGACGATTTCCTTGCATACACCGGAAACATGAACCCTAACCAGCGTGCAGCTCAACG +AGTAGAAGGGAACTTCACTACTAGCCCAACGAATGACGGTTTAAAAATTAAGCAAGACCAACCGCTGCCA +TTCATGAAGCAAGAGCCAGCTTTAAACTTTAAGAAAACAATTCAACAAGAAATACCGCGAAAAGATTTAA +CAGAAGTGCAAACGCAGGACTTAGCGCCGGACGGTTCACCCGCTGCTGGTGGATATGATTATAAAAACCC +GCAGTTCAAAACGCGTATGTTCACACAGTTCTTTAATGATAATGCTGACGGTCTAGCAACTGAAACAGGA +AAGCACATTAACCGCGATTCACAAGGCTTTTTATCTAAGCAAAAAGAAAAGATTCTTGACGCGACAAAAG +GTTTTAGAACTAATTTTATTGATGATTTAGCGCCGCTTGAAGCTCTCGAAAAGAAAATAAACGGCGGTGT +TGCTAGTGCTGAGGATTCTTTATACAAGACAGCGCGATTGTTCAGAGGTTCGCCACAAAGAGCGCACCAA +GTAGTTAGCCAGCAATTAGCTCCAATCATAAAAGAAATGAAAGAGCATAACATTAAGTTAAACGATCTTG +TTGACTATGCAACTGCTGTTCATGCTAGAGATTTAAACAGACAGGGTATTAAATCCGGTCTTAGTGATGC +AGAGATTAATAAGGACATCATTAACTTTGAATCGCCTAACATGGAACGCCTACGACAAAAACTTGTTGCA +GCTTCTAACGATGTCACGAAAAAAGAACTTGTTGACACAGGGGTTTTATCACAAGAAGCATTTGACGCAA +TGAGAGCGAAGCACCCTAACTACATGCCTATGTTCCGTCATTTCGATGATGAAAAAGTGGGCTTTCACAA +TGGTATTAATAGCGCTGTTGCGAATGCTACTAACCCAATCAAAAAAATGAAGGGTTCGGATAGAGATATT +ATTGACCCTATGGAAAGCATGGTAAAGAACATGTTTAACGCCGTTACACAAGGCGATAAGCAGCGTGTAG +CAAGTCAACTAGGTAAACTTGCAACAAAAGACAAAGAAGGCGCATTTGTTCGCCGTTTAGAACCTGGCGA +AGAAAAATCGAGACTTAACACCATTAAGATGTTTGAAGGCGGTAAAGAGGTTCATTATGAAGTGGAGCCG +GACGTTTACAAAGCTATGAAGGGATTAGATAGAGACGCAACAAACGCCGTTGTTAAAATCTTTGAAAAGC +CCGCTTCATGGTTACGTGCCGGAGCAACATTAACACCTGAGTTCTCAATGCGTAACTTTATGCGTGATGT +TCCTGCAGCGTTTATCGTTTCAGAATCCGGATTCAATCCGCTTGTTGATTTCCCGGTTGGTCTATGGCAG +TCTATGAGCTTGAAAGTAGGCGGCAAGACACTTAAAAACCCAGGCAAATTATATGAGCAATTTATTGAAC +AAAACGGCGGCTACGGTAACATTGTTTCTAATGACCGCGAGCTTCACCAAGAAGTCATTAAAAAGGTTAT +GAAAGAAGGAGACACGCCGAAATTTAGAAACATTGTAAATCCTAAAGCGTATTTAGATGTCTTACGCGGA +ATTGCTGACGTTTCGGAAAGTGCTGTAAAAGTCGGAGAGTACCGCGCAGCTTTACGAAAAGGCGTTTCAA +AAGAGGAAGCAGCATACAGAGCACGCGATATTATGGACTTTGCCCGCTCAGGTAACGGAATTAGAGAATG +GAATAAGGCAGTAGCTTTCTTGAATGCTAACATTCAAGGTAAAGACAAATTGTTACGTGCTGGTTTAAAA +AGCCCTAAAGACTTTGCAAGGGTAGCAACAAAAGCGGCTGTAGCTGTAAGTATTCCAACAATCGGAATTA +TTGCAGCTCAACACAAACTTTCCAATCCGGAGCAAAGAAAAGCAATTGATGACGCGCCGCAATGGTTAAA +AAATTCGTTTTGGTTAATGCCTATACCGGGAACGAATCAAGTAGCGCGTATACCTAAACCGTTTGACGTT +GCACCGTTCTTTGCTGACCCGATTGAAAGAGCTGCTGACTTTGCTTATAAGAACAACCCTAAAGCATTTG +ACGGTTATATTAAGCAAACATTCTCGGATTTATCTATCCCTGTTTTAATGAGTGGTCTTGTTCCGGTCCT +TGAAGGTTTTTCTGGACACTCTTTCTTCCGACAAGGCCCGATTGATTCAAGGGGCGATGATTACACAGAG +TTTCCCGACCATTACGACATTAAAACTAGCTCTACCGCTCGTGTGTTAGGTGCTGGAATTAATAAGATGA +CAGGCGGGGAGGGGCTATTTAAAAACTTCGGTTCGCCGCGTGTAGTTGATAACACTATCAGAGGTTTAAC +CGGAGGGCTAGGAACTTACGCCGTAGATGGTCTTGATGCTGCCGTAGTTAATCCAATTCTAAAAGCAACA +GGCAATCATGACGGAGTAACAAAGCCGGCTAAACAAATTAGTCAACAGCCTATAGCTCGTGCATTTTTAA +TGGACCAAAGCACATCAGGCGAGAGCATGAATAAACTATATGACCTACGCGAAAAGCTGCAGCGTCAAAG +AGGTTCTAAAAATCCATCGTTTGATGAAAGAAAGTACGACCAAGTTAAAGCCGGAACGCAAGCGGTAGGA +GACGTTACAAAAGAAATACGTTCTGTTCAGAACTCTACTACATTGACCGCTAAACAAAAACGTGACCGCC +TAGAACAATTGAACAGACAACGAAACGAAGTAGCTCGCCAAGCGTGGAAATCAATTGGAAACTAGGAGTG +GTTGAATGTATTGGTACCATTGGATAGCGATGTACTCAATTATTATAGGTGCGATAATCTTTACAATTAT +TCCTTATAAGCCTTTATGGTTGTGGGGCGTGATTTTTCTTCTCATAGGTGCGGGGCTTTCATTAAGTGTG +CTACCATCTAAAGAAGACCCAGTGTTAATAAAAGCCAATGAACGCGAAGCCCAGCGCAAAGCGGAATTGG +AGAAAGAAAACAAGGGTTAACACCCTTGTTTTTTTATATATATGGGGAGGTGTAGGAGGTTGCAAATGGA +GATTGTTCGTTTTTATTTGTTTGGACAAGTACGCTTTTTAGACTTGTTACTATTACTCATGTTTTGTGAT +ATTGTCACAGGTATTTTAAAAGCTTGGAAGAATAAAAGATTAAGGAGCCGCAGCGCTCTTTATGGGTATG +CACGTAAATTAGGCACGCTTGTTGCAATTATCGTGGCTAACGTTGTAGACCAGGTGTTAAATTTAAACGG +CGTGCTTGCTGGTATGTCGGTCCTTTGGTACATCGCGAATGAAGCTCTTTCTATCTTAGAGAACTTAAAT +CAAATGGGCGTTAAAATCCTTCCCGGCTTATCGAAAAAACTTCATGTTGTACAAGCTGAAATGGAAGAAC +AAGAAAAGAAAGAAGAACTTAACCCTATTTTAGAAAAGACTAAGGAGGAAGTTAAATGACTTTCGGTGAA +GCTCTTGAAATTATGAAAAAAGGCGGTAAAGTTCGCTTGCCTGAGTGGGTTGGTTATTGGTACAAGAAAA +ACGGTCAAGTTGTTGTTCACTTAGAAGATGGCGAAGAAGTTTATACGCCCTGGTTTCAACAAACAATATT +TCGTGAAGATTGGGAGGAAGTAAAATGACTTATTCTTTAAACGATCTTTTAAATAAAGCGAAAAACCACA +GCAAAATGAAGGGGGTACACCCTTATTTGGTTGAAAAAGCGCTTCAACTCATCACAGACGCATACAACAA +AAAGAAATATAAGCTGGTTATTGGTGAAGGCTATCGTTCTATTGCTTACCAAAACGAGTTATACGCACGA +GGAAGAACAACACCCGGACCAATCGTTACTAATGCTCGCGGTGGTTCTTCTTTTCATAATTTCGGGTTGG +CTTTTGATATTGCAATCTTAGACAAAGAAGAAGATGGAATTGATAATACTGATTCAAAATATCGTGAAGT +TGGTAAACTTGGGAAAGCTCTAGGGCTTGAATGGGGCGGCGATTGGAAAAGCATTTATGATGCTCCGCAT +TTTCAGTTCACCTTCGGGCTTGAACTAGATGAACTACGAGCAGGGGCTAAAATTCCGGCTGGTTCACCTT +CTAAACCTGTAAGTACACCTAAAGAGCCAGTGAAACAGTGTCCTGTTGATGACTTCGCGCCGCTTGTTCC +TTATCCCGGCATATTAAAACTAGGCAGCAAAGGTATTAACGTGAAACGTGTACAAAGAGCTGCAGGAATG +CCGGAAAGTTTAATTGATGGCGAATACGGTGCGCGTACAAAATCATACGTACAAGCTTACCAAACAAAAC +ATAAACTTGCTGCAGATGGAATCGTTGGAAAAGATACATGGAACATGATGTTCTAATTTTAAAAAGCTCT +CCTATATGGGGAGCTTTTTTTATTTTATTTTGTTGGAATCAAAACAAGCATACATACATATCATTTTAAA +GTACCGTATTAACCGCTAGTTAAACCGCTGAATACTTTCGTAACCTTTGGGGCACAATTACTTTAAAATG +CGCCTAGAAGGAAAATAAGCGGTTTAAATGGCACTCACATCATAGGAGGAATGCAAAATGTTAACTGTTG +GCTTAGGTGGACTTGTTTTTCTTGGCTTGGCTGTAGCAGAAAAGAAAGGCTGGATTGATGGCGAACGAGT +AAAGACAATCACTACAATTGGCATGTCGGCTGGCATTGGAGCTTTGCTGCTGTATTTCATTTTCTCGTTG +AAGGTTTTTCTGTAAAACTGGAATATCCATTTTATCCGCATATCTGGAATTTTAAAAGGAACTCTTTTTT +CACACGCTGCATACGATGTATAACCGCTAACAGCTAAGGAGAATTTCCCAATTAAATAGTTCTCCTTTCC +TTCTCACCCTTCCCGCAACATCATAATAAAAAAACGGCGCGAATTTAAAACATTGGACATATTCAGAAAA +GAGTTAGATTTTCACACAATATGAATATTGGAGGTTATTAAATGTTTGAAATTATTTTACCTGCTGCTGT +TGGTGGTCTAGCTGTTTTGCTTGGTAGAAAAAAAGGCTGGAATGACCGTAAATCTATCGAGCTTGTATTT +AAAAATTTAAAGATTGGTTACAAGTCGGGCGATGAATTTAAGTTTCCAACGTTCATAAGTGAGGACAAAG +GAACAGAAGGGAGGACCATATACACCTATAGGACCTCTATAGGGCTTACAGATAGCGAAGTTAAACCGAT +ACAAGAAACACTAACTAAAACGTTAAATAGCAAGGTTAGCGTGGAATATGACCGTTTTATTATCATCACT +GTATATCATGAATCAATTCCTAAACTTCTACATTATCGCGATATACCAAAAGGCGCGGGCGGCTGGCTTG +TTCCGCTTGGCAAAAATGAAGATGGCTTTCATTTTCATGACTTTGACGCAATCCCGCATATGACTGTTGC +AGGCACGACACGTTTCGGAAAGACAGTTAATTTAAAAAGTAACATGACCTATCTTATAGAAAGTCACCCG +GACGATGTAGAGTTTATTTTGATTGATTTAAAAGGCGGCTTGGAATTTGACCGCTACAAAAATTTAAAAC +AGGTGCGCCACGTATGCAAAAACTTAGAAGAAACTCACGCCGTTTTACAGCAGCTCCATTATGACCTTGC +ATCTTTAATGACTGATTTTCTTGAAAAAGGTATCAATAACATAGCTGAAACGAATTTAAAAAATAGATTG +TTTGTTGTTGTCGATGAAGCCGCGCAGCTTGCACCGGAAGCGTGGATGTCTAAAGAAGTGAGAGACGCAA +TGAGTGAATGCCAATGGTATCTTTCAGAGCTGGCCCGCGTTGCTGGTGGTTTAGGTGTTCGCCTTATTTA +CGCTACCCAATACCCAACGGCAGACTGCTTGCCGCGTCAGATAAAAATGAATAGTGATATTAAGATTTCT +TACCGCCTGGGCGCTGATTATGCGTCGAAGGTTGCTATAGATGAATATGGAGCAGAGAAGCTGCCTTCTA +ATTTTAAAGGCAGGGCGCTTGTGAAAACTCATGAGCTGAGAGAAATGCAAACACCGTTAATTACTGATAA +AGAAATGTTTGGGAGGTTAAAACAGTATGTCATCAAAAAAAGAGATACGCCGCCACCGGGAAATGACGAT +ATTATCGAAATTGGATAAGATGGGCGTTTTAAGCCGCTCACAGCTACAAAAAATCGTAGGTGTTCAAAAT +GTACGCACGATGAATGATATTTTATCTTCAATGGGAACGTATTTAAACCATACCCGCATGATGGAAAATG +TATATTATCTGAGCAAACAAGGAAGGGAGTATATAGGATCTAATACAATAGTTAAAAAAACTAGCCAGCT +CGAACATAAAATCATGAGAAATGATATGTTCATTTACTATGATTACCCTACTACATGGGAGCAAGAGAAG +CCTTTCACTATTACGGACGGTAAAACAAAGGAGAAAACAAAGATTATAGCCGATGCCTTTTTTACAATGG +ATAACGCACACTATTTTATAGAAGTTGACTGCCAGCAGAAAATGATTGCTAACTATCGAAAGATTGACCA +ATATATAAAGCTTTTCCCTGCATACGAGAAAAAATTTAATGTTGGTTGTGTGCTCGTTTTCTACACTAAT +TCAGAATTTAGGCAAAAGAAATTGCTACAATATGCAGAGAAAAACGGCTTAACAATAGGGGTTTTGAGCC +GCCGAGACTTGGAGTGATAAAAAAATCACTCTTTTTTTTTAAAAAGCTGTTGACACTATGGCAACTATAC +TTTAATATAAGGGTATGAGTTACCACAACGGCAACAAGAAAGGAGGTAACGCATGATTTATCACATCACG +AAATTTAGAGATAAGGCAGGGCTTTCACAAACTGAATTAGCCGATAAGCTAGGCGTAGATAAAGCAACAA +TTAACCGCTATGAAAAAGGCACTCGGCAGCCATCAGTTGAAATGCTCTACAAAATATCTAAAGTGCTTAA +CGTGTCCATTGACAACTTAATAAAAGGAGTGAAGGAAAATGAAAGCTAAGTCATTAATTCAAGAAATCTT +TCTTCAAATTCAAACGTGGCGCTCAATGAATCGCGGTAAATTAGGTAATGTTTATCTAGGCGAGAATGAA +ATGAATGCTCTTACTAACAGCATTGAGTTTAGGCTTGAAAATCAAGCTCTTACTACAAATGATAAACCGC +TTAAAATTTTTGGTTTTGATGTAATACCGGTGAAAGAAAGCAACTTTTTAGAAGTAGGTGGCAAAAAATG +AAAACAGTTGAGGAAAAGCTTGCTGAGTACATCAGTATTTTAGAGGTTTTAAAAGACCGCATTGAAGATG +ATACAAATGACATTACATTAAGTGACCATTCCCGCGCACTTGCTACTGGTGAATTTTACACACTTAAAAA +CGTTATCAACAAGTTAAAAGAAATCAAATAAAAAAAGCCCCAACAGGAGCTTAAAAAGGGAGAAGTTTTA +CTATGACAACAAAAACAATAACATTGCAATCGTTAGTCTTAACTAATATTAAAGGAATCCGCGAGCTGGC +GCTAGTGCTAGAAGGTAAAAACGTGAATATTTTCGGTGATAATGCAACAGGTAAAACAACTATTAACGAT +GGTCTTACATGGTTGTTGTTCGATAAAGACAGCTTAAACCGTAAAGACTTTCAGTTAAAAACGGTTGATT +CACAAAATAATGAAATTCATAACCTAGAGCACGCGGTTGAAGGTGTTTTCCTGGTAGATGGCGTGGAGCT +TTCTTTGAAGAAAGTATTTAAAGAAAAGTGGACGAAAAAGCGCGGTGCTGCTACGGCTGATTTTACAGGG +CATACAACAGATTATTTTGTAAATGGTGTTCCTTCTAAAAAAGGTGAATACGTAAATAAAGTAGCTGAGT +TAGTAAGTGAAGATACTTTCAAGCTTTTAACTACTCCAACATTCTTTAACGAGTTCATGAAATGGCAGGA +CCGCAGAAGCGTGCTTATGGAGATAGCGGGCGATTTAACGGACGCGGAGGTAATTGCATCATCTGATAAA +TTAAAAGCGCTAGAAGCGATTTTAGGCAGTCACAGCATAGCAGACCACCGCAAGATGGTAGCCAGCAAAA +AAACTGCAATCAATAAAGAGCTTAACGCTATCCCGGTTCGTATTGATGAAGTGCGCCGCTCTATTGTAGA +TGTGACAGAGCTTAATGAAACAGAAATCAATGAACGCATTAGACTTGCAGAGAATTTAATAGGTGAAGCA +AGAACAGCTATTGCAGAAATCAAAAACGGAAACAACGTGATTGATTTAAAAGGTCAAATCACTTTCCAAC +AAGCAGAGTTAGAAGAAAAGAAATTCAAATACAGCGAAAGTAATTATGCTGCTCTTAATCGCAAGCGTGC +CGAAATTCAAAAGTTAAACGATAAATCAAATGATTTAACAATCGAATTAAAGCAAGCTCAAAACGGTGTA +GGCAACATGAAAAACTACCTAACAGCACAAGAAAAAGAGCTTGAAGAAAAGCGCGGTGCTTGGGTAACGC +TTAATGCTCAAACATTTGATGAACATAAAAACACTTGTACTATGTGCGGTCAAGAGTTCCCGGAAGAAAA +ACGCCTTGAATTAGTTGACGCATTTAATGTTCATAAAGCTGAACAACTTGAAAAGTTAGCTAAAGAAGGG +AAAGCAGCAGCGGCAGAAGTTGAAAACGTAAAAGTTGAGCTTTCCAACAAGGAGAAAAACGTTTTTGCTA +TCGAAACAGAACTAAAAGAAGTAAACCGCCAAAAGCAAGAAGCTTCTGAGCAGTTTGAAAGCATGAAACA +GGGCGTGACGCGCTTTGAAGATACAAAAGAATACTTAGATATTCAAAATGAAATTGCTTCACTTACAGAG +CAAATAAACCATATTGGAGAAACGAACGCGCAGGCTATCCAAGAACAAGAAACAAAAATTCATAATCTTG +ACCAGGAAATCATGACAGAGCGTGAAAAGCGTGCTCGTTTGCAACAAGTCAAGGACGCTGAAAAACGTGT +CAATGAGCTTGAAGAAGAACAGCAAAAACTTGCTGCAGAGTATGAAAAAATTGAGCACCAGCTATTTTTA +ACAGAAGAATTTATTAGAACGAAAGTAAATCTTCTCGAAGAAAAAATTAATAACAAATTTAAAATGGCTA +AATTCAAACTGTTCAACACTCAAATTAACGGTGCTGTTGAAGAATGCTGCGAAACAATCTATAACGGCGT +GCCATATTCTAAAGGCTTAAATAATGCCGCTCGTATCAATGTAGGGCTGGACATCATTAATACACTATCT +GAGCATTACGGCGTGAAAGTGCCTATCTTTGTTGACAATGCGGAAGCTGTTACAAAGCTGCTAGAAGTTG +AAACGCAATTGATCGCGTTACGAGTAAATGAAGAAGATAAAACGTTACGTGTGGAGGTGCAAGCGTAATG +AATGAAGTTCAAGAGTACGCTTTAAATATGGCGCGGTTATGGGAGAAAGGAGAATTAACTCAGGTTGCTT +ATCAAATTAGCAACCTGTACAGCTCCTTAGAATATAGCTTCATTTTAAATGTAATGGCTGAATTTAAAAA +TCAAATTGACGGAGGGAACAAAAATGACTAATCAAATTACAGAACAAAAAGCAAAATTAACAATCGTTGA +GCAAGTGGAAAACCGCGTACAAAAATTACAGGAAAACAACCAGCTACATTTTCCGAAAAACTATAGCCCG +ACCAATGCGCTTAAAAGCGCGTGGTTGGTGCTTCAAGAAACAAAGGCGGGCAAGAACGCCGGATATGCGC +CAGTATTGCAGTATTGCTCACAGTCAAGCATTGCTAACGCTCTTTTCGATATGGTAGTTCAAGGGTTAAA +CCCTTCTAAAAAGCAAGGTTACTTTCTTTGCTACGGTAAGTCATTAACATTCCAGCGTTCTTATTTTGGA +ACAATGGCAGTAACGAAAAGCGTAGCAGGAGCTAAAACAATTAATGCAATGACTATTCATGAAGGGGATT +CTGTAGAATATGAAATCAAAAAAGGGCGTATTATCGACATTGAACATAAACAATCATTCGGAAGCATTGA +TAAGCCTGTTATTGGAGCTTATTGCACCATTGATTTTGGTAATGATGATATTTTTATCGAAGTTATGACA +ATTAAAGAAATTCGCCAAGCGTGGAGCAAGTCGCAGTCATGGAAGGCGGGCCAAGAAAAAGAATCAGCTA +ATAGTGTACATGGTCAATTTACTGTAGAAATGGCAAAGAAAACAGTCATTAACCGCGCTTGTAAGAAGTT +CTTAAACTCTAGTGATGACGCAAGCCTTGTTATGGACCTATTAAGCCAAGAGCAGGACGAAACGCAGCTA +GATATTGATGAAAATGCTAACACTGAGGTTTTAGACATGGAATACGAATCAGTTGACGAATCGCCACAAG +AGCAACCAGCTCCACAAGAATACGAAATCATTGACGCGCCGCCAAATGATGAAGTACCAGCAGGGCAAAC +AGCTTTTGATATTCCAGAAACACCTAAAACAAGTGGTGCTCCGTTTTGATTAATATTCAAGTCATCGGCT +CCGGCAGTAAAGGTAACGCCTATCTGCTGGACGATGGCACAACAAAAATACTCCTTGAATGTGGCGTGAC +ATTCAAGGAGCTGCAACAAGCGACCAACTACGAAACGTCTAGTGTTAGCGGGGTCTTGCTTACACACGAA +CATAGTGACCATTGCAAAGGATTAAAAGACGTTCTTAATCGCGGGATAGATGTTTATACCAGCGCTGGAA +CTGCTGCAGCGTTAGAAATTCAGCACAACCGCTTAAAGACAGTAGAAAAGAAAAAGCCTTTTAAAATCGG +TACGTTTCAAATAATGGCATTTGACGTTGAACACGATGTAAGCGAACCTTTTGGCTTTCTAATCATGAAC +CAGGCAGGCGATAAACTTTTATTCGCAACCGACACTTACTATATCAGATATAAGTTTCCTGGGCTAACGC +ACATTTTACTAGAGACGAATTACTCAGAGGACATCATAAACAGAAATGTTGATTTAGGGCGTTGCGCTCC +TTCTCTTAGAAAACGTATTAGGCAGTCGCACATGAGCTTAGAAACGGCTATAGAGTTCTTTAAAGTAAAC +GATTTGTCAAAGGTTGAAGAAATTCACCTTATACACCTTAGCGATAGCAACAGTGATGAACAGTTATTTA +AAACGGAAGTTCAGAAAGTAACCGGCAAGCCGGTATTTATCGCATAGGGGGCGTTGGGGAATGGGAGCAC +TTATATTTGTTGTAGCATTCATGTTTATGCTTGTTGGGGGATTCATTACGGTTGATTTTATAAATAAATG +TATCAAAGTATATGAAAAGGAGTTAGGGGAATGAGTTTCTTTACAGAAGAACAAAAAGCGATCATGAAAG +AAAAGAATTTTAGACCGCAAACAATTAAGTATCGTATGGTGGCAAAAAAGATGTCATTTGAAGCGGCTGT +GTCAAGACCGGTAGGAAAAGTAAGTTATGAGCAGCGATTGGACGCGCTTCTGACGAAGGAGGAAAAAGAA +GAAGCATATGCAAAGGGGATAACTAGCGCAGCTCTTACGCAGCGTGCGGCTTCTGATTGGACCAAAGAAG +AAATTTTAAATACACCTATGCGGGAAGGTGTTTTCTCTCCTGAGCAGCTTGCAAACATGAAGAAATACGG +TATTAAGTATCAGACAGCTAGAACGCGCGTTAATCGCTGCCATTGGTCCAAAGATGATGCTACAACTATA +AAGCCCGGTAAAGTGGGCAGGAATCACAGAAGAAAGAATTAGGGCTTATGCTCTAGTTCTTTTTTTACCG +TTAAATAGTATTATATTCAAGGTTATTAAAAAATATTACATATTTATAAAAATAAATGTAGACAACTAGC +GCAAAGTAATGTAAAGTAAAAGACAAGGAAAGGAAGTGAATAAAATTGAAAATCTTCGCAACTAAAGAAA +TGCGCCTTGCTCGTATGAGAAAAGGCTACAGCATTGTTGATTTAGCAAGAAAAGCCGAAATGTCACGCCA +AGCAGTTGGACAAGTCGAACTAATGAAAAACGGCGTTTCTCCTGCTAATGCTAAAAAGTTAGCTGATGCG +CTAGGCACAACATTTGAAAGCATATTCATCTTCAAGGAAAGAGGGGAATAACATGGCTAGACCTTTAAAA +GAAGGCTTAGACTACTTCCCTTTAGATGTCGATATTGACCAAGATGACAAAGTGGCAATCATTGAAGCGC +TTCATGGTGCGGAAGGTTTTGCAGTTGTTATCAAGCTGTTAATGAAAATTTATAAAGAGGGTTATTTCTA +CGAATGGACTAACCGCGAACAAATACTATTCTCCAAGCGAGTTAATGTTGACAATAACACCGTTAAAGAG +ATAGTTAATGATTGCATAAAGGAAGGTTTATTCAACGGAGAGTTACACGAACAGCACAATATACTTACAT +CTAAGGGCATTCAGTCGCGTTATTTAGAAGCTGCTAAACGCAGAAAAGAGGTAACTTTTTTAAAGAAATA +CTTCTTAATTAAGGACGTTGAATCAATCACAGGCAGCAACAAAATAGCTGTTTTTACGGTTGATGATAAC +GGAAATAAAGTTAATGTTAACAATAACTATAGTTTAGGTGTACATGATGTTAACAAAAGTACACAAAGAA +AAGGAAAGGAAATAGAAAGTAAAAAGAAAGAAAAGAAAAAAGATAGTATAGAACCTAAAATACTCTACGG +CGAATCTACTCTTTTAACTAACGAAGAATACGACAAGCTTGTAAACAAAATGAGTGAAGGTGTTGCATGT +GATTACATCGAAAGATTAGATAATTACATTGGTCAAATTGGTAAGGACAAATACAAAAGCCATTATCATA +CTATCTTGAATTGGTATAAGAAAGACAATCCTAACAAGCCGGAAGGAGAAAATAAAAATGAATCCGCTGC +AAGAAACATTGAATCAAATAATTCACCAGGCCTCAACGCTCTATCTCTCTAAAGACCCGCATATCTGTAA +ACATTGCGGTCAAGAGGTGCAAGTTATTGAAGTAGAGTTTCTAGGTATTAAGAAAGCTGTTCAACCTGTA +TGCCCTTGTGAAGCAGAAGCAATGAAACAAGAAGAAATTGCCCGCGCTAATTATCAAGAGCACCGCAAGA +TTAGAGAATTATTTTCTTTAAGCGATCTTGGCGAAAAGTTTTTAGAATCATCTTTTGATAAGTTTTTAGG +CAACAAGGGAACGGAAAACGCTTTAAAGTTTTCACAGCGTTATGTAAAAGAGTTCGATAGTGATTTGTGG +AAAGGTGCTGCATTGCTACTATGGGGAGTGCCTGGAAACGGAAAAAGCCTTCTAGCCGCGTCTGTCGCAA +ACGCACTAGAAAGCAAAGGTAAAACAATTGTATTCATCAGTATGCCAAACTTGCTCCAAAAAATACGCAG +TACATTCAATCAAAACAACCAAGAAACAGAGCACGAAATTATGAAAGCTCTACATACATGTGATTTGCTT +GTACTCGATGACATAGGAGCGGAAAAAGTCACTGATTGGGTGGAAGATGTAATTTTTAGGATTGTTGACG +GTCGCTACGTTCGTAAAAAACCTATTTTCGTTACATCGAACTTATCACCCGATGACTTATATAATAAAAT +CGGTCATCGTTCAATGGACCGATTAACAGAAATGTGCCAACCTATTCACAATCAAGGGACAAGCTACCGG +AAAATAATAGCTCAACAAAGGTTAGGCAAGATACTTGAAAATTAAATAAGGGGGAGAACAAATGAAAGAT +TTCATCTGCTCACCGGGTATTTGGTCTTTTGGAAATTATTCTACAGACGAGTATACAGGCATGACACCGG +AATGTGAAGCAACACTTAATGCCTTAGAAGCTAAAATTTCCGCTTTTGAGGAAAAACTTGCCGCAGAAAA +GGCGGTGTAACTAATGCAAAAGTGTGCTAGATGTGGGTGGATTCATGTAATATCTGTCAATATCTGCAAC +AATTGCAAGGCGAAGTTCACCGATGAAAAACAATTCTTTTTGGCTAATAAAGATTTCTTAATAGATTTAG +CGCTTAAAACAAAGGATTACAAATGGTTAAAAGCCATTATGAGGGGGAGTATTCACGATGTTGAATAGAG +AAGAAAAGAAAAGTGCTCGAAGTGCTGTTAGTGGGTTAATGAATGTAGCTTGTGCAAGATGTACAACGCC +TAACGAATGTGAAGGCTGCCCAATTCAAGCGGCTATGCAATCAATGTATTGCCTTATCGAAGGAAAAGAA +AGCTGGAAGAAGGCAACAGCAGGCATTACAGAACGCCGCTATCGTAAGTTACGCGCCCAGGGCTTCCATG +ATGCTGATATTGCGGAGATATACGGCATTACACCTAAGCAGCTCCTAGACTTCAAGCGCCGCGAAGGAAT +GATAGCAACACACCTGACTGATGAGGACATAAGAGAATTACGCCGGTTACGCAATGAGGAAAAGTGGAAG +TATCAAGATATTGCTGAAAAATACGGCATTACGCCAACATACGCAAGTGAAGTAGCTCGCGGCAAACGAT +TCCCGGAGGTGGTTTAAATGTGCGAATTAAAAAGCACTCTGTCATTAGTTGAAATGGCAGCTAAAGAAAA +TCCAGCAGTTTTAAAAGGTATACACGATCTTTTAAACAAATACGAAAACGCCGGTGCTACCAACACCAGC +GCAAAGAATAAACACTCTGTCAAAAGTCATATTCAATTTAATGATACCCATAAAAGCCTAATTGTATTCT +GCTTTAATTGCAATCTTACAAATGAACTAACCCTAAAGAACGTGATTTCTTACAAATGCCGTCATTGCGA +TTGGGAAAACCGCCTAAGCTACATGCAAGCTCGGTACATGCGCGAGCTATGAAAAAGTTAATCAACGGTG +AACACCTCACCATAGACGAAGCATGGGCAAAACATAAGGGGCTATGTTGGAAATACGTTAGATGTAATAT +GGAACGTGCCAAGCGTATGAGCTACACAAAAGCTGATTTAATACAAACGGCTGCTATGGCATTTACCCAG +GCATACAACGGTTTTGATGAAAATGCAGGGGTAAAGTTTAGCACTTATGCCGTTCCTGTCATATTCGGTG +TAATGGATAACGCTTTCTCACGAAACAATGCGGGCTTACATTACTCAGAACCAGTTAAAAGCCTTGCTTA +CAGGTATTTAAAAGGCAAAAGCAAGGAAGAAAGAGAAATATCACAGTTAGATGACATCATGAATAGCCTT +CAGATTGATTATTCTCGCGCGTATGACGTTTTTCAGTTCATTCACAATGAATTACTCTTTTCAATGGATT +TTCCCGTTACAATCGAAAATACGACAGGTTCCGGCGAAATGGTTGGAAGTAATCATTGGGACATCATCGG +GCAAGAAGCTGATTACTCATCAATTTTTATCAATGAGTTAAAAAGTCATTGTACTGAATTAGAAAATCAG +GTTATTGATTTGATATTCATAGGGGTTGAGCGCCGAGATATGCCCGAAATACTCGGCGTAAAGCCCACCA +ATATCTTTTCTAGGGTGCAACGTATTAAACGCAGAATACGAGAAAAGGGGCTTTTACATGATGGACAACC +ACCTGCAATTACTAAATGATATGCTACACAATTTAAAATATGACACGCTTTATGCAGATTTACAGGACTA +TGTTCCAGCTCTGGAAGCTATGGTGAAGGTTTATAAGCATAATGCTGAGGTACTTGAAGAAAAACGCGCC +TTAGAAAACGAAATGCGCGAAGTAAAAAAGAGCTACATGCAGACCATTGAGAAATTGAAGTCCTATAAGA +AGCGCAACCAAGAACAAAAGTTGCTGCTTGGTCAAATAAAATCTCTTGCTGCAGGAGGTAAACCAATTGA +AAACTAAAAAGCAACGATGGAGAAAAACAAAATTTTCAACTTGGAAATGGTCTTGTGAAGGTTGCGGAAA +AAGCACACATACAAACGGCTGCAAGTTTCCTAAAGGTTGGCATTACGGCGGGTATGGCGTTGTTTTTGTC +ACTTGCAAGGAGTGTGGACCATTTGAAGAAAATTGATTTCGGTTTCAATCCAGTAGCAAAACCCAATTAC +AAGCGCTCTAAGCCCACAGCAAAGGAGCGCGGTAAGTTTAGTAGTGAAACTATCTTAAACATTCATATAC +GCGATAACGGCAAATGTGTGTGTTGTGGCAGCGGTAGAGTTGAAGCAGTACCGCACCACGTTATTTTTCG +CAGTCAAGGCGGCACAGGTACAGAAGATAACGGCGTGTTGGTTTGTTCTCCTTGTCATCTATGGGCACAT +GGTAGAGCAGATGGGCCAAACGGCGAACCATTCAACGAGGGGCGAAAGTGGTTTGAAAATTATAGGGAGG +AAAATTTACTATGATGATCTATTTTGAACAGCTAAATGTTGTCACTGTTGCCTATATGCAAGCATGTATG +GAAATATGGAAGGGGCGATTTACTCATGATTGAATATGAAATGACTGTACAGGCGGATAGAATAGCGCCT +TATAAGTTTAGTTTTAAATCAAATGATGCCAATTTATTAAAAGCTGCTGAACGTTTCGAGCGTCATATTG +CAGAACATGACTTCATTTGCTCGGATAACATGGAATTTTTACGTACAAGCACTATAACAAGCTTTAAGCC +TAAGCAAAAAACGCCTATTGTTGACGCAAAAGCGAAGGCAACGGAAGTAATAGAGAACTATTTAAAACAT +AATGGTCCTGCTATTACAGTAGATTCAGTTATTTACATGTACAAAAGGGATTATTTAAACGGCGGGCGCG +ATATTAACCCAAGTATAAAGGCTGTTATTGAATCAAACATCAACGAAATTAAATTACTTTCCCAGGAGGA +ATATAAAAATGATTAATCAATCAATCGTAGTTGGACGCTTAACAAAAACGCCGGAGCTTCGTTATACTCC +AAGCGGCGCAGCAGTAACAAACTTCACAGTAGCATGTAACAAGCCTAAGAAAGATGGTAAAGACCAGGGC +GCAGACTTCATCAATTGTGTTGCATGGAATAAACAAGCGGAGAATCTTTGCAACTATCAAACAAAAGGTG +CTCTTATCGGTGTAACAGGGCGTACAACTACACGCAGCTATGAAGATAACAGCGGCAAAAAGGTATATGT +ACAAGAAATACTAGCTCAGAGCATTCAGTTTCTCGAATTTAGGGATAATAACGGCGGGAATAGTAATACA +TCTAATCAGGGTACGGCGTTCGATGAGGGCGAAACAATGGATATTCAAGATGATGATTTGCCGTTTTGAT +AAAAGGCTTACTATGGGGCGTGCTTCTTAGCATTCCCCTATGGCTTGCTATATTGGGATATATAAAACTA +TTTAAGGGGCTGTTGGAATGAATTTAAAAGAATTATTTGAGATACAAGCGGGTTTAGATGCAGAAATATT +AAAGAATCACCCTATTCAACCAGGAGAGGACCGTTTAGAAAAGAAACATGCTGCTTTATTGGTGGAGCTA +GGGGAAATGTTCAACGAGTGGAGAGCATTTAAGTTTTGGAGTCACGATAAAGAACCGCGTATGGCTGTAA +AATGTCCTGAGTGTGAAGGAGCTGCAGCGCGTCAAGCTTCTGACGGTAGTTATGTAGAGTGTGGCACATG +TGATGGAGCTGGAACAATTGATAAAGTATTAAAAGAGCTAGTGGACTGCTTACACTTTGTTTTAAGTATT +GGGTTAGAACATGAATTTGATACAAAATTAAATATGGTCATTGAACCAATTTTATTTAGCCGCTCGGACG +ATGGTAATAATATCATTGCTCAGTTCATTGAATTATTAAAAGTTGAGTGGGAGCTAGTAGGTAGACACTA +TAAAGAAGGTTTGGAGCTGTTTATAGGCTTTTGTGAAATGCTAGGCTATACATGGGAGCAAGTAAGAGAA +GCATACCTCATTAAGAACCAAGAAAATCATTACAGACAAATGAATGGCTATTGA + diff -r 000000000000 -r c28817831a24 test-data/sequence.gff3 --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/sequence.gff3 Fri Oct 09 09:22:42 2015 -0400 @@ -0,0 +1,56 @@ +##gff-version 3 +##sequence-region KT001911 1 40024 +# conversion-by bp_genbank2gff3.pl +# organism Bacillus phage Pavlov +# Note Bacillus phage Pavlov, complete genome. +# date 10-SEP-2015 +KT001911 GenBank gene 215 830 . + 1 ID=CPT_Pavlov1;Name=CPT_Pavlov1 +KT001911 GenBank gene 799 2310 . + 1 ID=CPT_Pavlov2;Name=CPT_Pavlov2 +KT001911 GenBank gene 2290 2729 . + 1 ID=CPT_Pavlov3;Name=CPT_Pavlov3 +KT001911 GenBank gene 2716 4636 . + 1 ID=CPT_Pavlov4;Name=CPT_Pavlov4 +KT001911 GenBank gene 4722 5527 . + 1 ID=CPT_Pavlov5;Name=CPT_Pavlov5 +KT001911 GenBank gene 5535 6512 . + 1 ID=CPT_Pavlov6;Name=CPT_Pavlov6 +KT001911 GenBank gene 6565 6926 . + 1 ID=CPT_Pavlov7;Name=CPT_Pavlov7 +KT001911 GenBank gene 6929 7366 . + 1 ID=CPT_Pavlov8;Name=CPT_Pavlov8 +KT001911 GenBank gene 7368 7758 . + 1 ID=CPT_Pavlov9;Name=CPT_Pavlov9 +KT001911 GenBank gene 7777 10001 . + 1 ID=CPT_Pavlov10;Name=CPT_Pavlov10 +KT001911 GenBank gene 10011 10422 . + 1 ID=CPT_Pavlov11;Name=CPT_Pavlov11 +KT001911 GenBank gene 10421 11010 . + 1 ID=CPT_Pavlov12;Name=CPT_Pavlov12 +KT001911 GenBank gene 11009 12713 . + 1 ID=CPT_Pavlov13;Name=CPT_Pavlov13 +KT001911 GenBank gene 12712 14596 . + 1 ID=CPT_Pavlov14;Name=CPT_Pavlov14 +KT001911 GenBank gene 14599 16395 . + 1 ID=CPT_Pavlov15;Name=CPT_Pavlov15 +KT001911 GenBank gene 16396 17290 . + 1 ID=CPT_Pavlov16;Name=CPT_Pavlov16 +KT001911 GenBank gene 17290 17641 . + 1 ID=CPT_Pavlov17;Name=CPT_Pavlov17 +KT001911 GenBank gene 17629 18895 . + 1 ID=CPT_Pavlov18;Name=CPT_Pavlov18 +KT001911 GenBank gene 18940 19800 . + 1 ID=CPT_Pavlov19;Name=CPT_Pavlov19 +KT001911 GenBank gene 19793 24845 . + 1 ID=CPT_Pavlov20;Name=CPT_Pavlov20 +KT001911 GenBank gene 24844 25080 . + 1 ID=CPT_Pavlov21;Name=CPT_Pavlov21 +KT001911 GenBank gene 25114 25539 . + 1 ID=CPT_Pavlov22;Name=CPT_Pavlov22 +KT001911 GenBank gene 25523 25718 . + 1 ID=CPT_Pavlov23;Name=CPT_Pavlov23 +KT001911 GenBank gene 25703 26446 . + 1 ID=CPT_Pavlov24;Name=CPT_Pavlov24 +KT001911 GenBank gene 26644 26825 . + 1 ID=CPT_Pavlov25;Name=CPT_Pavlov25 +KT001911 GenBank gene 27050 28228 . + 1 ID=CPT_Pavlov26;Name=CPT_Pavlov26 +KT001911 GenBank gene 28223 28787 . + 1 ID=CPT_Pavlov27;Name=CPT_Pavlov27 +KT001911 GenBank gene 28881 29099 . + 1 ID=CPT_Pavlov28;Name=CPT_Pavlov28 +KT001911 GenBank gene 29075 29331 . + 1 ID=CPT_Pavlov29;Name=CPT_Pavlov29 +KT001911 GenBank gene 29316 29501 . + 1 ID=CPT_Pavlov30;Name=CPT_Pavlov30 +KT001911 GenBank gene 29529 31498 . + 1 ID=CPT_Pavlov31;Name=CPT_Pavlov31 +KT001911 GenBank gene 31483 31671 . + 1 ID=CPT_Pavlov32;Name=CPT_Pavlov32 +KT001911 GenBank gene 31651 32599 . + 1 ID=CPT_Pavlov33;Name=CPT_Pavlov33 +KT001911 GenBank gene 32585 33297 . + 1 ID=CPT_Pavlov34;Name=CPT_Pavlov34 +KT001911 GenBank gene 33297 33424 . + 1 ID=CPT_Pavlov35;Name=CPT_Pavlov35 +KT001911 GenBank gene 33408 33852 . + 1 ID=CPT_Pavlov36;Name=CPT_Pavlov36 +KT001911 GenBank gene 33982 34211 . + 1 ID=CPT_Pavlov37;Name=CPT_Pavlov37 +KT001911 GenBank gene 34201 35052 . + 1 ID=CPT_Pavlov38;Name=CPT_Pavlov38 +KT001911 GenBank gene 35078 35815 . + 1 ID=CPT_Pavlov39;Name=CPT_Pavlov39 +KT001911 GenBank gene 35820 35990 . + 1 ID=CPT_Pavlov40;Name=CPT_Pavlov40 +KT001911 GenBank gene 35980 36188 . + 1 ID=CPT_Pavlov41;Name=CPT_Pavlov41 +KT001911 GenBank gene 36163 36627 . + 1 ID=CPT_Pavlov42;Name=CPT_Pavlov42 +KT001911 GenBank gene 36615 36942 . + 1 ID=CPT_Pavlov43;Name=CPT_Pavlov43 +KT001911 GenBank gene 36923 37679 . + 1 ID=CPT_Pavlov44;Name=CPT_Pavlov44 +KT001911 GenBank gene 37637 37947 . + 1 ID=CPT_Pavlov45;Name=CPT_Pavlov45 +KT001911 GenBank gene 37983 38444 . + 1 ID=CPT_Pavlov46;Name=CPT_Pavlov46 +KT001911 GenBank gene 38426 38533 . + 1 ID=CPT_Pavlov47;Name=CPT_Pavlov47 +KT001911 GenBank gene 38512 38936 . + 1 ID=CPT_Pavlov48;Name=CPT_Pavlov48 +KT001911 GenBank gene 38914 39339 . + 1 ID=CPT_Pavlov49;Name=CPT_Pavlov49 +KT001911 GenBank gene 39416 40024 . + 1 ID=CPT_Pavlov50;Name=CPT_Pavlov50 diff -r 000000000000 -r c28817831a24 test-data/sequence.gff3.out --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/sequence.gff3.out Fri Oct 09 09:22:42 2015 -0400 @@ -0,0 +1,10 @@ +##gff-version 3 +##sequence-region KT001911 1 40024 +KT001911 annotation remark 1 40024 . . . gff-version=3;sequence-region=%28%27KT001911%27%2C 0%2C 40024%29 +KT001911 TransTermHP_2.09 terminator 6521 6544 100 + . ID=TERM 1 +KT001911 TransTermHP_2.09 terminator 7749 7766 83 + . ID=TERM 2 +KT001911 TransTermHP_2.09 terminator 25063 25096 80 + . ID=TERM 3 +KT001911 TransTermHP_2.09 terminator 25071 25088 100 + . ID=TERM 4 +KT001911 TransTermHP_2.09 terminator 26456 26474 100 + . ID=TERM 5 +KT001911 TransTermHP_2.09 terminator 28782 28801 100 + . ID=TERM 6 +KT001911 TransTermHP_2.09 terminator 33846 33869 93 + . ID=TERM 7 diff -r 000000000000 -r c28817831a24 tool_dependencies.xml --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/tool_dependencies.xml Fri Oct 09 09:22:42 2015 -0400 @@ -0,0 +1,12 @@ + + + + + + + + + + + + diff -r 000000000000 -r c28817831a24 transtermhp.py --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/transtermhp.py Fri Oct 09 09:22:42 2015 -0400 @@ -0,0 +1,70 @@ +#!/usr/bin/env python +import sys +import re +import subprocess +from Bio import SeqIO +from BCBio import GFF +from Bio.SeqFeature import SeqFeature, FeatureLocation + + +def main(expterm, fasta, gff3): + with open(fasta, 'r') as handle: + seq_dict = SeqIO.to_dict(SeqIO.parse(handle, "fasta")) + + # Build coords file + with open(gff3, 'r') as handle: + for rec in GFF.parse(handle, base_dict=seq_dict): + with open('tmp.coords', 'w') as coords: + for feat in rec.features: + if feat.type == 'gene': + coords.write('\t'.join([ + feat.id, + str(feat.location.start + 1), + str(feat.location.end), + rec.id, + ]) + '\n') + with open('tmp.fasta', 'w') as fasta_handle: + SeqIO.write(rec, fasta_handle, 'fasta') + + cmd = ['transterm', '-p', expterm, fasta, 'tmp.coords'] + output = subprocess.check_output(cmd) + # TERM 1 4342 - 4366 + F 93 -11.5 -3.22878 | opp_overlap 4342, overlap 4340 4357 + ttre = re.compile( + '^ (?P.*) (?P\d+) - (?P\d+)\s+' + '(?P[-+])\s+(?P[GFRTHNgfr]+)\s+' + '(?P\d+)\s+(?P[0-9.-]+)\s+(?P[0-9.-]+)' + ) + + rec.features = [] + batches = output.split('SEQUENCE ') + for batch in batches[1:]: + batch_lines = batch.split('\n') + # Strip the header + interesting = batch_lines[2:] + unformatted = [x for x in interesting if x.startswith(' ')][0::2] + for terminator in unformatted: + m = ttre.match(terminator) + if m: + start = int(m.group('start')) - 1 + end = int(m.group('end')) + if m.group('strand') == '+': + strand = 1 + else: + strand = 0 + + feature = SeqFeature( + FeatureLocation(start, end), + type="terminator", + strand=strand, + qualifiers={ + "source": "TransTermHP_2.09", + "score": m.group('conf'), + "ID": m.group('name'), + } + ) + rec.features.append(feature) + yield rec + +if __name__ == '__main__': + for record in main(*sys.argv[1:4]): + GFF.write([record], sys.stdout) diff -r 000000000000 -r c28817831a24 transtermhp.xml --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/transtermhp.xml Fri Oct 09 09:22:42 2015 -0400 @@ -0,0 +1,76 @@ + + + finds rho-independent transcription terminators in bacterial genomes + + macros.xml + + + + $output]]> + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + doi:10.1186/gb-2007-8-2-r22 + +